Qunar用户画像构建策略及应用实践

 1.用户画像的构建原则

我们做用户画像的目的有两个:

必须从业务场景出发,解决实际的业务问题,之所以进行用户画像要么是获取新用户,或者是提升用户体验,或者是挽回流失用户等有明确的业务目标 。根据用户画像的信息做产品设计,必须要清楚知道用户长什么样子,有什么行为特征和属性,这样才能为用户设计产品或开展营销活动。
一般常见的错误想法是画像维度的数据越多越好,画像数据越丰富越好,费了很大的力气进行画像后,却发现只剩下了用户画像,和业务相差甚远,没有办法直接支持业务运营,投入精力巨大但是回报微小,可以说得不偿失。鉴于此,我们的画像的维度和设计原则都是紧紧跟着业务需求去推动。

2.用户画像数据仓库构建

2.1 数据源的集成

目前Qunar用户画像数据仓库中的数据源来自业务数据库的数据和用户行为日志数据,目前数据仓库中基本涵盖了机票、酒店、火车票以及保险等业务系统的数据,可以从全方位的了解去哪儿的一个用户的画像。

2.2 我们有哪些数据?-数据维度

  2.3 我们有哪些数据?-数据仓库

目前我们画像数据仓库的构建都是基于Qunar基础数据仓库进行构建,并按照维度进行划分。

  目前数据仓库中包括的信息如下:

画像数据仓库表20个画像数据仓库国内、国际 2年+数据标签数据每日增量
–基本数据

–业务数据

–搜索

–Booking

2.4 用户唯一标识设计

用户唯一标识是整个用户画像的核心,它把从用户开始使用app到下单到售后整个所有的用户行为轨迹进行关联,可以更好的去跟踪和描绘一个用户的特征。

  2.5 ETL过程设计-调度系统

依赖数据平台调度系统定时触发和Job依赖触发两种模式

  2.6 ETL过程设计-任务执行

ETL的过程主要是将数据源的清洗到数据仓库表的过程(每天更新增量)Summary表的处理逻辑(每天更新全量)标签库的处理(每周更新,2年全量)

  2.7 用户主题分析及数据挖掘

有了丰富的画像数据后,产品和运营人员可以根据用户主题进行数据分析和数据挖掘相关的工作。用户主题Cube的定义如下:

Measure:
–订单数量

–订单金额

–搜索次数

–Booking次数

Dimension:
–下单时间

–出发时间

–航司信息

–舱位信息

–航班(出发地、目的地)

–基本信息(年龄、性别等自然属性)

  3.用户画像标签构建策略

3.1用户标签特征属性

用户的特征属性可以是事实的,也可以是抽象的;可以是自然属性,比如性别,年龄,星座等,可以是社会属性,比如职业,社交,出生地等;还可以是财富状况,比如是否高收入人群,是否有豪车豪宅等固定资产,对于机票用户来讲位置特征也是比较重要的属性,比常驻地,常出差地,老家等。这些属性都可以清楚的描绘一个用户的画像特征。

画像标签一般根据公司的业务体系来设计,存储有HDFS,HBASE,ES标签的更新频率:每日更新,每周、每月更新标签的生命周期:有的数据随时间衰减迭代
3.2用户标签分类及特征项

提到用户画像就不得不提到一个词“标签”。标签是表达人的基本属性、行为倾向、兴趣偏好等某一个维度的数据标识,它是一种相关性很强的关键字,可以简洁的描述和分类人群。标签的定义来源于业务目标,基于不同的行业,不同的应用场景,同样的标签名称可能代表了不同的含义,也决定了不同的模型设计和数据处理方式。我们给机票用户画像打标签分类为两大类,基础类标签和个性化标签,这些标签可以有重复,但是都是通过不同的角度去定义和刻画一个用户,来满足不同的业务营销需求。

  3.3用户标签库构建流程

  4.用户画像技术架构

4.1 技术架构

  4.2 实施方法论

  5.用户画像数据应用实践

5.1 用户群体特征分析

设计目标
–根据条件可选项,输出筛选用户群体

–图形展示用户群体属性特征

应用场景

–如果筛选的用户群组满足业务的要求,将筛选条件形成参数

–根据参数提供接口查询

  5.2 客户行为预测

客户行为预测建立步骤

建模数据准备客户流失节点判断模型应用变量确定模型构建模型应用模型验证

  可以对用户流失做及时预测指导建议用户维系运营。

5.3 数据和业务在一起

用户画像与业务产品互相依赖,相辅相成

用户画像标签库丰富优化快速提供数据服务数据分析+机器学习+模型训练

  6.总结

用户画像作为大数据的根基,它完美的描述了一个用户的信息全貌,为进一步精准、快速的分析用户行为、消费等重要信息,用户画像仓库同时也提供了足够的数据基础,让我们Qunar更好的为用户提供高价值的服务,满足用户智慧出行的需要。

作者介绍李国芳,去哪儿网机票大数据组,精于架构,追求极致。曾先后搭建起机票实时数据处理系统,并主导用户画像项目,指导各业务线精准定位用户。在数据仓库方面,搭建saiku + kylin + hive平台,为运营及业务分析人员提供更快速精确的OLAP工具。技术涉猎广泛,乐于分享和激励新人。

本文转自d1net(转载)

时间: 2024-09-11 13:17:27

Qunar用户画像构建策略及应用实践的相关文章

基于用户画像的实时异步化视频推荐系统

前言 这个月做的事情还是蛮多的.上线了一个百台规模的ES集群,还设计开发了一套实时推荐系统. 标题有点长,其实是为了突出该推荐系统的三个亮点,一个是实时,一个是基于用户画像去做的,一个是异步化. 实时主要体现在三个层面: 1.用户画像中的的短期兴趣模型实时构建. 也就是你看完一个视频,这个视频几秒内就影响了你的短期兴趣模型,并且反应到你下次的推荐中. 2.候选集实时变更. 在我设计的推荐系统中,候选集的概念是不同类型的待推荐给用户的视频库,一个用户并不能看到某个候选集的全部,而是能够看到经过匹配

干货:如何构建用户画像

一.什么是用户画像? 男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟. 这样一串描述即为用户画像的典型案例.如果用一句话来描述,即:用户信息标签化. 如果用一幅图来展现,即: 二.为什么需要用户画像 用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如: 可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男.女比例是多少? 可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段

金融行业大数据用户画像实践

进入移动互联网时代之后,金融业务地域限制被打破.金融企业没有固定业务区域,金融服务面对所有用户是平的. 金融消费者逐渐年轻化,80.90后成为客户主力,他们的消费意识和金融意识正在增强.金融服务正在从以产品为中心,转向以消费者为中心.所有金融行业面对的最大挑战是消费者的消费行为和消费需求的转变,金融企业迫切需要为产品寻找目标客户和为客户定制产品. 一.用户画像背后的原因 1.金融消费行为的改变,企业无法接触到客户 80后.90后总计共有3.4亿人口,并日益成为金融企业主要的消费者,但是他们的金融

联想企业网盘基于Docker构建分布式部署框架实践

本文讲的是联想企业网盘基于Docker构建分布式部署框架实践[编者的话]本文首先介绍了企业级分布式系统部署所面临的挑战,并且结合联想云存储自有框架研发经验分享了一些解决问题的思想和具体做法.最后还与Kubernetes项目进行了简单对比. 众所周知,企业网盘在这两年呈现爆发式增长,越来越多的企业选择企业网盘,来解决企业在业务过程中面临的数据集中存储.共享.分发.协同办公以及移动化等痛点需求.同时将企业网盘整合到各个业务系统中,大幅提高企业的数据流转效率和安全! 而联想企业网盘增长尤为迅速,仅联想

大数据精准营销的关键“三部曲”及核心“用户画像”

大数据时代,实现精准营销并非无规律可循,关键三部曲,其中用户画像是核心: 第一步:知己,意味着知道自己产品的定位是什么,产品卖点是什么等等. 构建产品标签+内容标签. 第二步:知彼,简单的说就是清楚竞争对手的情况.清楚目标用户的情况. 构建用户标签,识别自身竞争力,选取切入点. 第三步:作战,对不同的对象采取不同的策略,直击痛点,实现转化. 序言 大数据时代下,企业如何驾驭数据,利用数据驱动.支持决策,是形成差异化竞争优势的关键所在.这听起来不错,但如何真正落地,是非常不容易的事,尤其是传统企业

看完这篇文章后,别再说自己不懂用户画像了

用户画像是一个挺新颖的词,最初它是大数据行业言必及之的时髦概念.现在我们运营谈及用户画像,它也是和精准营销.精细化运营直接钩挂的.这篇文章主要讲产品和运营角度的用户画像. 希望看完后,解决你一切关于用户画像的疑问. 什么是用户画像 用户画像一点也不神秘,它是根据用户在互联网留下的种种数据,主动或被动地收集,最后加工成一系列的标签.比如猜用户是男是女,哪里人,工资多少,有没有谈恋爱,喜欢什么,准备剁手购物吗? 我们常把用户标签和用户画像对等.但凡用户画像的文章,类似上文图片都会出现,有用烂的趋势.

《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一1.9 示例应用:SuperWebAnalytics.com

本节书摘来自华章出版社<大数据系统构建:可扩展实时数据系统构建原理与最佳实践>一书中的第1章,第1.9节,南森·马茨(Nathan Marz) [美] 詹姆斯·沃伦(JamesWarren) 著 马延辉 向 磊 魏东琦 译,更多章节内容可以访问"华章计算机"公众号查看. 1.9 示例应用:SuperWebAnalytics.com 在本书中,我们将创建一个大数据应用程序示例来说明一些概念.我们将为Google Analytics构建数据管理层-比如服务.该服务将能够每天追踪

用户画像数据建模方法

原文http://blog.baifendian.com/?p=8015 从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了"大数据时代".经历了12.13两年热炒之后,人们逐渐冷静下来,更加聚焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术.伴随着大数据应用的讨论.创新,个性化技术成为了一个重要落地点.相比传统的线下会员管理.问卷调查.购物篮分析,大数据第一

创建定性用户画像

在产品研发过程中,确定明确的目标用户至关重要.不同类型的用户往往有不同甚至相冲突的需求,我们不可能做出一个满足所有用户的产品. 为了让团队成员在研发过程中能够抛开个人喜好,将焦点关注在目标用户的动机和行为上,Alan Cooper提出了Persona这一概念."赢在用户"这本书将其翻译为"人物角色",在腾讯我们习惯了使用"用户画像"这个术语.表达的意思一样,是真实用户的虚拟代表,是在深刻理解真实数据的基础上得出的一个的虚拟用户.我们通过调研去了解