如何更有价值采集数据、高效分析数据?

上回说到,用户行为数据的意义和价值《为什么要做用户行为分析?》,以及互联网产品用户模型的构建,这其中就包含了对数据的采集和分析两大块儿,本文将从数据采集的三大要点、如何让分析更有价值更高效、以及数据分析思维三部分展开聊。

一、数据采集的三大要点

1、全面性

数据量足够具有分析价值、数据面足够支撑分析需求。

比如对于“查看商品详情”这一行为,需要采集用户触发时的环境信息、会话、以及背后的用户id,最后需要统计这一行为在某一时段触发的人数、次数、人均次数、活跃比等。

2、多维性

数据更重要的是能满足分析需求。灵活、快速自定义数据的多种属性和不同类型,从而满足不同的分析目标。

比如“查看商品详情”这一行为,通过埋点,我们才能知道用户查看的商品是什么、价格、类型、商品id等多个属性。从而知道用户看过哪些商品、什么类型的商品被查看的多、某一个商品被查看了多少次。而不仅仅是知道用户进入了商品详情页。

3、高效性

高效性包含技术执行的高效性、团队内部成员协同的高效性以及数据分析需求和目标实现的高效性。

基于以上三点,我们看如何让数据采集更准确、分析更有用以及团队内部更高效。

二、数据分析价值性和高效性

step1:明确数据驱动目标

数据采集切忌大而全,数据分析需求也是随着产品不断迭代的,明确长远和当前阶段的分析需求,让分析更有目的性,技术执行更高效。

场景举例:

小葛是公司的产品经理,小诸是技术,最近两人都认识到了数据在产品运营和决策中的重要性,经过几个数据平台的调研,最后,选择了诸葛io,并且已经明确了当前阶段的数据需求…

小葛:“小诸忙吗,文档中那个,登录流程、注册转化、购买转化、分享转化等是长远需要关注的数据指标,务必埋上哦;对于发现功能呢,两个礼拜后我们会提交一个新版本,先不埋了啦,辛苦啦。”

小诸:“小葛,你真棒,一会儿我就给你埋好了呢!”

小葛:“哦,还有,注册那个页面我们有个推荐人选项,需要用户输入推荐人账号,采集的时候别采账号啊,我只想看注册用户是否有推荐人的分布,把那个属性处理成判断哦”

小诸:“这简单。那今晚…”

看着小葛转身要离开了,小诸欲言又止,默默地继续敲代码了…

step2:按需采集数据

带着需求和分析目标去采数据,不仅避免了数据冗余带来的无从下手,也避免了全量采集之后却不知道要分析什么的尴尬。

图示为埋点范例:

图示文档可由数据分析需求人员整理,表格梳理让需求人员和技术人员协同更高效,也大大提升了后续的分析价值和效率

step3:多维交叉定位问题

对数据的应用可分为一般分析和探索性分析。一般分析包括对日常数据如新增、活跃、留存、核心漏斗的监测分析,也包括对各部门日常业务的数据监测。监测每日增长,分析异常情况,比如对注册失败、支付失败事件的监控和及时优化。

探索性分析是对数据的高级应用。对核心事件的相关性分析、挖掘产品改进关键点等,如促进用户购买的相关性分析、找到促进留存的Ahamoment等。

step4:优化产品、优化运营策略

基于数据反映的问题,做到实时监控和及时解决,基于分析得到的增长启发,去做A/B测试、灰度测试、去MVP实践。

step5:衡量

衡量是数据分析到实践的最后一步,当然,也可能是第一步。有时候我们看似找到了增长点,但实验发现,事实并不如预期,不要灰心,不要丧气,更不要不吃饭,分析过程中对用户的理解、对业务的深度挖掘可能会让下一次优化产生累计价值。

三、数据分析思维

数据采集固然重要,数据分析的方法论也很重要,但不要迷信数据,因为更重要的,可能是人的创造力和想象力!数据分析也从来不是一劳永逸的,产品在不断迭代,业务在不断更新,从认知到决策,数据更多的是起到了辅助的作用,从梳理需求、到采集、到分析、到实践、再到衡量,它是始终循环在企业增长的整个过程中的。

最后,那些改变世界的程序猿,他们始终希望能用自己的技术创造更多的价值,很多时候,他们要的可能是明确的数据需求、明确的分析目标,以及一套高效协同的方法,毕竟,谁都认为:能准确解决问题、能驱动业务增长,更!重!要!

本文作者:韩重明 诸葛io

来源:51CTO

时间: 2024-10-22 19:10:29

如何更有价值采集数据、高效分析数据?的相关文章

如何更有价值采集数据、高效分析数据?

上回说到,用户行为数据的意义和价值<为什么要进行用户行为分析?>,以及互联网产品用户模型的构建,这其中就包含了对数据的采集和分析两大块儿,本文将从数据采集的三大要点.如何让分析更有价值更高效.以及数据分析思维三部分展开聊. 一.数据采集的三大要点 1.全面性 数据量足够具有分析价值.数据面足够支撑分析需求. 比如对于"查看商品详情"这一行为,需要采集用户触发时的环境信息.会话.以及背后的用户id,最后需要统计这一行为在某一时段触发的人数.次数.人均次数.活跃比等. 2.多维

怎么做好网站优化参考数据与分析数据

现在百度统计的功能很强大,一个小小的统计工具就能够帮助我们完成很多以前不能够完成的事情,比如说用户是从哪个地方来的,又是通过什么搜索词进入的,百度统计都能够详细的提供这些数据   通过图中我们可以看出来源网址.搜索词.人口页面.受访页面,我觉得这已经不是一款简单的统计工具了,而这包含了很多SEO要素,而在网站优化的时候我们也非常有必要安装百度统计,因为其中的很多数据都是我们需要参考并利用的,下面我来谈谈我的看法: 第一.访问来源网站必须理清 访问来源网站可以有效的帮助我们获得外链布局,虽然我们可

4个步骤让你的网站分析报告更有价值

从哪里入手撰写网站http://www.aliyun.com/zixun/aggregation/8188.html">分析报告?报告中应该选择和使用哪些指标?如何让分析结果更有价值?这些都是在我们在撰写网站分析报告时经常遇到的问题.本篇文章分享一个创建网站分析报告的流程,通过四个步骤让分析报告变的更有价值. 1.明确分析目的,挖掘有价值的分析需求 网站的商业目的产生分析需求,而需求的价值则直接影响分析结果的价值.因此在开始撰写一份网站分析报告前,我们先要仔细思考并充分挖掘分析需求的价值.

《精通Wireshark》—第1章1.4节通过Wireshark进行数据包分析

1.4 通过Wireshark进行数据包分析 数据包分析(也称为数据包嗅探或协议分析)的作用是抓取在网络(以太网或WiFi)传输中的数据包,并且对其中的信息进行解答的过程,其目的在于了解网络中正在发生的情况.数据包分析需要借助像Wireshark这样的协议分析软件来实现,这些软件可以在互联网上进行下载.其中有些软件是免费的,也有一些软件需要付费才能用于商业目的.在本书中,我们会使用Wireshark来进行网络分析.Wireshark是一款开源软件,同时也是互联网上最优秀的免费网络分析软件. 在当

《Python数据分析与挖掘实战》一3.1 数据质量分析

3.1 数据质量分析 数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础,没有可信的数据,数据挖掘构建的模型将是空中楼阁. 数据质量分析的主要任务是检查原始数据中是否存在脏数据,脏数据一般是指不符合要求,以及不能直接进行相应分析的数据.在常见的数据挖掘工作中,脏数据包括如下内容. 缺失值. 异常值. 不一致的值. 重复数据及含有特殊符号(如#.¥.*)的数据. 本小节将主要对数据中的缺失值.异常值和一致性进行分析. 3.1.1 缺失值分析

《R语言数据分析与挖掘实战》——第3章 数 据 探 索 3.1 数据质量分析

第3章 数 据 探 索 根据观测.调查收集到初步的样本数据集后,接下来要考虑的问题是:样本数据集的数量和质量是否满足模型构建的要求?有没有出现从未设想过的数据状态?其中有没有什么明显的规律和趋势?各因素之间有什么样的关联性? 通过检验数据集的数据质量.绘制图表.计算某些特征量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索.数据探索有助于选择合适的数据预处理和建模方法,甚至可以完成一些通常由数据挖掘解决的问题. 本章从数据质量分析和数据特征分析两个角度对数据进行探索. 3.1 数据质量

吴健:小数据大心得 数据收集分析重在执行力

中介交易 SEO诊断 淘宝客 云主机 技术大厅 在我的网络推广集训系列文章第二篇<吴健:将微博做到极致,其实你也可以>中主要分享了完成牟长青师傅的第一个关于微博任务后的心得和一些增加听众的技巧,文章发布后受到许多同行朋友的关注,也纷纷加我QQ交流,在交流过程中我提的最多就是"执行力"这一词. 其实在那篇文章中,我也重点阐述了执行力在网络推广工作中的重要性,而这种重要性,在我完成长青师傅第二个关于数据收集分析任务的过程中体会更为深刻.本篇文章我也将于大家一起分享链接平台数据收

什么叫大数据,大数据与云计算彼此真的亲密无间吗?

大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取.管理.处理.并整理成为帮助企业经营决策更积极目的的资讯. 大数据的4V特点:Volume.Velocity.Variety.Veracity.大的数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据.适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统.互联网.云计算以及大数据,如今成了

PK BAT,运营商大数据其实更有价值

要谈起大数据,必然要提到BAT等互联网公司,它们在大数据领域是先发者,不过这也很正常,因为它本身是有数据基因的,其天然的在线性,其血液中流淌着BIT的血,并通过BIT的形式来售卖自己的产品和服务,它如果不提大数据,不提DT,反倒是不正常了,况且他的数据处理能力和应用成熟度也是领先的.但是,从对整个社会的价值角度讲,其数据也是很受局限的,而运营商的数据也许更有代表性和竞争力. 互联网大数据公司的劣势 先来说说BAT等互联网公司的大数据,其数据存在局部性.割裂性.封闭性和全面性等问题哦,当然这仅代表