互联网公司收集数据的利器:埋点

前言

很多人还没搞清楚PC互联网的时候,移动互联来了;我们还没搞清移动互联的时候,大数据时代又来了。伴随大数据时代的到来,我们生活中产生的数据呈现出巨大的增长,互联网每2天产生的数据相当于2003年之前产生的数据一样多。

马云说过,大数据就是未来的石油。越来越多的互联网公司开始重视数据的应用。数据应用的一个过程是:数据收集——数据整理——数据分析——数据可视化。经济基础决定上层建筑,数据收集是数据应用的基础,数据收集的重要性不言而喻。数据不会撒谎,但生活中,我们往往被数据纯洁的外表所欺骗。所以我们也要注重数据的质量。那么互联网公司是如何收集数据的?这其中就不得不提出一个很关键的人物——「埋点」。

埋点技术

所谓「埋点」,就是在正常的功能逻辑中添加统计逻辑。拿统计微信右上角「+」的点击次数为例,上报的数据可以采用KEY-VALUE形式,我们定义KEY为「CLICK_ADD_BTN」,VALUE的值为点击的次数。当用户点击「+」时,展示菜单的代码会通过按钮的「回调」来触发执行,程序猿在业务代码执行完后,又加上了统计代码,把「CLICK_ADD_BTN」对应的VALUE加1,「+」被统计到了一次使用。

目前常见的前端埋点技术有3类:代码埋点、可视化埋点、无埋点(无埋点属于埋点的一个子集)。

代码埋点:控件操作发生时通过预先写好的代码来发送数据。

优点:控制发送数据时间,事件自定义属性详细记录

缺点:时间、人力成本大,数据传输的时效性。

可视化埋点:利用可视化交互手段,通过可视化界面配置控件操作与事件操作发生关系。通过后台截屏的方式采集数据。

优点:成本低,速度快

缺点:行为记录信息少,支持的分析方式少

无埋点:Growing IO和Heap analytics,这2家是国内与国外的无埋点技术公司代表。用户展现界面元素时,通过控件绑定触发事件,事件被触发的时候系统会有相应的接口让开发者处理这些行为。现在市面上主流无埋点做法有两种,一种是预先跟踪所有的渲染信息,一种是滞后跟踪的渲染信息。

优点:无需埋点,方便快捷

缺点:行为记录信息少,传输压力大

总结

最后,关于埋点有无问题,可视化埋点和代码优劣问题,不管选择哪个都要从自身情况去考虑,自身分析场景来体验和对比,选择最适合自己的。适合自己的才是最好的。

本文作者:数控小V

来源:51CTO

时间: 2024-10-22 13:51:56

互联网公司收集数据的利器:埋点的相关文章

sqlite-从SQLite单行索引中收集数据

问题描述 从SQLite单行索引中收集数据 有一个在数据库中单行索引,需要收集分数. 23 然后在收集之后相加. String[] projection2 = {BorrowMeTable.COLUMN_CREDIT_SCORE };Cursor databaseCursor2 = getContentResolver().query(uri projection2 null null null);int number = 0;if (databaseCursor2 != null) { whi

奥巴马提议政府从企业收集数据 以解决薪酬差距问题

据外媒报道,美国总统奥巴马正提议推出一项政府从美国每个企业收集数据的新举措,以解决员工收入不平等的问题.该项措施提议政府需要从每个企业收集100多名员工的数据,以便解决6300多万不同性别和种族企业员工的薪酬差距问题. Salesforce首席执行官马克·贝尼奥夫(Marc Benioff)承认,该公司的20000名员工中,女性员工的总收入比男性员工少300万美元. 他表示:"建立平等的薪酬制度是每位CEO的职责所在. 这是我们这个时代及大部分公司面临的最大变革." 美国劳工部部长托马

10种令人惊讶的方式你的日常生活中正在收集数据的大数据野兽

10种令人惊讶的方式你的日常生活中正在收集数据的大数据野兽 原文:http://www.bloomberg.com/slideshow/2014-06-03/10-surprising-ways-your-daily-life-is-feeding-the-big-data-beast.html 无处可逃 大数据是你日常生活中,不管你喜欢与否的重要组成部分 - 甚至是意识到这一点. 当你去看医生,去到你的手机上工作或获得方向,有一个很好的机会,有软件在那里悄悄地收集和分析这些信息.并根据不同的情

微软公布Windows 10收集数据细节 控制措施更完善

微软表示,从今天开始,微软更新其隐私声明并发布Windows 10收集数据有关细节.微软首次发布了在基本级别收集诊断数据的完整列表.微软还提供了从基础和全面诊断的用户收集数据的详细摘要.微软正在最新的"创作者更新"中引入更好的Windows 10数据收集级别控制措施,这将在下周开始广泛推出. 这项措施允许用户在基本和完整级别的数据收集之间进行切换.微软团队自从周年纪念更新以来一直在努力重新评估在基本层面收集数据的必要性,以使Windows 10设备保持最新和安全.因此,微软将收集事件数

利用Access新推出功能SharePoint component收集数据

这都Web 2.0的时代啦,要是直接通过网络来收集数据,life就easy了呀.不仅如此,Walter同学在上一篇的留言里提及了GoogleDocs, 这么好的segue引出Access Services,在这里谢过Walter了 :) 先说Access Services是什么吧.Access Services是2010新推出的一个SharePoint component,功能在于把一个Access文档发布到SharePoint网站,这样一来Access窗体和报表就变成了网页,直接通过浏览器浏览

未挖掘到足够信息:非收集数据少,是利用率只有1%

Gurjeet Singht,Ayasdi联合创始人兼CEO.在Gigaom上带来了关于当下大数据技术的看法,Singht认为:从查询开始分析数据本身就是一个死胡同,并指出了当下的大数据只完成了万里长征的第一步. 以下为译文: 许多人都会被震惊,如果他们知道研究人员只是从收集到数据中1%的数据进行分析和提取见解.而就是这1%被分析的数据支配了革新和见解,现在我们称之为"大数据".而在每天收集的1 quintillion(百万3次方)字节的数据中,有99%的数据完全未被利用. 我们都知道

晨亮:如何有效快速的收集数据

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 最近几天晨亮一直在看有关数据分析的文章,也在实践怎样收据晨亮所需要的目标数据. 对于做网络营销或者网络推广这块,很多站长朋友都或多或少的会知道,数据在工作中的重要性.因为数据不仅仅可以检验我们的工作进度,然后恰当的调整,还可以帮助我们根据数据分析得到最有效果的推广方法和合作手段,更可以监控合作,推广的效果. 结合这几天晨亮收集alexa20万

从空调系统中收集数据的房屋等各种基于互联网的工具

被誉为"互联网之父"的谷歌副总裁温顿·瑟夫(Vinton Cerf)日前在CES大展上表示,可穿戴的网络设备虽然先进,但也应当适可而止.例如可以上网的衬衫就不太适合成为产品.瑟夫在CES大会的一个分论坛上问到,"如果衣服能上网会来带怎样一番情形?"虽然这可以方便人们找到想用的东西--内嵌的RFID芯片会帮助人们进行位置识别,但这种设计用途也会带来多余的监视问题.如果一位丈夫告诉他的妻子,自己在公司加班,但妻子却发现他的衬衫在某个酒吧里,这就会带来麻烦."或

谷歌隐私政策剧变:短期内不会停止收集数据

摘要: 对利润的追逐驱使谷歌更改隐私政策( 腾讯科技配图) 美国沃顿商学院旗下电子杂志<沃顿知识在线>近日撰文称,谷歌更改隐私政策的行为引发了广泛争议,欧盟和美国的监管机构就率 对利润的追逐驱使谷歌更改隐私政策(腾讯科技配图) 美国沃顿商学院旗下电子杂志<沃顿知识在线>近日撰文称,谷歌更改隐私政策的行为引发了广泛争议,欧盟和美国的监管机构就率先要求谷歌暂停这一隐私更改政策.然而无论是从法律还是文化角度分析,大西洋两岸的冲突都各不相同.而谷歌短期内则不会停止收集数据. 以下为内容全文