数据挖掘与数据化运营实战. 2.4 互联网行业数据挖掘应用的特点

2.4 互联网行业数据挖掘应用的特点

相对于传统行业而言,互联网行业的数据挖掘和数据化运营有如下的一些主要特点:

数据的海量性。互联网行业相比传统行业第一个区别就是收集、存储的数据是海量的,这一方面是因为互联网的使用已经成为普通人日常生活和工作中不可或缺的一部分,另一方面更是因为用户网络行为的每一步都会被作为网络日志记录下来。海量的数据、海量的字段、海量的信息,尤其是海量的字段,使得分析之前对于分析字段的挑选和排查工作显得无比重要,无以复加。如何大浪淘沙挑选变量则为重中之重,对此很难一言以蔽之的进行总结,还是用三分技术,七分业务来理解吧。本书从第7~12章,几乎每章都用大量的篇幅讨论如何在具体的分析课题和项目中选择变量、评估变量、转换变量,乃至如何通过清洗后的核心变量完成最终的分析结论(挖掘模型)。

数据分析(挖掘)的周期短。鉴于互联网行业白热化的市场竞争格局,以及该行业相对成熟的高级数据化运营实践,该行业的数据分析(挖掘)通常允许的分析周期(项目周期)要明显短于传统行业。行业技术应用飞速发展,产品和竞争一日千里,都使该行业的数据挖掘项目的时间进度比传统行业的项目模式快得多。一方面要保证挖掘结果的起码质量,另一方面要满足这个行业超快的行业节奏,这也使得传统的挖掘分析思路和步调必须改革和升华,从而具有鲜明的Internet色彩。

数据分析(挖掘)成果的时效性明显变短。由于互联网行业的用户行为相对于传统行业而言变化非常快,导致相应的数据分析挖掘成果的时效性也比传统行业明显缩短。举例来说,互联网行业的产品更新换代很多是以月为单位的,新产品层出不穷,老产品要及时下线,因此,针对具体产品的数据分析(挖掘)成果的时效性也明显变短;或者说,用户行为变化快,网络环境变化快,导致模型的维护和优化的时间周期也明显变短,传统行业里的“用户流失预测模型”可能只需要每年更新优化一次,但是在互联网行业里类似的模型可能3个月左右就有必要更新优化了。

互联网行业新技术、新应用、新模式的更新换代相比于传统行业而言更加迅速、周期更短、更加具有颠覆性,相应地对数据分析挖掘的应用需求也更为苛刻,且要多样化。以中国互联网行业的发展为例,作为第一代互联网企业的代表,新浪、搜狐、雅虎等门户网站的Web 1.0模式(传统媒体的电子化)从产生到被以Google、百度等搜索引擎企业的Web 2.0模式(制造者与使用者的合一)所超越,前后不过10年左右的时间,而目前这个Web 2.0模式已经逐渐有被以微博为代表Web 3.0模式(SNS模式)超越的趋势。具体到数据分析所服务的互联网业务和应用来说,从最初的常规、主流的分析挖掘支持,到以微博应用为代表的新的分析需求,再到目前风头正健的移动互联网的数据分析和应用,互联网行业的数据分析大显身手的天地在不断扩大,新的应用源源不断,新的挑战让人们应接不暇,这一切都要求数据分析师自觉、主动去学习、去充实、去提升自己、去跟上互联网发展的脚步。

时间: 2024-09-06 12:29:11

数据挖掘与数据化运营实战. 2.4 互联网行业数据挖掘应用的特点的相关文章

数据挖掘与数据化运营实战

大数据技术丛书 数据挖掘与数据化运营实战:思路.方法.技巧与应用 卢辉 著 图书在版编目(CIP)数据 数据挖掘与数据化运营实战:思路.方法.技巧与应用 / 卢辉著.-北京:机械工业出版社,2013.6 (大数据技术丛书) ISBN 978-7-111-42650-9 I. 数- II. 卢- III. 数据采集 IV. TP274 中国版本图书馆CIP数据核字(2013)第111479号 版权所有·侵权必究 封底无防伪标均为盗版 本书法律顾问 北京市展达律师事务所     本书是目前有关数据挖

数据挖掘与数据化运营实战.导读

 本书是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供"菜单化"实战锦囊的著作.作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的"非技术"语言和大量活泼生动的案例,围绕数据分析挖掘中的思路.方法.技巧与应用,全方位整理.总结.分享,帮助读者深刻领会和掌握"以业

数据挖掘与数据化运营实战. 1.2 数据化运营的主要内容

1.2 数据化运营的主要内容 虽然目前企业界和学术界对于"数据化运营"的定义没有达成共识,但这并不妨碍"数据化运营"思想和实践在当今企业界尤其是互联网行业如火如荼地展开.阿里巴巴集团早在2010年就已经在全集团范围内正式提出了"数据化运营"的战略方针并逐步实施数据化运营,腾讯公司也在"2012年腾讯智慧上海主题日"高调宣布"大数据化运营的黄金时期已经到来,如何整合这些数据成为未来的关键任务". 综合业界尤其

数据挖掘与数据化运营实战. 2.2 统计分析与数据挖掘的主要区别

2.2 统计分析与数据挖掘的主要区别 统计分析与数据挖掘有什么区别呢?从实践应用和商业实战的角度来看,这个问题并没有很大的意义,正如"不管白猫还是黑猫,抓住老鼠才是好猫"一样,在企业的商业实战中,数据分析师分析问题.解决问题时,首先考虑的是思路,其次才会对与思路匹配的分析挖掘技术进行筛选,而不是先考虑到底是用统计技术还是用数据挖掘技术来解决这个问题. 从两者的理论来源来看,它们在很多情况下都是同根同源的.比如,在属于典型的数据挖掘技术的决策树里,CART.CHAID等理论和方法都是基于

数据挖掘与数据化运营实战. 1.3 为什么要数据化运营

1.3 为什么要数据化运营 数据化运营首先是现代企业竞争白热化.商业环境变成以消费者为主的"买方市场"等一系列竞争因素所呼唤的管理革命和技术革命.中国有句古语"穷则思变",当传统的营销手段.运营方法已经被同行普遍采用,当常规的营销技术.运营方法已经很难明显提升企业的运营效率时,竞争必然呼唤革命性的改变去设法提升企业的运营效率,从而提升企业的市场竞争力.时势造英雄,生逢其时的"数据化运营"恰如及时雨,登上了大数据时代企业运营的大舞台,在互联网运营的

数据挖掘与数据化运营实战. 2.3 数据挖掘的主要成熟技术以及在数据化运营中的主要应用

2.3 数据挖掘的主要成熟技术以及在数据化运营中的主要应用 2.3.1 决策树 决策树(Decision Tree)是一种非常成熟的.普遍采用的数据挖掘技术.之所以称为树,是因为其建模过程类似一棵树的成长过程,即从根部开始,到树干,到分枝,再到细枝末节的分叉,最终生长出一片片的树叶.在决策树里,所分析的数据样本先是集成为一个树根,然后经过层层分枝,最终形成若干个结点,每个结点代表一个结论. 决策树算法之所以在数据分析挖掘应用中如此流行,主要原因在于决策树的构造不需要任何领域的知识,很适合探索式的

数据挖掘与数据化运营实战. 3.6 信息质量模型

3.6 信息质量模型 信息质量模型在互联网行业和互联网数据化运营中也是有着广泛基础性应用的.具体来说,电商行业和电商平台连接买卖双方最直接.最关键的纽带就是海量的商品目录.商品Offer.商品展示等,无论是B2C(如当当网.凡客网),还是C2C(如淘宝网),或者是B2B(如阿里巴巴),只要是以商业为目的,以交易为目的的,都需要采用有效手段去提升海量商业信息(商品目录.商品Offer.商品展示等)的质量和结构,从而促进交易.在同等条件下,一个要素齐备.布局合理.界面友好的网上店铺或商品展示一定比不

数据挖掘与数据化运营实战. 1.4 数据化运营的必要条件

1.4 数据化运营的必要条件 虽然从上面的分析可以看出,数据化运营有如此多的优越性,但并不是每个企业都可以采取这种新战略和新管理制度,也不是每个企业都可以从中受益.个中原因在于成功的数据化运营必须依赖几个重要的前提条件. 1.4.1 企业级海量数据存储的实现 21世纪核心的竞争就是数据的竞争,2012年3月29日,美国奥巴马政府正式宣布了"大数据的研究和发展计划"(Big Data Research and Development Initiative),该计划旨在通过提高我们从大型复

数据挖掘与数据化运营实战. 3.4 用户路径分析

3.4 用户路径分析 用户路径分析是互联网行业特有的分析专题,主要是分析用户在网页上流转的规律和特点,发现频繁访问的路径模式,这些路径的发现可以有很多业务用途,包括提炼特定用户群体的主流路径.网页设计的优化和改版.用户可能浏览的下一个页面的预测.特定群体的浏览特征等.从这些典型的用途示例中可以看到,数据化运营中的很多业务部门都需要应用用户路径分析,包括运营部门.产品设计部门(PD).用户体验设计部门(User Experience Design,UED)等. 路径分析所用的数据主要是Web服务器