人人都是“数据动物” 大数据分析激活产业链

  马云在给阿里巴巴员工的一封内部邮件中说,以控制为出发点的IT时代正在走向激活生产力为目的的DT(data technology)数据时代。随着计算机技术的发展,大数据运算变得越来越现实,基于大数据应用服务的公司不断崭露头角。大数据在营销领域的应用将广告变成了“窄告”——精准营销,而在互联网金融大热的背景下,大数据在金融业征信方面的应用也在逐渐兴起。

  人人都是“数据动物”

  不同于“天空中没有留下鸟的痕迹,但我已飞过”,人们不论是网上聊天、购物还是浏览网页、发微信、微博,都会或多或少留下记录,这些记录以数据的形式被存储下来。随着移动互联网的迅猛发展,无论在何时、何地、何处,手机等各种网络入口以及无处不在的传感器等都会对个人数据进行采集、存储、使用、分享。而大量的数据结合起来,通过分析,不难还原出一个人的“样子”——数据化的形象。

  很多人在浏览网页时都有这样的体验,网站上的广告位所出现的广告往往是自己最近浏览过的产品,或是最近搜索过的内容,这背后就是大数据在营销上应用。

  北京集奥聚合科技有限公司就是一家大数据服务提供商,公司推出的DataQuate解决方案主要用于解决运营商大数据的接入、挖掘及应用,为运营商大数据的价值转化提供端到端服务。

  集奥聚合所做的正是通过大数据的挖掘,帮助广告主更精准地进行广告投放。据集奥聚合CMO段培力介绍,公司通过系统地对海量的、碎片化的网络用户行为数据进行梳理,采用科学的分类法和特征模型进行数据挖掘及用户建模,最大程度逼真还原“用户画像”,分析获得用户多维度信息,实现数据的商业价值。

  尽管这样的广告很大程度上具有一定滞后性,但相比于过去“漫天撒网”式的广告投放,在精准性上已经有了较大程度的提升。段培力表示,用户数据的“新鲜”程度,直接影响到用户的回复率。数据对于用户兴趣判定的准确性会随着时间迅速降低,因为该浏览者很可能已经完成了一次购买行为。因而数据光是有量还远远不够,数据方还必须保证时效性。

  此外,目前的大数据技术多将数据还原到某一终端,基于PC端的数据由于无法区分具体的数据源自一人或多人,也可能出现不够精确的情况。不过,随着移动互联网的普及,手机终端的一对一特性,则为大数据追踪到具体用户创造了条件。段培力认为,现有的大数据基础加上实时数据分析,甚至数据源的动态跟踪,将有助于广告的推送更加精准并具有前瞻性。

  事实上,大数据的商业应用远远不止营销这一个领域,集奥聚合新近开发了针对互联网金融的个人征信数据产品。“实际上不管是营销还是征信,数据的搜集方法都是一样的,只是数据输出的维度不同。” 段培力介绍说。

  大数据分析激活产业链

  根据IDC过去五年的研究,全球数据量大约每两年翻一番。然而,大数据产业链上常常出现一个怪相:有数据的公司不知道怎么用,需要数据的公司又没有足够的数据来源,或分析数据的技术。在这种背景下,大量大数据服务公司产生,它们通过大数据技术从各种各样类型的数据中快速获得有价值的信息,并提供给需要数据的公司。

  作为建设和管理数据管道的运营商,在大数据领域有天然的资源优势。以一个省级电信运营商为例,每天能产生70~100TB的数据量,几十亿次点击的上网记录。运营商已经认识到信息资产的价值含量,并正在着手建设其用户数据仓库。不过,由于行业应用与数据运营的经验有限,运营商需要面向应用的数据挖掘,需要数据的价值转化工具和运营层面的战略合作伙伴。

  据业内人士介绍,根据所提供价值的不同来源,目前主要有三种大数据公司。三种数据来源是指:数据本身、技能与思维。

  基于数据本身的公司往往拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。例如微博等社交网络和运营商。前文所提到的集奥聚合则属于基于技能的公司。这些公司能够进行不同程度的大数据整理和分析,提供给需要数据的公司使用。而基于大数据思维的公司,则通过现有数据的加工,创造性地为用户提供更具价值的想法和建议。这些公司成功的关键不在于占有多少数据和分析数据的技能,而是其创新的思路。

  阿里巴巴的金融业务就是基于其数据资产进行商业创新的重要成果。阿里巴巴在金融业的全面布局已经对传统银行、保险、小贷等多个行业形成冲击,尤其在技术、模式和思维上已经形成巨大的冲击,且将推动金融产业格局的重构。而这也正是马云宣称要“摇一摇”传统金融的基础。

  一位正在大数据领域创业的人士告诉中国证券报记者,他所从事的大数据业务将为金融企业提供有关个人的数据化行为分析,并进行评级,以推动金融产品的差别定价。例如,给予个人信用好的贷款人更低的贷款利率;或给驾驶行为良好的有车族提供更低的车险保费。

  隐私保护的矛盾

  隐私问题一直是越来越社交化的互联网争论的热点,而大数据时代则将这一争论进一步推向高潮。大数据来自于具体的网络行为,作为做出这些行为的个人,最关心的当然是自己的隐私数据会不会被泄露和滥用。

  据媒体报道,欧洲议会的一项研究报告表示:云计算大数据已经对个人隐私造成了比想象中更加严重的威胁。该报告还称:云计算的隐私威胁被低估了。大数据时代现有的技术手段保护对于个人隐私而言远远不足,除了要建立健全个人隐私保护的法律法规和基本规则之外,鼓励隐私保护技术的研发、创新和使用,从技术层面来保障隐私安全,完善用户保障体系。

  据段培力介绍,集奥聚合所采用的是非cookies(访问网络时储存在用户本地终端上的数据)数据,不仅能够更全面地进行受众描述,也有助于保护用户隐私信息。“在网络上,其实有很多地方都属于"公共场合",比如网店、网站公开信息等,用户在这些区域产生的数据是我们主要使用的。”

  据了解,集奥聚合在隐私安全方面拥有独家首创的核心技术,公司采用三级数据安全技术全面保障用户数据的隐私安全。第一级采用集奥聚合大数据采集解决方案,在数据源头消除用户隐私;第二级采用大数据挖掘和价值应用解决方案,系统间通过IPSEC隧道协议通信,具有不可否认性、发重播性、数据完整性、数据可靠性和认证功能;第三级采用大数据挖掘解决方案,运维支撑系统通过SSL隧道协议维护挖掘系统,具有身份识别和数据加密功能。

时间: 2024-09-24 15:19:52

人人都是“数据动物” 大数据分析激活产业链的相关文章

激活数据 Teradata大数据分析瑞士军刀

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;       [IT168 专稿]谈到大数据,很多人往往会津津乐道地提起"啤酒和尿布"的故事.这个故事产生于美国沃尔玛超市,看起来,啤酒和尿布似乎完全是面向完全不同顾客群的商品,但沃尔玛通过对数据做产品关联性分析,结果显示:在居民区中尿布卖得好的店面啤酒也卖得很好.原来,一般太太让先生买尿布的时候,先生一般都会犒劳自己两听啤酒,因此啤酒和尿布一起购

[重磅]清华大数据产业联合会"应用创新"系列第1讲:大数据分析(46PPT)

2014年11月26日晚,清华大数据产业联合会成立仪式在清华大学舜德楼401室召开,联合会依托于清华大学独特的师资和生源优势.清华大学多个院系和学科在大数据相关领域多年的积累与探索,联合大数据产业链中的优秀龙头企业与创新企业,旨在提供大数据产业链的思维碰撞与资源对接平台,促进产.学.研良性互动,以产业需求带动复合型大数据人才的培养,推动大数据生态系统中的各方合作共赢.会议由联合会秘书长王霞主持. 到场的嘉宾有: 清华大学杨斌副校长,清华大学数据科学研究院执行副院长.清华大数据产业联合会会长韩亦舜

大数据百科:传统分析 vs 大数据分析

"大数据"是用来表示大量的没有按照传统的相关格式存储在企业数据库中的非结构化数据的总术语.以下是大数据的一般特点. 数据存储量相对于当前企业TB(TERA BYTES)字节的存储限制,定义在PB(PETA BYTES)字节,EXA字节以及更高的容量顺序. 通常它被认为是非结构化数据,并不适合企业已经习惯使用的关系型数据库之下数据的生成使用的是数据输入非传统的手段,像无线射频识别(RFID),传感器网络等. 数据对时间敏感,且由数据的收集与相关的时区组成. 在过去,专业术语"分

解读:大数据分析及其数据来源

当我们谈到大数据分析,首先需要确定数据分析的方向和拟解决的问题,然后才能确定需要的数据和分析范围.大数据驱动的分析主要的挑战不是技术问题,而是方向和组织领导的问题,要确定方向,提出问题,需要对行业做深入的了解.当然,大数据分析最核心的,关于数据的来源更是至关重要的.在数据量非常大的今天,如何以更高的效率获取到分析所需要的数据,如何利用这些数据反应最真实的情况,是业内不断探讨的议题.接下来,小编就带大家来了解下大数据分析及其数据来源. 大数据分析 大数据分析,顾名思义,就是对规模巨大的数据进行分析

人人手中的数据资产——对话阿里妈妈超凡

对话阿里妈妈超凡:人人手中的数据资产大数据时代的来临让越来越多的人明白数据这种资产的价值和重要性.在海量的数据基础下,推广者的投放需求与消费者之间能够进行越来越精准的匹配,此时,需要有个数据管理平台可以被客户所认知,并产生价值.而阿里妈妈达摩盘的关键是拥有足够的数据量,并且进行 多维度的挖掘分析,以此将营销内容准确地投放到目标人群面前.这对于阿里来说,先天拥有优势.阿里平台本身就产生足够多的数据,且阿里系的其他公司也能产生大量的数据,因此阿里集团需要有一个独立的水平平台,不绑定任何垂直平台,而T

大数据分析工具要怎样适应企业需求

现在人人都在谈大数据,大数据已经从当初一个模糊的概念逐渐发展为一个成熟的行业.企业希望利用大数据来为自己寻求发展契机,于是部署大数据分析工具就成了当务之急.我们知道,没有最好,只有最合适,那么企业该如何选择适合自己大数据分析工具呢? 一. 根据业务选择 企业的业务不同,对大数据分析工具的要求也不同.如电商.零售业希望能及时地把握市场信息,了解用户画像:而制造业.航空产业则更希望了解行业内部的信息,特别是竞争对手的行为动态. 在大数据分析工具中,这一切都是在数据分析的前提下得出的,这就需要大数据分

你不了解的数据:大数据信息与数据

      全球 微软合作伙伴在大数据上的潜力将达到每年600亿美元. 目前大部分的企业所分析的数据量一般以TB为单位.按照目前数据的发展速度,很快将会进入PB时代.特别是目前在100-500TB和500+TB范围的分析数据集的数量会呈3倍或4倍增长. 2012年7月到9月一项来自欧洲针对184名IT和业务专业(数据)人士所作的调查报告显示,企业在数据管理和BI方面愿意投入更多的资金.56%的企业预计明年BI分析的投入会有所增长,43%则计划在数据仓库和分析数据库上增加预算.虽说大数据的使用还处

如何理解大数据分析

如今,云计算的热潮似乎还没散去,行业厂商就已经开始关注下一个热点:大数据.而与以往的炒作周期一样,现在的大数据对于用户来说其来源比较混乱,因为供应商提出了自己独特的,并且经常相互矛盾的定义和术语. 大数据定义之所以混乱的最常见的原因,是人们将大数据存储与大数据分析的结果混为一谈."大数据"一词起源于开源社区,其开发和分析过程比传统的数据仓库速度更快,扩展性更强,并且可以通过网络在用户每天产生的大量非结构化数据中提取价值. 大数据的存储是相关的,其旨在解决大量的非结构化数据,助长企业级的

推荐六个用于大数据分析的最好工具

在大数据和大数据分析,他们对企业的影响有一个兴趣高涨.大数据分析是研究大量的数据的过程中寻找模式,相关性和其他有用的信息,可以帮助企业更好地适应变化,并做出更明智的决策. 一.Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架.但是 Hadoop 是以一种可靠.高效.可伸缩的方式进行处理的.Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理.Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处