大数据能力?不是你想说有就能有

“大数据”概念被滥用的情况越来越严重,“大数据”能力需要有漫长积蓄过程,绝非“想用就能用”。

2016年可谓是中国的“大数据之年”,不仅国家推行“大数据战略”,倡导发展互联网新经济,各行各业也都在谈论大数据的前景。国务院总理李克强5月出席大数据产业峰会并提出大数据驱动信息产业升级的战略导向。大数据一时成为了各大企业都争相推拥的热词。

单纯从字面理解,大数据描述的是一个巨量数据的概念。而在实际的应用上,“大数据”更类似“光年”一样,当光指引到时间中,就成为了描述距离的单位,而把海量的有效数据进行有针对性的整合分析时,他就可以对用户行为进行描述,为我们的生活提供各种各样的决策和指引。

随着国家大数据战略的推行,“数聚”、“精准”等概念纷纷涌现。然而,在各大品牌层出不穷的新玩法下,“大数据”概念被滥用的情况越来越严重。笔者之见,“大数据”能力需要有漫长积蓄过程,绝非“想用就能用”。

在品牌宣传上,大数据的概念常常被有意无意地偷换,主要表现在,“有数据”并不等于大数据。大数据存在5V的特征,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。除了存有数据的基本条件外,还需满足以上五个维度。因此,大数据是一个非常严格的概念。

一个企业的大数据实力如何,主要基于其拥有的数据资产的数量和质量,同时也取决于数据的维度,及对海量数据的开发运用能力(内部算法)。因此不少巨头在不断扩张自己数据库容量的同时,也在通过并购整合,拓宽其自身数据资产的覆盖度和完整度,同时提升自己对数据的运算能力。

以阿里巴巴为例,阿里拥有庞大的用户群体以及十多年的用户数据积累。其大数据资产,无论从数量还是质量上,在中国处于绝对领先地位。但究其根本,其主要数据维度主要集中在电商领域。随着阿里巴巴不断的跨领域扩张,其大数据维度也随之丰富起来。UC浏览器、高德地图、优酷土豆、新浪微博等多个领域产品的加入,阿里大数据基于移动信息领域的矩阵逐渐扩展。截至目前,据不完全统计,阿里大数据矩阵至少包含了电商、阅读、社交、搜索、地图、视频、应用、游戏等维度的用户行为数据,从覆盖率和完整度上,应该是目前BAT三大巨头中最具优势的。

然而,企业收集到“多维度”的数据只是第一步,如何运用、创造价值是接下来面临的考验。在数据价值的“落地”上,各个企业也正在积极探索。

移动互联时代深受“信息过载”的诟病,“如何实现信息与人更为精准的连接”是整个行业未来探索的方向。为了能够给用户提供最佳的内容获取决策,除了需要对数据宽度与厚度进行累积,还需要让数据变得更加“聪明”。通俗来讲,企业需要能够对用户产生的每个数据进行统计、分析与开发,并以此帮助用户做出决策。

以UC为例,从阿里大数据中的高德地图POI数据可以知道用户当下处于的特定场景,根据对“时间+地点”的描述分发用户当下最需要的资讯;此外,在淘宝、神马搜索、优酷等多维数据的互通下,可以知道用户对不同类型资讯的需求。此外,UC的算法还能实现根据不同领域按权重绘画属于该用户的用户画像,在基本的人群聚类下再继续进行需求分层。

以上用户数据的分析及处理,将形成个人定制化数据库,之后,再根据算法进行精准推送,目前常用的推荐算法有三种:

第一代基于“协同过滤”,即收集大量的用户浏览记录,通过相似行为进行关联推荐。由于算法简介,逻辑清晰,可行性强,这种算法被大多数企业采用,例如今日头条、天天快报等都是采用的这种算法,但其也存在缺陷。由于获取数据的手段有限,数据不能够真实的反应出用户对信息的需求,很容易让用户深陷在自己的“兴趣爱好”当中;

第二代基于“搜索”,在分析了用户的核心兴趣点之后,通过隐式搜索的方式,给用户结果,这是在搜索引擎全面普及后出现的数据算法。但是与第一代算法类似的是,不同的人搜索相同的信息有不同的目的,而不同的时间地点搜同样的信息也有不同的目的,用同样的标准衡量用户行为,容易产生误判;好处是,对第一代算法所产生的“信息孤岛”效应有了较大的减弱,较容易形成兴趣圈群。在这方面做得比较好的是一点资讯。

第三代基于“社群+场景”,从“人”的角度,切入到具体的社群,实现“人以群分”;从内容的角度,切入到具体场景,这也是目前算法的发展趋势,比较典型的是以阿里大数据矩阵为依托的UC头条。

不过,就目前而言,实现“社群+场景”精准分发还处于一个比较理想的阶段,体现在“社群+场景”有一系列苛刻的要求,基础要满足的就是精准的用户画像绘制。眼下有此能力的恐怕也只有BAT三家。

当然,一个行业的成功除了能够给用户带来改变,自身还应具备优秀的商业化能力,以实现行业的可持续发展。Facebook、Twitter等企业对大数据在信息流里的商业模式早有示范。其中,Facebook移动广告营收公司总营收的82%(2016年Q1财报),是基于大数据的精准定向广告流为收入带来快速增长。而这种模式能够适用并持续增长,其主要原因是B端与C端的互利,B端的广告在更为精准、高效推送到用户外,C端获取了精准的信息,不会影响用户体验。

如以上所列举的“在高德地图里形成固定的商圈,在UC头条相应商圈的资讯就会推送给你”,这样一次信息与人的精准连接,对用户来说,带来是获取价值信息时间成本的缩小;对内容提供者来说,是潜在受众价值的挖掘;而对广告主而言,是高效、精准传递受众的价值实现。在这里面,满足的是消费测、供给侧、商业测三方需求。

大数据时代不止于“大”,企业对数据资产的厚度与深度的积累成为了决定大数据成败的关键,在大数据被日益滥用的今天,笔者更希望在时代大趋势下,大数据能真正落地,至少不止一个阿里巴巴。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-10-29 16:40:57

大数据能力?不是你想说有就能有的相关文章

禽流感考验政府大数据能力

"大数据"能力不仅是一种统计技术和数据分析能力,更考验着政府在信息上的开放和透明. 在令人恐惧的http://www.aliyun.com/zixun/aggregation/12631.html">SARS事件过去10年后,令人不安的禽流感又来了. 最新报道:4月9日上海新增确诊2例人感染H7N9禽流感病例,浙江新增2例:全国共发现确诊病例28例,共8人死亡.一个好消息是,上海4岁感染H7N9禽流感男童康复:一个坏消息是,农业部称不排除更大范围检出H7N9禽流感.人们

饶少阳:运营商急需网络大数据能力

在"合作共建大网络"专题峰会上,中国电信北京研究院网络规划中心副主任饶少阳表示,网络大数据通过运用大数据技术,分析和挖掘网络上用户流量流经各网元产生的数据,可实现网络的可视化,当前运营商急需网络大数据能力. 饶少阳指出,随着SDN/NFV等技术的发展,网络朝着越来越灵活的方向发展,只有建立在可感知基础上的网络,灵活的调整才是更有意义的.而网络大数据可以改变运营商运营网络的方式 ,最终可实现数据驱动运营.实现的方式是:通过采集和综合散布于网络各处的数据,将用户的发展情况,用户-应用网络质

IBM升级大数据能力帮助企业拓展价值

文章讲的是IBM升级大数据能力帮助企业拓展价值,2013年11月13日,IBM宣布其大数据能力再度升级.利用业界领先的认知计算和预测分析技术,IBM正在帮助全球企业更轻松地预测和应对大数据挑战,赢得机遇.此外,基于IBM BLU Acceleration技术的进一步扩展,企业用户得以通过更加高速的分析软件发掘海量数据中的价值. 利用新的IBM大数据软件,企业能够在本身的IT基础架构上应用认知智能的基本元件,帮助员工从大数据中获得洞察,而不是仅仅关注如何应对庞大的数据量."洞察"将有助企

百度发布大数据引擎 开放核心大数据能力

中介交易 SEO诊断 淘宝客 云主机 技术大厅 [摘要]合作机构能利用百度大数据能力来改造和优化传统行业企业管理.产品服务设计.商业模式等环节. 腾讯科技讯(乐天)4月24日消息,百度今日宣布正式发布大数据引擎,将包括开放云.数据工厂.百度大脑三大组件在内的核心大数据能力开放,通过大数据引擎向外界提供大数据存储.分析及挖掘的技术能力. 百度"大数据引擎"包括开放云.数据工厂.百度大脑构成,将大数据存储.分析和智能化处理等一整套核心能力,通过平台化.接口化方式对外开放.合作机构和传统企业

中国企业对商业智能及大数据能力的提高有越来越多的需求

摘要: 瀚纳仕公司最新发布的调查显示,中国企业对商业智能及大数据能力的提高有越来越多的需求.然而另一项由广州华大鑫盛网络科技有限公司针对2753家企业的调研显示,尽管中国的ER 瀚纳仕公司最新发布的调查显示,中国企业对"商业智能"及"大数据能力的提高"有越来越多的需求.然而另一项由广州华大鑫盛网络科技有限公司针对2753家企业的调研显示,尽管中国的ERP发展时间不短,但20多年来实施应用成功率只有10%左右,本来应该为企业决策提供数据支撑的信息化管理系统,用着用着最

应用大数据能力

应用大数据能力 --当当网在个性化推荐&精准营销方面的探索 傅强  2012云计算架构师峰会 [下载地址]:http://bbs.chinacloud.cn/showtopic-15561.aspx

如何获取阿里巴巴的大数据能力?

平台定位 图一 数加平台的定位 面对不同的用户,数加平台定位也各不相同.对于开发者而言,它是一站式数据采集.加工和应用的平台:面向企业用户,数加平台提供了影视.金融.电商.交通.通用等行业解决方案:面向服务商,数加平台提供的更多是行业内先进的技术引擎.开发平台,丰富大数据应用经验. 产品概览 数加的产品大致分为三层,在座的各位会比较关心最上层的数据应用,刚才大家体验的智能语音交互就是其中之一,后面还会给大家介绍其他几个智能工具.除了成熟的数据应用之外,中间还有两个开发平台,一个是算法开发的平台.

量子计算机将如何改变大数据能力?

9月7日消息,据福布斯杂志报道,我们每天能产生2.5EB(约合10亿GB)数据,这相当于25万个美国国会图书馆或500万台笔记本电脑记录的内容.我们有32亿个全球互联网用户,他们每分钟在Pinterest上发布9722个Pin,在Twitter发布347222条消息,在Facebook上留下420万个"点赞",我们还通过拍照和视频.保存文件.打开账户等行为产生其他大量数据. 我们正处于传统计算机数据处理能力的极限,而数据却依然在不断增长.虽然摩尔定律(Moore's Law)预测集成电

2020年M2M收入达160亿美金 运营商需加强“大数据”能力

在日前召开的"ICT中国·2016高层论坛" 上,安永大中华区科技媒体和电信行业的主管合伙人张伟雄指出,2020年M2M收入将达到160亿美金.运营商可以在M2M价值里面找到新的角色定位,一方面与设备上进行友好合作,另一方面一定要掌握大数据分析能力. 张伟雄表示,2015年M2M收入已经达到有60亿美金,2020年我们相信它会在收入里面增长三倍,达到160亿美金. "从2012年到2015,中国已经做好M2M基础建设准备."张伟雄预测,未来4年是中国IOT市场发展的