数据大规模流通与交易将会盛行,很大程度上已成为了业界对大数据未来应用模式的一个共识。
连在《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》和国务院印发《促进大数据发展行动纲要》中,都作出了关于推进数据资源开放共享的战略规划,要求各级政府引导培育大数据交易市场,开展面向应用的数据交易试点,探索开展大数据衍生产品交易,鼓励产业链各环节的市场主体进行数据交换和交易,促进数据资源流通,建立健全数据资源交易机制,规范交易行为等一系列健全市场发展机制的思路与举措。
虽然上有政策、下有产业展望,更有众多先行者已经投入参与到数据交易的试验田之中,但数据流通的模式究竟是怎样,恐怕目前还是一个懵懂的话题。
1、数据流通河流的形成
熟知地理的朋友都会清楚,河流的形成,首先源于高原或是高山上有冰川存在,冰川会随季节温度的变化而变化,温度上升,冰川消融形成若干条小溪,小溪随地势变化汇集到谷地,在谷底形成小河,若干小河又随地势慢慢汇集成大河,大河从山区奔涌出来得到沿途支流和降水的补给流淌进入海洋,同时河流冲刷掉河流底部的物质并带走,使得河床向下切割,最终形成稳定的河床。
未来的数据流通,宛如上述的河流形成过程,要勾画出一张完整的宏观大数据流通版图,需要首先深入理解数据的形成来源。
对于大数据的理解,很多刚接触的人简单理解为Hadoop+4V特征,存在海量异质异构的数据,需要新技术去应对,从而抽取出内涵的价值。诚然这个认识是说得通的,但却偏重于从科技角度去看待大数据,比如4V特征是IT厂家提出的,无论哪一个V,最终都演变为IT预算的提升,就正如当年淘金热,最后发财的是在河流旁边卖水和工具给淘金者的人。
而正因数据未来的潜在高流动性,我认为需要于从大数据的数据形成来源去深入理解。
数据的本质,是各类信息的数字化编码,数字化使得信息采集、存储、处理及分发的速度得到了不可思议的飞跃,也带领人类进入了信息爆炸的时代。而信息归根到底是以人为主体的、与客观世界各种其他客体之间交互的状态和变化的反映,也是人与其他事物之间相互连接和相互作用的表征。因此从这个角度理解,数据是以人与“其他事物”之间数字化连接下的信息副产物。
互联网逐渐赋予了我们与这些“其他事物”间无处不在的数字化连接,最早Web 1.0实现了人与信息的连接,门户网站、搜索引擎让我们冲浪于信息的海洋;SNS、IM分别以异步/同步的形式实现了人与人在互联网上前所未见的紧密连接;而传感器与物联网技术的兴起,让我们与物品也建立了数字化连接,与家中的空调、冰箱聊天不再天方夜谭;而O2O则开启了传统服务业的互联网化;最后则是产业互联网,过往传统产业无法知道自己的终端用户究竟是谁,而产业互联网将深度将产业与终端用户实现绑定连接。
而上述数字化连接的背后,将产生难以估量的数据,如人与人间的连接产生了海量的UGC数据,基于Twitter数据的股市情绪分析、舆情监测等应用都留下了有趣的想象空间,智能穿戴设备每天产生了大量的健康数据,正是基于互联网的数字化连接的出现,成为了大数据的繁衍温床。而随着将有更多事物与我们产生数字化连接,如大量的产业、更多的智能设备、车联网等,人类数据总量还会经历更为壮观的扩容。
2、数据流通宏观版图
大数据成于互联网的不断外延,数字化连接的必然结果就是孕育了海量的数据。在过去弱连接时代,运营商、银行等服务机构虽然探测用户行为的能力,但不同于交易数据,这些数量庞大、处理复杂的用户行为数据属于不需要强制记录的数据,而Hadoop等大数据技术,赋予了业界低成本的大规模数据存储及计算的工具,使得在这些数字化连接中有更多的数据得以沉淀,渐渐将汇聚为数据海洋,而这些数据又能反馈到数字化连接中,构建出一个有趣的全新版图。
▋物联网平原——越来越廉价的传感器让万物皆互联、智能感知变成了可能,智能化设备外延的扩大是更为清晰的趋势。在我们生活当中,将会有更多的传感器出现在不同物品之中,无论是智能跑鞋、可穿戴设备、智能家居设备、智能家电等,传感器及物联网一方面为它们带来了紧密的数字化连接,不同设备间能实现同步的通信,而为更为重要的是,这些传感器将会把我们一切的使用习惯与偏好、个人特征、潜在需求等都量化为数据,汇聚到大数据海洋之中,在未来,物联网将会成为大数据最重要的来源,就如一块广阔无边的平原一样,一旦进入,则一马平川。
如此前李宁连同小米推出了一款内嵌了传感芯片的智能跑鞋,我们先跳出其销量和客户评价高低,这款智能跑鞋概念上能收集到步数、距离、路线、步频、卡路里等跑步准常规数据,更能监测用户跑步时脚掌的落地方式和跑鞋缓解冲击比例等用户跑姿与跑鞋性能数据,并将数据上传到云端,同步为用户反馈回跑步统计数据及相关建议,以帮助用户提高运动水平,减轻运动劳损。而将来甚至能应用这些数据,提供健康计划,保险计划、跑鞋定制等服务,使得跑鞋本身已经脱离了传统的产品范畴。
▋服务互联网山谷——O2O开启了线下传统服务业与用户数字化连接的浪潮,而更为传统的电信运营商早已意识到在对用户让渡价值的过程中,能收集到海量的数据,形成运营商大数据之源,并依据数据提供个性化服务与推荐,形成反馈闭环。随着服务业——产业——用户三方连接的强化,服务互联网的蓝图将清晰呈现。
▋产业互联网山脉——说山脉是有原因的,产业互联网是一座此前甚少人能涉足的山区,在过去,对于大部分产业而言,核心在于大规模、低成本的生产。但目前产能将逐渐不再是产业瓶颈,智能生产、3D打印技术将带领我们进入个性化生产与服务的时代,互联网技术将对产业产生显著甚至决定性影响,成为产业的核心竞争力所在,产业互联网具体有几个趋势:
‖趋势一:产业-产品-用户建立反馈经济闭环连接。
在过去传统产业无法了解到终端用户是谁,更无从分析用户的产品使用行为,而物联网和传感器带来的智能化浪潮,让产品成为了产业与用户间的中枢,不断将数据输出到产业端,赋予产业快速反馈用户新需求的能力,而这个闭环代表了反馈经济在消费端的主要形态。
‖趋势二:产业与服务的界限逐渐模糊,客户运营商将产生。
反馈经济的兴起,颠覆了过往产业与用户的关系,从过去单纯的生产-销售关系转变为生产-销售-服务的关系,产业与服务间将越行越近,提供产品,相当于提供一个可持续运营客户的平台,小米的成功,归根到底就是从单纯的生产手机,跳跃到以小米手机为平台运营一个庞大的客户生态圈,任何客户的需求在这个生态圈中都可以得到快速反馈,社交平台、去中心化的方式让用户成为小米的核心工程师。
‖趋势三:智能工厂的产生。
产业与产品的从属关系将由计划经济走入以用户个性化需求为根基的智能生产,产业再也无法强塞给客户各种标准化的产品,而是根据客户的特征提供个性化的产品,而智能工厂则是为此而生。
▋社会化媒体高原——人与人之间的连接是传统互联网的根基之一,社交媒体为人类的经济与政治带来了深远的影响,而当几乎人人都有一个Twitter账号之后,社会化媒体将会发生怎样的演变?或许最大的趋势在于社会化媒体的主体化,围绕图片分享、职场关系催生了Instagram以及LinkedIn两个估值无限的SNS新模式,而围绕上述客户运营商的趋势,将来是否会围绕产品/兴趣产生更多的主体化社会媒体?我们拭目以待。
▋传统互联网极地——搜索引擎、门户网站等传统互联网应用的影响力将逐渐受到冲击,而人与信息的连接,未来核心趋势也许在于Siri式的人工智能大数据引擎。Siri、Cortana满足普通大众对于信息的智能化搜寻,而更多基于专业领域大数据的人工智能系统将逐渐出现,如IBM基于Watson的医疗大数据人工智能系统,她能“听懂”医生的自然语言问题,同时快速分析堆积如山的医疗研究数据给出答案。趋势的本质,在于人类知识图谱的智能化,知识的爆炸将超越人类物理学习的能力范畴,如何让人类拥有一个“数字化外脑”,帮助人类个体连接到个体学习永远不可想象的庞大知识数据,是知识图谱智能化的核心任务。
3、未来:数据流通的专业化分工
各个疆域数字化连接所产生的数据,汇聚为一条条河流,最终汇入无际的大数据海洋(Ocean of Bigdata),而来自五湖四海的数据需要重新回到大陆上,届时,数据将出现三个“长尾”特征,即数据的供给是长尾的,数据的需求也是长尾的,而数据本身同样是长尾。因此,数据大规模的流通和交易将成为大数据的一个核心业态,一方面数据不再被少量巨头所垄断,另一方面各行各业都需要数据作为反馈经济的生产资源,一个社会化的数据交易平台与通道的出现,将会是最为经济的选择。
因此,从这个角度理解,大数据的流通和交易,是彻头彻尾的流通业务场景问题,在不同的区域板块中,数据流通会有显著不一样的模式,各个领域甚至都有自己的数据流通标准,因此我预测会一种创新性的区域产业行数据交换组织将会诞生,那就是产业数据交换联盟(Industrial Data-Exchange Alliance)。产业数据交换联盟是一种围绕特定产业的企业成员制组织,如交通大数据交换联盟、金融大数据交换联盟等,其服务于成员间的数据交易,并致力于打造低成本、规范化的数据流通平台。对内产业数据交换联盟指定严格的成员行为准则,明确保护个人用户数据隐私,并制定联盟内部标准数据交换协议(Standard-Data Exchange Protocol),统一数据标准。
正因如此,大数据流通的产业内专业化分工,是大数据流通逐渐走向成熟的标志,一个个产业数据交换联盟将会在自己的版图内加速数据流通河流的形成,正如河流形成的历史上,由于地面上水潭或湖泊太多,影响了远古人类的生产生活,远古人类于是有意识的疏浚这些水域,又加快了河流的形成。
本文转自d1net(转载)