需要一点想象力——九谈大数据时代

  记得2005年在业内鼓吹WEB2.0革命的时候,得到最多的有两类反应。一类可以称之为虚无派,他们说讨论这事虚无缥缈,没有马上就能挣钱的模式。一类可以称之为停滞派,他们说讨论这事有什么新鲜,我们的某某东西早就是WEB2.0了。随后几年的产业发展证明了这两类说法的无知与荒谬。

  今天在业内鼓吹大数据时代即将到来的时候,得到最多的仍然是同样两类反应。虚无派说大数据云山雾罩,看不出有什么钱途。停滞派说大数据有什么新奇,老子的数据很大,挖掘技术很高。我想,今后几年的产业发展又将证明这两类说法的无知与荒谬。

  一些不肯认真读点想点东西的人,一看到大数据这个词,就望文生义地想到数据要大,却忘记了大数据的其他基本特性,需要反复加以提醒。

  大数据的特性之一是数据的完整性和综合性。很多业内朋友一谈起大数据,就习惯性地盘点起自己那点存货,或者那些可以直接从自身服务中可以获取的东西。考虑到目前互联网的发展还在非常初级的阶段,现有网络服务都是简化,扭曲,片面地对现实世界的浓缩和裁剪,由此产生的数据是零乱的,破碎的,局部的,其中所含有的含金量是极其有限的。如果同意这个世界上的万事万物可以而且正在被数据化和网络化,那么由此产生的大数据就必然是完整的和综合的,不仅包括网络公司通过自身服务所获得的用户行为数据,而且包括社会的,经济的,政治的,自然的方方面面的数据。这些数据当然分散在不同企业,机构和政府部门手中,汇聚整合在一起绝非易事,但操作上的困难并不能否定大数据本身的完整性和综合性。今天之所以讨论大数据时代的到来,是因为互联网发展到目前阶段使得现实世界数据化发展到了一定程度,各种信息终端普及到了一定程度,数据获取的成本降到了一定程度,使得完整和综合的数据不仅是一种理想,也正在变为现实。

  大数据的特性之二是数据的开放性和公共性。正是因为完整的综合的大数据难以由一家公司,机构或政府部门所获得,所以大数据必然产生于一个开放的,公共的网络环境之中。这种开放性和公共性的实现取决于若干个网络开放平台或云服务以及一系列受到法律支持或社会公认的数据标准和规范。任何封闭的或单向获取的数据都不可能是大数据,无论这些数据的规模有多大。

  大数据的特性之三是数据的动态性和及时性。天体物理学和理论物理学早就依赖于从宇宙间获取的大量数据,类似的学科还有环境生态学,医药学,和自控技术。但是,这和我们今天讨论的大数据不是一回事。今天的大数据是基于互联网的及时动态数据,不是历史的或严格控制环境下产生的东西。

  所以,今天我们谈论的大数据是完整综合的,开放公共的,动态及时的,这样的大数据是我们过去从未有机会获取利用过的全新挑战,也是我们未来应该努力去争取利用的全新战略机会。如果有人以为过去积累的那点数据就是大数据,或者过去积累的数据处理利用能力和经验就可以在大数据时代自然领先,那不是无知就是狂妄。

  近来媒体上对大数据方向的进展报道颇多,其中一个很能说明我心目中大数据的性质及其利用的前景。据8月30日《纽约时报》的报道:一家名为气候公司(Climate Corporation)的创业企业每天都会对美国境内超过一百万个地点,未来两年的天气情况进行超过1万次模拟。随后,该公司将根系结构和土壤孔隙度的相关数据,与模拟结果相结合,为成千上万的农民提供农作物保险。

  通过遥感获取土壤数据,这和我们过去所熟悉的通过网络服务获取用户网络行为数据不是一回事,数据的概念得以极大的扩充。每天对百万以上地点进行成万次的模拟,其数据量庞大,动态,及时。要想对每块田地提供精准的保险服务,肯定还需要与土地数据相配套的农产品期货数据,气候预测数据,国际贸易数据,国际政治和军事安全数据,国民经济各方面的数据,产业竞争数据,等等。在如此庞杂的大数据基础上推出的商业模式,是创新的,同现有农作物保险方式相比是具备极大竞争力的,是可持续和规模化的。更妙的是,这家公司基于大数据的运营,完全没有进行高额的网络设施投资,只是租用了亚马逊的公共云服务,一个月几万美元而已。

  如果留心观察,这样的案例已经很多了,虽然都还比较简单初级,但足以说明问题。如果展开一下我们的想象力,类似上述案例的创新,在即将到来的大数据时代可以在任何行业,任何服务,任何公共管理上出现,由此可能产生的服务和商业模式是无穷尽的。同现有或现在还没有的服务和商业模式相比,服务更加精准,成本更加低廉,利润更加丰厚。这不是目前网络业所熟知的对现有用户数据的挖掘,不是对用户进行更精细的分组,不是现有数据技术的普及应用,而是一个全新的世界,一个全新的网络地球和数据地球。一个理想的前景是,一个以网络业为核心的大数据服务业会成为今后几十年9374.html">世界经济和社会发展的主要推动力。当然,这事未必一定发生,尤其是在中国。如果我们网络业的朋友们没有雄心,没有想象力,那也可能除了少数公司成为大数据服务业的主力外,其他大部分公司仍然固守在陈旧的网络业内苦苦挣扎,变成大数据时代的传统产业大军中的一员。

时间: 2024-11-08 18:16:48

需要一点想象力——九谈大数据时代的相关文章

放眼业界看得见的未来 十谈大数据时代

本文讲的是放眼业界看得见的未来 十谈大数据时代,半年前开始讨论大数据时代的到来时,大数据还只是个专业小圈子里探讨的话题.到今天大数据这个概念已经在业界内外和大众媒体上沸沸扬扬地广为传播,并不断涌现出这个方向上的努力与创新了.正所谓"历史潮流,浩浩荡荡,顺之者昌,逆之者亡",这个过去只用在政治话题上的说法借过来描述大数据时代的到来与迅猛发展的形势真是再恰当不过. 站在不同角度看大数据,它既可能是大机会,大发展,大创新,也可能是大危机,大破坏,大淘汰. 目前,最活跃的领域是网络终端创新和网

谢文:法律标准与事实标准----八谈大数据时代

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 苹果与三星的专利大战有了初步结果,苹果大胜,三星惨败.就像世界杯预选赛一样,这场大战是双场制,在韩国打一场,在美国打一场,以避免主场优势.在韩国打成3:3,法院判双方都有侵权行为,苹果净赔偿不过几万美元.在美国打成7:0,三星要赔苹果10亿多美元.三星发誓要上诉,但败局已定,纠缠下去可能输的更多.韩国法院象征性地在本国禁售了苹果几款过时型号的产品,苹果很可能要求在美国禁售三星的当红产品.考虑到不对称的市场规模,三星最好寻求和解.以韩国民族主

看得见的未来——十谈大数据时代

半年前开始讨论大数据时代的到来时,大数据还只是个专业小圈子里探讨的话题.到今天写到系列文章的最后一篇时,大数据这个概念已经在业界内外和大众媒体上沸沸扬扬地广为传播,并不断涌现出这个方向上的努力与创新了.正所谓"历史潮流,浩浩荡荡,顺之者昌,逆之者亡",这个过去只用在政治话题上的说法借过来描述大数据时代的到来与迅猛发展的形势真是再恰当不过. 站在不同角度看大数据,它既可能是大机会,大发展,大创新,也可能是大危机,大破坏,大淘汰. 目前,最活跃的领域是网络终端创新和网络基础设施创新,也就是

谢文谈大数据时代:产业链将发生重组性巨变

互联网进入商业化市场化运营的二十多年来,产业生态环境和产业链都发生了天翻地覆的变化.在即将到来的大数据时代,网络业的产业链也必将发生重组性的巨变. 近年来,网络业经历着一系列深刻的变化,姑且称之为"分离化".在网络业早期,典型的模式是一个网络公司开发运营一个网站,其中包含若干产品和服务,公司的服务器通过网络线连接一台网络终端对一位用户服务,由此产生的网络数据归公司独有,形成单一固定封闭的循环.但时至今日,这种模式已经难以应对产业的发展.一个公司的网络产品和服务,未必只通过自己网站运营,

院士谈大数据时代的国家治理(上)

2月26日上午,在人民大学召开了一场以"开放政府数据"为题的研讨会,会议由中国人民大学社会转型与社会管理协同创新中心主办,由中国人民大学原常务副校长.社会转型与社会管理协同创新中心主任冯慧玲主持.中国人民大学校长陈雨露会见与会嘉宾.中国工程院院士.中国计算学会大数据专家委员会主任李国杰做了题为"数据共享--大数据时代国家治理体系现代化的前提"的精彩演讲.以下文字摘自李院士演讲.   本来是重点讲一些怎样评价一个城市或一个国家数据开放做的好不好的标准,后来想一下这个问

聚沙成塔 集腋成裘----四谈大数据时代

在地球任意地方捡起一块石头,都可以验出铁元素.但是,说世界遍地都是铁矿一定是胡扯.只有石头中铁含量超过一定比例,而石头数量又达到相当规模,这堆石头才能称为铁矿,人们才会对它产生投资开采的兴趣.如果铁矿石埋藏不是太深,开采和运输的成本不是太高,市场有长期稳定的购买需求,那么铁矿开采的兴趣才会变成行动,成为一个有利可图的商业活动. 同样的道理也适用于对于大数据由来的分析.有了互联网,也就有了网络数据.随着网民的增加和网络服务的日益丰富,网络数据也就丰富起来.做个网站,上面罗列些服务,无论它们是新闻资

谢文:看得见的未来——十谈大数据时代

一.迎接大数据时代 如果你的网站拥有数以千万计的活跃用户,如果网站上拥有数以百计的产品服务,如果这些服务以多媒体的形式在多个网络终端上运行,如果正在或者打算尝试走向云计算和WEB2.0架构,那就恭喜你了,因为你已经不知不觉地成为大数据时代的先行者或受害者. 按照维基百科上的定义,所谓"大数据"(big data)在当今的互联网业指的是这样一种现象:一个网络公司日常运营所生成和积累用户网络行为数据"增长如此之快,以至于难以使用现有的数据库管理工具来驾驭,困难存在于数据的获取,存

孕育中的数据服务业——六谈大数据时代

自从苹果公司先后推出iPhone和iPad红遍全球,全世界进入了若干产业被颠覆,若干产业被重组,若干公司被干掉的大乱局面.以近来谷歌和微软相继推出平板电脑为标志,再加上它们在手机操作系统以及手机制造上的努力,可以说传统的产业划分和商业模式分析需要重新来过了. 从产业分析的角度看,今天再把网络业,IT业,电信业和软件业分开看已经什么都说不清楚了.传统的TMT概念(电信,媒体和信息技术业的统称)更是应该被扔进历史垃圾堆.一个重新定义过的大网络业概念可能会更加贴切地反映高度变动中的世界和日益模糊的产业

聚沙成塔集腋成裘——四谈大数据时代

在地球任意地方捡起一块石头,都可以验出铁元素.但是,说世界遍地都是铁矿一定是胡扯.只有石头中铁含量超过一定比例,而石头数量又达到相当规模,这堆石头才能称为铁矿,人们才会对它产生投资开采的兴趣.如果铁矿石埋藏不是太深,开采和运输的成本不是太高,市场有长期稳定的购买需求,那么铁矿开采的兴趣才会变成行动,成为一个有利可图的商业活动. 同样的道理也适用于对于大数据由来的分析.有了互联网,也就有了网络数据.随着网民的增加和网络服务的日益丰富,网络数据也就丰富起来.做个网站,上面罗列些服务,无论它们是新闻资