李国杰院士谈大数据热:近期力戒忽悠

中国工程院院士李国杰

“其实,生物信息学、脑科学、空间科学等基础研究早就采用数以PB级计">的大数据,却没能引发大数据浪潮。大数据如今引起各方重视,主要还是因为它蕴藏着巨大的经济价值。”

近日,在北京召开的“大数据背景下的计算机和经济发展高层论坛”上,中国工程院院士李国杰表示,我国开展大数据研究,一定要以企业为主体,充分调动企业和经济界学者的积极性。

大数据在经济领域应用的一个有趣案例,是通过社交网络预测股价涨落。社交媒体监测平台DataSift监测了社交网站Facebook首次公开募股当天Twitter上的情感倾向与Facebook股价波动的关联。在Facebook开盘前,Twitter上的情感逐渐转向负面,25分钟之后,Facebook股价便开始下跌。而当Twitter上的情感转向正面时,Facebook股价在8分钟之后也开始了回弹。最终当股市接近收盘、Twitter上的情感转向负面时,10分钟后Facebook的股价又开始下跌。该机构得出最终的结论是:Twitter上每一次情感倾向的转向都会影响Facebook股价的波动。

“预测股价,是公认的很难做到的事,但大数据分析也能发挥作用。”李国杰说,“其他过去认为做不到的事情,也许大数据分析都能派上用场。因此,我们的当务之急是多实践,实践出知识,实践出理论。只有当每个领域的数据分析做得相当深入时,才能提出数据科学的共性问题。”

虽然大多数单位其实仍处于“小数据”处理阶段,但李国杰认为,企业和政府部门都不必太在意自己正在分析的是不是“大数据”,更不必花精力对各种名词和定义作无谓争论。“只要在纵向上有一定的时间积累,在横向上有较丰富的记录细节,通过多个源头对同一个对象采集的各种数据有机整合,进行认真仔细的数据分析,就可能产生大价值。”

李国杰还提醒,要对我国在大数据方面的技术基础落后有清醒认识。由于我国人口最多,网民也最多,许多人估计我国每年新数据的增量应该在世界上名列前茅。但仅就数据量而言,我国还不是数据大国。根据麦肯锡公司的报告,2010年美国新增数据量为3500PB,欧洲为2000PB,中国仅为250PB。也就是说,我国每年新增数据量仅为美国的7%、欧洲的12%。

“当然,大数据的关键并不在数据量的大小,而在于获取有效信息的能力和数据分析能力的高低。”李国杰说,“但在大数据领域,我国与世界先进国家也不在同一条起跑线上。”

现在涉及大数据的会议很多,但李国杰觉得政府、企业和学术界未必真正理解大数据的重大意义。“许多人对变革性技术的效益估计往往是,近期过于乐观,远期估计不足。”

他自己的判断是,如同云计算、物联网一样,近几年内大数据的市场规模不会很大,全世界大概只有数百亿美元。但是,大数据市场的增速将是传统IT产业的好几倍。“对近期的大数据市场不能估计过高,不能自己忽悠自己。开展大数据研究和应用一定要有长远眼光。”

(责任编辑:蒙遗善)

时间: 2024-09-25 21:05:23

李国杰院士谈大数据热:近期力戒忽悠的相关文章

中国工程院院士李国杰:现有大数据计算框架亟待提升

[CSDN现场报道]2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研.应用与产业发展为主旨的 2014中国大数据技术大会 (Big Data Technology Conference 2014,BDTC 2014)暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店盛大开幕. 2014中国大数据技术大会首日全体会议中,中国工程院院士,中国科学院计算技术研究所研究员李国杰首先介绍了BDTC与其他论坛的区别:

院士谈大数据时代的国家治理(上)

2月26日上午,在人民大学召开了一场以"开放政府数据"为题的研讨会,会议由中国人民大学社会转型与社会管理协同创新中心主办,由中国人民大学原常务副校长.社会转型与社会管理协同创新中心主任冯慧玲主持.中国人民大学校长陈雨露会见与会嘉宾.中国工程院院士.中国计算学会大数据专家委员会主任李国杰做了题为"数据共享--大数据时代国家治理体系现代化的前提"的精彩演讲.以下文字摘自李院士演讲.   本来是重点讲一些怎样评价一个城市或一个国家数据开放做的好不好的标准,后来想一下这个问

院士谈大数据时代的国家治理(下)

  接上文,李院士的课题组,提出政府开放数据的六项原则: 开放原则:政府信息资源以共享为原则,不共享为例外.注意开放与保护隐私的平衡. 保障安全原则:根据安全等级确定数据共享的范围. 价值导向原则:开放的政务数据资源应具有经济价值和社会价值,共享的目的是促进数据资源的利用. 质量保障原则:内容完整可信,数据格式方便使用,内容及时更新 责权利统一原则:政务数据拥有部门承担数据开放的责任,依法明确可开放数据的范围.用户对下载后数据的使用行为负责. 数字连续性原则:被开放的政务数据资源应维护其数字连续

浅谈大数据现状:误区严重 人才紧缺

文章讲的是浅谈大数据现状:误区严重 人才紧缺,大数据现在很热,企业.个人都在谈论,每个人对大数据有着自己不同的看法和观点,但是笔者通过日常与朋友们聊天,发现很多朋友对大数据仍然具有一些观念上的误区,比如很多人会认为大数据是一个最新的技术,还有一些朋友认为多有数据只服务自己一个人等等,这些问题我们在本期都会与大家讨论. 大数据不是一项最新技术 大数据现在已经融入我们的生活,人们在日常工作办公的时候都会接触到大数据,这些大量数据总会以不同的形式,以及庞大的数量存在和运用,这也导致了很多朋友认为大数据

DataStax公司CEO谈大数据和云计算

本文讲的是DataStax公司CEO谈大数据和云计算,DataStax是大数据时代下诞生的创业公司,近一个月的时间里,DataStax完成了B轮1100万和C轮2500万美元的融资,成为近期大数据市场中表现最强势的公司.DataStax的CEO Billy Bosworth也是数据库技术领域的传奇人物,他拥有超过了20年的数据库市场经验,同时也在著名软件公司Quest(被Dell收购)和Embarcadero担任过管理职务. 近期,Bosworth接受了媒体的采访,他与记者探讨了关于大数据和云计

Facebook前主管谈大数据技术趋势和演变

本文讲的是Facebook前主管谈大数据技术趋势和演变,全球系统架构师大会于8月10-12日在深圳万科国际会议中心隆重举行.首先给大家带来分享的是前Facebook数据基础设施团队主管,Qubole创始人,CEO Ashish Thusoo,他主要介绍了大数据架构以及怎么样不断的演进,与其说演进,不如说革命.其中主要包括三个方面的主题: ▲全球系统架构师大会现场报道 第一,大数据的需求.当今世界需要大数据,有哪些驱动因素促使我们不同方式考虑大数据?以不同方式处理数据. 第二,技术给我们带来哪些架

火币网徐宝龙谈大数据网络攻防与区块链

文章讲的是火币网徐宝龙谈大数据网络攻防与区块链,2017年5月11日-13日,2017中国数据库技术大会于北京国际会议中心盛大开幕.作为国内最受关注的数据库技术大会,本届大会以"数据驱动·价值发现"为主题,汇集多个领域的百余位专家,与大家共同打造一场以数据为驱动力,为企业进行价值创造的技术盛会. 在13日下午的区块链与大数据专场中,来自火币网的区块链投研中心的负责人徐宝龙为大家带来了主题演讲<大数据.网络攻防与区块链>. ▲火币网区块链研究中心负责人 徐宝龙 日前近百个国家

CNCC 人物专访 谭晓生(上)| 360 首席隐私官谈大数据与个人隐私的博弈

     现任奇虎 360 科技有限公司首席隐私官,2013 中国互联网安全大会主席. 2009 年 7 月加盟北京奇虎科技有限公司担任副总裁,负责公司网站技术.技术运维.数据分析与挖掘.云查杀.云存储等业务的技术团队管理. 1992 年毕业于西安交通大学计算机科学与工程系计算机应用专业.2003 年 1 月至今先后任 3721 技术开发总监.雅虎中国技术开发总监.雅虎中国 CTO.阿里巴巴-雅虎中国技术研发部总监.还曾任 MySpace CTO 兼任 COO. 目前还担任 CCF 副秘书长,Y

《Hadoop与大数据挖掘》——第一篇 基 础 篇 第1章 浅谈大数据 1.1 大数据概述

第一篇 基 础 篇 第1章 浅谈大数据 当你早上起床,拿起牙刷刷牙,你是否会想到从拿起牙刷到刷完牙的整个过程中有多少细胞参与其中?这些细胞在参与的过程中会结合周围环境(可能是宏观的天气.温度.气压等,可能是微观的分子.空气中的微生物等),由你的意识控制而产生不同的反映.如果我说结合这些所有的信息,可以预测你接下来的0.000 000 01秒的动作,那么,你肯定说,这我也可以预测呀.比如正常情况下,你脚抬起来走路,那么抬起来后,肯定是要落下去的,这算哪门子预测呢?那如果我说可以预测你接下来一个小时