科学研究进入大数据时代

  进入21世纪后,随着信息技术的不断发展,人类的数据化能力显著增强。2012年2月11日,美国《纽约时报》发表了一篇主题为“大数据时代”的专栏文章,最早明确地提出了大数据时代的来临,大数据也由此变成了一个火遍全球的热词。大数据不仅给人们的日常生活带来了很多变化,也对科学研究产生了巨大的影响。

  在科研领域,从宏观到微观,从自然到社会,越来越多的观察、计算和传播等仪器设备正在产生着源源不断的海量、复杂的数据,这使得几乎每个学科领域都在面对着空前的数据爆炸。可以说,科学研究正在进入大数据时代。

  2014年4月由国际科技数据委员会(简称CODATA)中国全国委员会编著的《大数据时代的科研活动》一书,就致力于对大数据时代科研活动发生的种种变化进行一个总体性的描绘。“我们主要从自然科学的视角,当然其中也涉及到一些社会科学的内容,来看待大数据时代给科研活动带来的挑战,讨论科研人员如何去应对,探讨会不会由此形成一个新的学科—数据科学,就是这本书的整体逻辑框架。”中国科学院计算机网络信息中心科学数据中心主任、CODATA中国全国委员会秘书长黎建辉告诉《中国科学报》记者。

  “我们很早就开始这项工作了,大概从2011年3月开始。”黎建辉介绍道。2010年,中国科学院副院长、CODATA中国全国委员会主席丁仲礼提出,应当针对当时数据与科研活动相关的、前沿的内容作一些专门性的研究,并形成研究报告,使得科研人员对这类问题有更清楚的认识。于是,从2011年开始,CODATA中委会就开始组织一些对数据感兴趣的专家开会讨论,分析数据密集型科学研究的特点和面临的技术挑战,探讨国家应该在这方面作出怎样的部署和调整等内容。经过两年多的调研和研讨,在举办了四次大型专题研讨会议,并且针对研究报告中的每一篇文章进行了多次推敲和修改后,《大数据时代的科研活动》终于完成。

  本书内容主要分为三部分。第一部分是对目前越来越多地利用数据来进行研究的科学领域的现状、特点、遇到的问题和未来发展趋势的分析,涉及研究领域包括高能物理、天文学、对地观测和生命科学等;第二部分是从数据采集、传输、存储与处理、数据整合、数据与文献互操作、数据挖掘及可视化技术等方面,探讨未来的科研活动中需要哪些技术支持以及这些技术的发展趋势;第三部分是对数据科学发展的展望。

  对于大数据对科研活动的影响,黎建辉认为一个典型的例子就是天文学研究中的虚拟天文台。“天文学最早是个观测科学,主要是利用望远镜寻找新的星体等。但是现在,随着各种新型仪器设备的快速发展,人类逐渐有了对天象进行数据采集的能力和技术手段,由此产生了海量的复杂数据。所以,在未来的天文学研究中,观测能力已经不构成问题,真正的问题在于研究人员如何在浩如烟海的数据中进行分析和挖掘,找到需要的东西,提出科学问题。”黎建辉进一步解释道,“所以,在很早的时候就有人提出了虚拟天文台的说法,假设观测到的数据都能够共享,这些数据就可以形成一个天文台。与传统意义上由仪器设备所构成的天文台不同,这些由数据构成的天文台实际上是虚拟的天文台。在这样的环境下,科研人员如何协作、分析数据,怎么发现新的天文现象,都需要科学研究方法随之发生变化。”

  黎建辉一直认为,大数据是一种现象,或者说是一个问题或挑战,应对大数据挑战的方法之一就是建立一个新的学科—数据科学。而所谓数据科学,就是从数据密集型学科中提炼出具有共性的问题和方法,从而形成的一个新学科。

  目前,对于数据科学的内涵、外延、科学问题等都没有一个清晰的认识,也没有达到共识。但据黎建辉介绍,从去年开始数据科学发展态势加快,在国际上,美国的哥伦比亚大学、加州大学伯克利分校,英国的帝国理工学院等高校都成立了数据科学研究院,国内的清华大学也于今年5月成立了数据科学研究院。“现在,大家意识到数据科学似乎要出现了。”

  “当然,正如计算科学刚出现时也面临着诸多质疑一样,有人也认为数据科学并不是一门科学,因为其实每个学科都可以叫作数据科学。”黎建辉说,“也有人认为,数据科学可以为其他学科的发展提供工具和模型支持,但在另一方面也有自己学科发展的需要。目前,对于数据科学还没有一个共识,还需要不断地讨论和碰撞。”

时间: 2024-09-22 20:19:53

科学研究进入大数据时代的相关文章

大数据时代给社会科学研究带来新问题

大数据时代的图书出版是近两年的热点,8月27日即将在北京开幕的第21届北京图博会之前,不少出版界人士已纷纷开始筹备热议.那么,大数据时代,对学术出版乃至http://www.aliyun.com/zixun/aggregation/39459.html">社会科学研究有什么样的影响及意义呢?中国传媒大学调查统计研究所所长沈浩近日在第十五届全国皮书年会上,就相关话题做了专题报告. 沈浩认为,大数据时代,数据科学让人们越来越多地从数据观察到人类社会的复杂行为模式,以数据为基础,并非是数据改变了

茅明睿:大数据时代的城市规划【大数据100分】

我是一名非典型规划师,我很少做具体的规划设计项目,在北京规划院工作近15年,入行之初遇到了数字城市建设大潮,参与了数字北京的先发工程--数字绿化带,群里的@王国良的武大吉奥公司就是当年主要的合作伙伴. 2000-2010年从事的工作都围绕以地理信息系统.遥感.三维仿真.数据建库为核心的数字规划技术体系的构建,为北京的规划工作建立数据基础和GIS应用基础.2010年开始,基于10年的基础积累,我们开始把视线放到数据挖掘,城市定量研究或者说城市计算上来. 群里都是高大上的技术大牛.上市公司老总.参与

大数据时代比较教育研究范式的转型

随着互联网和信息技术的发展,大数据正在影响着政治.经济.教育.科技.文化.医疗等社会生活的各个领域.为了应对大数据的挑战,各国纷纷将大数据研究提升为国家战略,例如,美国政府在2012年3月29日率先发布了<大数据研究和发展计划>,决定投资2亿多美元开展大数据研究.大数据将改变人们的生活.工作和思维方式,就科学研究来说,大数据将引发科学研究范式的转变. 一.大数据时代的科学研究范式及其对比较教育研究的挑战 "范式"(Paradigm)是由科学哲学家托马斯·库恩(Thomas

科学研究与大数据概念的滥用

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;       突如一夜春风来,千树万树梨花开.2012年兴起的"大数据"潮流,让"data"这个IT圈子里面的名词一下风靡各个行业.可以说,没有任何一个IT界 的术语能够受到如此之大的关注和使用.除了传统IT界以及和IT圈子相关的行业以外,各种如餐饮业.房地产业.金融业等都迫不及待的宣布了自己的"大数据 "战

大数据时代已经到来,你了解吗?

一.大数据出现的背景 进入2012年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新.它已经上过<纽约时报><华尔街日报>的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的证券公司等写进了投资推荐报告. 数 据正在迅速膨胀并变大,它决定着企业的未来发展,虽然现在企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识 到数据对企业

大数据时代的教育变革:挑战、趋势及风险规避

2011年5月,美国的麦肯锡咨询公司发布<大数据:创新.竞争和生产力的下一个前沿领域>报告,开启了大数据产业界的先河.这份报告认为,大数据是大小超出了传统数据库软件工具的获取.存储.管理和分析能力的数据集①.国际数据公司据此总结出大数据的四大特征:大量化.多样化.快速化.价值化.相对过去的小数据,大数据体现的是一种快速搜集.处理和利用复杂信息的能力.2012年3月,奥巴马政府发布<大数据研究和发展计划>,将大数据上升为国家战略.2013年被称作大数据时代的元年,信息技术进入一个崭新

大数据时代,如何构建国家地质基础数据更新体系

大数据是当今世界经济.社会和科技发展的大趋势,已成为信息时代大国竞争的新领域.美国政府将大数据看作是"未来的新石油",并将对大数据的研究上升为国家意志.我国也要求充分运用大数据.云计算等现代信息技术,提高政府服务水平. 地质基础数据是地质行业最基本的数据,反映了国家基础性.公益性地质调查工作的精度和质量.随着大数据时代的到来,地质基础数据的质量.数量和更新时效已成为衡量一个国家地质调查工作水准的基础标准之一,对保障国家资源能源环境安全.支撑服务经济社会发展具有重大而深远的意义. 发达国

共享+结合 大数据时代几个关键问题剖析

大数据时代来临,每个公司都应该重视起数据部门.以前搜集数据没有足够的时间.能力.资源,因而无法获得更多的支撑.因为数据量不够.当我们有了更多的数据,我们看到的东西发生实质的变化,我们以前从来没有看到过这种情形.足够的数据,让我们更好的理解彼此,达到历史绝无仅有的水平. 大数据的核心在于共享 大数据之父舍恩伯格说"大数据的核心要义在于共享." 我们的各级政府.公共机构汇集了存量大.质量好.增长速度快.与社会公众关系密切的海量数据资源.除了部分分享自用和信息公开外,大部分没有充分发挥数据源

战争步入大数据时代

点击标题下「大数据文摘」可快捷关注 随着大数据在军事领域的高效开发和全面运用,战争将步入大数据时代.在未来战场上,"除了上帝,任何人都必须用数据说话",只有具备大数据优势的一方,才能有效掌控数据--这一关键战略资源,从而在战场上立于不败之地.毫无疑问,打赢未来信息化战争,大数据已成为军队必备的能力. 应对海量数据的挑战 什么是大数据?人们并未形成统一的认识,一般而言,它是指规模远远超过传统数据库软件处理能力的海量数据集合.这一概念首要是针对信息化社会数据"爆炸式"增