赵斌:生态学研究正进入大科学、大数据时代

说起“大科学”这个词,首先让人联想到的是火箭、天文望远镜和粒子加速器的研究,这些研究需要大量的资金支撑。而生态学研究,让人联想到的是带着样方尺的植物生态学家、拿着望远镜的鸟类生态学家、以及手持捕虫网的昆虫学家等等,很少会有人将他们的研究与大科学联系起来。其实,反过来想,这又是特别令人奇怪的!生态学家研究的地区,例如大多数陆地,是一个真正被人类占领的区域,却一直没有归为大科学的范畴。不过,在David Schimel的带领下,一大邦美国生态学家们正打算纠正这种状态。他们计划将撼动陆地生态学领域,并将之引入到大科学的规模和范围,这就是他们正在建立的的美国国家生态观测网络(NEON, National Ecological Observatory Network),这也正是本文将作为详细案例进行探讨的一个话题。

“大数据”(Big Data)所覆盖的范围越来越大。例如,《纽约时报》2012年8月2日就大数据这种新出现的文化基因(cultural meme)进行了探讨。通常,人们首先以技术爱好者的角度来看待大数据。《纽约时报》的文章将大数据描述为“应用人工智能工具,如机器学习,巨大的数据的新搜集,这超越了标准的数据库。新的数据来源包括网页浏览数据的痕迹、社会网络通信、传感器数据和监测数据。”

大数据受到自然世界的塑造,并影响我们如何理解自然世界和与自然世界交流。生物学在如此多的水平上提供一个巨大的数据:来自遗传研究几乎无限的数据正充斥着我们最大的数字仓库中的字节;大量保存在自然历史博物馆的标本;在全球范围内日常生活所拍摄的摄影档案;大量的来自“公民科学”(citizen science)数据库中的数据,如国家物候学网络(National Phenology Network),有关这个内容,在2012年出版的一期的Frontiers in Ecology and the Environment中的“公民科学”栏目中有一个非常重要的综述文章“From Caprio’s lilacs to the USA National Phenology Network”介绍了这个网络;大尺度的生物地球化学作用研究的汇集,比如滨海“死亡地带”的研究,实质上是总汇了工业氮转换、人类农业实践、初级生产力和生物呼吸之间的相互作用。有关这些区域的交互式地图已经由WRI出版。

大数据正在影响我们如何理解世界,因为它正在瓦解我们在过去50年被告知的对科学理解的基石:在一个“强大的推理”框架中用受控实验来测试可证伪的假设。认为科学必须可证伪的想法来自卡尔·波普尔(Karl Popper),他从约翰·普拉特(John Platt)的传道中得到了启示,在其1964年所发表的高引用“强推论”(Strong Inference)雄文中主张用标准化方法进行生物科学研究。Observation and Ecology的作者Rafe说:“如果你第一次阅读他的文章时候就很喜欢,其实我也是这样的,但我还是劝您以批判的态度再读一遍”。并说这有点像在高中时候对艾茵·兰德(Ayn Rand)很痴迷,成年后试图用她的思想与现实结合起来。显而易见,这些哲学思想产生了一些惯例性的规则:“相关性并不意味着因果关系”、“模式不能揭示机制”,以及科学的结论如果没有推翻预先确定的假设,其作用就仅相当于“审前调查”。大数据使得以前这些坚实的信念看起来有点古怪。虽然这些信念有时候仍然有价值,但其中自反的特性被科学家和非科学家以相同的方式采用,这都需要重新评估。如果我们无法把一些机制性原因弄得100%清楚(其实没有那个方法能做到这点儿),大数据方法允许生命科学家在更大的混沌周期中发现更为健壮的模式,或者时会让我们尽可能接近真实状况。同时,在对待大数据中应该注意的是,大数据永远不会完全取代小数据。那些花时间观察自然的小数据,以及对小数据片言只语的理解,是构成大数据整体的基石。

在生态学领域,现在提起NEON,不能说是家喻户晓、人人皆知,但也可以说是在这个大数据时代增添了一道异常鲜艳的光芒。开始,这个项目仅立足于在科罗拉多的博尔德寻求资金支持,项目进展异常艰难。但是在长达十年的讨论和计划后,美国国家科学基金会设法说服国会专项拨款4.34亿美元进行建设,这是一个中等太空探测器的价格,操作预算大约为每年8千万美元。2011年美国的大陆尺度生态网络计划终于启动了,它将全面监测整个美国的环境变化,从根本上改变传统的小规模、地域性研究方式,形成陆地领域的群体合作。研究人员宣称,生态领域的大数据时代已经来临,生态观测将迎来“数据洪流”。

最终,覆盖美国的60个地区将同步建立起来。一旦在2016年这个台站网络完成后,一切顺利的话,将有15000个传感器用于收集超过500个类型的数据,包括温度、降水、气压、风速和风向、湿度、日照、如臭氧等的空气污染物浓度、土壤和溪流中各种营养的总量,以及地区的植被和微生物状态。在每个地方这些仪器将以同样的方式安装,并采用相同的测量,用标准化方式坚持长期的数据收集,希望能达到统计学功效的需求,将生态学研究从一些技巧性实验观测变成一个工业规模的企业运作。有了这样的基础,就可以观察生态系统是如何应对气候变化和土地利用变化以及新物种入侵的。最终,利用这些观测数据可开发一些预测生态系统未来的模型,这可帮助决策者评估各种行动方案所产生的后果。

图1 美国NEON项目将美国划分为20个不同的生态系统区域

NEON的研究人员将美国划分为20个不同的区域(图1),每一个区域代表一个特定的生态系统类型。每个区域都配备有三套传感器。一套固定安装在核心位点进行至少30年的连续监测,核心位点的环境条件不受干扰而且可能维持下去。其他两套可进行移动,在一个地方进行三到五年的观测后移动到其他地方,这些“浮动”的位点用于同区域内的比较。每一个位点,不管是核心位点还是浮动位点,都有一座布满传感器的观测塔,这座塔比现有的植被冠层高10米。在围绕这座塔方圆几十平方公里的区域内,研究者将更多的传感器布设在土壤和溪流中,测量温度、二氧化碳和营养水平,以及根生长速率和微生物活动。这些传感器将记录不同的生态系统如何有效地利用养分和水分,植被如何响应气候变化,以及二氧化碳在生物和大气之间是如何移动的。这将有助于寻求对碳循环的理解,以及温室气体引起的气候变化的后果。为了配合这些地面测量,研究人员还将在每个核心站点进行一年一次空中的调查,观察诸如叶化学特征和森林冠层的健康问题,也可用于与卫星观测数据进行比较。此外,NEON的研究人员可以部署一个特殊装备的飞机,其上配备了激光雷达(雷达的光学本的),一个光谱仪(测定化学成分)和一个高分辨率的相机,用于评估自然灾害如洪水、野火和害虫爆发的影响。

(责任编辑:蒙遗善)

时间: 2024-09-20 16:41:46

赵斌:生态学研究正进入大科学、大数据时代的相关文章

让基础设施研究变得更可见--- 清华大学数据科学研究院大数据基础设施研究中心成立

信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已经成为国家基础性战略资源,大数据正日益对全球生产.流通.分配.消费活动以及经济运行机制.社会生活方式和国家治理能力产生重要影响.然而,相对于金融.医疗领域的火爆发展,大数据基础设施的建设往往会遭到忽视.为提高社会对大数据基础设施的认知.推动数据基础设施建设.促进数据开放共享,2017年8月17日,在清华大学FIT楼多功能厅举办了大数据基础设施认知RONG论坛暨大数据基础设施研究中心(以下简称"中心")成立仪式. 北京龙腾佳讯科技股份

数据驱动:大数据时代的科学决策

大数据时代,数据驱动的科学决策正成为企业资源优化配置的利器.大数据技术结合运筹学尖端理论是实现数据驱动的科学决策的坚实基础. 大数据时代,数据驱动的科学决策正成为企业资源优化配置的利器.大数据技术结合运筹学尖端理论是实现数据驱动的科学决策的坚实基础. 大数据弥补了传统小数据存在的缺陷,能够让企业获得更多维度.更海量.更有时效性的全样本数据.植根于科学决策的现代运筹学优化算法,作为大数据商业建模的重要组成部分,正在众多领域带给企业更系统准确的决策依据.大数据通过抓取.挖掘.分析海量数据并用经典模型

大数据时代的跨国比较研究与比较教育学科转型

计算机和网络的高速发展带来了"大数据",根据IBM最近的一次估计,人类和机器每天共同产生2.5万兆字节的数据.这些数据的来源包括电子邮件.博客.点击流.安全摄像头.气象传感器.社会网络.学术研究.学生学习历程档案等.大数据并非一个新概念,只是从量的角度来看数据,也称为"海量数据".[1]全世界对大数据越来越重视,并掀起了一场大数据的研究热.2012年,英国的经济与社会研究理事会(Economic and Social Research Council,简称ESRC)

IDC:中国金融行业正步入大数据时代初级阶段

3月25日,IDC研究显示,当前,数据是重要资产的理念已经在中国金融行业形成共识,数据的真正价值在于能够洞察企业内部规律,数据的洞察力成为金融企业的核心竞争力.在中国金融行业信息化建设中,与信息加工密切相关的大数据管理正逐渐成为与核心业务系统建设.渠道建设和前置建设同等重要的领域. 经过多年的发展与积累,目前中国的大型商业银行和保险公司的数据量已经达到100TB以上级别,并且非结构化数据量在迅速增长.基于IDC对大数据的定义(通常数据量大于100TB, 数据量年增率大于60%,数据采集是高速数据

大数据时代比较教育研究范式的转型

随着互联网和信息技术的发展,大数据正在影响着政治.经济.教育.科技.文化.医疗等社会生活的各个领域.为了应对大数据的挑战,各国纷纷将大数据研究提升为国家战略,例如,美国政府在2012年3月29日率先发布了<大数据研究和发展计划>,决定投资2亿多美元开展大数据研究.大数据将改变人们的生活.工作和思维方式,就科学研究来说,大数据将引发科学研究范式的转变. 一.大数据时代的科学研究范式及其对比较教育研究的挑战 "范式"(Paradigm)是由科学哲学家托马斯·库恩(Thomas

Nature:2014年度十大科学人物

12月18日出版的<自然>杂志评选出2014年度十大科学人物.这十大人物是本年度一些重要科学进展及事件的中心人物.其中与生物学有关的主要有癌症免疫疗法研究人员Suzanne Topalian.干细胞疗法研究者Masayo Takahashi.对抗埃博拉的医生Sheik Humarr Khan.结构生物学Sjors Scheres. Suzanne Topalian:信念坚定的抗癌斗士(癌症免疫疗法) Topalian是一位坚信癌症免疫疗法并为之奋斗的临床医生,她参与开发的一种癌症药物,今年被批

从大数据向大信息升华,亟待统计科学与数据科学的革新

大科学工程,是以工程方式.计划手段.汇聚科技资源与力量整体推进重大科技计划的最新范式,是科学研究由传统的"手工小作坊"向现代大规模"工场"演进的一次革命.大科学范式的"兵团作战",将以空域和领域维度上的大规模,甚至超越时域维度上的长尺度,实现今朝一日.史上数年的突破. 大科学是大数据的摇篮,大数据是大科学的产物 大科学的王者之道始于大数据的产生.人类历史上的大数据,源于科技领域,确切地说源于大科学研究.曼哈顿计划打开了微观世界,并开创了借用人造的

大数据时代社交网络个人信息安全研究

文章讲的是大数据时代社交网络个人信息安全研究,随着科技的发展,现代社会产生和捕获的数据量迅猛增长,统计数据量以PB(1024TB)级趋势加增,我们已经迈进了大数据时代.社交网络风生水起,越来越多的人愿意在这个交互的时代分享自己的见闻感受,而我们通过电脑.手机等电子设备在网上进行的每一个操作,都被服务器记录了下来,社交网络中的个人信息也成为大数据时代商家博弈的一大焦点.在开发社交网络中个人信息潜在价值的同时,如何保证个人信息安全,保证个人信息不被非法收集和不当利用,以及如何提高用户对于个人信息的可

何帆:大数据时代正聚集改变的能量

以下内容来自社科院世界经济与政治研究所副所长何帆的一次讲座. 大数据时代需要重视统计学 我们现在要开始重视大数据,要重视统计学,因为在数据足够大了之后,我们突然发现一切社会现象到最后都有统计规律,它不像物理学那样可以准确的去描述因果的关系,它从本质上来说就是一个统计的规律.统计学学好了,你再去学别的都战无不胜,因为一切社会现象到最后都是一个统计规律. 为什么要强调统计学呢,因为我们的认知能力中最差的是统计思维.人的大脑有一些功能优良得超过我们的想象,比如我们的语言能力.著名的语言学家乔姆斯基曾说