说起“大科学”这个词,首先让人联想到的是火箭、天文望远镜和粒子加速器的研究,这些研究需要大量的资金支撑。而生态学研究,让人联想到的是带着样方尺的植物生态学家、拿着望远镜的鸟类生态学家、以及手持捕虫网的昆虫学家等等,很少会有人将他们的研究与大科学联系起来。其实,反过来想,这又是特别令人奇怪的!生态学家研究的地区,例如大多数陆地,是一个真正被人类占领的区域,却一直没有归为大科学的范畴。不过,在David Schimel的带领下,一大邦美国生态学家们正打算纠正这种状态。他们计划将撼动陆地生态学领域,并将之引入到大科学的规模和范围,这就是他们正在建立的的美国国家生态观测网络(NEON, National Ecological Observatory Network),这也正是本文将作为详细案例进行探讨的一个话题。
“大数据”(Big Data)所覆盖的范围越来越大。例如,《纽约时报》2012年8月2日就大数据这种新出现的文化基因(cultural meme)进行了探讨。通常,人们首先以技术爱好者的角度来看待大数据。《纽约时报》的文章将大数据描述为“应用人工智能工具,如机器学习,巨大的数据的新搜集,这超越了标准的数据库。新的数据来源包括网页浏览数据的痕迹、社会网络通信、传感器数据和监测数据。”
大数据受到自然世界的塑造,并影响我们如何理解自然世界和与自然世界交流。生物学在如此多的水平上提供一个巨大的数据:来自遗传研究几乎无限的数据正充斥着我们最大的数字仓库中的字节;大量保存在自然历史博物馆的标本;在全球范围内日常生活所拍摄的摄影档案;大量的来自“公民科学”(citizen science)数据库中的数据,如国家物候学网络(National Phenology Network),有关这个内容,在2012年出版的一期的Frontiers in Ecology and the Environment中的“公民科学”栏目中有一个非常重要的综述文章“From Caprio’s lilacs to the USA National Phenology Network”介绍了这个网络;大尺度的生物地球化学作用研究的汇集,比如滨海“死亡地带”的研究,实质上是总汇了工业氮转换、人类农业实践、初级生产力和生物呼吸之间的相互作用。有关这些区域的交互式地图已经由WRI出版。
大数据正在影响我们如何理解世界,因为它正在瓦解我们在过去50年被告知的对科学理解的基石:在一个“强大的推理”框架中用受控实验来测试可证伪的假设。认为科学必须可证伪的想法来自卡尔·波普尔(Karl Popper),他从约翰·普拉特(John Platt)的传道中得到了启示,在其1964年所发表的高引用“强推论”(Strong Inference)雄文中主张用标准化方法进行生物科学研究。Observation and Ecology的作者Rafe说:“如果你第一次阅读他的文章时候就很喜欢,其实我也是这样的,但我还是劝您以批判的态度再读一遍”。并说这有点像在高中时候对艾茵·兰德(Ayn Rand)很痴迷,成年后试图用她的思想与现实结合起来。显而易见,这些哲学思想产生了一些惯例性的规则:“相关性并不意味着因果关系”、“模式不能揭示机制”,以及科学的结论如果没有推翻预先确定的假设,其作用就仅相当于“审前调查”。大数据使得以前这些坚实的信念看起来有点古怪。虽然这些信念有时候仍然有价值,但其中自反的特性被科学家和非科学家以相同的方式采用,这都需要重新评估。如果我们无法把一些机制性原因弄得100%清楚(其实没有那个方法能做到这点儿),大数据方法允许生命科学家在更大的混沌周期中发现更为健壮的模式,或者时会让我们尽可能接近真实状况。同时,在对待大数据中应该注意的是,大数据永远不会完全取代小数据。那些花时间观察自然的小数据,以及对小数据片言只语的理解,是构成大数据整体的基石。
在生态学领域,现在提起NEON,不能说是家喻户晓、人人皆知,但也可以说是在这个大数据时代增添了一道异常鲜艳的光芒。开始,这个项目仅立足于在科罗拉多的博尔德寻求资金支持,项目进展异常艰难。但是在长达十年的讨论和计划后,美国国家科学基金会设法说服国会专项拨款4.34亿美元进行建设,这是一个中等太空探测器的价格,操作预算大约为每年8千万美元。2011年美国的大陆尺度生态网络计划终于启动了,它将全面监测整个美国的环境变化,从根本上改变传统的小规模、地域性研究方式,形成陆地领域的群体合作。研究人员宣称,生态领域的大数据时代已经来临,生态观测将迎来“数据洪流”。
最终,覆盖美国的60个地区将同步建立起来。一旦在2016年这个台站网络完成后,一切顺利的话,将有15000个传感器用于收集超过500个类型的数据,包括温度、降水、气压、风速和风向、湿度、日照、如臭氧等的空气污染物浓度、土壤和溪流中各种营养的总量,以及地区的植被和微生物状态。在每个地方这些仪器将以同样的方式安装,并采用相同的测量,用标准化方式坚持长期的数据收集,希望能达到统计学功效的需求,将生态学研究从一些技巧性实验观测变成一个工业规模的企业运作。有了这样的基础,就可以观察生态系统是如何应对气候变化和土地利用变化以及新物种入侵的。最终,利用这些观测数据可开发一些预测生态系统未来的模型,这可帮助决策者评估各种行动方案所产生的后果。
图1 美国NEON项目将美国划分为20个不同的生态系统区域
NEON的研究人员将美国划分为20个不同的区域(图1),每一个区域代表一个特定的生态系统类型。每个区域都配备有三套传感器。一套固定安装在核心位点进行至少30年的连续监测,核心位点的环境条件不受干扰而且可能维持下去。其他两套可进行移动,在一个地方进行三到五年的观测后移动到其他地方,这些“浮动”的位点用于同区域内的比较。每一个位点,不管是核心位点还是浮动位点,都有一座布满传感器的观测塔,这座塔比现有的植被冠层高10米。在围绕这座塔方圆几十平方公里的区域内,研究者将更多的传感器布设在土壤和溪流中,测量温度、二氧化碳和营养水平,以及根生长速率和微生物活动。这些传感器将记录不同的生态系统如何有效地利用养分和水分,植被如何响应气候变化,以及二氧化碳在生物和大气之间是如何移动的。这将有助于寻求对碳循环的理解,以及温室气体引起的气候变化的后果。为了配合这些地面测量,研究人员还将在每个核心站点进行一年一次空中的调查,观察诸如叶化学特征和森林冠层的健康问题,也可用于与卫星观测数据进行比较。此外,NEON的研究人员可以部署一个特殊装备的飞机,其上配备了激光雷达(雷达的光学本的),一个光谱仪(测定化学成分)和一个高分辨率的相机,用于评估自然灾害如洪水、野火和害虫爆发的影响。
(责任编辑:蒙遗善)