生物大数据:中国能否与世界同步?

        大数据时代已经来临。2014财年,美国政府就如何充分利用生物医学大数据,启动Big Data to Knowledge计划,这是继2012年美国国家大数据计划实施后新一轮面向生物大数据的基础研究计划。目前,发达国家在生物大数据领域的技术和应用已远远走在前端。在我国,生物大数据还处于发展的初期阶段。该如何以最快的速度赶上这一潮流,如何从国家主权层面对生物大数据进行有效的保护和管理,如何在基础研究和技术市场应用上与世界同步,已成为不可回避且值得深入思考的话题。

  谁是生物大数据技术的领航者

  大数据发展的核心动力来自于人类记录、测量和分析世界的渴望。当前,高通量测序技术的快速发展,使生命科学研究获得了强大的数据产生能力。

  哈尔滨工业大学计算机科学与技术学院院长王亚东教授告诉科笔者,上世纪90年代,科学家花费10年时间、近30亿美元获得了第一个人类基因组图谱;而今天,完成一个个人基因组测序不到一天时间,费用低于1000美元。

  自人类基因组计划完成以来,以美国为代表,世界主要发达国家纷纷启动了生命科学基础研究计划,如国际千人基因组计划、DNA百科全书计划、英国十万人基因组计划等。这些计划引领生物数据呈爆炸式增长,目前每年全球产生的生物数据总量已达EB级,生命科学领域正在爆发一次数据革命,生命科学某种程度上已经成为大数据科学。

  “这还只是刚刚开始”,王亚东强调,“随着测序技术在医疗、健康、医药、环境、能源等相关领域的广泛应用,人类将面临生物数据的海洋,其将成为这些领域创新的源泉,对这些数据创新性的管理和应用,将为生命科学及相关产业领域带来一次新的革命。”

  与全球蒸蒸日上的生物大数据创新发展热潮相比,中国的研发及应用才拉开帷幕。“我们与国际前沿技术水平至少相差30年,差距主要表现在数据分析、数据管理和与临床的应用对接上”,上海生物信息技术研究中心主任李亦学研究员对此深表担忧。

  李亦学分析认为,我国有四大方面非常欠缺:其一,国内现有的生物大数据分析能力虽然与欧美相差不大,但是在数据分析构架、软件系统与先进的IT技术接轨上有待提升。其二,国外在生物大数据领域的领先人才多,尽管我们也有国际顶级刊物上发表的论文和成果,总体而言,国内高水准团队还是少。其三,欧美讲求成果应用,层出不穷的分析软件可被实验室、临床、产业多方应用。其四,在生物大数据理论研究、标准制定和广泛应用上,中国都亟待全面跟进。

       谁将引领生物大数据应用的市场和资源

  对生物大数据的有效管理和利用,发达国家很早就开始了竞争。早在上世纪80—90年代,美国、欧洲和日本即已分别建立世界三大生物数据中心:美国国家生物技术信息中心(NCBI)、欧洲生物信息研究所(EBI)和日本DNA数据库(DDBJ)。

  王亚东强调,“这三大生物数据中心掌握并管理着全世界的生物数据和知识资源,并处于垄断地位。”

  美国国立卫生研究院(NIH)建立了8个国家级生物数据技术研究中心,旨在长期发展生物大数据分析技术,提高生物大数据利用和转化能力,并保持其领先地位。王亚东进一步指出,美国政府于近两年两次启动生物大数据研究计划,目的是有针对性地研究生物大数据管理、分析、共享等生物领域迫切需要的核心技术,从根本上提升美国利用生物大数据的水平,并以此带动生物领域研究与产业发展。

  在商业领域,生物大数据的应用市场也如雨后春笋,目前,一些公司已开始提供生物大数据服务。例如,谷歌投资DNANexus公司,提供生物大数据管理和分析服务,并于2011年接管NCBI数据;早在2006年,23AndMe公司就开始提供个人基因组数据分析服务,目前其受益者总数已超过50万人;英国卫生部于2013年专门建立了Gel公司,管理和分析英国十万人基因组计划产生的基因组数据。

  BCC报告指出:“至2018年,生物大数据的市场总额将增长至76亿美元,年复合增长率达到71.6%。”麦肯锡公司报告指出:“如果美国医疗保健行业有效利用大数据,就能把成本降低8%左右,从而每年创造出超过3000亿美元的产值。”

  谁来掌控我国生物大数据主权

  对于一个国家而言,重要领域的大数据已成为战略资源,拥有数据的规模和运用数据的能力将成为一个国家综合国力的重要标志。

  我国人口居世界首位,生物样本资源丰富,这将使我国很快成为生物数据产出大国,但目前还不是生物大数据利用强国。

  事实上,国际上生物数据资源一直掌握在欧美的几大数据中心。我国产生的许多生物数据资源不得不提交到这些数据中心,导致我国投入大量资金与人力产生的生物数据严重流失。

在生物大数据领域,我国缺乏从国家层面对生物大数据进行有效管理与利用的体制、机制和环境,李亦学称,“这已经使中国的生物数字主权受到严重威胁”。

  王亚东也强调,“现在国际上的三大生物数据中心都是欧美国家层面建立的,并免费向国际开放。我国的相关科学研究和市场应用发展受益于这些数据中心,同时也严重依赖和受制于此。”

  业内人士指出,我国尚未建立面向生物大数据技术发展的国家级技术研究中心,技术研发缺乏宏观规划和引导,技术产出较少,难以建立完善的生物大数据技术体系,不能满足生物大数据发展面临的数据管理和服务需求。同时,除了哈尔滨工业大学和上海生物信息技术中心等少数高校和研究所建立了生物大数据专业研究团队外,人才缺口较大。

  大数据的使用已经成为一个国家各领域提高生产力、创新能力以及竞争力的关键要素。

  专家们指出,生物大数据是国家战略资源,对生物大数据资源的管理和利用应上升为国家意志,并考虑实施如下措施:建立国家生物大数据中心,保障我国数字主权,统筹管理和合理利用国家生物大数据战略资源;通过国家科技政策,集中突破生物大数据核心技术,形成自主关键技术与系统产品,打破美欧技术限制;以现有优势学术和技术资源为基础,建立国家级生物大数据研究机构,提升我国生物大数据技术和服务水平,并培养专业的生物大数据人才;强调应用需求牵引和政策支持,以加快生物大数据产业的全面发展。

原文发布时间为:2014-02-28


时间: 2024-09-15 18:30:58

生物大数据:中国能否与世界同步?的相关文章

“大数据”方兴未艾 中国正在与世界同步前进

维克托·迈尔―舍恩伯格,被誉为"大数据时代的预言家",牛津大学网络学院互联网研究所教授.<大数据时代>的作者.英国<经济学家>杂志.美国<科学>杂志均尊其为最重要的大数据研究者. 艾伯特―拉斯洛·巴拉巴西,全球复杂网络研究权威,美国东北大学教授.网络科学研究中心创始人兼主任,美国物理学会院士,匈牙利科学院院士,欧洲科学院会员,畅销书<爆发>的作者. 回顾现代史上历次技术革命,中国均是学习者.而这一次变革中,中国与世界距离最小,甚至在很多领

生物大数据“行路难”

"大数据"时代已经到来.目前,大数据成为继云计算.物联网之后IT行业又一大颠覆性的技术革命.而随着技术的普及,大数据在生物.金融.零售.能源.交通等领域已得到应用,正在渗透到人们生活的各个方面. 同其他领域相比,我国在大数据方面和国外起点一致,可以说,大数据时代也是我国一次新的发展机遇.为此,本报将开设专栏介绍大数据在不同领域的应用现状及我国大数据发展亟需破解的难题,与读者共迎大数据时代的来临. 虽然我国数据产生量很大,但是生物大数据与国外相比仍比较落后. 世界杯预测.高考预测.当前哪

百度世界大数据论坛:百度大数据助你感知世界

2014百度世界大数据论坛于9月3日在北京举行,会上既有来自百度大数据的专家介绍百度的大数据产品和发展经验,也有来自各行各业的精英介绍他们与百度在实际合作中的心得. 百度大数据的价值--感知世界 百度大数据部高级总监朱永忠讲到百度大数据给行业带来的最大价值即时感知世界.所谓感知世界就是让机器能够模拟人脑的方式处理感知到的所有信息.而能够像人脑那样处理感知的信息之后,随之给行业带来的价值即是类似人脑活动的思考和决策. 对此百度推出的产品是百度大脑.百度大脑依托图像识别技术.语音识别技术.手术识别技

产业互联网(大数据中国 第四期)

产业互联网(大数据中国 第四期) 我们看到互联网金融.互联网旅游.互联网购物.互联网制造以及在线的医疗.教育等,看到企业管理和组织方式.企业融资和销售方式,甚至一些企业内部的人力资源.法律.财务.会议组织.车辆使用等职能都在被互联网改造,或者在新的平台重组变成为新的产业.如果说以前我们的企业无视互联网的存在可能会失去竞争力,未来这样的企业根本不可能存在,就像现在没有企业说不需要水或者电这样的基础设施一样. 互联网对于传统行业的渗透.改造以及带来的创新能力和商业模式升级,带动的是企业管理和商业模式

依托大数据 中国智能制造将“三步并作一步走”

中国智能制造的路径和方向渐渐浮出水面.在今天进行的全国智能制造试点示范经验交流会上,相关人士表示,中国要同步发展工业2.0.3.0.4.0,以三步并作一步走的方式,推进智能制造. 在工信部部长苗圩看来,我国智能制造已经在关键技术装备,标准体系建设等多个方面,取得了显著成绩.不过他同时指出,与发达国家相比,我们在这方面还有不小的差距. 苗圩:智能感知与控制技术.数字化设计与制造技术亟待提升.机器人.传感器等关键技术装备还受制于人.智能制造网络,信息安全基础还比较薄弱,系统集成解决方案提供能力不足.

大数据,中国可实现技术和应用超越

12月6日下午,陕西省工信厅副厅长蔡苏昌在"2012西咸新区大数据高峰论坛"上演讲前讲了一件小事:一位北京的朋友在得知陕西要在北京召开关于大数据的论坛时调侃道:"你们陕西人一直挺实在的,怎么现在也学会忽悠了!"从物联网到智慧城市,从云计算到大数据,面对近几年信息技术领域日新月异的发展,习惯于从传统产业发展视角看信息技术发展的人着实感到眼花缭乱,而认为陕西发展大数据只是追风的怀疑显然是这种心态的折射. 事实上,就在12月4日,IBM在京举行了主题为"凝聚专家

大数据量下高并发同步的讲解(不看,保证你后悔)(转)

  对于我们开发的网站,如果网站的访问量非常大的话,那么我们就需要考虑相关的并发访问问题了.而并发问题是绝大部分的程序员头疼的问题, 但话又说回来了,既然逃避不掉,那我们就坦然面对吧~今天就让我们一起来研究一下常见的并发和同步吧. 为了更好的理解并发和同步,我们需要先明白两个重要的概念:同步和异步 1.同步和异步的区别和联系 所谓同步,可以理解为在执行完一个函数或方法之后,一直等待系统返回值或消息,这时程序是出于阻塞的,只有接收到 返回的值或消息后才往下执行其它的命令. 异步,执行完函数或方法后

BT遇上IT 迎接5年后生物大数据爆炸

随着测序成本的降低,基因测序的应用从科研走进医疗和日常生活.随之而来的问题是,未来5-10年生命科学突破之后可能带来大数据爆炸.如何存储.传输和处理这些生命大数据? 这是4月11日,在深圳举行的基因组云计算技术开发者大会上,与会者提出的问题.在此大会上,来自华大基因.阿里云.英特尔.百度开放云.华为.聚道科技.微基因等公司的技术开发者们,正式发布了"中国生物信息云计算产业联盟"倡议. 目前,华大基因股份有限公司正处于上市排队期,华大基因股份有限公司执行总裁尹烨表示,华大在做"

用“大数据”的眼光看世界看未来

大数据,即将成为石油.矿产类的新能源.新生产要素和巨大的经济资产,开启一次重大的时代转型,预示着新一波生产率增长和消费者赢余浪潮的到来.它是管理国家的手段.商务经营的法宝.未来就职的热门,可能还是发达国家下一轮全球化竞争中的利器. 2013被称为大数据元年. 关于大数据的图书市面上就有20多种,其中最突出的是维克托·迈尔-舍恩伯格的<大数据时代--生活.工作与思维的大变革>(浙江人民出版社出版). 舍恩伯格是最早洞见大数据时代发展趋势的数据科学家之一,早在2010年就在<经济学人>