ENCODE变废为宝 大数据成就基因工程

1972年,日本遗传学家大野乾给不能编码蛋白质的DNA片段起名为“垃圾DNA”。然而在2012年9月5日的这篇“80%的基因组是有功能”的报道中说明,这些大野乾称为“垃圾”的DNA实际上是一个庞大的控制面板,能调控数以万计基因的活性,并决定了一些基因的特质。如果没有这些开关的调控,基因将不能正常工作,而这些区域也许会导致人类患上疾病。这个发现震惊了整个科学界!

但是对于计算机领域的我们来说,神奇的不仅是ENCODE项目的成果,还有那些提供支持的基础设施。新闻稿还报道了ENCODE产生了15TB以上的原始数据,数据分析更是耗费了300年以上的执行时间!对于那些以大数据谋生的公司来说这也许算不了什么 — ">Facebook公布日处理数据超过500TB。但是别忘了,ENCODE的数据是在科学界中共享和存取的!

当我们试图去建立节约和有组织的大数据时,ENCODE项目还是值得我们借鉴的。它不只是提出了一些新的遗传物质真理 — 还是一个全球性的合作,需要32个实验室,收集和完成多于147个组织样本上超出1600多个实验产生的数据,然后进一步的使用这些数据收获更多的发现。

在近期一份来自ENCODE的报告中。UCSC Genome Browser项目主任ENCODE Data Coordination Center主事Jim Kent公布了一些难题。这些挑战来自确定实验是独立的、有价值的及它仍然能够产生精确的数据。

Kent及他的生物分子科学与工程数据协调小组(位于加州大学圣克鲁兹分校中心),就项目规模提出了许多挑战。首先,他们必须协调一部分来自世界各地制造数据的科学家。Kent还说,我们有5个数据收割者周游于各个实验室之间,在高峰期通常1周4次的电话会议还要辅以1年两次的大型会议,还有数不清的电子邮件和网络电话。

数据及活动进程/QA的管理的难题更是如影随形。基因数据管理Appistry公司的副总裁Sultan M.Meghji说,大部分的人都致力于数据的管理,好让它能一直保持最新。

该项目还使用了庞大的数据集。研究人员同样对结果分析工具进行了开发。其中包括为了追踪遗传分析细节而设计的数据库HaploReg和RegulomeDB。还有一个预配置的虚拟机提供托管和对项目所产生数据进行分析。当然数据会对研究者开放,该项目的参与者还鼓励有兴趣人士积极的学习如何使用数据并为他们提供了一个门户网站。

随着信息科技的发展,世界范围的互通性得到显著性的提高,以往以实验室为单位的科技研究将渐渐的被有组织的多实验室研究所替代。而随着云计算的发展、大数据的完善及新技术的问世,这些现有的难题必将被逐一解决!( 原文来自gigaom)

(责任编辑:蒙遗善)

时间: 2024-09-20 09:27:09

ENCODE变废为宝 大数据成就基因工程的相关文章

呼和浩特:大数据成就大发展

忽如一夜春风来,千树万树梨花开.在刚刚结束的2016内蒙古大数据产业推介大会上,内蒙古发展大数据产业得天独厚.不可替代的优势吸引了世界的目光.这次大会正式启动了内蒙古国家大数据综合试验区建设,国家把内蒙古列为大数据基础设施统筹发展类综合试验区,又为内蒙古大数据发展带来了重大战略机遇.而作为自治区首府,呼和浩特市是自治区大数据产业发展的主战场,从2011年起,我市相继引进了中国电信.中国联通.中国移动三大运营商建设大型云计算数据中心,投资规模近500亿元.目前,中国联通.中国电信和中国移动三大运营

IBM大数据成就飞鹤一贯好奶粉

ZDNet至顶网软件频道消息: IBM.北京汉端科技有限公司(以下简称:汉端科技)与中国飞鹤乳业集团(以下简称:飞鹤乳业)联合宣布,通过利用IBM全面大数据与分析能力,和汉端科技在商业智能领域丰富的行业经验,飞鹤乳业实现了产品的可追溯与食品安全的数字化管理,完成了系统数字化.透明化.服务化的升级.此外,该系统也是中国乳品行业运用大数据技术实现对产品质量管控.为用户提供追溯服务的一种崭新的模式探索,是乳品行业全产业链食品安全管理体系建设的首个尝试,对于食品安全体系的完善和乳品行业信息化转型具有指导

爱帮公交走进清华 大数据成就领军企业

近日,凭借绿色出行理念和卓越的产品设计,以及众多用户背后的企业无私付出,爱帮公交总裁刘建国被邀走进http://www.aliyun.com/zixun/aggregation/25205.html">清华大学时代论坛,和众多清华学子面对面交流了"爱帮公交"的大数据故事. "清华大学时代论坛"自2003年创办以来,曾邀请众多名人与同学进行面对面的交流,如莫言.李开复.马云.余秋雨.余光中.毕淑敏等.但爱帮总裁刘建国先生还是"清华大学时代论坛

大数据时代看维也纳酒店如何利用大数据成就品牌发展

互联网技术用数据和代码连接起大千世界的人.物.场,同时,互联网技术也让曾经繁杂的数据整理工作变得简单而直白.大数据了因此被广泛地运用于各行各业.那么,对于酒店业来说,大数据又能拿来做些什么呢?今天,我们就拿中档酒店领导品牌维也纳酒店作为案例,来向大家一一解秘. 会员经济 大数据的一项重要作用就是让企业更全面.更精准地了解客户.会员,作为酒店业最核心的消费群体,大数据能做的就是让企业能够利用会员大数据了解会员的消费情况.消费习惯.以及会员喜好等等,继而利用这些数据进行会员有效管理,实现会员经济的"

“517吃货节”来袭 大数据成就饕餮盛宴

近日,百度糯米推出"517(我要吃)吃货节".网友可以通过百度糯米手机客户端参与活动,尽享全国五城特色美食.活动期每个城市每天12次分时秒杀,数百道秒杀菜品只售5块1毛7分钱.同时百度糯米还将推出北京.上海.成都.厦门及西安五个城市的美食排行榜.继 "3·7女生节"后,百度糯米短短两个月时间再造一场基于大数据的饕餮盛宴. 投其所好 大数据分析准确针对用户需求 在花样频出的榜单中,其中既有北京的名家荟萃,又有成都的麻辣口味.厦门的海滨风情.上海的清新国际.西安的醇厚浓

大数据成就《人生需要揭穿》

上线4天,微博等社交平台最高单日提及量已经破万,国内首部揭穿剧<人生需要揭穿>正在由一部视频网站原创剧集,演变为一场全民揭穿浪潮的引爆点."跨年.情人节.光棍节这些特殊的节日,很多人热衷于在网络上分享自己的感悟,<人生需要揭穿>的目标用户群正是这群在社交平台上非常活跃的一群人."爱奇艺数据研究院院长葛承志表示,<人生需要揭穿>能够在社交平台大热,一方面得益于其专业的影视制作班底,另一个非常重要的因素在于在题材选择.目标观众定位以及上线时间.营销推广等

第五届CCF大数据学术会议在广东深圳圆满结束,这里也有大数据的“广”和“深”

2017年10月13日至15日,第五届CCF大数据学术会议(CCF BigData 2017)在深圳市麒麟山庄举行.本届会议由中国计算机学会主办,中国计算机学会大数据专家委员会和深圳大学联合承办.雷锋网也作为协办单位,全程参与会议并进行报道. CCF大数据学术会议的举办目的是探讨大数据相关领域面临的技术挑战,共享各类技术创新思想,展示中国大数据技术的最新研究进展,交流大数据的应用成果和研发经验.会议中以学术内容为主,也邀请了一些产业界人士共同分享真知灼见.在3天会议中,雷锋网(公众号:雷锋网) 

大数据生态旅游创精准扶贫新理念

杜熊董事长 百花湖 启动"300"计划 百花湖 贵谷集团部分员工合影 贵州省作为我国贫困人口数最多.贫困面积最多.贫困程度最高的省份之一,目前仍有623万贫困人口,总体原因可归结为贵州省的区域自然和地理环境较为恶劣.民族地区发展程度不同.农业基础条件薄弱.农村公共基础服务滞后.扶贫投入水平与实际需求量差距较大等.因此,如何保障和改善民生.如何加快脱贫步伐,成为"十三五"开局之年贵州省全面开展扶贫工作的重点关注方向,如何把贫困的贵州转变成山清水秀.百姓丰裕.物产富饶的

大数据如何推动金融业的商业变革?

无论是接受还是拒绝,中国金融业的大数据时代正在呼啸而至.据调查,经过多年的发展与积累,目前很多国内金融机构的数据量级已经达到100TB以上.而且,非结构化数据量正在以更快的速度增长.在高数据强度的金融行业,这一发展激起了巨大的想象空间.然而,要抓住这一机遇并非易事. 我们系统梳理了大数据在全球金融行业的发展现状.潜在应用.关键瓶颈及应对方案,旨在协助金融机构从价值的角度更好地理解大数据,并在大数据迅速渗入金融业务各个层面的当下抓住发展机遇. 大数据引领金融机构变革主要体现在哪些方面? 成就大数据