惊!科学家可利用DNA将数据中心压缩至方糖大小

DNA存储——延续千年的承载介质。

微软与华盛顿大学的研究员们已经演示相关方案,旨在利用合成DNA作为数据归档存储介质。

如果这项技术足够强大,则完全可以将沃尔玛这样的巨型企业的全部数据存储设备缩小为一块方糖尺寸,研究员们指出。

“我们认为时机已经成熟,基于DNA的存储方案已经具备可行性,且能够立足于此设计并架构相关系统,”研究员们在其论文中写道。

该研究团队已经成功将来自四幅图片的数字化数据存储在合成DNA片段当中。更重要的是,他们亦能够逆转该过程——即从较大DNA池中检索正确序列,并利用提取到的完整字节重构图像。

华盛顿大学计算机科学与工程研究科学家们混合DNA样本以实现存储功能。每条DNA中存储一个数字化文件。

另一项实验则证明,华盛顿大学的“卢旺达法庭之声”项目能够编码并检索数据,从而实现视频文件归档。该项目共使用49段视频,分别来自卢旺达战争罪法庭中对法官、律师以及其他相关人员的访谈。

“生命造就了DNA这一梦幻般的分子,其能够有效存储各类基因信息以及生命系统的运作方式——其非常紧凑且极为耐用,”威斯康星大学计算机科学与工程副教授、研究论文联合作者Luis Ceze表示。

“我们基本上就是在利用DNA存储数字化数据——包括图片、视频、文档,且其管理周期能够长达数百甚至数千年,”他补充称。

DNA数据存储研究进展神速。1999年,DNA存储方案还仅仅只能编码并恢复长度为23个字节的信息。

到2013年,来自英国EMBL欧洲生物信息学研究院的科学家们已经能够将马丁·路德·金的“我有一个梦想”演讲MP3文件存储在DNA当中。

研究员们在《自然》杂志上发表的论文中指出,只需一杯DNA即可存储至少长达1亿小时的高清视频数据。

而且根据英国研究员们的解释,存储在DNA链中的数据可以持续数万年之久。

读取DNA的方式非常简单,但向其中写入却难度很大。这方面共存在两项挑战:其一,利用现代方案仅能制造短DNA序列;其二,DNA在写入与读取时容易出错,特别是在重复相同的DNA字母时。

以上三幅图片为此次DNA数据存储实验中的对象。

微软与华盛顿大学的研究员们指出,他们开发出了“一种新型方案”,能够将长字符串转换为DNA序列的四种基本组成部分——腺嘌呤、鸟嘌呤、胞嘧啶与胸腺嘧啶,分别简写为A、G、C与T。

要访问这些数据,研究员们在DNA序列内编制出类似于邮编及街道地址的符号。聚合酶链反应(简称PCR)技术——常用于分子生物学当中——帮助他们能够更为轻松地识别自己正在搜索的邮编。

利用DNA测序技术,研究人员得以“读取”数据,并利用街道地址重新排序数据以将其恢复为视频、图片或者文档。

“将1和0转换为A、G、C和T非常重要,因为只有采用非常精妙的实现方式,我们才能提高存储密度并降低错误率,”论文联合作者Georg Seelig解释称。

微软与华盛顿大学的研究员们宣称,他们已经在编程语言与操作系统架构支持ACM国际大会上公布了研究成果。

“DNA拥有可观的发展潜力,”研究员们表示,因为其存储密度极高,理论极限比磁带高出八个量级。磁带技术能够在巴掌大的卡带中存储最高185 TB数据。

微软与华盛顿大学的研究员们还证实了合成DNA的长效性,称其能够在恶劣环境中带来超过500年的半衰期。相比之下,磁带寿命为10到30年,而磁盘驱动器则仅为3到5年——研究员们指出。

研究员们还强调称,预计到2020年存储于计算机中的全部数据——包括归档、视频、图片、企业系统数据以及移动设备信息——将达到44万亿GB,这一数字来自IDC与EMC的研究报告。

“这相当于2013年全部数据总量的十倍。虽然并非全部信息都需要进行长期保存,但可以肯定的是数据存储设备的增长速度完全跟不上数据的产生速度。”

不过在投入商业使用之前,DNA存储系统还需要克服一系列难题。首先,DNA合成与测序的效果还远称不上完美,每核苷酸中仍存在1%的排序错误率。因此,DNA存储需要设计出合适的编码方案,从而带来额外的容错能力。

再有,DNA存储不擅长实现随机数据存取,这意味着整体而言读取延迟远高于写入延迟。目前的进展只能够实现大型数据块存取;即使仅读取单个字节,也必须对整套DNA库进行测序与解码。

科学家们已经提出了对应的解决方案,即利用聚合酶链式反应(简称PCR)对需要的数据进行定向放大,从而通过针对性测序改善随机接入能力。如此一来,我们将不再需要对整套DNA库进行测序。

“这是我们借用大自然产物的绝对实例,”Ceze解释称。“但我们也在使用现有计算机技术对其加以完善,例如如何纠正内存错误,并让最终成果回归自然。”

本文转自d1net(转载)

时间: 2024-09-29 01:17:58

惊!科学家可利用DNA将数据中心压缩至方糖大小的相关文章

想不到!居然利用DNA存储数据

即使最终有一天人类从地球上消失,他们所创造出来的东西也可能暂时不会.但是,服务器,硬盘,闪存和磁盘最终会降解(和图书馆的纸质书籍一样).不过瑞士联邦理工学院的一群研究员们发现,可以将数据写入DNA,也就是生物的基因信息中并将其储存起来,用这种方式可以将信息保存千年之久. 根据<新科学家>杂志报道,1克DNA理论上携带有455艾字节(Exabyte,EB)的数据.1EB等于10亿GB,而1000EB等于1ZB.云计算公司EMC估计2011年全球数据总额也只有1.8ZB,这意味着我们只需要4克(一

EMC创建出《星际旅行》全息甲板,并利用其模拟数据中心

是的,我们猜--应该有用--吧 在着手构建数据中心之前,首先进行模拟验证 EMC公司现在已经能够利用虚拟服务器模拟数据中心内部的交互关系. 数据中心可以说是世界上最为复杂的建筑之一.然而,这并不是因为其中包含大量物理组件--事实上,其它复杂基础设施同样令人头痛,例如石化炼油厂房. 数据中心之所以如此复杂,是因为我们需要考虑物理设备内部与不同设备之间的交互广度与深度.这意味着我们需要立足于硬件及软件层进行设计,而后将微硬件细化到分子水平,这就让数据中心获得了几乎无可比拟的复杂性. 有鉴于此,建立与

惊艳!有一种数据中心的布线叫&quot;艺术&quot;

说起机房布线,在一部分企业的IT团队看来是非常简单的事情,而在另一部分企业的IT团队看来则是相当复杂.需要仔细规划并且严格执行的事情.而不一样的IT团队,就打造出了"我们家的机房"和"别人家的机房",究竟两者有何区别?看了自然心中有数!(PS:图片均来自网络)                                                                                本文转自d1net(转载)

微软拟用DNA存储数据:一段就能顶一个数据中心

5月24日消息,据Technologyreview报道,微软公司旗下研究院的研究人员表示,在早期利用NDA存储电影和文档的研究基础上,该公司正在研发利用生物学取代磁带驱动器的存储装置. 微软研究院的计算机架构师表示,该公司已经正式制定了一个目标,即在2020年之前,在数据中心内建立一个以DNA为基础的操作存储系统.微软研究院架构师道格·卡米(Doug Carmean)说:"我们希望3年内实现这样的愿景,即在原始商业系统中的DNA上存储相当于1个数据中心的数据量."卡米还描述了最终设备的

微软打算用DNA存储数据 但成本和速度仍是个大问题

5月24日消息,据国外媒体报道,微软去年就开始研究利用DNA存储数据,而现在微软已打算在2020年建立基于NDA的数据存储系统,不过目前NDA数据存储的成本和速度仍是这一计划顺利推进的障碍. 微软在去年春季开始联合华盛顿大学的研究人员研究利用DNA来存储数据,并在7月份宣布已成功在一段DNA片段中存储了200MB的数据. 而现在,微软已制订了一个更远大的目标,即在2020年之前,在数据中心内建立一个基于DNA的数据存储系统. 微软方面的研究人员表示,这一存储系统的大小同20世纪70年代的施乐复印

绿色数据中心 靠奇葩的散热降低能耗并不一定适用

在节能减排的大背景下,如何打造绿色节能的数据中心,降低能耗,控制成本,工程师们为此操碎了心.的确,在数据量爆增的当下,数据中心的节能减排问题已经引起了各大企业的足够重视,为了降低数据中心的能源消耗,工程师们使出了浑身解数,例如把数据中心建在冰川或者海底下,把服务器放到矿物油中散热,利用热水散热等等.首先,我们来盘点一下数据中心各种"奇葩"散热方式. 1)将数据中心建在南北极 将数据中心建在南北极,利用自然环境进行散热,从2011年开始,Facebook就宣布了在瑞典北部的卢雷亚(Lul

施耐德电气推新版数据中心运维管理平台

http://www.aliyun.com/zixun/aggregation/33721.html">2014年5月28日,全球能效管理专家施耐德电气近日宣布推出数据中心运维管理平台StruxureWare 7.4版,该款产品提供全新功能和访问可操作智能的通道,在整个数据中心生命周期内有效实现高可用性和高能效间的完美平衡.作为施耐德电气数据中心基础设施管理(DCIM)解决方案StruxureWare数据中心的一部分,数据中心运维管理平台StruxureWare 7.4版能够优化数据中心管

英特尔提高数据中心耐热能力:最高可达38度

近日,英特尔对其数据中心客户称,他们可以利用新技术提升数据中心的耐热度,最高达华氏100度(约为37.7摄氏度). 大部分服务器和存储设备被安置在一个冷却到华氏64至69度(约为摄氏18至21度)房间内,此举是为了避免热点可能导致设备发生故障.英特尔称,数据中心每年的空调电力成本为http://www.aliyun.com/zixun/aggregation/4962.html">260亿美元,占据全球1.5%的电能使用量,该数字到3721.html">2014年时还将翻番

那些选址奇特的数据中心趣谈

给数据中心选址是一件颇费周折的事情,要经过大量的实地考察.理论分析与设计,选址要慎之又慎.一般数据中心的使用周期都要数十年,一旦地址确认之后,无法再去改变.俗话说"好的开始是成功的一半",如果数据中心建的地址不合理,后续运行的数十年也将麻烦不断,所以选址是数据中心建设的关键环节.选址也是一个非常复杂的过程,涉及到方方面面,不仅是技术方面,也涉及资金.投资环境.税收.电力和通信等基础设施.交通成本.人力成本等等,每个企业自己的情况又都各不相同,要找到最适合自己的数据中心的地方,有时甚至要