用DNA存储数据

用DNA存储数据,这已经不是不可能实现的任务。我们之前为大家介绍过哈佛大学在DNA存储方面的工作,他们将700TB的数据存进了仅仅1克DNA之中。关于DNA存储的研究也不断地有着新进展,不久前,欧洲分子生物学实验室(EMBL)的研究人员创造了一种新的DNA存储数据方法,通过这种方法,他们克服了DNA存储易出错的问题,并且数据的存储时间可达成百上千年。这个新方法于1月23日在《自然》杂志上发表,文中表示,用这种方法存储1亿小时以上的高分辨率的视频,只需一小杯DNA即可。

现如今,全世界的数字信息量实在是太庞大了,大约有3Zb之多(相当于3*10^23个字节),而且还在不断大量涌入新的数字信息,这是数据存储所面临的一道难题。大容量的硬盘很贵并且需要持续的电力供应,就算是最好的“无电”归档材料,例如磁带,也在几十年内便会降解失效。而这在生命科学领域也成为了一个日益严重的问题,因为大量的数据(包括DNA序列)也是科学记录的重要部分。

“我们都知道DNA是一种很稳定的存储信息的介质,因为我们可以从千万年前的猛犸象的骨头里提取DNA,可见它能保存非常长的时间。”欧洲分子生物学实验室的尼克·高曼(Nick Goldman)解释道,“而且它非常小,密度又非常高,存储起来还不需要任何电力支持,所以运输和保存都很容易。”

尼克·高曼与他合成出来的人工DNA。图片来自EMBL

读取DNA的工作很简单,但是如何准确地写入数据仍然是实现DNA存储的主要障碍。目前研究者主要面临两个困难:第一,使用现在的方法只能制造出一小段DNA;第二,DNA的读写都非常容易出错,尤其是在大量相同的字符被编码进DNA时。而尼克·高曼和同事伊万·伯尼(Ewan Birney)想出了一种方法,克服了上述问题。

“我们只能使用较短的DNA序列来进行编码,但这种编码方式又会产生大量的相同字符串。所以我们就想,干脆就将编码分开成两个方向的若干个重叠的碎片,每个都搭载有索引信息,这样可以显示出每个碎片是属于整个代码的哪一段,这样就设计出了一个不允许重复的编码方法。利用这种方法,数据只有在四个碎片上出现相同的错误才会读取失败,而这种情况又是非常罕见的。”伊万·伯尼说道。

新的方法需要从编码信息中合成DNA,加利福尼亚州的安捷伦科技公司为研究者们提供了合成设备。伊万和尼克将一段经过DNA编码后数据寄给了安捷伦公司,其中包括一个马丁·路德·金《我有一个梦想》演讲的mp3文件,一张欧洲分子生物学实验室的jpg格式照片,一篇开创性论文《核酸的分子结构》的pdf文档,一首莎士比亚十四行诗的txt文件和一份编码的描述文件。

“我们从网上下载了这些文件,然后用它们合成了成百上千段DNA,最终合成得到的东西就像一小团灰尘,”安捷伦公司的艾米丽博士说道。她将样本寄回了实验室,那里的研究者将DNA排序后就可对其进行无错译码。

“我们以分子形式(即DNA)创造出了一种具有高容错能力的编码方式,而且这种存储方式在合适的条件下可以存放一万年,甚至更久,”尼克说道,“只要有人知道这些编码是什么,再有一台可以读取DNA的机器,他们就可以知道其中的内容了。”

虽然还有很多实际问题需要解决,但是DNA的这种高密度和持久性使得它成为一种非常吸引人的存储介质。未来研究者将进一步完善编码方案,探索实际问题,为DNA存储的商业化铺好道路。

(责任编辑:蒙遗善)

时间: 2024-09-24 02:56:28

用DNA存储数据的相关文章

想不到!居然利用DNA存储数据

即使最终有一天人类从地球上消失,他们所创造出来的东西也可能暂时不会.但是,服务器,硬盘,闪存和磁盘最终会降解(和图书馆的纸质书籍一样).不过瑞士联邦理工学院的一群研究员们发现,可以将数据写入DNA,也就是生物的基因信息中并将其储存起来,用这种方式可以将信息保存千年之久. 根据<新科学家>杂志报道,1克DNA理论上携带有455艾字节(Exabyte,EB)的数据.1EB等于10亿GB,而1000EB等于1ZB.云计算公司EMC估计2011年全球数据总额也只有1.8ZB,这意味着我们只需要4克(一

黑极空间:微软计划使用DNA存储数据

谷歌想要把人们的记忆放进数据库,洛杉矶科技初创公司Humai则想使用人工智能技术让死人复活,现在,微软计划使用人类的DNA存储数据. 科技已经带来了很多震惊,但这项技术可能成为终极冲击.你肯定知道很多种存储设备,但是否想过使用DNA分子存储数据呢?当前,微软正对此展开实地测试. "DNA就像计算机程序,但比历史上的任何软件都先进太多了."--比尔·盖茨 微软宣称,有可能通过技术将我们的过去和未来连接在一起.这家技术巨头在近日与Twist Bioscience公司结成合作关系时宣布,后者

微软拟用DNA存储数据:一段就能顶一个数据中心

5月24日消息,据Technologyreview报道,微软公司旗下研究院的研究人员表示,在早期利用NDA存储电影和文档的研究基础上,该公司正在研发利用生物学取代磁带驱动器的存储装置. 微软研究院的计算机架构师表示,该公司已经正式制定了一个目标,即在2020年之前,在数据中心内建立一个以DNA为基础的操作存储系统.微软研究院架构师道格·卡米(Doug Carmean)说:"我们希望3年内实现这样的愿景,即在原始商业系统中的DNA上存储相当于1个数据中心的数据量."卡米还描述了最终设备的

微软打算用DNA存储数据 但成本和速度仍是个大问题

5月24日消息,据国外媒体报道,微软去年就开始研究利用DNA存储数据,而现在微软已打算在2020年建立基于NDA的数据存储系统,不过目前NDA数据存储的成本和速度仍是这一计划顺利推进的障碍. 微软在去年春季开始联合华盛顿大学的研究人员研究利用DNA来存储数据,并在7月份宣布已成功在一段DNA片段中存储了200MB的数据. 而现在,微软已制订了一个更远大的目标,即在2020年之前,在数据中心内建立一个基于DNA的数据存储系统. 微软方面的研究人员表示,这一存储系统的大小同20世纪70年代的施乐复印

数据存储技术取得突破,存储数据需“开源”更需“节流”

日前,IBM研究团队成功地通过"孤立原子"(solitary atom)的方式创造出了全世界最小的磁体.具体的思路是,现有的数据存储技术及硬盘在存储数据时,大多需通过磁头磁化磁层上的介质,每存储1bit数据大约需要10万粒原子,而IBM通过"孤立原子"的方式,使数据存储的硬盘体积缩小了1000倍. 对此,该团队在<自然>(Nature)杂志上发文称,这一突破将为人类带来令人兴奋的全新数据存储系统. 如今,移动计算和云计算飞速发展,全球数据量随之猛增.数据

你可能还没听过DNA存储技术,但微软已经打算三年内将其商用了

如果未来我们能够像使用磁带一样用DNA存储数据,那么理论上可以将人类有史以来记录的所有数据存储在大约两个车库大小的空间里. 本周,微软研究院的计算机网络架构师们跟外媒分享了他们的愿景.他们表示,希望在接下来的几年时间里,开始将数据存储到DNA链中,并于2020年前将DNA存储系统投入到数据中心中使用. 尽管老式磁带看起来有些过时,但它仍然是目前最佳的数据存储方式之一,不仅价格便宜,而且可以有效保存数据长达30年.每卷磁带还可以容纳多达1TB的数据. 但考虑到过去两年产生的数据比此前人类历史上的数

微软黑科技:DNA存储技术催生方糖大小的数据中心

凤凰科技讯 北京时间4月12日消息,据科技网站Computerworld报道,微软和华盛顿大学研究人员已经展示了利用人工合成DNA作为数据存储介质的技术. 研究人员表示,如果这一技术成熟到适合主流应用,装备当今存储密度最高的存储设备.沃尔玛超市般大小的数据中心,就可能"瘦身"到一块方糖大小,"我们认为,考虑把DNA作为存储介质,探索相关系统设计问题的时机已经成熟". 研究团队成功地将4个图片文件的数据编码为人工合成DNA片段的核苷酸序列.更重要的是,他们能实现逆过程

DNA存数据,可存2000年

云天明(<三体 III>中浪漫悲情男)为了给几千万年后的程心写信,不得不把信息刻在石头上,如果他有DNA存档技术,就不需要这么笨重的方法了. 一个研究团队成功演示了可以把数据存储在DNA里并经受长达2,000年存档衰变,证明我们可以寻求基于DNA的存储解决方案而不是几十年就损坏的传统硬盘来保存信息和数据. 探索用DNA作为归档存储设备的科研人员将在美国化学学会(ACS)第250届全国会议暨展览会上展示他们的工作,披露这一显著成果. 他们的实验是这样进行的: # Robert Grass和他的研

DNA存储技术创造新纪录 存储容量已达200MB

DNA存储技术是利用人工合成的脱氧核糖核酸(DNA)作为存储介质,具有高效.存储量大.存储时间长等优点.据外媒报道,近日来自微软和华盛顿大学的一组研究人员宣布他们已经在DNA存储技术方面创造新纪录,目前已利用这项技术完成了约200MB数据的保存,其中包括古登堡计划(Project Gutenberg)数据库中的100部经典文学作品.研究人员表示,首先他们需要把数据中诸多由"0"和"1"组成的长串转换为DNA序列的四个基本组成部分:腺嘌呤(A).鸟嘌呤(G).胞嘧啶(