(原标题:Storing information on DNA is now cheap enough to be viable)
网易科技讯 7月2日音讯,据国外媒体Quartz报道,如今,将数据信息存储在DNA上的本钱曾经足够廉价,因而该技术无望完成商业化。
我们需求供认这样一个现实:我们曾经成为数码囤积者,消耗少量的空间来存储我们的数据。
2016年,人类合计发生了16.1万亿GB的数字信息;到2025年,这一数字估计将添加十倍以上。我们的团体照片、文本和电子邮件只是占很小的一局部;真正的数据激流来自于迷信家们在其研讨活动中所发明的海量信息,比方停止实验和临床实验,深化研讨生物的最小组成局部;察看其他行星,尽能够深化地察看浩瀚的宇宙。而我们目前放置数据的中央――内部硬盘和云效劳器机房――大局部都称不上完满的处理方案。它们占用少量的空间,而且每隔十年左右就需求晋级一次。
生物技术创业公司正在寻觅从我们的身体外部来处理这个成绩。详细地说,就是应用我们的细胞。
大容量存储的最新趋向是在DNA中编码数据。毕竟,基因资料曾经是一种编码技术。它编码的生活:每团体体细胞包括30亿个碱基对。配对的核苷酸要么是腺嘌呤(A)与胸腺嘧啶(T),要么是鸟嘌呤(G)与胞嘧啶(C)。它们的序列,是一切执行我们(和一切生物)存活所需的功用的蛋白质的秘诀所在。
包括美国国防初级研讨方案局(DARPA)在内的几家机构曾经开发了基于DNA的存储零碎,这种零碎可以将各种信息编码到巨大而波动的分子链中,分子链可以继续数千年。
只要一个成绩:制造编码信息的共同DNA本钱非常昂扬。据《连线》杂志报道,印制目前录制一分钟平面声响所需的150万对碱基对,本钱约为10万美元。
总部位于波士顿的Catalog公司正试图降低那些本钱。该公司是由麻省理工学院的前研讨人员兴办的。Catalog并不是用信息填充一长串DNA,而是制造20到30个碱基对长的DNA片段,这些片段可以用酶缝合在一同。这些片段的陈列决议了它们的意义。实质上,它就像一种言语:在英语中,只要26个字母,但经过各种组合,实际上,我们可以发明出有数不同的单词。Catalog估量,存储1MB数据的本钱将不到0.001美分。作为参照,在Spotify上,一分钟最高质量的平面声响约为2.4MB。
6月26日,Catalog宣布,它曾经运用这一零碎将道格拉斯・亚当斯(Douglas Adams)的小说《银河系遨游指南》(A Hitchhiker’s Guide to the Galaxy)和罗伯特・弗罗斯特(Robert Frost)的诗《未选择的路》(the Road Not Taken)存储到基因资料当中。该公司还表示,曾经取得了来自不同风险投资公司的900万美元投资。它方案明年将其技术商业化。
任何对该技术感兴味的公司可以将其想要存储的数据提交给Catalog,然后Catalog会将那些信息转换成二进制代码,即由0和1组成的长链。接着,该公司的流程为每个核苷酸分配一对0和1;例如,“A”可以是00,“C”可以是01,“T”可以是11,“G”可以是10。之后,经过运用这种DNA代码,数据被转换到一小瓶的基因资料里。小瓶子可以平安地寄存在任何温度到达4摄氏度的冰箱里,比方餐馆运用的那种冰箱。
当信息以这种方式存储时,你需求运用密钥来将DNA解码回二进制代码,然后转换回可读的格式。Catalog的开创人之一Hyunjun Park表示,一旦公司开端对信息停止编码,他们就会将他们的密钥地下,这样客户就可让任何人都可以对他们的信息停止重新排序。但是,企业可以恳求取得一个新的公有密钥,这样他们的信息就有了额定的加密层。
假如Catalog的技术真如它所说的那样无效,那么该公司将无望为使得基因数据存储可为任何人所用和继续数百年铺平路途。Hyunjun Park说,该公司正与档案学家协作,寻觅在DNA编码中参加明晰而耐久的密钥的最佳方式,以便将来我们的曾曾孙(或外星入侵者)可以本人解码Catalog DNA。(乐邦)