DNA:下一場數(shù)據(jù)存儲革命!

蔥香娛看
我們現(xiàn)正在使用合成DNA來存儲數(shù)據(jù),不過將來可能會使用有機(jī)DNA,但實際上,如果您考慮一下,那是相反的。我們已經(jīng)在體內(nèi)使用有機(jī)DNA。我們已經(jīng)使用它存儲數(shù)據(jù)。

CNET和CBS News的高級制作人Dan Patterson采訪了從事DNA數(shù)據(jù)存儲的Catalog公司的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Hyunjun Park。以下是他們倆的談話內(nèi)容,已經(jīng)過編輯。

Hyunjun Park:為了便于討論,數(shù)據(jù)是指我們在全世界生成的任何類型的信息。但是就存儲目的而言,數(shù)據(jù)在我們眼里實際上就是一連串1和0。這是一長串的1和0,您通常使用計算機(jī)將這二進(jìn)制數(shù)據(jù)存儲在硬盤驅(qū)動器和閃存驅(qū)動器之類的介質(zhì)上。現(xiàn)在,我們試圖存儲在新介質(zhì)DNA上。

我們現(xiàn)正在使用合成DNA來存儲數(shù)據(jù),不過將來可能會使用有機(jī)DNA,但實際上,如果您考慮一下,那是相反的。我們已經(jīng)在體內(nèi)使用有機(jī)DNA。我們已經(jīng)使用它存儲數(shù)據(jù)。那就是染色體,即人體細(xì)胞內(nèi)的DNA。它以非常數(shù)字化的方式存儲信息,不過我們正嘗試使用我們模仿的合成DNA分子來復(fù)制該存儲方案。我們現(xiàn)在模仿大自然,使用這種新介質(zhì)存儲信息。

何謂合成DNA?說到底,它與有機(jī)DNA一模一樣,只不過我們從合成和人工的角度來探討。我們使用化學(xué)方法使分子看起來完全像人體內(nèi)的有機(jī)DNA。

人體已經(jīng)在使用DNA以非常數(shù)字化的方式存儲信息。我的意思是,四種不同的單位組成DNA。四個不同的堿基:A、T、G和C以及那些堿基對的順序決定了存儲在其中的信息。這是人體存儲信息的一種非常數(shù)字化的方式。因此我們從中得到了靈感,充分利用DNA的所有特征來存儲數(shù)字信息,而不是遺傳信息。這將發(fā)生在試管或?qū)嶒炇抑?,而不是在?xì)胞內(nèi)。

現(xiàn)在,我提到的優(yōu)點包括不可思議的信息密度。由于人體要將大量的遺傳信息塞到一個小小的細(xì)胞內(nèi),這意味著您可以在很小的體積中存儲大量信息。這就是信息密度。如果您考慮DNA的信息密度,每克DNA相當(dāng)于存儲200 PB左右的數(shù)據(jù)。

這意味著含有EB級數(shù)據(jù)的數(shù)據(jù)中心可以存儲在一塊方糖大小的DNA中。信息密度很大。另一個優(yōu)點是這些分子很穩(wěn)定。我們已經(jīng)能夠?qū)υ谟谰脙鐾林斜4媪?0萬年的馬匹的基因組進(jìn)行測序。利用DNA的信息存儲,您可以將信息一次性放入該介質(zhì)中,基本上可以永遠(yuǎn)保存。您可以將其存儲在室溫下的試管中,它是一種非常穩(wěn)定的信息存儲形式。

聽起來很牽強(qiáng),但我不敢邀功,我們不是第一個提出將信息存儲在DNA中或?qū)?shù)字信息存儲在DNA中的想法。這個想法已存在了數(shù)十年,甚至早在50年代就有了。之前使用DNA來存儲大量信息之所以不可能,是由于將信息寫入這些分子中的成本非常高昂。

我們Catalog所做的全新工作是,開發(fā)出了一個平臺,能夠從事基因存儲,比現(xiàn)有技術(shù)便宜得多、快速得多。我們填補(bǔ)了這一空白。

這項技術(shù)在實際生活中能派怎樣的用場?去年我們做了演示,使用我們研發(fā)的可打印分子的新型打印機(jī),將維基百科的所有英文文本存儲到DNA中。您可以想象在不久的將來,我們可以將這些機(jī)器連接到數(shù)據(jù)中心;針對需要長期歸檔或高度并行處理的數(shù)據(jù),我們可以以DNA形式存儲這些信息,并根據(jù)需要進(jìn)行查詢;如果需要,還可以創(chuàng)建成千上萬個副本。這也是DNA作為存儲介質(zhì)大有優(yōu)勢的另一個特點。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論