DNA存儲技術(shù)跨越時代

近幾年DNA存儲的研究已經(jīng)取得了一些突破。DNA已經(jīng)被研究人員用來以不同的方式管理數(shù)據(jù),這些研究人員正在努力理解海量數(shù)據(jù)。

本文來自半導(dǎo)體產(chǎn)業(yè)縱橫,作者/六千。

自從二進制成為計算機語言,人類社會的發(fā)展速度大幅加快,0與1在無數(shù)電路中改變了人類生活的方式。計算機的出現(xiàn)如同信息時代的一次大爆炸,讓人類可以快速處理大量的數(shù)據(jù),無論是日常生活還是科學(xué)前沿研究都有了翻天覆地的變化。

大量的數(shù)據(jù),帶來了變革,也帶來了考驗。據(jù)統(tǒng)計,2021年全球數(shù)據(jù)總量達到84.5ZB。(1ZB=1021B)如此龐大的數(shù)據(jù)量不但對算力提出了高要求,對存力也提出了極高的要求。為了存儲如此大的數(shù)據(jù),數(shù)據(jù)也住進了數(shù)據(jù)中心這樣的“樓房”之中。在2024年前,全球超大規(guī)模的數(shù)據(jù)中心數(shù)量可能達到1000個。數(shù)據(jù)中心越建越多,但土地資源有限,修建數(shù)據(jù)中心的“摩天大樓”是一件奢侈的事情,于是提高數(shù)據(jù)存儲密度成為另外一種解決方案。

為了尋找更高效能的存儲載體,研究者將目光對準(zhǔn)到了自然界中遺傳信息的載體DNA。作為遺傳學(xué)名詞,大眾對DNA并不陌生。在遺傳過程中,DNA序列存儲了遺傳信息,進而通過轉(zhuǎn)錄、翻譯的過程將遺傳信息復(fù)制,以維持生物發(fā)育和正常運作。曾有研究者猜想,外星人(或者高等文明)把一些信息存放在了生物的基因組中,等待人類會解密。這看似科幻小說中的猜測,其實是基于一個重要事實:DNA已經(jīng)傳遞了人類千百年來演進中重要信息,是已知的最密集和最穩(wěn)定的信息媒介之一。

DNA存儲技術(shù)如何實現(xiàn),又能帶來怎樣的改變?

DNA存儲靠譜嗎?

技術(shù)層面上來看,DNA存儲已經(jīng)被證明是可行的。

用DNA存儲信息的想法可以追溯到分子生物學(xué)出現(xiàn)的時期。生物化學(xué)家Frederick Sanger發(fā)明了Sanger測序法讓DNA序列可以測量,從此人類可以讀出以代號為A、T、C、G,排列組合而成的核苷酸序列。既然0與1可以成為計算機語言,那么用DNA序列傳遞特定信息同樣有可能實現(xiàn)。不過在當(dāng)時,合成一條10堿基的DNA序列需要花費6000美元,雖然材料性能不錯,價格過于高昂。

2345截圖20220818151609.png

DNA數(shù)字數(shù)據(jù)存儲的主要步驟

隨著DNA合成和測序新技術(shù)的發(fā)展,DNA作為數(shù)字存儲介質(zhì)不再是天方夜譚。2001年,一個研究組將兩句狄更斯的名言寫入到DNA序列中。用三個堿基代表一個英文字母,比如A=AAA,B=AAC。2009年,有研究組成功將兒歌“瑪麗有只小羊羔”的歌詞、樂譜和一張圖片編碼到一組DNA序列集合中。

DNA存儲的優(yōu)勢主要有兩個。一是存儲條件簡單,對于DNA只要保持足夠低的溫度,數(shù)據(jù)就可以保存數(shù)千年,因此擁有成本幾乎降至零;DNA能夠以遠超電子設(shè)備裝置的密度精準(zhǔn)地裝載海量數(shù)據(jù)。DNA存儲技術(shù)更適用于存儲重要且無需經(jīng)常訪問、調(diào)用的“冷數(shù)據(jù)”。“冷數(shù)據(jù)”在接近零能耗的情況下,理論上來看可保存千年以上。在未來DNA存儲極有可能成為龐大冷數(shù)據(jù)存儲的主要存儲介質(zhì)。

二是DNA存儲密度大,占地面積小,如果以DNA的形式存儲,每部制作的電影都可以存儲在比方糖還小的空間中。哈佛大學(xué)George Church及其同事于2016年在Nature Materials上發(fā)表的計算,簡單細菌大腸桿菌的存儲密度約為每立方厘米1019比特。在這樣的密度下,一個邊長約一米的DNA立方體可以很好地滿足世界當(dāng)前一年的存儲需求。從重量上看,每克DNA的數(shù)據(jù)存儲量能夠達到215PB,約為2,2544,3840千兆字節(jié)(GB),相當(dāng)于22萬個1TB硬盤的數(shù)據(jù)存儲量。

DNA存儲已有突破

近幾年DNA存儲的研究已經(jīng)取得了一些突破。DNA已經(jīng)被研究人員用來以不同的方式管理數(shù)據(jù),這些研究人員正在努力理解海量數(shù)據(jù)。新一代測序技術(shù)的最新進展允許輕松同時讀取數(shù)十億個DNA序列。有了這種能力,研究人員可以使用DNA序列作為分子識別“標(biāo)簽”來跟蹤實驗結(jié)果。

2345截圖20220818151609.png

DNA數(shù)字數(shù)據(jù)存儲相關(guān)主要成果的時間線(1995~2018)

哈佛大學(xué)的研究小組采用CRISPR DNA編輯技術(shù)將人手的圖像記錄到大腸桿菌的基因組中,讀取的準(zhǔn)確率超過90%。瑞士的研究人員設(shè)計出了一種“DNA-of-things”(DoT)存儲架構(gòu)來生產(chǎn)具有不可變內(nèi)存的材料。在DoT框架中,DNA分子記錄數(shù)據(jù),然后這些分子被封裝在納米二氧化硅納米珠中,這些二氧化硅珠融合到各種材料中,用于打印或鑄造任何形狀的物體。

2345截圖20220818151609.png

使用DoT技術(shù)打印3D兔子的過程

華盛頓大學(xué)和微軟研究院的研究人員已經(jīng)開發(fā)出一種全自動系統(tǒng),用于寫入、存儲和讀取DNA編碼的數(shù)據(jù)。

2021年12月,中國DNA存儲研究人員宣布開發(fā)出一種滑動芯片——這種微流體裝置能夠保存DNA化學(xué)物質(zhì)及各種試劑。一個滑動芯片可以是一個電極,其電荷會隨DNA序列的存在/不存在而改變。

2022年天津大學(xué)合成生物學(xué)團隊成功將10幅精選敦煌壁畫存入DNA中,并表示這些壁畫信息在常溫下可保存千年,在9.4℃下可保存兩萬年。

巨頭背書的DNA存儲技術(shù)

縱使DNA存儲技術(shù)可能具有跨時代的意義,但是否能夠真的被應(yīng)用呢?對此,存儲行業(yè)的巨頭持積極態(tài)度。美光科技高級研究員兼副總裁Gurtej Sandhu是最早參與DNA存儲技術(shù)研究的項目組成員之一。他在2016年參與了哈佛大學(xué)George M.Church的研究小組。希捷已經(jīng)將Catalog的DNA存儲技術(shù)引入其“片上實驗室”。希捷的DNA存儲與微流體研究工程已經(jīng)持續(xù)了兩年半,目前已知的專利申請有四項。

這家與希捷合作的公司是成立于2016年美國初創(chuàng)公司,Catalog曾經(jīng)通過制作20-30個堿基對的DNA片段,并將這些片段用酶縫合起來,通過不同的順序排列,實現(xiàn)數(shù)據(jù)存儲。Catalog曾用DNA技術(shù)存儲了小說《銀河系漫游指南》和詩歌《未走的路》。

存儲巨頭看好DNA存儲技術(shù),但DNA存儲賽道上更多的是以生物技術(shù)為核心的初創(chuàng)公司。這一現(xiàn)象的核心原因是DNA存儲技術(shù)的底層關(guān)鍵技術(shù)其實是DNA測序技術(shù)、DNA合成技術(shù)和DNA存儲技術(shù)。

DNA數(shù)據(jù)存儲技術(shù)的主要公司除了與希捷合作的Catalog還有美國創(chuàng)業(yè)公司Iridia。Iridia成立于2016年,旨在開發(fā)世界上第一個具有商業(yè)吸引力的基于DNA的數(shù)據(jù)存儲解決方案。通過結(jié)合DNA聚合物合成技術(shù)、電子納米開關(guān)和半導(dǎo)體制造技術(shù),公司正在開發(fā)一種高度并行的格式,以使納米模塊陣列具有以極高密度存儲數(shù)據(jù)的潛力。

DNA合成技術(shù)的公司包括法國公司DNA Script、美國公司Molecular Assemblies。

DNA Script成立于2014年,公司專注于使用專有的無模板技術(shù)制造合成DNA。通過快速、經(jīng)濟和高質(zhì)量的DNA合成技術(shù),大大加速新療法、可持續(xù)化學(xué)品生產(chǎn)、改良作物以及數(shù)據(jù)存儲等新應(yīng)用的開發(fā)。公司特有的酶促技術(shù)和核苷酸化學(xué)合成平臺,可以合成更高純度的更長的DNA序列,使序列的精確性提高500倍,合成速度更快,耗時縮短50倍。

Molecular Assemblies成立于2013年,公司開發(fā)的酶促DNA合成技術(shù),能夠為工業(yè)合成生物學(xué)、個性化治療、精確診斷,以及信息存儲、納米技術(shù)等領(lǐng)域的新產(chǎn)品提供動力。公司專有的DNA合成方法旨在提供經(jīng)濟可靠、可持續(xù)地生產(chǎn)高質(zhì)量、序列特異性的DNA。

Twist Bioscience成立于2013年,公司致力于為醫(yī)療、農(nóng)業(yè)、工業(yè)化學(xué)品和數(shù)據(jù)存儲等領(lǐng)域的客戶提供高通量的DNA合成和測序服務(wù)。公司開發(fā)的基于半導(dǎo)體合成DNA制造工藝,將反應(yīng)體積減少100萬倍,同時將產(chǎn)量提高1000倍,從而在單個硅片上全面合成9600個基因。2016年,微軟與Twist Bioscience簽訂協(xié)議訂購了約1000萬條DNA產(chǎn)品,用于測試DNA數(shù)據(jù)存儲能力。

DNA測序公司主要有英國公司Oxford Nanopore Technolog等。Oxford Nanopore Technologies成立于2005年,旨在開發(fā)基于納米孔科學(xué)的顛覆性電子單分子傳感系統(tǒng)。Oxford Nanopore Technologies開發(fā)了新一代傳感技術(shù),該技術(shù)使用納米孔-納米級孔-嵌入高科技電子設(shè)備中,進行全面的分子分析。

中國方面,2019年,華為宣布成立戰(zhàn)略研究院,表示主要研發(fā)前沿技術(shù),其中包括DNA存儲。2021年華為全球分析師大會上,華為董事、戰(zhàn)略研究院院長徐文偉表示將要借助DNA存儲來突破超大存儲空間模型和編碼技術(shù),打破容量墻。

2021年05月26日,中科碳元(深圳)生物科技有限公司(C-ATOM)正式成立。今年9月中科碳元依托中國科學(xué)院深圳先進技術(shù)研究院戴俊彪研究員團隊前期在DNA存儲領(lǐng)域的積累,通過自主研發(fā)并擁有自主知識產(chǎn)權(quán)的DNA在線編解碼系統(tǒng)(簡稱“ATOM”),使用自主引進的合成儀及測序儀,成功完成了從編碼、合成、保存、測序、到解碼的DNA存儲技術(shù)路徑完整流程。

DNA存儲的挑戰(zhàn)與潛力

目前DNA存儲技術(shù)的落地還存在一些技術(shù)難題,中國科學(xué)院院士樊春海表示,在DNA存儲的合成過程中,數(shù)據(jù)輸入和讀取的效率仍不高,耗費的時間較長、成本較高。中國科學(xué)院院士、天津大學(xué)副校長元英進表示,DNA信息存儲是一個新興的、多學(xué)科深度交叉融合的研究方向。想要將DNA存儲技術(shù)商用,還需要多領(lǐng)域的研究團隊共同攻關(guān)。

如果只有成本是問題,那么這終能被解決。DNA存儲是最具潛力的數(shù)據(jù)存儲方式之一已經(jīng)毋庸置疑。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論