為什么不用DNA存儲海量數(shù)據(jù)?

數(shù)據(jù)存儲的本質(zhì),實際上就是用一連串的1和0來編碼信息。對應到DNA存儲,則是將原本用0和1來表示的內(nèi)容,換成用堿基A、C、G、T來表示,數(shù)據(jù)編碼就是合成序列,解碼就是進行DNA測序解讀。

從原始社會的結(jié)繩記事,到之后的竹簡紙張,近代時人們用磁帶和光盤,而現(xiàn)在最為常見的還有閃存和硬盤……生活在被數(shù)據(jù)包圍的世界,人類從未停止追求高效便捷的信息存儲方式。

早前物聯(lián)傳媒對全球存儲領導企業(yè)西部數(shù)據(jù)進行采訪,了解到業(yè)界正預測到2021年,全球聯(lián)網(wǎng)設備將達到300億個,全球每年產(chǎn)生的數(shù)據(jù)量將從33ZB增長到2025年的175ZB。海量設備、天量數(shù)據(jù),這樣的現(xiàn)實推動人類尋找更大的存儲空間。

除了對硅制程工藝作出迭代以外,存儲生物遺傳密碼的介質(zhì)——DNA開始進入眾多科技公司和研究機構(gòu)的視野。

原理上是可行的

數(shù)據(jù)存儲的本質(zhì),實際上就是用一連串的1和0來編碼信息。對應到DNA存儲,則是將原本用0和1來表示的內(nèi)容,換成用堿基A、C、G、T來表示,數(shù)據(jù)編碼就是合成序列,解碼就是進行DNA測序解讀。

再加上堿基有四個,相比于原本的0和1,能夠表達的狀態(tài)更多,比如用A代表00,C代表01,G代表10,T代表11。

此外,一個堿基只有幾個原子大小,且堿基之間的密度更大,因此DNA作為存儲介質(zhì)整體的體積較于傳統(tǒng)的硬盤將更小,現(xiàn)有技術也可以支持DNA存儲的穩(wěn)定性。

加速推進DNA存儲的研發(fā)

關于DNA存儲技術的探索在好幾年前就開始了。

2015年,在哈佛大學實驗室,研究人員把一幅“奔跑的駿馬”的動圖放進了活大腸桿菌的DNA中,并以90%的準確度測序解碼了出來。

2016年,華盛頓大學和微軟研究院在頂級期刊《Nature biotechnology》上發(fā)表DNA存儲的研究成果,表示成功用技術將莎士比亞的十四行詩、馬丁路德金的演講原聲、醫(yī)學論文等資料編碼成DNA序列并存儲起來。

2017年,國外還出現(xiàn)文章,表示如果采用DNA存儲技術,只需要1公斤DNA物質(zhì)就可以把當時全世界高達30ZB的數(shù)據(jù)全部存儲下來,一時掀起諸多爭論。

到2019年,來自歐洲的研究團隊發(fā)文,宣布首次將DNA作為信息存儲工具,注入到了一只3D打印的兔子中。并且,切下兔子身體的任何一部分,就能創(chuàng)建另一只相同的兔子。這項技術的革新在于,無生命特征的兔子也擁有了DNA,擁有了3.7億份描述它輪廓的數(shù)據(jù)文件。

2020年,關于DNA存儲的討論和研究還在繼續(xù),這項技術在實際生活中究竟能派上多大用場?商用路上最大的困難——成本高和效率低的問題該如何解決?如何避免DNA受到外部環(huán)境影響而變質(zhì)?每個研究者和參與公司在這條路上付出了無數(shù)的努力。

當然,即便一項超前的技術開始到來,其并不能快速將既有成熟有效的技術取代,甚至它們將有機會在未來共同存在。

正確的存儲方案對從數(shù)據(jù)中獲取最大價值至關重要

DNA存儲的優(yōu)點,在于體積小,數(shù)據(jù)存儲的容量大,數(shù)據(jù)保存的耐久性;

但DNA存儲的不足,在于其多用于“冷”數(shù)據(jù)的歸檔保存,替代磁帶存儲的可能性更大一些,實際在一些時延要求較高的場景,比如車聯(lián)網(wǎng),智慧工廠、視頻監(jiān)控,并不是可選用的存儲方案。

在這之中,閃存正是各項存儲介質(zhì)中最受到關注的一大領域,其從擅長的消費市場中萌芽,正在往更多的物聯(lián)網(wǎng)細分場景覆蓋蔓延。

而具體如何為存儲方案做好選型,獲取隱藏在數(shù)據(jù)中的寶貴價值,這是所有企業(yè)客戶的期許,也是存儲廠商長久努力的方向。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論