大開眼界!重慶誕生“DNA活字打印機”
近日,記者從兩江新區(qū)科研院所中科計算技術(shù)西部研究院(下稱:西研院)獲悉,該院與中國科學(xué)院北京基因組研究所(國家生物信息中心)、中國科學(xué)院計算技術(shù)研究所等多家科研機構(gòu)歷經(jīng)三年多的緊密合作與不懈努力研發(fā)出“DNA活字打印機”,該技術(shù)可以顯著降低DNA存儲系統(tǒng)的使用成本。
其中,研發(fā)團隊研發(fā)了“DNA活字打印機”工程樣機“畢昇一號”,這也是重慶誕生的首臺“DNA活字打印機”,技術(shù)達(dá)到世界領(lǐng)先水平。
近日,位于兩江新區(qū)的中科計算技術(shù)西部研究院,實驗人員正在調(diào)試DNA活字存儲噴墨打印機“畢昇一號”樣機。記者 張錦輝 攝/視覺重慶
近日,上述研究成果以《Cost-Effective DNA Storage System with DNA Movable Type》為題,在國際知名期刊《ADVANCED SCIENCE》(《尖端科學(xué)》)發(fā)表。
什么是DNA存儲,用DNA存儲有哪些優(yōu)勢?“DNA活字存儲”又是啥?“畢昇一號”有哪些功能?記者到西研院進(jìn)行了打探。
個頭小、容量大
DNA“天生”就適合存儲數(shù)據(jù)
西研院科研人員楊東鑫介紹,在大數(shù)據(jù)時代,全球的數(shù)據(jù)增長呈現(xiàn)井噴之勢。根據(jù)IDC的預(yù)測,僅2024年一年,全球就將生成159.2ZB數(shù)據(jù)。而1ZB等于1萬億GB。電腦硬盤的1TB僅等于1024GB。
為了存儲海量數(shù)據(jù),全球各地修建了大量的數(shù)據(jù)中心。硬盤、U盤等,也不斷“擴容”。但常見的硬盤壽命往往不足10年,每5-6年就需要更新,以免造成數(shù)據(jù)丟失。
在此情況下,急需一種體積小、容量大、保存壽命長的存儲介質(zhì)。而攜帶海量遺傳信息的脫氧核糖核苷酸(DNA),就是一種很好的存儲工具。
早在10多年前,國際上就提出了基于DNA的數(shù)據(jù)存儲技術(shù),即通過人工合成的DNA保存文本、圖片和聲音等數(shù)據(jù)文件,隨后經(jīng)由高通量測序完成數(shù)據(jù)準(zhǔn)確讀取的技術(shù)。
DNA數(shù)據(jù)存儲技術(shù)示意圖。西研院供圖
DNA具有超高存儲密度,據(jù)估算,1克DNA理論上攜帶有455EB(1EB等于約10億GB)的數(shù)據(jù),在這樣的密度下,1公斤DNA就能儲存全球數(shù)據(jù)。
并且,存儲數(shù)據(jù)的DNA可以保存為干粉,在恒溫條件下,數(shù)據(jù)可以完好保存上萬年。
“畢昇一號”DNA活字存儲技術(shù)的當(dāng)前成本約為每兆字節(jié)(MB)122美元,這一價格相較于現(xiàn)有的DNA存儲技術(shù)展現(xiàn)出顯著的成本優(yōu)勢。研究團隊透露,后續(xù)研究可通過一系列技術(shù)革新來進(jìn)一步降低存儲成本。
DNA存儲技術(shù)及其優(yōu)勢示意圖。西研院供圖
具體而言,通過增加活字連接段數(shù)和優(yōu)化反應(yīng)體系,他們有信心將存儲成本削減至每兆字節(jié)僅需0.06美元。
此外,隨著編碼技術(shù)的不斷進(jìn)步,例如集成高密度噴泉碼以及改進(jìn)DNA活字的校驗機制,預(yù)計“畢昇一號”DNA活字存儲的成本還將持續(xù)下降。這一系列技術(shù)突破不僅預(yù)示著DNA存儲技術(shù)成本的顯著降低,更為其商業(yè)化進(jìn)程的加速推進(jìn)奠定了堅實基礎(chǔ)。
建立DNA“活字庫”
可重復(fù)靈活利用
為什么傳統(tǒng)的DNA技術(shù)會如此昂貴?“DNA活字存儲”系統(tǒng)又為啥能大幅降低成本?
這是因為用傳統(tǒng)的存儲技術(shù),相當(dāng)于“雕版印刷”,只能一次性使用,所以成本昂貴。
將數(shù)據(jù)文件存儲到DNA中,需要轉(zhuǎn)換格式。傳統(tǒng)的文件在電腦中都用0和1組成的編碼來代表,科學(xué)家用DNA的4種堿基(即A、T、G、C)與電腦編碼對應(yīng),將文字、數(shù)據(jù)、圖片等“翻譯”為堿基的組合,再通過化學(xué)合成手段,將它們“寫”入DNA中。
楊東鑫打了個比方:用傳統(tǒng)的DNA存儲技術(shù)來存儲今天的《重慶日報》,就需要把報紙版面上的每個字、每個標(biāo)點都用化學(xué)合成方式“寫”入DNA,等于用化學(xué)合成方式重新印刷了一份《重慶日報》。
而如果要存儲昨天的《重慶日報》,就得從頭開始,把昨天的《重慶日報》全部內(nèi)容進(jìn)行一次化學(xué)合成,再重新“寫”進(jìn)DNA。
以此類推,如果要用DNA存儲一個月的《重慶日報》,至少要重復(fù)合成28次以上,成本怎能不高?
“畢昇一號”全自動的DNA活字存儲噴墨打印機示意圖。西研院供圖
還是用存儲《重慶日報》的例子。如果使用“DNA活字存儲”,每一天的《重慶日報》的報頭、版面樣式、字體等“活字”可以重復(fù)套用,只需要將每天不一樣的內(nèi)容重新“排版”組合即可。成本大幅降低。
畢昇一號DNA活字存儲系統(tǒng)的工作流程示意圖。西研院供圖
“畢昇一號”打印的第一句話
來自蘇軾的作品
在西研院的實驗室,記者看到了“畢昇一號”。它約有1.4米寬,約5米長。上部是密密麻麻的白色試管,下部有一條自動傳送帶。
“這些白色試管,就是DNA‘活字’庫,相當(dāng)于傳統(tǒng)打印機的墨盒。”楊東鑫介紹,目前“畢昇一號”的活字庫規(guī)模可達(dá)556種,打印時,這些“活字”以溶液形式存儲在數(shù)百個白色儲液管中。“畢昇一號”會通過電腦程序,自動從“活字庫”中選擇所需的“活字”。
近日,位于兩江新區(qū)的中科計算技術(shù)西部研究院,實驗人員將調(diào)配有化學(xué)試劑如同“打印紙”的微量離心管放入“畢昇一號”樣機。記者 張錦輝 攝/視覺重慶
而裝“打印紙”的,則是一個個的微量離心管。
“打印”時,微量離心管在傳送帶上自動移動,“活字”和數(shù)據(jù)寫入所需的基礎(chǔ)溶液(酶、載體)從相應(yīng)的白色儲液管中精確注入到對應(yīng)的離心管中。打印的過程實際上就是對數(shù)據(jù)寫入的過程。
近日,位于兩江新區(qū)的中科計算技術(shù)西部研究院,西研院科研人員楊東鑫正在關(guān)注DNA活字存儲噴墨打印機打印過程。記者 張錦輝 攝/視覺重慶
在前期準(zhǔn)備就緒的情況下,一次“DNA活字打印”最短大約僅需幾分鐘即可完成“活字”的精確打印(即數(shù)據(jù)的全程自動化寫入)。打印完的“成品”DNA可長期穩(wěn)定保存在冷凍冰箱中。
近日,位于兩江新區(qū)的中科計算技術(shù)西部研究院,小試管中裝的打印完成的液體“成品”DNA。可存儲文本、圖像、音頻和視頻等形式的數(shù)據(jù)。記者 張錦輝 攝/視覺重慶
近日,位于兩江新區(qū)的中科計算技術(shù)西部研究院,實驗人員將裝有打印完成的液體“成品”DNA小試探放入冰箱冷凍。記者 張錦輝 攝/視覺重慶
記者了解到,2020年,西研院正式組建團隊,參與到“DNA活字存儲”項目研發(fā)中。為紀(jì)念發(fā)明活字印刷術(shù)的畢昇,將“DNA活字打印機”命名為“畢昇一號”。
2021年4月,團隊基于“DNA活字存儲”方案進(jìn)行了首次全自動DNA存儲聯(lián)調(diào)試驗,并順利完成。“畢昇一號”打印的第一句話是“明月幾時有?把酒問青天”,出自蘇軾的《水調(diào)歌頭·明月幾時有》。
至今,團隊使用“畢昇一號”,陸續(xù)實現(xiàn)了對文本、圖片、音頻和視頻文件的存儲與讀取,圓滿完成既定任務(wù)目標(biāo)。
據(jù)悉,目前,西研院圍繞“畢昇一號”DNA活字存儲噴墨打印機已經(jīng)獲得了8項發(fā)明專利和2項實用新型專利。項目團隊接下來的工作重點是完善并升級現(xiàn)有設(shè)備,目標(biāo)在于盡快實現(xiàn)并推出成本更低的DNA存儲技術(shù)平臺。(新重慶-重慶日報原創(chuàng)記者 申曉佳 張錦輝)
分享讓更多人看到