讓信息保存千萬年的方法,是通過DNA的儲存_風聞
根新未来-2022-09-18 08:38
文/觀察未來科技
DNA擅長儲存信息,實際上,DNA最基本的任務就是儲存信息。
**一方面,DNA儲存信息具有高效率和低損耗的特點。**DNA攜帶的遺傳信息儲存於胞嘧啶(C)、鳥嘌呤(G)、腺嘌呤(A)與胸腺嘧啶(T)這四個核苷酸鹼基的排列順序之中。其中每三個鹼基對應編碼一個氨基酸。一個基因可能需要成百上千個鹼基才能產生一個蛋白質。對於儲存在DNA上的信息而言,需要200本電話簿才能將30億個鹼基序列印全。然而,人類23 600個基因僅佔用了DNA大約2釐米的長度。
**另一方面,DNA存儲信息****可以提供大量的信息密度和超常的半衰期。**如今,全球每年產生的數據需要4180億個1TB的硬盤才能放下,而把這些數據儲存在DNA上,僅僅需要1千克DNA物質。不僅如此,依靠生物鹼基不同的排列方式,這些信息還可以在-18℃的環境儲存100萬年之久。相比之下,紙張會腐爛,硬盤會降解,甚至連石頭也會風化,DNA卻可以徹底無視這些物理過程,保留人類文明的知識和歷史。

幾十年來,受到DNA儲存人類遺傳信息的啓示,科學家們一直想通過DNA來解決日益困擾人類的信息儲存問題。
現在,天津大學宣佈,該校合成生物學團隊創新DNA存儲算法,將十幅精選敦煌壁畫存入DNA中,通過加速老化實驗驗證壁畫信息在實驗室常温下可保存千年,在9.4℃下可保存兩萬年。該算法支持DNA分子成為世界上最可靠的數據存儲介質之一,可以讓面臨老化破損危機的人類文化遺產信息保存千年萬年。
值得一提的是,雖然DNA存儲高效低耗,但作為一種鏈式生物大分子,在體外常温保存時會面臨DNA斷裂降解等風險,嚴重影響信息存儲的長期可靠性。對此,此次研究團隊設計了基於德布萊英圖理論的序列重建算法來解決DNA斷裂等問題。該算法結合貪婪路徑搜索和循環冗餘校驗碼來實現斷裂DNA片段的高效從頭組裝,從原理上支持了DNA存儲的長期可靠性。
結合該序列重建算法(內碼)與噴泉碼算法(外碼),團隊設計編碼了6.8MB敦煌壁畫,合成了承載圖片信息的DNA片段21萬條。為數據的長期可靠性,團隊製備了一個沒有任何特殊保護的DNA水溶液樣本,並在70℃下加速樣本斷裂、降解長達十週。
處理後的DNA片段80%以上都發生了斷裂錯誤,依靠設計的序列重建算法依然可以準確組裝並解碼96.4%以上的片段,再通過噴泉碼解決少量片段丟失的問題,原始的敦煌壁畫圖片依然能夠完美恢復。根據理論推算,這種程度的高温破壞相當於實驗室常温25℃一千年或者9.4℃長達兩萬年的自然保存。
大數據與人工智能的大爆發,促使人類必須找到更多的新興算力之源,而DNA儲存的創新技術,很可能就是人類未來的智能新大陸,DNA儲存技術的突破,自然也就是人們朝着未來儲存技術的更進一步。