天津大學合成生物學團隊完成十幅敦煌壁畫DNA存儲
None
天津大學新聞網9月15日消息,隨着時間的推移,人類歷史文化遺產面臨着不可避免的老化和破損,如敦煌壁畫等。為了讓我們子孫後代都能欣賞到這一壯美的歷史畫卷,天津大學合成生物學團隊創新DNA存儲算法,將上述十幅敦煌壁畫存入DNA中,通過加速老化實驗驗證壁畫信息可在實驗室常温下可保存千年,在9.4°C下可保存兩萬年。

圖1 DNA存儲的敦煌壁畫

圖2 DNA存儲技術概念圖
團隊通過DNA合成技術結合糾錯編碼將壁畫信息寫入到DNA中實現了高密度(295 PB/g,1 PB = 1024 TB)的數據存儲。然而,DNA作為一種鏈式生物大分子,在體外常温保存時面臨DNA斷裂降解等風險,嚴重影響信息存儲的長期可靠性,是亟待解決的關鍵科學問題。

圖3 基於德布萊英圖圖論設計的序列重建算法高效解決DNA斷裂、降解問題
團隊設計了基於德布萊英圖理論的序列重建算法來解決DNA斷裂等問題。該算法結合貪婪路徑搜索和循環冗餘校驗碼來實現斷裂DNA片段的高效從頭組裝,從原理上支持了DNA存儲的長期可靠性。
結合該序列重建算法(內碼)與噴泉碼算法(外碼),團隊設計編碼了6.8 MB敦煌壁畫,合成了承載圖片信息的DNA片段21萬條。為數據的長期可靠性,團隊製備了一個沒有任何特殊保護的DNA水溶液樣本,並在70°C下加速樣本斷裂、降解長達十週。處理後的DNA片段80%以上都發生了斷裂錯誤,依靠設計的序列重建算法依然可以準確組裝並解碼96.4%以上的片段,再通過噴泉碼解決少量片段丟失的問題,原始的敦煌壁畫圖片依然能夠完美恢復。根據理論推算,這種程度的高温破壞相當於實驗室常温25°C一千年或者9.4°C長達兩萬年的自然保存。
該算法支持DNA分子成為世界上最可靠的數據存儲介質之一。這項技術為我們長期保存人類歷史文化遺產提供了一個潛在的數字化解決方案。相關成果以“Robust data storage in DNA by de Bruijn graph-based de novo strand assembly”為題在線發表於Nature Communications雜誌。
這是繼基於人工合成染色體的酵母體內信息存儲模式取得突破後(Chen et al., National Science Review, 2021, 8, 5, nwab028),天津大學合成生物學團隊在DNA信息體外存儲模式上又取得一項重要突破。