《自然》《科學》齊發里程碑,兩款新型AI精準預測蛋白結構_風聞
推医汇-汇聚健康行业资讯,推动学术交流。2021-07-16 14:20
去年,DeepMind公司開發的AlphaFold2人工智能系統,基於氨基酸序列,精確預測了蛋白質的3D結構。它的準確性與使用冷凍電子顯微鏡(CryoEM)、核磁共振或 X 射線晶體學等實驗技術解析的3D結構相媲美。這一突破被譽為“變革生命科學和生物醫學”的突破。

今日,DeepMind公司在《自然》雜誌上發表論文,公開了進一步優化的AlphaFold2人工智能系統的源代碼並且詳細描述了它的設計框架和訓練方法。同日,華盛頓大學(University of Washington)蛋白設計研究所David Baker教授課題組在《科學》雜誌上發表論文,公佈了其開源人工智能系統RoseTTAFold的研究結果。《自然》上發表的評論指出,這些論文和人工智能系統資源的發佈,不但讓基於DeepMind開發的AI系統預測蛋白質結構的技術能夠為廣大科學家和研究人員使用,而且有望進一步激發這一領域的進展。

蛋白質對生命來説不可或缺,它們支持生物體的幾乎所有功能。這些複雜的大分子由氨基酸鏈構成,而蛋白質的功能很大程度上決定於它的3D結構。生物醫學領域的眾多挑戰,包括開發治療疾病的創新療法,依賴於對蛋白質結構和功能的理解。
在過去的五十年中,科學家們已經能夠利用冷凍電子顯微鏡、核磁共振或 X 射線晶體學等實驗手段在實驗室中確定蛋白質的形狀,但每種方法都依賴於大量的試錯,耗時耗力,可能需要花上好幾年時間。1972年,諾貝爾化學獎得主Christian Anfinsen博士表示,理論上,蛋白質的氨基酸序列應該能夠完全決定它的3D結構。這一假説激發了50年來基於氨基酸序列,通過計算方法預測蛋白質3D結構的探索。
在2018年,DeepMind開發的AlphaFold人工智能系統首次在國際蛋白質結構預測競賽(CASP)上亮相。而在去年的CASP上,DeepMind的AlphaFold2系統表現驚豔,在接受檢驗的近100個蛋白靶點中,AlphaFold2對三分之二的蛋白靶點給出的預測結構與實驗手段獲得的結構相差無幾。有些情況下,已經無法區分兩者之間的區別是由於AlphaFold2的預測出現錯誤,還是實驗手段產生的假象。
綠色,實驗結果;藍色,計算預測結果;圖片來源:DeepMind Blog
AlphaFold2根據氨基酸序列預測的蛋白結構與實驗手段解析的結果幾乎完全重合
DeepMind今日發佈的更新版AlphaFold2在去年的系統基礎上進行了優化,在解析蛋白結構的速度上有了進一步的提高。主要開發人員John Jumper博士説,這一系統的處理速度快了大約16倍。根據蛋白的大小,它可以在幾分鐘到幾小時內生成準確的蛋白結構。

AlphaFold2系統去年在CASP上的出色表現促進了蛋白質3D結構預測領域其它團隊的進步。華盛頓大學蛋白設計研究所David Baker教授的團隊從AlphaFold2的設計思路中獲得啓發,構建了名為RoseTTAFold的軟件系統。它的神經網絡能夠同時考慮蛋白序列的模式,蛋白中不同氨基酸之間的相互作用,以及蛋白質可能出現的3D結構。在這個系統中,一維、二維和三維的信息能夠相互交流,讓神經網絡綜合所有信息,決定蛋白質的化學組成部分和它摺疊產生的結構之間的關係。
圖片來源:參考資料[3]
RoseTTAFold系統結構簡介
研究人員表示,RoseTTAFold系統在解析蛋白質3D結構方面的表現,與AlphaFold2的水平幾乎相當,在有些蛋白上甚至優於AlphaFold2。
在論文中,研究人員指出,這一工具還可以用於預測由兩個或者多個蛋白構成的複合體的構象。這讓研究人員可以直接從蛋白序列,推測出不同蛋白相互結合的結構模型。在論文中,研究人員利用IL-12和IL-12受體(IL-12R)的序列預測的IL-12/IL-12R複合體結構與此前用冷凍電子顯微鏡解析的結構非常類似。
圖片來RoseTTAFold系統能夠基於多個蛋白序列,預測複合體的結構源:參考資料[3]
Baker教授的團隊已經將RoseTTAFold軟件工具上傳到GitHub網站上,7月份以來,它已經被世界上超過140個不同研究團隊下載。
同時,該團隊也搭建了服務器,讓研究人員可以輸入蛋白質序列,然後獲得預測的蛋白結構。服務器在上個月啓動後,已經幫助解析了大約500名用户遞交的超過5000個蛋白結構。“我很高興科學界已經在利用RoseTTAFold服務器來解決重要的生物學問題。” David Baker教授説。
“我們希望這一新工具將繼續為整個研發團體造福。”論文的第一作者,Baker教授課題組的博士後Minkyung Baek説。
《自然》發表的新聞評論指出,隨着RoseTTAFold和AlphaFold2源代碼的公佈,研究人員可以在兩者的基礎上繼續前進,有望對人工智能系統做出進一步改進,攻克目前人工智能系統尚且無法確定構象的蛋白,以及使用這些軟件設計全新的蛋白。
我們期待這一天的早日到來。
參考資料:
[1] DeepMind’s AI for protein structure is coming to the masses. Retrieved July 15, 2021, from https://www.nature.com/articles/d41586-021-01968-y
[2] Jumper et al., (2021). Highly accurate protein structure prediction with AlphaFold. Nature, https://doi.org/10.1038/s41586-021-03819-2.
[3] Baek, et al., (2021) Accurate prediction of protein structures and interactions using a three-track neural network. Science, https://doi.org/10.1126/science.abj8754.
[4] AlphaFold: a solution to a 50-year-old grand challenge in biology. Retrieved July 15, 2021, from https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
[5] Accurate protein structure prediction now accessible to all. Retrieved July 15, 2021, from https://www.eurekalert.org/pub_releases/2021-07/uows-aps070921.php