AlphaFold再獲重大突破!已預測出幾乎所有已知蛋白質的結構_風聞
中国生物技术网-中国生物技术网官方账号-2022-08-01 10:06

蛋白質是生命的基石,由氨基酸鏈組成,並摺疊成複雜的形狀。蛋白質根據儲存在DNA中的指令產生複雜的生物分子,它們執行着至關重要的細胞任務,並完成各種機體功能。

一些蛋白質是有益的,例如那些參與消化食物的蛋白質;而另一些則是有害的,例如那些參與腫瘤生長的蛋白質。它們各自都有着非常複雜的形狀和結構。
由於蛋白質的形狀與其功能密切相關,因此,瞭解蛋白質的結構可以更好地瞭解其作用和工作原理,這也是解決許多生命科學問題的關鍵,例如為疾病設計新的療法或疫苗,或解決糧食安全問題和環境污染問題等。
2020年11月,Google旗下人工智能團隊DeepMind宣佈開發出一個人工智能驅動的蛋白質摺疊模型,可以使用算法快速預測蛋白質結構,從而解決了生物學領域50年來的重大難題,即蛋白質如何摺疊。這意味着,曾經分子生物學家需要花費數年實驗來破譯的蛋白質結構,AlphaFold只需在幾分鐘內就能完成。這一突破性的進步證明了人工智能對科學發現的影響。
2021年,DeepMind和歐洲分子生物學實驗室(EMBL)旗下歐洲生物信息學研究所(EBI)在《Nature》上發佈了由AlphaFold預測的蛋白結構數據庫,涵蓋了人類和20種常用模式生物的35萬個蛋白質結構,並且對98.5%的人類蛋白質結構進行了準確預測。

而且,AlphaFold還入選《Science》2021年度科學突破榜首。
不過,上述突破仍是已知約200億種蛋白質中的一小部分。
當地時間7月28日,DeepMind和EMBL-EBI聯合宣佈,AlphaFold揭示出蛋白質“宇宙”的結構——已預測出100萬個物種超過2億個蛋白質的結構,幾乎涵蓋了地球上所有已知蛋白質。並且,正在加速幾乎所有生物學領域的研究。

同一天,**《Nature》**新聞也對此進行了報道。

從今天開始,確定已知的幾乎所有蛋白質的結構將變得像使用搜索引擎一樣簡單。

這些蛋白質“宇宙”的數據將在DeepMind和EMBL-EBI聯合建立的數據庫中免費提供。該團隊希望這一突破性的資源將有助於加速全球科學研究和發現,其他團隊可以從AlphaFold上取得的進展中學習和開發,以創造進一步的突破。
最新公佈的2.14億個蛋白質結構是基於另一個名為UNIPROT的數據庫中的序列。巴塞羅那Josep Carreras白血病研究所的計算生物學家Eduard Porta Pardo表示,科學家很可能已經對其中一些蛋白質的形狀有了概念,因為它們在實驗結構的數據庫中被涵蓋,或者與這類數據庫中的其他蛋白質相似。
根據EMBL-EBI的説法,在超過2.14億個預測中,大約35%被認為是高度準確的,這意味着它們與實驗確定的結構一樣好;另外45%的預測被認為可以在許多應用中使用。
許多AlphaFold預測的結構足夠好,可以在某些應用中取代實驗結構。或者,研究人員可以使用AlphaFold預測來驗證和理解實驗數據。不好的預測結果往往是顯而易見的,其中一些是由蛋白質本身的內在無序性造成的,這意味着它沒有明確的形狀。
DeepMind的創始人兼首席執行官Demis Hassabis在發佈的聲明中表示,從本質上講,最新公佈的預測已經涵蓋了整個蛋白質世界,包括動物、植物、細菌、真菌和其他生物體的預測結構。這一進展為AlphaFold在可持續性、糧食安全和被忽視的疾病等重要問題產生的影響開闢了巨大的新機會。

參考文獻:
https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe
https://www.nature.com/articles/d41586-022-02083-2
https://www.nature.com/articles/s41586-021-03819-2