意義堪比人類基因組圖譜!AlphaFold預測出98.5%人類蛋白結構_風聞
推医汇-汇聚健康行业资讯,推动学术交流。2021-07-23 11:43
“這是自人類基因組圖譜發佈以來最重要的數據庫之一!”

今日,谷歌旗下DeepMind團隊和歐洲生物信息研究所(EMBL-EBI)合作,發佈由人工智能系統AlphaFold預測的蛋白結構數據庫(AlphaFold Protein Structure Database)。這一數據庫將免費提供給全球的科研人員開放使用。新聞稿指出,如同人類基因組圖譜的公佈代表着基因組學革命的起點,這一數據庫的發佈也有望為生命科學帶來革命性的變化。歐洲生物信息研究所主任Ewan Birney博士將它稱之為人類基因組圖譜發佈以來最重要的數據庫之一。
截圖來源:DeepMind博客
一週前,DeepMind團隊剛剛在《自然》雜誌上發表論文,公開了優化的AlphaFold人工智能系統的源代碼並且詳細描述了它的設計框架和訓練方法。這一系統在2020年的國際蛋白質結構預測競賽(CASP)上表現驚豔,在接受檢驗的近100個蛋白靶點中,AI系統對三分之二的蛋白靶點給出的預測結構與實驗手段獲得的結構相差無幾。
今日公佈的蛋白3D結構數據庫包含了AlphaFold人工智能系統預測的約35萬個蛋白結構,覆蓋包括人類以及20種生物學研究中常用模式生物(大腸桿菌、果蠅、斑馬魚、小鼠…)。在人類蛋白質組方面,AI對98.5%的人類蛋白的結構做出了預測。此前,科學家們在數十年的努力之後,解析的蛋白結構只覆蓋了人類蛋白序列中17%的氨基酸。

今日在《自然》發表的論文中,研究人員指出,AlphaFold能夠對人類蛋白質組中58%的氨基酸的結構位置做出可信預測(confident prediction),對36%的氨基酸的結構預測達到很高的置信度(very high confidence)。
DeepMind和EMBL-EBI同時表示,雙方將不斷為這一數據庫添加新的蛋白3D預測結構。到今年年底,數據庫可能包含1.3億個蛋白結構。DeepMind團隊的目標是為所有具有已知序列的蛋白提供預測結構。
AlphaFold預測的結構仍然有很多侷限性。研究人員指出,很多蛋白通過與其它蛋白、核苷酸或配體結合來行使功能,AlphaFold尚且不能預測複雜複合體的3D結構。而且,蛋白構象很多情況下是個動態過程,同一個蛋白可能根據環境和其它因素,變換成不同的構像並且具有不同的功能。而AlphaFold通常只能預測出一個構象。對於不產生特定結構的氨基酸序列,AlphaFold也無法做出可信的結構預測。

即便如此,大規模的準確結構預測將給科學家們提供一個重要工具。EMBL-EBI發表的評論文章指出,這一數據庫將對分子結構生物學研究產生“立竿見影”的影響,啓動此前認為不可能或不實際的研究項目,加快複雜蛋白複合體的模型建立。對於廣泛的生命科學界來説,高質量的3D蛋白模型能夠幫助研究人員解釋觀察到的實驗現象,促進新藥靶點和候選藥物的開發。
作者表示,隨着AlphaFold數據庫的公佈,“結構生物學,以及廣泛的生物學,將永遠和以前不再相同,我們迫不及待地想看到這些新發展的影響——這將是一次令人振奮的體驗!”
參考資料:
[1] Putting the power of AlphaFold into the world’s hands.Retrieved July 22, 2021, from https://deepmind.com/blog/article/putting-the-power-of-alphafold-into-the-worlds-hands
[2] DeepMind and EMBL release the most complete database ofpredicted 3D structures of human proteins. Retrieved July 22, 2021, from https://www.ebi.ac.uk/about/news/press-releases/alphafold-database-launch
[3] Great expectations – the potential impacts of AlphaFoldDB. Retrieved July 22, 2021, from https://www.ebi.ac.uk/about/news/opinion/alphafold-potential-impacts
[4] DeepMind’s AI predicts structures for a vast trove ofproteins. Retrieved July 22, 2021, from https://www.nature.com/articles/d41586-021-02025-4
[5] Tunyasuvunakool et al., (2021). Highly accurate proteinstructure prediction for the human proteome. Nature, https://doi.org/10.1038/s41586-021-03828-1