DeepMind AI實驗室預測出大多數蛋白質結構 - 《華爾街日報》
Steven Rosenbush
DeepMind科技人工智能實驗室的研究人員週四表示,他們已經預測出幾乎所有已知蛋白質的結構,這是生物學領域的重大突破,將加速藥物發現進程,並有助於解決可持續發展和糧食安全等問題。
這家總部位於倫敦的實驗室是谷歌母公司Alphabet旗下的子公司,開發了一種名為AlphaFold的算法,可預測蛋白質的三維結構。蛋白質存在於所有生物體中,在細胞功能中發揮關鍵作用。該項目始於2016年。
去年7月,DeepMind發佈了包含35萬種蛋白質預測結構的AlphaFold數據庫,其中包括人體內所有蛋白質結構,供全球研究人員和實驗室自由使用。到2021年12月,數據庫已擴展至100萬種蛋白質。
週四DeepMind宣佈,該數據庫現已涵蓋2.14億種預測蛋白質結構,幾乎包含科學界已知的所有蛋白質,涉及動物、植物、細菌等多種生物體中的蛋白質。
瘧疾蛋白Pfs48/45的三維圖像。圖片來源:DeepMind科技DeepMind聯合創始人兼首席執行官德米斯·哈薩比斯表示,瞭解蛋白質結構對理解其功能至關重要。此前,這類建模需要依賴耗時且昂貴的X射線等實驗方法。
“去年七月我們推出這個數據庫時,它被公認為生物學領域的重大突破,我認為這也完美展示瞭如何利用人工智能推動科學發現。現在查詢蛋白質三維結構幾乎像用谷歌搜索一樣簡單。”哈薩比斯博士表示。
歐洲分子生物學實驗室副主任兼歐洲生物信息學研究所所長尤安·伯尼指出,在AlphaFold的推動下,這項持續數十年的蛋白質建模研究取得了巨大進展。該研究所參與了該項目合作。
“這個難題困擾了我們太久太久。”伯尼博士感慨道。
牛津大學分子寄生蟲學教授馬修·希金斯透露,過去一年間,科研人員運用AlphaFold加速了瘧疾疫苗研發。這種每年導致全球數十萬人死亡的傳染病,其關鍵蛋白Pfs48/45的研究曾長期受阻。
“儘管投入多年心血,傳統方法始終無法清晰呈現這個分子的結構細節,我們只能獲得非常模糊的影像。”希金斯博士解釋道。
據他介紹,一位博士後研究員將AlphaFold預測的蛋白質結構與實驗獲得的模糊影像進行比對,兩種模型完美契合,最終清晰揭示了該分子的結構特徵、作用機制及抗體結合方式。
“AlphaFold的應用具有革命性意義,讓我們首次看清了這種瘧疾表面蛋白的真實面貌。”希金斯博士強調道。
AlphaFold是一種神經網絡系統,它基於已知蛋白質模型進行訓練,並學會了自主預測蛋白質結構。
“這是科學與人工智能領域的非凡里程碑,展示了AI作為科學發現工具的作用,其規模前所未有,“南加州大學工程系教授兼Nikias講席教授Shrikanth Narayanan表示。Narayanan博士稱共享AlphaFold精選數據集有望推動全球科研與臨牀轉化。
DeepMind以開發多款突破性AI模型聞名,例如掌握複雜圍棋遊戲的AlphaGo,該程序在2016年擊敗了頂尖棋手李世石。
Angus Loten對本文亦有貢獻。
聯繫記者Steven Rosenbush,郵箱:[email protected]
更正與補充説明
谷歌母公司Alphabet旗下DeepMind Technologies的AlphaFold數據庫最初於2021年7月發佈時包含35萬種預測蛋白質結構,至2021年12月擴展至100萬種。本文早期版本錯誤稱初始數據庫包含100萬種預測蛋白質。(已於7月29日更正)
本文發表於2022年7月29日印刷版,標題為《AI實驗室預測絕大多數蛋白質結構》。