《華爾街日報》:驅動聊天機器人與搜索查詢的人工智能如何助力新藥研發
Karen Hao
插圖:弗吉尼亞·加布裏埃利在尋找新型抗病藥物的過程中,製藥公司長期採用費時費力的試錯法來篩選合適化合物。但如果人工智能能像谷歌預測你的搜索內容,或像郵件程序預判你的回覆(比如"收到,謝謝")那樣,預測出新藥物分子的構成呢?
這正是新型研究方法的目標——利用名為自然語言處理的AI技術(與OpenAI的ChatGPT生成類人回覆的技術相同)來分析與合成蛋白質。作為生命及眾多藥物的基礎單元,蛋白質的生物密碼與搜索查詢、郵件文本存在共性:均由字母序列構成。
蛋白質由數十至數千個稱為氨基酸的化學亞基組成,科學家使用特殊符號記錄其序列。每個氨基酸對應一個字母,使得蛋白質呈現為類似長句的組合形式。
自然語言算法能快速解析語言並預測對話走向,同樣可應用於這類生物數據以構建蛋白質語言模型。這些模型通過編碼所謂的"蛋白質語法"——即決定何種氨基酸組合產生特定治療特性的規則,來預測可能成為新藥分子基礎的字母序列。如此一來,藥物發現初期所需時間可從數年縮短至數月。
“大自然為我們提供了大量蛋白質的絕妙設計範例,它們擁有多種多樣的功能,”總部位於加州伯克利的初創公司ProFluent Bio創始人阿里·馬達尼表示,該公司專注於基於語言的蛋白質設計,“我們正在向大自然學習設計藍圖。”
蛋白質藥物被用於治療心臟病、某些癌症和艾滋病等多種疾病。過去兩年間,包括默克公司、羅氏控股旗下基因泰克以及Helixon Ltd.和Ainnocence等多家初創企業在內的公司,已開始利用自然語言處理技術研發新藥。他們希望這種方法不僅能提升現有藥物和候選藥物的療效,還能為發現前所未見的分子的可能性打開大門,這些分子或可治療胰腺癌或肌萎縮側索硬化症(ALS)等目前仍缺乏更有效療法的疾病。
“這類技術將開始攻克生物學中那些‘不可成藥’的領域,”位於華盛頓州温哥華市的藥物研發公司Absci Corp.創始人兼首席執行官肖恩·麥克萊恩表示。
Absci Corp.的實驗室,該公司正與默克合作探索藥物設計新方法。圖片來源:Absci據計算生物學家稱,用於藥物發現的自然語言處理技術仍面臨重大障礙。他們表示,對現有蛋白質藥物進行過多調整可能會引發意外副作用,而全合成分子需要進行嚴格測試以確保其對人體安全。
但如果自然語言算法能如採用者所願發揮作用,它們將為人工智能變革藥物研發的承諾注入新動力。以往的人工智能應用受限於技術瓶頸或數據匱乏。支持者指出,自然語言處理技術的最新進展與蛋白質測序成本的大幅下降(由此產生了海量氨基酸序列數據庫)已基本解決了這兩大難題。
鑑於該技術仍處早期階段,目前企業主要利用蛋白質語言模型優化已知分子,例如提升候選藥物的療效。以天然單克隆抗體為起點,模型可對其氨基酸序列提出調整建議以增強治療效果。
在8月發佈的預印本論文中,Absci公司研究人員運用此方法強化了基於抗體的抗癌藥曲妥珠單抗,使其與癌細胞表面靶點結合更緊密。更強的結合力意味着患者可用更低劑量獲得療效,從而縮短療程並減少副作用。
在3月發表於《美國國家科學院院刊》的另一篇論文中,來自麻省理工學院、清華大學及北京初創企業Helixon的研究人員,利用蛋白質語言模型將僅對α、β和γ變種有效的新冠候選藥物改造為可同時應對δ變種的版本。
橫跨中美兩國的初創公司Ainnocence,據其創始人兼CEO潘璐榮介紹,正協助客户運用此類模型將兔源抗體等動物蛋白質(藥物研發的常見起點)改造為符合人體生理的形態。
但即便是現在,製藥公司已將目光投向超越已知蛋白質修飾的領域,轉向所謂的從頭設計——即從零開始合成分子的過程。
基因泰克表示,最近一項實驗表明,可以設計出一種抗體,使其與市場上乳腺癌藥物帕妥珠單抗(基因泰克以Perjeta品牌銷售)相同的細胞靶點結合,但採用全新的氨基酸序列。基因泰克執行董事理查德·博諾(去年公司收購其初創企業Prescient Design時加入)表示,公司科學家僅向蛋白質語言模型提供了靶點和抗體所需的三維結構——這是蛋白質功能的主要決定因素。
Absci和Helixon也正與製藥公司合作,利用從頭設計方法開發針對癌症和自身免疫性疾病的藥物。據麥克萊恩先生透露,Absci今年1月宣佈與默克公司合作開發三個藥物靶點。默克發言人表示,公司已建立多項合作以探索人工智能在藥物開發中的潛力。Helixon首席執行官兼創始人彭健表示,上月與兩家大型製藥公司簽約,致力於攻克此前無法成藥的疾病。
“藥物研發中所有難題已停滯多年,正等待新一輪技術突破來解決,“愛諾華思的潘博士表示,“這確實是範式變革的方法論。”
最終,許多計算生物學家預期蛋白質語言模型將帶來超越加速藥物開發的效益。生物學家指出,該技術還可用於生產更高效的塑料降解酶、廢水處理劑和原油泄漏清理劑等環保應用。
“蛋白質是生命的勞動力,”ProFluent Bio公司的馬丹尼博士説,“它們讓我們能夠呼吸和看見,維持環境運轉,關乎人類健康與疾病。如果我們能共同設計出更優秀或全新的‘工作者’,這將帶來極其廣泛的應用。”
聯繫凱倫·郝,郵箱:[email protected]
刊登於2022年12月8日印刷版,標題為《AI對話技術或助力藥物研發》。