陳根:MIT的新機器學習模型,讓醫藥研從坑中避坑_風聞
陈根-知名科技作家为你解读科技与生活的方方面面。2022-05-11 10:38
文/陳根
眾所周知,一款新藥是一個風險大、週期長、成本高的艱難歷程,國際上有一個傳統的“雙十”説法**——10年時間,10億美金,才可****能成功研發出一款新藥**。即使如此,大約只有10%新藥能被批准進入臨牀期,最終只有更小比例的藥物分子可以上市,甚至有人將這個過程形容為“死亡之谷”。
面對投入越來越高的製藥領域**,**人工智能作為一種新興技術,被視為新藥研發實現降本增效的重要方式之一。一方面,人工智能可以幫助尋找疾病、基因和藥物之間的深層次聯繫,以降低高昂的研發費用和失敗率。
基於疾病代謝數據、大規模基因組識別、蛋白組學、代謝組學,人工智能可以對候選化合物進行虛擬高通量篩選,尋找藥物與疾病、疾病與基因的鏈接關係,提升藥物開發效率,提高藥物開發的成功率。
另一方面,工智能可以虛擬篩選候選藥物**,幫助科研人員高效找到活性較高的化合物,提高潛在藥物的篩選速度和成功率**。人工智能可以通過模擬小分子化合物的藥物特性,在較短時間內挑選出最佳模擬化合物進行合成試驗,大幅提高化學合成路線設計速度,以降低操作成本。

當然,人工智能協助製藥也並非一帆風順,其中一個重要問題就是,人工智能所構建的****這些新的分子結構模型經常在實驗室中難以或不可能產生。而如果化學家無法實際製造分子,就無法測試其抗病特性。
基於此,麻省理工學院研究人員的一種新方法****限制了機器學習模型,因此它只建議可以合成的分子結構。該方法保證了分子是由可以購買的材料組成的,並且這些材料之間發生的化學反應遵循化學規律。
**具體來看,****為了創建一個分子結構,該模型模擬了合成一個分子的過程,以確保它能夠被生產。**該模型得到了一套可行的構建模塊,即可以購買的化學品,以及一個有效的化學反應列表,以便進行操作。這些化學反應模板是由專家手工製作的。通過只允許某些化學品或特定反應來控制這些輸入,使研究人員能夠限制一個新分子的搜索空間有多大。
該模型使用這些輸入來構建一棵樹,通過選擇構件並通過化學反應將它們連接起來,一次一個,來構建最終的分子。在每個步驟中,隨着更多的化學品和反應的加入,分子變得更加複雜。而這個模型既滿足了輸出最終的分子結構,又能輸出合成它的化學品和反應樹。
與其他方法相比,此次研究人員所開發的模型提出的分子結構在流行的評價中得分很高,甚至更高,同時也保證可以合成。他們的系統還需要不到一秒鐘的時間來提出一個合成途徑,而其他單獨提出分子然後評估其合成能力的方法可能需要幾分鐘。在擁有數十億潛在分子的搜索空間中,這些時間的節省會增加。
儘管對於新藥發現和研發,人工智能可以解決的部分依然有限,但長遠來看,人工智能對於醫藥研發的貢獻依然可估量,未來,人工智能藥物研發將不再是生物醫藥行業中一個概念性技術,而是成為行業中非常核心的存在。