蘋果發佈輕量AI模型SimpleFold,大幅降低蛋白質預測計算成本
【環球網科技綜合報道】9月25日消息,據海外科技媒體 9to5Mac報道,蘋果公司研究團隊對外發布輕量級蛋白質摺疊預測人工智能模型SimpleFold。該模型創新性採用流匹配方法,替代傳統模型中多序列比對等複雜模塊,在保障預測性能的同時,顯著降低計算成本,為更多科研團隊開展蛋白質相關研究創造有利條件,有望進一步推動藥物研發與新材料探索進程。
蛋白質摺疊預測是生命科學領域的重要研究方向,精準的預測結果能為疾病機理研究、藥物設計等提供關鍵支撐。此前,谷歌DeepMind公司的AlphaFold2、RoseTTAFold等模型雖在預測精度上取得突破,但由於依賴多序列比對、三角更新等計算密集型特定架構,模型的訓練與推理過程需投入大量計算資源,較高的硬件門檻限制了其在更廣泛科研場景中的應用。

為解決這一痛點,蘋果研究團隊將目光投向流匹配技術。據悉,流匹配方法源自擴散模型,與傳統擴散模型需通過逐步去噪生成目標結構不同,它能直接從隨機噪聲中一次性生成蛋白質目標結構,有效跳過多個去噪環節,不僅大幅減少計算量,還顯著提升生成速度。目前,這一技術已在文本生成圖像、3D建模等領域成功應用,其高效性得到充分驗證。
為全面檢驗SimpleFold的性能,研究人員構建了參數規模從1億到30億不等的多個模型版本,並在CAMEO22和CASP14兩大權威基準測試中展開評估。這兩項測試覆蓋模型泛化性、魯棒性(即系統或過程在面臨干擾、不確定性或異常輸入時,維持功能穩定運行的能力)及原子級精度等關鍵維度。結果顯示,SimpleFold在性能上穩定優於同類流匹配模型ESMFold,且整體表現可與頂尖蛋白質摺疊預測模型媲美。
具體數據表明,不依賴昂貴多序列比對和三角注意機制的SimpleFold,在CAMEO22測試中性能達到AlphaFold2、RoseTTAFold2的約95%;而參數規模更小的SimpleFold-100M版本,在保持高效計算特性的同時,性能超過ESMFold的90%。這一成果不僅驗證了SimpleFold的優異性能,更證明了通用架構模塊在蛋白質預測領域的可行性與競爭力。(純鈞)