告別“十年磨一劍”的製藥模式 神農平台開啓“AI+製藥”時代_風聞
懂懂笔记-懂懂笔记官方账号-2021-09-26 23:05
今年5月發佈業界首個2000億參數中文預訓練語言模型——鵬程.盤古之後,鵬城實驗室在Huawei Connect 2021又發佈新成果——鵬程.神農平台,一個面向生物醫學領域的人工智能平台。
AI正在加速向各行各業滲透,用全新的模式破解傳統產業的痛點。醫藥領域多年來一直存在着“雙十魔咒”,即十年的研發週期,十億美元的投入,但最終未必是一定能有完美的研發結果。鵬程.神農平台的落地,有望助力醫藥行業告別“十年磨一劍”的製藥模式,開啓“AI+製藥”時代。
“雙十魔咒”有解了
抗生素是人類歷史上的重大發現,不僅大大提升了人們的抗病能力,也讓人類的壽命延長了數十年。
但是,隨着抗生素的廣泛使用甚至濫用,目前細菌對抗生素的耐藥性問題已十分嚴重,抗生素耐藥性正在對全球健康構成威脅。因此,發展新型抗生素勢在必行。基於不同機制的新型抗生素正處於研發的不同階段。另外,由於生物技術的迅猛發展,促進了抗體藥物的發展,抗菌多肽類藥物成為抗生素領域的新生力量。
根據世界衞生組織近日發佈的一份報告,儘管人們越來越意識到抗生素耐藥性的迫切威脅,但世界仍未能開發出急需的新型抗菌治療方法。世衞組織助理總幹事哈南·巴爾基(Hanan Balkhy)表示:“開發、生產和分配有效的新抗生素的持續失敗進一步加劇了抗生素耐藥性的影響,並威脅我們成功治療細菌感染的能力。”
抗菌肽具有廣譜抗菌活性,對細菌有很強的殺傷作用,並且某些抗菌肽對部分病毒、真菌、原蟲和癌細胞等有殺滅作用,甚至能提高免疫力、加速傷口癒合過程,在醫學上有非常好的應用前景。
但是抗菌肽的研究進展並不快。世界上第一個抗菌肽是1980年被發現的,此後人們相繼從細菌、真菌、兩棲類、昆蟲、高等植物、哺乳動物乃至人類中發現並分離獲得具有抗菌活性的多肽。但是這樣的研究過程很慢,效率低下。人類利用自然合成的方法在40年間僅僅發現了4000多種候選抗菌肽。
廣闊的應用前景與傳統的研究方法之間的矛盾,因技術的進步看到了新機遇。
抗菌肽分子量在2000~7000左右,由20~60個氨基酸殘基組成。今天,藉助鵬程.神農平台強大的序列生成能力,結合現有的抗菌肽數據集,可以在很短的時間內生產數萬種候選肽的氨基酸序列,而且經過篩選的高價值的潛在序列,提高生成準確率,再經過生物實驗室和臨牀驗證,極大加速了新型抗菌肽的發現過程。
行業迭代,AI+成製藥行業新動能
中國古代神話傳説中的神農是通過嚐遍百草瞭解每一種植物的藥性,“嘗”百草是古代探索藥性的基本方法,無論是中國歷史上的神醫藥聖李時珍用畢生精力撰寫的《本草綱目》,還是藥王孫思邈《千金要方》中記錄的藥草、藥方,都是通過傳統的方式一點點試出來的。也正是因為方法受限,醫藥的進步也很緩慢。
發展到現代製藥產業,包括資金、技術、經驗等各方面的條件都在不斷提升,但製藥依然是一個成本高、投資大、風險高的行業。行業內有一個共識,新藥研發是一場九死一生的冒險,新藥研發成本都在10億上,研發週期一般是10-12年,臨牀失敗率高達95%。比如人類對艾滋病、阿爾茨海默、癌症等病一直無解,無數藥企、研究機構投入重金研發,但至今這些病還都沒有研發出特效藥。2020年初,突然爆發的新冠疫情給席捲全球,多項研究遭到擱置,這對許多研製新藥的企業而言無異於雪上加霜。
全球生物醫藥規模持續增長,但是醫藥研發的效率不斷下降,研發一款新藥投入的成本和時間越來越呈指數級的增長。以德勤公司發佈的研究報告顯示,藥物開發的投資回報率從2010年的10%穩步下降至2018年的2%左右。
這一點在抗生素藥物的研發上更為明顯。世衞組織的報告指出,雖然有一些前景不錯處於不同開發階段的產品,但是由於藥物開發過程中巨大的經濟成本和內在的科學挑戰,這些產品中只有一小部分會最終進入市場。再加上成功的抗生素產品能帶來的投資回報少,導致主要私營投資者和大多數大型製藥公司的積極性不高。
報告證實,新抗生素的臨牀前和臨牀開發繼續由中小型公司推動。這些企業通常在臨牀開發的後期或直到獲得監管機構批准之前,都難以為其產品融資。
從上個世紀80年代開始,製藥行業就開始利用計算機來輔助藥物的研發。但是依然不能滿足人類發展對於新藥的迫切需求。就以去年爆發的新冠疫情來看,無論是治療藥物還是疫苗,都非常急切。在此背景下,“AI製藥”也逐漸成為了當前藥學研究和前沿醫學創業的新發展熱點。
鵬程.神農平台是面向醫藥領域的一個新成果,包含蛋白質結構預測、小分子生成、靶點與小分子相互作用預測以及新抗菌多肽設計與效果評價等模塊。基於神農平台,各藥廠、機構可以做一系列的開發研究,通過蛋白質生成模型加速推理和生成氨基酸序列,並可開展更多生物研究科研任務。
以新型抗菌肽項目來看,基於已知抗菌肽結構,解密與掌握多肽類氨基酸序列規律,採用AI方式設計目標新型肽鏈,提高搜索空間和生成效率。神農平台可加速新型抗菌肽發現,這使得抗菌肽有望成為新一代“抗生素”。
傳統制藥行業之所以存在“雙十魔咒”,主要還是過於依賴專家的經驗。AI+製藥,則是將人類的經驗與計算機強大的算力結合。
鵬城可期,加速AI在行業應用中落地
人工智能正從單點技術走向真正的通用技術,AI的通用性、泛化能力以及性能,決定AI在各行各業的就應用價值以及發展速度。以前,行業AI多侷限於單點技術,應用落地依賴工程師的開發能力以及專業人員的經驗,AI應用呈現出碎片化,成本高、落地慢等痛點。而鵬程.盤古大模型、鵬程.神農平台具備很強的泛化能力,通過與行業知識結合,少量樣本也能達到高精度,基於預訓練+下游微調的工業化AI開發模式,這無疑將大大加速AI在行業應用中的落地。
以鵬程.盤古大模型為例,作為業界首個 2000 億參數中文預訓練語言模型,預訓練階段學習了40TB中文文本數據,是最接近人類中文理解能力的AI大模型。盤古NLP大模型具備廣泛的運用場景,在知識問答、知識檢索、知識推理、閲讀理解等文本生成領域表現突出。未來金融領域,可以輔助識別企業風險,助力企業盡調和項目審核;在醫療方面,其強大的信息抽取能力,可以幫助科研人員和醫生從海量文獻中快速提取關鍵知識。
無論是鵬程.盤古大模型還是鵬程.神農平台,背後離不開AI平台的支撐。
昇騰AI基礎軟硬件平台,包括昇騰處理器、Atlas系列硬件、異構計算架構CANN和AI框架昇思MindSpore等。其中,CANN是針對AI場景推出的異構計算架構,通過軟硬件的協同優化,親和昇騰AI的圖編譯技術,持續擴充高性能算子庫,來釋放昇騰AI硬件的強大性能,極大提升應用可獲得算力。昇思MindSpore是面向萬物智能時代覆蓋端、邊、雲的全場景AI框架,為開發者提供了友好設計、高效運行、簡捷部署的開發體驗。昇騰AI基礎軟硬件平台,除了底層硬件本身自帶的強大AI計算性能,全棧化的整合更能在開發層面最大程度發揮出硬件最佳性能,從而降低AI應用開發門檻,最終加速AI向場景滲透的產業進程。
而基於昇騰AI基礎軟硬件搭建而成的“鵬城雲腦Ⅱ”主要提供人工智能研究必須的計算力資源、存儲資源、網絡資源、數據資源和研究環境,覆蓋人工智能基礎研究、重大應用、操作系統、數據資源共享、產業服務等專門研究實驗領域。國際超算大會(ISC21)最新一期IO500排行榜上, “鵬城雲腦II”蟬聯全系統輸入輸出和10節點規模系統兩項世界冠軍,再次刷新世界紀錄。特別值得一提的是,“鵬城雲腦II”在全系統輸入輸出性能角度的得分是第二名的近20倍,呈現碾壓優勢。如此強大的“鵬城雲腦II”成為大模型研發的肥沃土地,土地越肥沃,生長出來的花花草草也就越茂盛。
當然,花草長得是否種類繁多,更重要的就是要依靠生態。此前,鵬程.盤古的模型、代碼、數據集在 OpenI 啓智社區全面開源、開放,吸引更多行業的開發者共同參與,針對不同場景創新應用,已經在一些行業開花結果。
【結束語】
從0到1難,給1後面再加0就相對快得多。鵬程.盤古大模型和鵬程·神農平台乾的都是從0到1的事,當相於給AI造好了輪子。輪子造好了,行業應用也就會越跑越快。