陳根：人工智能，如何破解癌症語言密碼？_風聞

陈根-知名科技作家为你解读科技与生活的方方面面。2021-04-13 10:40

2021-04-13

文/陳根

當打開Netflix的時候，它會不會給你推薦一些劇，“恰好”是你感興趣的；當在Facebook上聊天時，它會不會給你推薦一些朋友，“恰好”是你欣賞的；當逛亞馬遜的時候，會不會推薦一些物品，“恰好”是你需要的。

其實並沒有那麼多“恰好”，這些推薦都是平台基於機器學習算法整合出的數據。而且，最新的研究顯示，這些平台的算法已經強大到可以幫助研究癌症和阿爾茨海默氏症等神經退行性疾病的生物學語言。

蛋白質是大而複雜的分子，它們在細胞內發揮着重要作用，是構成人體組織和調節器官功能的必需，比如抗體就是一種蛋白質，其功能是保護身體。

**在影響全球5000萬人的阿爾茨海默病中，蛋白質會變質，形成團塊，殺死健康的神經細胞。**健康的大腦有一個質量控制系統，可以有效地處理這些潛在危險的大量蛋白質，即所謂的聚合體。

但是一些無序的蛋白質形成液體狀的蛋白液滴，它們沒有膜，相互之間自由融合。蛋白質凝結物控制着細胞中的關鍵事件，如基因表達，任何與這些蛋白滴相關的缺陷結合都可能導致癌症等疾病****的發生，而疾病的大腦無法控制這些結合。

為此，研究人員使用類似的平台機器學習技術訓練了一個大規模的語言模型，以觀察體內蛋白質出現問題時會發生什麼。

研究人員特別要求該程序學習形變生物分子凝結物的語言，即在細胞中發現的蛋白質液滴，因為只有真正瞭解了這些語言，才能破解導致癌症和阿爾茨海默氏症等神經退行性疾病的生物功能障礙密碼。

科學家向算法提供了已知蛋白質的所有數據，結果發現，這些平台的機器學習技術可以解讀癌症、阿爾茨海默氏症和其他神經退行性疾病的生物語言。可以説，將機器學習技術引入到神經退行性疾病和癌症的研究中，絕對是一個遊戲規則的改變。

這一發現將有助於糾正細胞內部導致疾病的語法錯誤，以及幫助相關靶向藥物的開發，以極大地緩解症狀或根本防止痴呆症的發生。該突破性研究已於2021年4月8日發表在科學雜誌《PNAS》上。