Nature子刊:新的人工智能可以通過查看圖像來揭示細胞生物學_風聞
中国生物技术网-中国生物技术网官方账号-2022-08-03 14:25

在看到上面的那組狗狗的照片後,我們通常會根據長相(品種)、毛色、耳朵大小、臉型等特徵對它們進行快速地比較和分類。這似乎是人類所擅長的。然而,如果針對狗狗下面那組蛋白質圖像進行細胞分析,那顯然那不是人眼人腦能勝任的工作;但一種新的人工智能就可以做到。
眾所周知,細胞功能失調是許多人類疾病的根源,包括心血管疾病、神經退行性疾病、糖尿病和癌症等。因此,解釋蛋白質定位的多樣性和複雜性對於充分理解細胞結構和功能至關重要。它不僅可以揭示出健康細胞的工作方式;更重要的是,當疾病來臨時,它還可以讓科學家知道細胞內部發生了什麼。
2022年7月25日,發表在**《Nature Methods》上的一項新研究中,來自陳·扎克伯格生物中心**(簡稱CZ Biohub)的研究團隊開發了這種名為“Cytoself”的完全自監督的深度學習方法,可以在沒有預存知識、類別或註釋的情況下從熒光顯微鏡圖像中分類和比較不同的人類蛋白質,從而揭示出高分辨率的蛋白質亞細胞定位圖譜。

每個細胞包含大約10000種不同類型的蛋白質,它們中的一些單獨工作,另一些協同工作以保持細胞健康。蛋白質在細胞中定位的所有可能方式是什麼?它可能存在於任何位置,以及位置的各種組合。這是一個最基本的問題。幾十年來,生物學家們一直試圖建立細胞內蛋白質所有可能的位置和可能的結構。但這一直都是通過人工查看數據的方式來實現的。問題是,人類的侷限性和偏見在很大程度上會使這一過程產生瑕疵。
Cytoself要比人類做得更好。它可以找到更精細的類別,並在極其精細的圖像中看到差異。
在旋轉的3D UMAP圖像中,每個點代表單個蛋白質圖像。根據蛋白質定位類別進行着色
在這篇論文中,Cytoself不僅展示了機器學習算法的威力,還深入瞭解了細胞和蛋白質,提供了細胞內蛋白質定位豐富且詳細的信息。由於蛋白質的定位與其細胞功能高度相關,因此,Cytoself將是一個寶貴的工具,可以對未知的或研究不多的蛋白質進行初步的功能預測,並定量研究細胞擾動和細胞狀態變化對蛋白質亞細胞定位的影響。這將進一步加快細胞生物學的研究進度,並最終用於加速藥物發現和藥物篩選過程。

Cytoself是一個自監督學習的例子,這意味着人類不會像監督式學習那樣教授關於蛋白質圖像算法的任何內容。
在監督學習中,研究人員必須一個例子接一個例子地去教授機器學習算法,這需要大量繁瑣枯燥的工作;而且,如果機器僅限於人類訓練給它的知識類別,那麼它可能會在系統中引入偏差。
該研究第一作者Hirofumi Kobayashi説:“我們相信信息已經在圖像中了。我們想看看這台人工智能自己能學會什麼。”
他們發現,Cytoself從圖像中提取的信息量着實令人感到驚訝。
該研究共同通訊作者Manuel Leonetti説:“蛋白質定位的詳細程度比我們想象的要高得多。機器將每個蛋白質圖像轉換成一個數學向量。然後你可以開始對看起來相同的圖像進行排序。我們意識到,Cytoself可以讓我們以高特異性預測蛋白質在細胞中的協同作用,這着實令人驚訝。”
雖然以前也有一些研究使用了自監督或無監督模型對蛋白質圖像進行了研究工作;但該團隊表示,能在如此大的數據集上且如此成功地使用自監督學習還是首次。該數據集包含100多萬張圖像,涵蓋了從活體人類細胞中測量的超過1300種蛋白質。
這些圖像是CZ Biohub開發的OpenCell項目的一部分,該項目旨在創建人類細胞的完整圖譜,包括最終描述驅動細胞的20000種左右的蛋白質。
與CZ Biohub開發的所有工具一樣,cytoself是開源的,所有人都可以使用。該團隊望這將激勵更多研究人員使用類似的算法來解決自己的圖像分析問題。
今年早些時候,他們在**《Science》**上發表了第一批1310種蛋白質的特徵,包括每種蛋白質的圖像以及它們之間相互作用的映射。

Cytoself是OpenCell成功的關鍵(所有圖像可在OpenCell.czbiohub.org上獲得),提供了關於蛋白質定位的非常精細和定量的信息。

Cytoself團隊的下一個目標是如何利用對蛋白質定位的微小變化進行跟蹤來識別不同的細胞狀態,例如,正常細胞與癌細胞。這可能是更好地瞭解許多疾病和促進藥物發現的關鍵。
Kobayashi説:“藥物篩選基本上是試錯的過程。但對於Cytoself,這是一個巨大的飛躍,因為你不需要對數千種蛋白質逐一進行實驗。這是一種低成本的方法,可以大大提高研究速度。”
該團隊表示,Cytoself是關於人體細胞如何連接的重要生物學結果。同時,他們還在將該算法應用於新的問題,並且在繼續完善人類已知的一切和未知問題。未來,他們會將Cytoself應用於不同類型的圖像,從而開闢出更多的可能性。
論文鏈接:
https://www.nature.com/articles/s41592-022-01541-z
https://www.science.org/doi/10.1126/science.abi6983
https://opencell.czbiohub.org/