AI是搶活還是賦能?顏寧給出最新答案
陈轩甫专业压稿
近日,中國科學院院士、深圳醫學科學院院長、深圳灣實驗室主任顏寧,應上海交通大學人工智能學院邀請,在該校徐匯校區“上海交通大學大師講壇|匯智大講壇”上作學術報告《CryoSeek(酷尋)——以結構為先導的生物學發現新範式》。顏寧回顧了自己主要的學術生涯,並探討了AI與科研的關係等熱點問題。
“要能上教科書”
顏寧坦率地表示,2007年在清華大學剛建立實驗室時,“當時有一個特別簡單的目標,就是東西做出來,要能進教科書”。
糖酵解是每一本、每一版生化教科書裏一定會有的,所以就把葡萄糖轉運蛋白如何獲得能量作為研究重點。
另一個重點則是電信號的產生和傳導,聚焦在與此相關的鈉離子通道上。
她戲言,自己是個“吃貨”,因為這兩個方向就是糖和鹽(鈉)。
顏寧還透露,她的“初戀”課題其實是與另一類“吃貨”要素——脂肪相關的蛋白(膽固醇調控元件結合蛋白,SREBP)。但是,這一領域到現在為止進展非常緩慢。她也藉此提醒學子,“當以問題為導向時,有時因為技術還不夠發達,可能要暫時擱置,過多少年有新技術了,再回過頭來研究”。
不過,葡萄糖轉運蛋白的結構,在被破解之前同樣是巨大的挑戰。“在X-射線晶體衍射技術主導的年代,膜蛋白是當之無愧的最難的靶點,所以我們當時是非常敢啃硬骨頭的。”
轉運並不是原本想的三步走——打開、通過、關閉那麼簡單。大分子有不同的構象(conformer),就像手掌能攤開,能握拳一樣。顏寧表示,轉運蛋白有許多構象,結構都要一一破解,“在沒有理解這些細節的時候,去説基於結構的製藥云云,都只是一種幻想”。

葡萄糖轉運蛋白GLUTs的晶體結構以及在此基礎上進一步完善的GLUTs工作模型 《自然》
這些研究結果如願登上了教科書後,下一個目標就是鈉離子通道,且不説構象變化,光α亞基的亞型就有9個(Nav1.1-1.9)。其中,與痛覺相關的Nav1.7,頗為引人關注。
在2004-2006年間,通過對無痛症和痛覺異常的人測序,科學家剛剛鎖定Nav1.7的作用,破解其結構是最前沿的問題。
加之全世界有大約三分之一的成年人受到某種疼痛的折磨,以及止痛藥濫用現象抬頭,製藥企業也非常關注這個潛在的新藥位點。
然而,晶體衍射的方法需要大量非常純的蛋白來結晶,鈉離子通道蛋白本身非常達,又有糖基化和磷酸化,“想得到蛋白都非常難,更別説用結構解析了”。
顏寧感慨,“幸虧我們又迎來了一場技術革命”,代表性的成果就是2013年,大衞·朱利葉斯(David Julius)與程亦凡用冷凍電鏡技術,解析出了辣椒素受體(TRPV1)的結構。戴維於2021年獲得諾貝爾生理學或醫學獎。

人類Nav1.7-β1-β2複合體結構 《細胞報告》(Cell Reports)
顏寧介紹了為推動冷凍電鏡技術進步,而做出貢獻的諸多科學家,特別是“分辨率革命”。提高分辨率的關鍵,一是計算力大大提高,二是材料科學的突破,誕生了直接電子探測成像系統,可以直接捕獲高能電子信號。
“以前它的分辨率達到10埃就已經很不錯了,經過這場革命,現在已經達到1埃,就是0.1納米的分辨率,使得以前只有X射線晶體學和核磁共振能做的事情,電鏡也可以做了。”隨後,顏寧團隊將冷凍電鏡技術運用到鈉離子通道及類似的鈣離子通道上,目前已經破解了這些通道中的大部分構象。
那麼根據氨基酸序列預測蛋白質三維結構的AI工具Alphafold,能不能預測構象呢?顏寧表示,Alphafold的預測暫時沒有意義,“不是我們想要的構象,而且它也沒有那樣高的精準度,所以我們還在吭哧吭哧地做着”。

一些藥物與Nav1.7的結合 《自然通訊》
要展示一個跨膜轉運蛋白的工作週期,需要靜息態、激活態和失活態,每一種狀態下可能又有很多亞狀態。
“過去我們拿到的主要是失活態,現在對於如何拿到激活態也已經有了一定的線索,應該很快能做出來,但研究靜息態目前還是最難的。”
蛋白結構研究依然長路漫漫,也風景無限。在顏寧看來,最重要的還是方法的開發,尤其是交叉學科的努力。例如,石墨烯載網的材料製備,在膜兩側加電勢的方法,處理流程的優化,分辨率的提高,等等。分辨率尤其重要。(Resolution matters.)
她提醒説:“常見的情況是,開發方法可能發不了好文章,而且進展又慢,但是一旦能夠取得突破,就會帶來巨大的影響。”
科研範式轉變:從“問題導向”到“觀察啓發”
在研究蛋白質的過程中,由於純化而丟失了糖,糖與蛋白的相互作用就沒法展現了,把純化過程“最小化”勢在必行。
如果再進一步,不要特殊的純化直接觀察呢?
基礎的電鏡技術如今已相當成熟,不僅可以揭示出已知分子的高分辨率結構,它還有可能幫助發現新的分子。
顏寧認為,過去用顯微鏡觀察微觀世界,而現在世界上分辨率最高的顯微鏡就是電子顯微鏡,特別是冷凍電鏡,“我們能不能拿它來看看這個大千世界,看能發現什麼”。
這種“觀察啓發”的科研範式,與之前的“問題導向”截然不同。
最終,為了避免“糟蹋外太空的、月球上的、深海的樣品”,顏寧團隊選擇了朱自清筆下的清華荷塘。
他們取出水樣後,只過濾了渣滓,再濃縮樣品,放入電鏡——“突然間,真的就是開眼看世界了”。


清華荷塘纖維 PNAS
水中發現了大量獨特的纖維,在AI的幫助下,蛋白質大多得以歸類,但有一類怎麼都做不出來。“最後是我方人類,用肉眼盯了三個小時”,才恍然大悟,這是糖啊!
“這些結構完全是靠糖撐起來的,真的是進入一個新的領域”。這些從沒有觀察過的結構,被顏寧稱為“生命暗物質”。
每一個結構還帶來了大量的問題:糖是如何摺疊的?它們有什麼樣的作用?這麼漂亮的結構,這麼複雜的糖,它是如何合成的?還更嚴峻的問題,它們來自於哪?這些纖維裏面的蛋白序列只有幾種氨基酸的重複,如何去查?
顏寧説:“實驗室研究範式正在從問題導向變成觀察驅動”。
最令人興奮的是,甚至還發現了只有糖沒有蛋白的纖維,未來它有沒有可能用於碳中和?因為靠生物體的光合作用合成糖,長期儲存要滿足不少條件,而這種糖纖維可以直接穩定地存在於自然環境裏,要求就簡單多了。它還能抗温度變化,抗各種酶切,或許可以作為一種新材料,甚至成為信息存儲的載體。

荷塘裏的各類纖維
在這一新領域,同樣也有技術的開發,以及AI的應用。“以前我們兩週做一個結構,現在一天做了十幾個結構,正努力在方法開發上把電鏡做成一個高通量的技術。”
觀察者網還了解到,顏寧團隊今年10月在線發佈的論文,介紹了一種名為Ahaha的簡單高效算法,專門用於在冷凍電鏡圖像中測定糖纖維的絕對手性。

Ahaha測定糖纖維絕對手性 BioRxiv
冷凍電鏡(cryo-EM)與“尋找”(seek)相結合,這整套新方法便有了個很酷的名字——“酷尋”(CryoSeek)。
AI的“影響”是賦能
顏寧表示,現在的電鏡技術已經非常厲害,“大家不要怕電鏡”,也不要覺得電鏡很貴,許多設備是開放共享的。
但電鏡“酷尋”得到的大量信息,仍然有待解讀。解決之道一方面是在線公開數據,與全球學者分享;另一方面,就是訓練並利用AI。
當Alphafold橫空出世時,曾有人擔心,像顏寧這樣破解蛋白結構問題的學者,會不會“受影響”,她在現場表示,“AI是為我所用的”。
原本AI不認識糖,現在顏寧團隊已經自己開發能夠自動搭建糖的AI模型。
顏寧表示,每一次技術革命都是把人從相對繁瑣的工作中給解放出來,讓你可以去做最想做的,這本身就是很棒的賦能。
AI賦能科學(AI for Science)正在加速推動科學發現,而生物學也可能賦能AI(Biology for AI)。“我們大腦能這麼節能地去處理信息,是因為從有生物開始到現在、長達幾十億年的進化,讓我們大腦結構高度複雜。生命把太陽能轉化成了化學能,經過這麼多年的儲能,才有了現在這樣一個高級結構。”
顏寧暢想,參考大腦,AI未來的硬件結構,或許也會有變化。各學科對AI的賦能,可能是一個更深刻的科學問題。