八旬院士“神預言”DeepSeek誕生!“真沒料到會成預言家”
陳潤生是我國非編碼基因研究的拓荒者,也是20世紀末至21世紀初全球規模最大的生命科學工程——“人類基因組計劃”的參與者。
很多人認識陳潤生是在一條熱傳的短視頻上。當DeepSeek成功崛起,很多人找出了兩年前他説的一句話,“堆積算力的盡頭是沙漠,不能夠一味地堆積芯片,而是應該開發底層創新。”
有人説當全球陷入算力競賽的時候,他成功預言了中國AI的破局之路,並不在芯片的數量,而在智算的密度。近日,總枱《吾家吾國》專訪中國科學院院士陳潤生,聽他講述他的科研人生。
在他的努力下,中國成為全球第六個
具備大規模基因組測序能力的國家
1964年,陳潤生畢業於中國科技大學生物物理系。上世紀80年代,正值中國改革開放之後首批大規模公派留學,他把目光投向了德國,因為那個時期德國在分子生物學和生物信息學上都處於國際的前沿。1985年,已經44歲的他前往德國紐倫堡大學從事量子生物學的研究。
1990年,陳潤生在《自然》雜誌上看到關於人類基因組計劃 的論文後,敏鋭地意識到基因組學將成為生命科學前沿的新課題。 於是,他給基因組學的創導者詹姆斯・沃森寫信,很快收到美國人類基因組計劃辦公室的回信,並獲得了人類基因組工程第一個5年計劃文本。

當時,中國的生物信息學和基因組學研究正處於轉型階段。1992年,中國醫學遺傳學奠基人吳旻提交的《中國人類基因組計劃重大項目建議書》獲批,成為中國參與國際人類基因組計劃的原點。陳潤生得知消息後,立刻拜訪吳旻院士,並希望承擔兩項關鍵任務:拼接測序片段和尋找重要功能基因。

1999年,中國加入國際人類基因組計劃,負責完成人類三號染色體短臂約 3000萬個鹼基對的測序任務,佔整個計劃的1%。
這看似只有1%的工作量,實際操作起來困難重重。測序片段的拼接就像沒有模板的拼圖,每段長度僅約一千個鹼基對,離完整拼接差距巨大。
面對這個難題,陳潤生團隊創新測序方法,最終提前兩年高質量完成任務,中國成為全球第六個具備大規模基因組測序能力的國家。
發現97%的基因暗藏致病玄機
向世界開源64萬個非編碼分子信息
在研究過程中,陳潤生髮現人類基因組中用於編碼蛋白質的序列僅佔2%—3%,其餘97%都是非編碼序列,曾被認為是垃圾DNA,沒有生物學功能。
但陳潤生堅信這些序列絕非無用,於是帶領團隊專注研究非編碼區域。“我堅信那97%絕對有用,不可能進化幾十億年,最後進化出來97%是垃圾,這不合邏輯。 ”
他們以食管鱗癌等多種腫瘤患者的組織為研究對象,發現部分患者編碼蛋白質的基因正常,但非編碼區域發生了變化,進而找到了許多與疾病相關的新位點。
從1993年開始,團隊建立超級檔案庫,整理、分類和存檔全世界科學家發現的64萬個非編碼分子信息。
陳潤生選擇開源這些信息,為全球科研人員提供研究基礎。他説,“科學是一個人類集成的貢獻,我們作為基礎研究人員,能提供我們的貢獻,這就足夠了。”**
“不要簡單把AI當成工具
而應把它視作創新中心”
基因研究外,陳潤生也一直關注着大模型。早在上世紀八十年代末,他就運用人工神經網絡來預測遺傳密碼中的編碼基因。對於生物信息學領域的研究者來説,各種方法都是相通且一脈相承的。他對DeepSeek等大模型發表看法,是長期在該領域深耕的必然結果。
如今,陳潤生團隊在生物信息學與醫學AI大模型方面積極探索,嘗試將中醫數據融合到模型中。
在他看來,雖然中醫和西醫對疾病的認知存在差異,但大模型可以提供一個融合的平台,將這些不同的數據整合處理,更好地服務人類。
對於未來AI的發展,陳潤生期待AI能夠“湧現”出更多創新火花,他提出將人工智能作為新的創新中心。“我們不要把AI當成簡單的工具,而是把它作為人類新的創新中心,這樣能有更多創新的可能性。”
本文來源:央視新聞微信公眾號綜合《吾家吾國》