解碼人類基因組“暗物質”
記者 張夢然
人類基因組研究正邁入一個前所未有的精細與包容的新階段。一個國際科學家團隊在《自然》雜誌上發表重磅研究成果,他們利用來自65個不同祖先背景的個體完整基因組序列,成功解碼了人類基因組中一些最複雜、最被忽視的區域。
而這些區域的神秘和難解,如同基因組的“暗物質”。

新研究不僅填補了基因組數據中的關鍵空白,還揭示了隱藏的DNA變異如何影響從免疫反應到疾病風險等多方面的生物學功能。研究由美國傑克遜實驗室(JAX)共同領導,標誌着基因組學在邁向全球代表性與精準醫學目標上的重大進步。
從“空白”到“完整”:泛基因組研究持續演進
這一里程碑式的研究建立在近年來基因組學發展的兩大基石之上:2022年,科學家首次實現了人類基因組的完整測序,填補了人類基因組計劃中長期存在的空白,標誌着基因組學進入“完整基因組”時代;2023年,研究人員發佈了一份基於47名個體構建的泛基因組草案,首次在更大範圍內代表了全球遺傳多樣性。

此次新研究進一步擴展了這兩項工作,縮小了92%的剩餘數據空白,以前所未有的分辨率繪製了跨祖先羣體的基因組變異圖譜。研究不僅提升了基因組數據的完整性,更重要的是揭示了長期被忽視的結構變異。這些變異可能影響從消化、免疫反應到肌肉控制等關鍵生理功能,並有助於解釋為何某些疾病在不同人羣中表現出顯著差異。
正如研究共同負責人、JAX和康涅狄格大學健康中心遺傳學家克里斯汀·貝克所説:“長期以來,我們的基因參考系統未能涵蓋全球大部分人口,而這項工作捕捉到了關鍵差異,有助於揭示每個人疾病風險為何不同。基因組不是靜態的,我們對它們的理解也應不斷演進。”
從“盲區”到“全景”:揭秘結構變異
結構變異是指DNA片段中發生的缺失、重複、插入、倒位或易位等大規模變化,這些變異長期以來因技術限制而難以準確識別。尤其是在高度重複的基因組區域,傳統測序方法常常無法準確讀取。然而,這些區域往往與多種遺傳疾病密切相關。
新研究通過先進的測序技術和創新的分析工具,成功解開了1852個此前難以解析的複雜結構變異,並提供了開源分析工具,供全球科學家使用。研究團隊還首次完整解析了Y染色體、主要組織相容性複合體(MHC)區域、SMN1/SMN2基因簇以及澱粉酶基因簇等關鍵區域,這些區域分別與免疫、神經發育和消化功能密切相關。
此外,研究還首次在着絲粒區域識別出跳躍基因(轉座子)的插入,共編目了12919個轉座元件。這些“跳躍基因”幾乎佔所有結構變異的10%,可能在基因表達調控和進化過程中發揮重要作用。早在1983年,芭芭拉·麥克林托克因發現玉米中的跳躍基因獲得諾貝爾獎,現如今,這一領域的研究終於邁向更深入的人類基因組層面。
從現在到未來:精準醫學向人們招手
此次的成功離不開新一代測序技術的突破。科學家們結合了高精度的中等長度DNA讀段與長讀段技術,實現了對複雜區域的高分辨率解析。同時,JAX開發的專用軟件對基因組變異進行了精準分類,使研究人員能夠“看到”過去幾十年來一直被忽視的基因組部分。
“僅僅有一個長而完整的序列,並不意味着我們真的知道里面有什麼。”JAX計算生物學家彼得·奧達諾解釋道,“這些工具將使我們能夠解釋基因組中那些缺失的部分。現在我們可以明確指出,某個變異從哪裏開始、在哪裏結束,以及它具體是什麼樣子。”正是以此為基礎,這項進展為自閉症、罕見病和癌症等領域的研究提供了全新的工具和視角。
隨着研究的推進,基因組學正朝着更全面、更包容的方向發展。它不僅為理解人類遺傳多樣性提供了堅實基礎,也為未來精準醫學的實現鋪平了道路,確保科學進步能夠真正惠及全球所有人羣。