陳根:“女媧”基因組發佈,提供中國人羣遺傳變異圖譜_風聞
陈根-知名科技作家为你解读科技与生活的方方面面。2021-11-20 10:23
文|陳根
1854年的夏天,孟德爾用34個豌豆株系進行了一系列實驗。他選出22種豌豆株系,挑選出7個特殊的性狀,通過觀察豌豆的突變性狀,總結出了超越時代的基因分離定律和基因自由組合定律。
21世紀的今天,生命科學領域已步入信息化的進程,生物信息學在生物研究中也越來越重要。人類基因組計劃(HGP)使人們意識到基因組本質上只是一種抽象編碼,只要能將這本“天書”讀懂,就可以解鎖生命的奧秘。
實際上,人類基因組中存在着大量的遺傳突變,其中只有少部分可以導致明顯的遺傳性狀。相對而言,很多遺傳變異僅從外表上無法看出,但並不意味着這些變異不會對機體造成健康影響。
遺傳變異圖譜對於研究人類基因組十分重要,針對特定人羣的基因組數據可以為全基因組關聯研究、區域適應性研究、用藥指導等提供更準確的參考。
自 2003 年第一次人類基因組信息發佈以來,許多大規模的全基因組測序 (WGS) 項目率先在西方國家啓動,生成了大量和多樣化的人口遺傳變異資源。然而,直到目前,中國人羣全基因組測序資源仍極大缺乏。

為此,中國科學院生物物理研究所的科學家們做了一次大規模的研究,系統介紹了一種被稱之為 NyuWa(女媧)的基因組資源,提供了針對中國人羣的遺傳變異圖譜推演服務,從而為促進中國人羣的遺傳學與醫學研究奠定了基礎。
NyuWa 基因組資源包括 2999 個不同中國樣本的高測序深度的 WGS 數。樣本來自中國 23 個行政區域,包括 17 個省、2 自治區和 4 個直轄市。大部分樣本來自上海、廣東和北京,共包括 1335 名女性和 1664 名男性。
**通過與其他變異信息公共數據庫相比,NyuWa 數據集包含 2500 萬個新的變異,包括 2310 萬個 SNP(32.5%)和 190 萬位點插入(23.3%)。**此外,蛋白質編碼基因共存在 3190 萬個變異位點,其中 85.7 萬個位於 CDS 區域,110 萬個位於 UTR,3000 萬個位於內含子。lncRNA 外顯子區共有 478 萬個變異。
總的來説,該研究對於擴充世界人羣遺傳資源多樣性、提高中國人羣醫學研究準確性十分重要。未來,也將對尋找複雜疾病遺傳因素的研究設計以及人口健康指導具有重要參考價值。