重複的基因:你我都是復讀機_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!2021-01-29 16:01
人類的本質是復讀機?從基因上看確實如此。不僅每個人體內都有過半的重複DNA序列,而且每個人重複的方式還都不一樣。重複多了,還可能得病。
撰文 | 劉天同(清華大學醫學院)
只要在網上衝浪夠久,你總會遭遇靈魂一問:人類的本質到底是鴿子、檸檬、真香,還是復讀機?
有意思的是,這個問題有答案——從分子生物學上講,我們是復讀機。
在人類基因組中,有一種“自私的垃圾”DNA,它們包含大量類似 GAGAGAGAGA 這樣的重複序列,甚至可以佔據基因組的一半以上。
而它們卻不編碼蛋白質。
所以如此聒噪、狂刷存在感,是要幹啥?今天我們要講的就是這些“垃圾”DNA,看它是真垃圾,還是假垃圾。
從分子生物學上看,我們是復讀機。| 來自網絡
生物越複雜,DNA未必越多
常見的生物都有基因組,它是生物體中包含的DNA(部分病毒是RNA)中全部遺傳信息的總和。
我們或許直覺地認為,物種越複雜,其基因組中包含的 DNA 就越多。比如,作為萬物靈長的人類,我們每一個細胞中所含的 DNA 一定超過很多簡單的生物,才能編碼如此豐富的信息。
但人們很快發現,事實並非如此:對不同物種,個體細胞中所含的 DNA 的量不僅差異巨大,而且與決定生物複雜性的基因數量似乎並無多少關係。
*基因,是指有遺傳效應的DNA或RNA片段,其數量越多,生物功能越複雜。
比如,蠑螈基因組的大小是人類的幾十倍,基因數量卻並不比人多,也明顯不如人類複雜。只會吃飯睡覺撓沙發的貓貓,基因組幾乎跟人類一樣大。
蠑螈的基因組比你大幾十倍。|University News
貓的基因組跟你一樣大。所以誰是主子?|圖蟲創意
於是我們不禁納悶,那些多出來的DNA,是用來當擺設的嗎?
1970年前後,科學家們發現,基因組上有一些 DNA 並不轉錄出 RNA(一般而言,蛋白質都是由RNA翻譯,被稱為“中心法則”),從而也不直接參與蛋白質的合成,它們叫非編碼 DNA。對不同物種,非編碼DNA在基因組中所佔比例有所差別,有時甚至佔到九成以上。
中心法則示意圖:基於DNA和RNA的生命遺傳信息的流動方向或傳遞規律
既然不編碼蛋白質,那非編碼DNA有什麼用呢?難道是自然造物的時候走神啦?
基因組裏的噪音:阿巴阿巴阿巴……
1980年,四位科學家在《自然》上發表文章,認為DNA可以分為兩種:特異性的和非特異性的。前者負責蛋白質合成,在細胞裏勤勤懇懇地工作,但只佔一小部分。後者則有三個特點:
其一,基因組裏的大部分 DNA 都是此類;其二,它們通過已有的 DNA 拷貝擴展而來;其三,也是最重要的,無用!
他們認為,非編碼 DNA 並沒有明顯的正面或負面作用,不過是DNA複製過程中不得不產生的副產物。它們如此堂而皇之地賴在細胞中,不幹活還佔地方,只是因為比較“自私”。
不編碼蛋白質的DNA就是自私的垃圾嗎?另一些科學家對此表示懷疑。
一些證據顯示,這些“自私的DNA”並非完全無用。比如在一些物種中,基因組的大小跟細胞週期和世代時間(生物從一次繁殖結束到下一次繁殖結束的時間間隔)有關。所以,或許我們不應該急着將這些冗餘 DNA 扔進垃圾桶。
圖源:Lily Padula
40多年後的今天,全基因組測序越來越便宜,也越來越普遍了,我們對人類基因組的認識早已今非昔比。科學家發現,人類基因組裏除了與編碼蛋白質有關的特異性 DNA 序列之外,還有相當一部分重複DNA序列——正是它們決定了人類的“復讀機”本質。
基因測序結果表明,在同一人類個體的基因組中,這些序列有的重複幾次,有的重複成千上萬次;其中既有長達1000~200 000個鹼基對的片段重複,也包括短的簡單序列重複;重複的基本單位有時只有一個鹼基(比如AAAAAAAAAA),有時包含幾個鹼基(比如CACACACACAC和CAGCAGCAGCAG)。它們加起來甚至可以佔到人類基因組的一半以上!
人類的基因組包含特異性序列和重複序列。重複序列甚至可以佔到人類基因組的一半以上。|來源:Molecular biology of the cell
人類基因組中為何存在如此多的重複DNA序列?這種“復讀機”本質對我們有哪些影響呢?
你我都是獨特的復讀機
科學家逐漸瞭解到,那些曾被認為是垃圾、自私且毫無用處的重複DNA序列,對基因表達和決定生物性狀至關重要。
*基因表達,指基因通過指導蛋白質合成,將自己表現出來。
以簡單序列重複(簡稱STR)為例,雖然它們只佔人類全基因組的3%,但分佈極為廣泛。據估計,有超過10萬個STR位點遍佈基因組的各個角落。它們既可以直接出現在編碼序列中,直接影響DNA的翻譯產物蛋白質,又可以處於調控序列中,間接影響基因表達。
有趣的是,STR 雖然是看似冗餘的重複序列, 在每個人體內的重複方式卻並不一樣。即使是同一STR位點,在不同個體中,其基本單位的重複次數也有較大差異。這就像是,我們的基因組雖然都有着復讀機的本質,但每個人的復讀方式卻又獨一無二。
同一STR位點,在不同個體中,其基本單位的重複次數也有較大差異。|ScienceDirect
實驗證實,STR 與人體的數十種疾病有關,且主要為神經肌肉性疾病,比如舞蹈徵、肯尼迪病、肌萎縮側索硬化等。其中與舞蹈徵有關的 STR 位點位於一個特定基因中,如果它的基本單位的重複次數小於30次,患者就不發病;重複次數越多,則發病年齡越小,症狀越嚴重。
2021年1月13日,《自然》上發表的一項新研究還發現,STR的突變與自閉症有關。研究人員分析了1637 個家庭的全基因組數據,結果發現,罹患自閉症的兒童,他們基因組上的STR突變數量明顯比未患病的兄弟姐妹高出一截。而且與導致舞蹈徵的STR突變不同,這些導致自閉症的STR突變並不侷限於一個特定的基因,而是與很多基因都相關。
自閉症與肥胖類似,和遺傳因素有很大關係,並且難以確定到底是哪些基因在搗鬼,更別説找出什麼具體的突變。而STR突變的加入,為解釋自閉症的遺傳根源增加了一個新維度。
除了研究疾病,STR 序列還因為具有如指紋般的獨特性,在現實生活中有廣泛應用。比如身份認定、親子鑑定、產前檢查等。
2008年,美國洛杉磯的警察就曾通過比對嫌疑人和兇手的STR序列,追蹤到二十多年前一樁連環強姦殺人案的真兇。美國 FBI 則建立數據庫,在國家範圍內收集罪犯或失蹤人員的 STR 序列信息,以提高破案率。
人類基因組中仍藴藏着許多未知。|Chris Madden
眼下,基因測序已經非常普及,要把每個人的基因組測個明明白白,並非難事。不過,就像猴子可以打出一串字母,但並不知曉意思一樣,我們也遠未明白這些 DNA 序列的含義。它們與RNA、蛋白質如何相互作用,又如何影響我們的生命特徵,許多未知問題仍有待嚴謹的生物醫學探索。
但,關於重複序列的價值討論早已沒有疑義:我們是復讀機,但不是垃圾。
魯迅:我沒説過這句話。| 來自網絡
注:以上關於復讀機的比喻僅為文字戲謔,並非科學上的比喻,各位讀者請勿當真。
參考資料
[1] Molecular biology of the cell, 6th
[2] https://www.nature.com/articles/s41586-020-03078-7
[3] https://www.nature.com/articles/284601a0
[4] https://genome.cshlp.org/content/24/11/1894.full.html
[5] https://www.nature.com/articles/285617a0
[6] https://academic.oup.com/emph/article/2019/1/17/5303511
本文經授權轉載自微信公眾號“十點科學”。