科研人員破譯中華蟾蜍大型基因組揭示其“成功”的秘訣_風聞
中科院之声-中国科学院官方账号-2021-02-04 14:58
中華蟾蜍(Bufo gargarizans)隸屬蟾蜍科蟾蜍屬,俗名“癩蛤蟆”, 是我國常見且為人熟知的兩棲動物。蟾蜍在我國的傳統文化中佔有重要地位,其也是象徵招財進寶的吉祥物。此外,蟾蜍還具有較高的醫藥研究價值,其耳後腺和背部皮膚的分泌物有較強毒性、成分複雜,主要是強心甾類化合物和生物鹼,統稱為蟾蜍毒素(Bufotoxin),有麻醉止痛的功效。
蟾蜍科(Bufonidae)物種分佈廣泛,在除澳大利亞、馬達加斯加及南極洲之外的各大洲均有分佈。甘蔗蟾蜍(Rhinella marina)在被人為引入澳洲後,迅速入侵土著物種的生境,氾濫成災,破壞了生態系統。中華蟾蜍在我國分佈廣泛,從島嶼到高原均有其足跡,其食性廣泛,可適應不同的生境,強烈的毒性讓一些潛在的捕食者(蛇類等)望而卻步。目前,學界尚不清楚蟾蜍廣佈適應性的遺傳機制,通過基因組測序和組裝可幫助學界更好地瞭解該物種。與其他動物相比,兩棲動物的基因組破譯較困難,這主要是由於其基因組普遍較大,無尾兩棲類(anurans)基因組的大小多數範圍在2到8 Gb之間、蚓螈(caecilians)多數達~5-10 Gb、蠑螈(salamanders)多數達~20-60 Gb、基因組最大的是一種洞螈(Necturus lewisi),為137 Gb;重複序列佔比較高也是造成測序和組裝困難的主要原因之一。因此,目前兩棲動物的基因組數量較少,且多數組裝呈高度片段化、質量不佳。近幾年發展成熟的長片段測序技術能夠跨過較長的重複區域,結合基因組輔助組裝技術,學界有望得到較高質量的兩棲類基因組。
為了揭秘中華蟾蜍的適應性遺傳機制,中國科學院成都生物研究所呂彬、江建平和傅金鐘聯合華中師大吳華、河南師大陳曉紅、信陽師大宋曉威和西華師大廖文波等高校的科研人員,共同發起了中華蟾蜍基因組測序項目,破譯了中華蟾蜍基因組,獲得了首個組裝到染色體是水平的蟾蜍基因組參考圖譜。
該研究利用了4種最新的測序組裝技術來構建參考基因組,包括PacBio長讀長測序(103X)、BioNano光學圖譜(137X)、10x genomeics(130X)和Hi-C染色體構象捕獲技術(176X),總計產生了近3 Tb的測序數據量。最終,基因組組裝大小約4.55 Gb,僅由747條scaffolds構成(6,822條for熱帶爪蟾Xenopus tropicalis),Scaffold N50達539.8 Mb,gap佔比僅為1.79% ,96%的序列可定位到11條染色體上(圖1A和圖2A)。比較發現,中華蟾蜍與熱帶爪蟾的基因組染色體之間具有良好的共線性,研究人員推測至少經歷過1次染色體融合和3次分裂事件(圖3A)。中華蟾蜍基因組是目前兩棲動物中連續性最好的參考基因組(圖1B-D),為兩棲動物的基因進化和功能以及遺傳學研究提供了理論支撐。
蟾蜍基因組中重複序列佔比為65.5%,大部分為長末端重複(LTR)序列,這與墨西哥鈍口螈(Ambystoma mexicanum)中的發現較近似,其基因組大小約為32 Gb。研究人員推測,LTR反轉錄轉座子的轉座複製產生的大量拷貝可能是兩棲類基因組巨大的重要原因。基因結構註釋和比較發現,越大的基因組擁有較長的基因間區和內含子,外顯子長度在不同物種間較保守(圖2B)。
研究發現,中華蟾蜍中具有較多的多拷貝基因,在斑馬魚、甘蔗蟾蜍和墨西哥鈍口螈中也存在類似的狀況。斑馬魚經歷了硬骨魚全基因組加倍事件,基因複製數目在該研究物種中是最多的;而墨西哥鈍口螈基因組是迄今完成測序的最大的動物基因組,也發生了較多的基因複製事件;甘蔗蟾蜍和中華蟾蜍隸屬蟾蜍科,均是“真蟾蜍”,大多數複製是局部發生的。中華蟾蜍中的基因複製方式以串聯(TD)和近端複製(PD)為主,並且TD和PD受到的正選擇壓力顯著高於其他複製方式(圖3B和C),研究人員推測這兩種複製方式可能與其環境適應性有關。
根據上述推斷,研究人員分析了中華蟾蜍基因組中基因家族的擴張狀況,發現有122個基因家族發生了顯著擴張(圖4),化學感受基因家族顯著富集,包括嗅覺和苦味受體基因。相比而言,中華蟾蜍的中性替換速率不高,處於中間水平,但其祖先經歷了快速的進化過程(圖4)。
和其他脊椎動物類似,兩棲動物同樣擁有數目龐大的嗅覺基因(800~1400 ORs this study),有功能的嗅覺基因佔比為60%~70%,眾多的基因數目説明嗅覺對兩棲動物的生存具有重要意義。中華蟾蜍中共鑑定出1013個嗅覺基因(圖5A和B),765個是完整可能有功能的,佔比較高(~76%)。就功能和變化趨勢而言,蟾蜍感受空氣中化學分子的嗅覺基因增多且功能基因比例升高,水中則相反。信息素受體在種內和種間通訊中扮演重要角色,研究人員在蟾蜍中鑑定到5個完整的信息素受體1(V1Rs),但未發現假基因;4個完整的信息素受體2(V2Rs)和33個假基因(圖5C)。V1Rs負責檢測空氣中揮發的小分子,V2Rs則檢測水中的。多物種比較傾向支持從水到陸驅動的動態進化假説。
苦味受體能夠幫助動物感知食物是否有毒。苦味受體(TAS2Rs)在“真蟾蜍”中發生過3次急劇的擴張(圖5D),形成了130多個功能基因,分佈在1,4,6,8和11號染色體上。與其他無尾目物種相比,其家族成員數目是最多的,完整基因的比例也是最高的(~80%)。蟾蜍分佈廣且食性雜,大量的苦味受體有助於提高其毒素檢測的能力。此前關於美國白蛾入侵機制的研究(Wu et. al 2019)也發現了苦味受體的顯著擴張。
蟾蜍利用毒素進行防禦,但其如何避免自中毒是個有意思的話題。研究人員發現,細胞色素P450基因家族中起代謝解毒作用的CYP2C亞家族在“真蟾蜍”中發生了顯著擴張(圖6A),中華蟾蜍中產生了39個基因,甘蔗蟾蜍中有35個,而其他無尾類只有約一半的成員數。聚類分析發現蟾蜍枝系特異性的CYP2C擴張(圖6A),分佈在中華蟾蜍5號染色體上一段約3 Mb的區域內(圖6B),通過PD(近端)和TD(串聯複製)方式形成。這些擴張的家族成員應該在祖先物種中就已形成。
離子通道基因在防止自中毒過程中發揮重要的作用,其中的一個經典案例是:箭毒蛙的煙鹼乙酰膽鹼受體只發生了1到2個位置的氨基酸替代就進化出毒素耐受性(2017 Tarvin et. al)。研究人員發現,一種煙鹼乙酰膽鹼受體CHRNE在中華蟾蜍、甘蔗蟾蜍和草莓箭毒蛙基因組中均產生了2個拷貝(圖7B),通過串聯複製產生,可能和抗生物鹼毒性有關;在“真蟾蜍”的鈉鉀離子泵基因的關鍵毒素結合區存在一些獨有的氨基酸突變(圖7A),先前實驗證明有的位點突變能夠顯著鑑定毒素結合敏感性,降低程度甚至能夠達到1000倍以上。這些關鍵區域的氨基酸位點在中華蟾蜍和甘蔗蟾蜍中完全一致,説明受到較強的功能限制。進化分析表明,與其他物種相比,“真蟾蜍” 鈉鉀離子泵基因的經歷了快速的進化並受到正選擇壓力。此外,研究還發現,6個與牙齒(牙釉質和牙本質)形成相關的基因在“真蟾蜍”祖先中就已丟失(圖8),這和無齒的龜、鳥類、鬚鯨一致,但均是獨立丟失的,説明四足動物牙齒形成機制較保守。
相關研究成果以A large genome with chromosome-scale assembly sheds light on the evolutionary success of a true toad (Bufo gargarizans)為題,發表在Molecular Ecology Resources上。研究工作得到國家自然基金、四川省科技廳應用基礎重點項目、生態環境部生物多樣性調查監測與評價項目等的支持。
圖1.(A) Hi-C熱圖;(B-D)兩棲無尾類基因組組裝連續性比較
圖2.(A)中華蟾蜍基因組全景;(B)不同動物類羣基因組的基因區及基因間區長度示意
圖3.(A)染色體共線性;(B)5種複製模式統計;(C)中華蟾蜍不同複製模式的選擇壓力比較
圖4.基因家族進化分析。枝顏色代表進化速率,黑框內數字為分化時間,+擴張,-收縮
圖5.化學感受基因家族進化。(A)嗅覺受體類型和數量;(B)嗅覺受體不同類型在蟾蜍染色體上的分佈;(C)信息素受體的類型;(D)苦味受體的擴張
圖6.P450 CYP2C基因家族在真蟾蜍中發生支系特異性的擴張(A)和分佈(B)
圖7.離子通道基因進化與毒素耐受性。(A-B)鈉鉀離子泵;(C-D)煙鹼乙酰膽鹼受體
圖8.牙齒髮育基因的多次獨立丟失