| EN
當前位置:首頁 > 最新動態

最新觀點| Nature Genetics:中國農業大學賴錦盛教授團隊首次實現玉米Mo17全基因組T2T完整無間隙組裝

作者:王成、李煥改

玉米(Zea mays L.)是世界范圍內重要的糧食、飼料和生物能源作物,也是遺傳學和基因組學基礎研究的重要模式植物,玉米基因組的組裝對于玉米等作物的基礎理論研究以及分子育種具有重大意義。自2009年玉米基因組草圖首次公布以來,已有近50個不同玉米自交系基因組被組裝并發表。然而,由于玉米基因組規模龐大(與人類基因組相近),且擁有超過80%的重復序列,給玉米基因組的完整組裝和注釋帶來了不少困難。目前已報道的玉米基因組中除B73-Ab10存在53個“空白”缺口外,其他均存在數百或數千個“空白”區域尚未填補;且僅有極少基因組的部分染色體實現端粒到端粒(T2T)組裝,尚無全基因組所有染色體的T2T組裝。

近日,中國農業大學農學院、國家玉米改良中心、玉米生物育種全國重點實驗室賴錦盛教授團隊在國際重要學術期刊Nature Genetics 發表了題為“A complete telomere-to-telomere assembly of the maize genome”的研究論文。該研究發表了玉米自交系Mo17全基因組十條染色體T2T完整組裝結果,首次實現復雜動植物基因組的完整無間隙組裝。

1.png

該研究以Mo17自交系為材料,獲得高覆蓋率的ONT(237.7×)原始測序數據,選擇高質量、Ultralong ONT數據用于Mo17基因組的初始組裝。之后,利用Pacbio HiFi(69.4×)測序數據對ONT組裝結果進行空白填補和糾錯,最終完成Mo17基因組所有十條染色體的完整T2T組裝(圖1)。T2T Mo17基因組總大小為2,178.6 Mb,估算其堿基精確度為99.994%。

2.png

圖1. Mo17基因組T2T組裝

Mo17基因組中約88.37%為重復序列,包括75.52%的逆轉錄轉座子和9.78%的DNA轉座子。此外,microsatellites、minisatellites、satellites、5S rDNAs和45S rDNAs在全基因組中占比共計3.92%。去除轉座子基因后,共獲得42,580個具有高置信度的編碼蛋白質的基因,其中1,029個基因為新增加基因。同時,該研究鑒定到55,189個重復片段,平均大小為6,236bp,總大小為344.16 Mb,包括1,679個幾乎相同的基因群,與5%的注釋基因有關。這些重復片段約85%分散在染色體上,只有15%以串聯重復的形式出現。

Mo17基因組具有豐富的衛星陣列,Knob180、CentC和TR-1重復是最豐富的衛星陣列,占已確定衛星長度的90.32%,這些衛星陣列只有少數在之前的Mo17參考基因組被發現。CentC主要存在于中心體和端粒周圍區,Knob180和TR-1主要存在于部分染色體臂中。除此之外,Mo17基因組還有五個著名的衛星陣列,其中三個為首次發現(圖2)。

3.png

圖2. 衛星陣列基因組結構

不同物種rDNA的數量是可變的,Mo17基因的chr2L和chr6S上分別只鑒定到一個5S rDNA陣列和一個45S rDNA陣列,在其他基因組區域沒有檢測到完整的5S和45S rDNA。5S rDNA具有346個基因型,位于中心粒近端的5S rDNA基因型比較集中,且沒有轉座子的插入;而位于中心粒遠端的5S rDNA序列更加多樣化,可能于更早時期形成,且有更多轉座子的插入。所有5S rDNA以相同的方向排列在chr2L上,轉錄方向均朝向染色體末端。45S rDNA有64個基因型,最常見的基因型占58.34%,大多數轉錄方向朝向chr6S的末端。在45S rDNA聚集的核仁組織區中,轉座子主要插入在中心粒近端而非遠端(圖3)。

4.png

圖3. rDNA基因組結構

通過CENH3抗體染色質免疫沉淀測序,確定了Mo17的中心粒位置。十條染色體的中心粒的平均長度為2.22 Mb,其中chr2的中心粒最長(2.93 Mb),chr1的最短(1.62 Mb)。中心粒的長度和染色體大小無關,且在染色體上的相對位置各不相同。中心粒主要由CentC,CRM和non-CRM Gypsy組成。根據CentC的豐度,中心??梢苑譃閮煞N結構類型,其中chr1,chr7,chr9的中心粒富含CenC。中心粒通常位于染色體中CentC和CRM重復最多的區域,但也有例外,chr8的中心粒位于CentC和CRM富集區域上游(圖4)。Mo17基因組中心粒共編碼82個基因,在細胞中以較低水平表達,且這些基因的表達通常具有組織特異性。

5.png

圖4. 中心?;蚪M結構

T2T Mo17基因組中20個端粒的平均長度為26.1 kb,chr1S的端粒最長(49.0 kb),chr8L的端粒最短(17.4 kb),每個端粒具有3,700個端粒重復拷貝,富含G的端粒重復總是朝向染色體末端的方向。在Mo17基因組中,其中15個染色體末端具有典型的亞端粒重復,這些富含亞端粒重復的區域被定義為亞端粒,在染色體上緊鄰端粒。但在chr1S中,端粒和亞端粒被587.87 kb的片段隔開,這個區域74%為轉座子序列,其余26%為非重復序列,包括24個基因。亞端粒的平均長度為92.57 kb,個體長度和序列之間差異巨大(圖5)。

6.png

圖5. 端粒和亞端?;蚪M結構

綜上,T2T Mo17基因組標志著植物基因組組裝研究向前邁出了一大步,對進一步理解高等植物基因組的復雜性和功能具有重要意義。




原文鏈接:

https://doi.org/10.1038/s41588-023-01419-6

































電話:010-62993788 郵箱:lss@ziiab.cn 版權所有?北京中智生物農業國際研究院 地址:北京市平谷區峪口鎮峪達大街1號院 京ICP備20027069號-1
疯狂操骚逼摸奶子扣逼浪叫