TEL:18327076163

NG精选丨高质量烟草基因组测序为基因组演化和复杂性状调控提供新见解

华命生物目前已成功完成60+物种的T2T基因组组装,物种涵盖动物、植物、昆虫及同源和异源多倍体等疑难物种,已有多个合作项目在顶级期刊发表和接收,欢迎有需要的老师垂询。联系方式:18371456025。

 

烟草(Nicotiana tabacum)是由林烟草(N. sylvestris)与绒毛烟草(N. tomentosiformis)杂交形成的异源四倍体,也是遗传学研究的模式物种。然而,其亚基因组进化特征、表达协同性、遗传多样性及复杂性状调控机制仍未完全阐明。

近日,中国农业科学院杨爱国老师团队和其合作者一起,在国际著名期刊《Nature Genetics》上发表了题为“The genome and GeneBank genomics of allotetraploid Nicotiana tabacum provide insights into genome evolution and complex trait regulation”的研究成果,通过三种烟草的高质量near-T2T基因组组装,结合大规模烟草种质资源的基因型与表型数据。发现了多倍化后的染色体结构变异与表观遗传修饰与基因组进化和表达协调密切相关,并构建了涵盖多种形态、发育及抗病性状的参考"基因型-表型"图谱。该成果为理解异源四倍体烟草的基因组进化与复杂性状调控提供了新见解,同时展示了如何利用种质库规模资源推进遗传与基因组学研究。

 

一、烟草高质量基因组组装与注释

作者通过illumina+PacBio+10×genomics+Hi-C数据,组装了烟草品种ZY300高质量参考基因组,基因组大小为4.17 Gb,contig N50达27.17 Mb。通过高深度PacBio+illumina+Hi-C实现了林烟草仅含3个gaps的near-T2T基因组组装(2.38 Gb,contig N50 190 Mb)。绒毛烟草基因组通过结合PacBio Revio+ ONT+Hi-C+illumina数据,最终获得2.24 Gb序列(contig N50 170.53 Mb,含5个gaps)。与最新参考基因组相比,三者组装大小分别提升10.51%、6.59%和24.75%,contig N50提高77.02倍、2,383.67倍和2,064.62倍。

烟草、林烟草和绒毛烟草基因组中分别注释到80,433、40,290和37,862个蛋白质编码基因,其中95.36%、98.82%和99.23%具有功能注释。重复序列占比分别为82.75%、74.92%和81.26%。T亚基因组重复序列多于S亚基因组。通过CENH3 ChIP-seq信号、既往研究及quarTeT的着丝粒预测,在烟草中定位了14个着丝粒区域。

烟草基因组与祖先种呈现大片段共线性,共检测到1,420处倒位、539处重复和725处缺失(>1 Mb)。群体基因组研究显示,异源四倍体烟草基因组较理论值缩小约3.45%,绒毛烟草2/17/21号染色体的重复区域在烟草中缺失,证实T亚基因组在重复区域存在快速遗传变异和偏向性缩小。

图1:林烟草、绒毛烟草和普通烟草的高质量基因组组装及比较基因组学分析

 

二、亚基因组表达分化与表观遗传修饰调控

为解析烟草中基因表达与DNA甲基化的演化规律,作者对两个祖先种及烟草进行了RNA-seq和bisulfite-seq。烟草基因的整体表达水平与其祖先种高度相似,仅2,025个(S亚基因组)和2,040个(T亚基因组)基因存在显著差异表达。值得注意的是,当基因在异源四倍体烟草中表达上调时,其CHG甲基化水平显著降低,反之亦然,表明多倍化后的基因表达变化与表观遗传修饰相关,提示多倍化可能通过去甲基化激活基因表达。

通过比较28,143对同源基因的表达模式,发现尽管整体上未检测到同源基因表达偏向性(HEB),但5,753对同源基因在亚基因组间存在差异表达。其中29.30%(1,680对)可能由多倍化触发。此外,2,284对基因在祖先种间差异表达,但在烟草亚基因组中趋于平衡,表明多倍化既能引起表达分化,亦可消除祖先种差异。

图2:亚基因组间基因表达分化与表观遗传修饰相关

 

三、全球烟草种质资源的遗传多样性分析

为解析主要烟草类型的遗传变异全球分布格局,作者采用GBS对5,196份种质进行了全基因组分析,基于95,308个SNP标记的分析表明:

地理起源主导了遗传结构,大陆尺度的地理来源是遗传分化的最主要因素。PC1主要区分烤烟与晒烟,PC2呈现纬度梯度。

尽管表型差异显著,但全基因组分化程度较低,且未检测到选择清除信号。这可能源于不足数百年的定向育种历史,其目标在于平衡多种叶片性状品质,而非强选择压下的快速分化。

作者通过GWAS构建了涵盖43个性状的等位变异综合图谱。研究共鉴定出39个性状的178个显著标记-性状关联位点,其中多个关联信号具有重要研究价值。通过整合已有QTL数据,本研究中95%的QTL为新发现,这些关联位点共同构成了系统的"基因型-表型"映射图谱,为后续遗传研究提供了重要参考。

图3:全球5,196份烟草种质资源的遗传与表型多样性分析

 

四、亚基因组分化与复杂性状调控

在开花时间(FT)和黑胫病抗性(RBSH)等性状中,作者检测到来自两个同源染色体的QTL,而其他性状仅在一个亚基因组中存在QTL。通过建立双随机效应混合模型,作者将28个连续分布复杂性状的表型变异分解为两个亚基因组的贡献。结果显示除RBSH外,T亚基因组对所有抗病性状变异的解释比例更高,而S亚基因组对现蕾期、RBSH和叶片数的贡献更显著。

针对3,964对受多倍化触发或平衡的同源基因,作者进一步分析其5 kb区域内标记(对表型变异的贡献。尽管这些标记数量有限,但对白粉病抗性、开花时间等性状具有超比例贡献。该结果不仅揭示了两亚基因组对复杂性状的非均衡调控,也为HEB影响性状变异的假说提供了实证依据。

图4:43项植物形态、生理、代谢及抗病性状的关联分析结果,以及亚基因组与杂种优势位点(HEB)对复杂性状变异的贡献

 

五、Arf9基因调控烟草叶宽变异

本研究鉴定出12个叶形态性状(包括叶宽、叶长、叶脉直径等)的65个QTL位点。其中,3个QTL同时关联叶宽(LW)与叶平整度(LF)。位于23号染色体末端的位点中,T等位基因可使LW增加1.11±0.18 cm,LF提升0.2±0.02单位。

通过构建NILs,作者将该QTL精细定位至134 kb区间(chr.23:147231844-147366149)。该区域仅含一个基因——Arf9的同源基因NtZY23G02972。CRISPR-Cas9敲除实验证实,该基因功能缺失可使LW增加6 cm。该研究首次揭示了烟草Arf9在叶片发育中的调控作用,为叶片形态遗传改良提供了新靶点。

图5:与叶重(LW)变异相关的QTL精细定位与功能解析

 

六、人工选择信号解析

作者将种质资源划分为地方品种、引进品种和现代育成品种后,发现叶宽、开花时间等7个性状在育种过程中持续改良。46.42%的QTL等位基因频率在育种过程中上升,但仅17%频率>0.8,显示巨大改良潜力。其中10.71%的QTL等位基因频率从地方种持续增至现代品种,而微量效应等位基因贡献了23.12-98.37%的遗传力。该研究通过种质库基因组资源解析了复杂性状的遗传基础与育种演化规律,为作物遗传改良提供了新范式。

图6:选择育种过程中的选择信号分析

 

结语

作者通过烟草、林烟草和绒毛烟草的高质量near-T2T基因组组装,揭示了基因组重排现象以及亚基因组在转录组和表观基因组层面的分化。通过对5,196份烟草种质资源库材料进行全基因组测序和表型分析,系统鉴定了全局遗传变异与表型多态性。这项研究为多倍体物种的亚基因组进化与复杂性状遗传调控机制提供了新见解。本研究发布的基因组组装结果、海量基因型与表型数据集、标记-性状关联分析及候选基因资源,将成为推动未来比较基因组学、植物功能基因组学和作物改良研究的公共基础平台。

 

华命生物产品服务一览

 

华命生物目前已开通微信公众号、抖音、知乎、B站、小红书等线上平台,欢迎感兴趣的老师扫码关注了解更多内容!