番茄 (Solanum lycopersicum) 是全球重要的蔬菜作物,也是研究果实发育及抗逆机制的关键模式植物。尽管 Heinz 1706 的首个基因组及后续的 SL5.0 版本不断改进,但目前的番茄基因组仍存在缺口、端粒缺失及 45S rDNA 信息不完整等问题。
中国科学院梁承志研究团队于2025年11月18日在Plant Communications期刊发表标题为 “A telomere-to-telomere reference genome assembly of tomato cultivar Heinz 1706”的研究论文,对番茄栽培品种Heinz 1706构建了首个高质量端粒到端粒(T2T)参考基因组SL-T2T,并在此基础上系统解析了其重复序列、着丝粒与核糖体DNA分布及全基因组DNA甲基化图谱。

一、基因组高质量组装与评估
研究基于95.7Gb的超长Oxford Nanopore数据与11.8Gb的Illumina短读长,对番茄Heinz 1706基因组进行了高质量组装。利用Hifiasm生成的初始组装已覆盖大部分染色体框架,其中10条染色体达到双端粒完整水平,染色体3与染色体2仍存在局部缺失。通过补齐端粒、整合rDNA相关序列并结合Illumina数据,最终构建出高质量的SL-T2T基因组。该基因组总大小为831.45Mb,contig N50达68.49Mb,由12条染色体组成并包含全部24个端粒;除染色体2上的45S rDNA阵列外,其余部分均实现T2T级别的完整组装。进一步的质量评估显示,SL-T2T基因组的Merqury评估QV值为53.39, BUSCO评估完整性为98.6%。与SL5.0相比增加了29.67 Mb主要由45S rDNA和串联重复构成的序列,并补齐了SL5.0中全部31个缺口,同时纠正了倒置与易位等结构错误。
二、基因组注释与重复序列分析
在SL-T2T基因组中共注释到36006个基因,其中22784个获得功能注释;多数基因与SL5.0注释区域重叠,但其结构更契合转录组证据,表明注释质量得到提升。全基因组约66.51%为重复序列,以转座子为主,串联重复比例较低,并涵盖多类卫星与小卫星DNA。基于TGRIV重复序列共鉴定12个着丝粒,总长度达40.90Mb,其基因密度显著低于基因组平均值,并主要由LTR反转录转座子构成。卫星SlSat181主要分布于亚端粒和部分着丝粒区域,而小卫星SlSat35在基因组及全部着丝粒中广泛存在。另在染色体1上检测到由大量重复单元组成的5S rDNA阵列。
三、番茄45S rDNA区域与伪45S形成
已有研究指出,番茄2号染色体起始端拥有大量45S rDNA的串联重复,估算的拷贝数量约为2300个。本研究利用ONT测序数据重新评估了这一区域的规模,结果显示Heinz 1706基因组大约包含3400个完整的45S rDNA重复单元,其中有2105个集中分布在2号染色体端粒附近,并且排列方向一致;在11号染色体上仅检测到一个额外的重复单元。由于这些重复序列之间高度相似(相似度超过99%),接近当前ONT测序的精度上限,因此该区域在基因组组装中仍存在部分缺口。序列变异分析仅识别到少量SNP和微小Indel,没有形成明显可区分的重复类型。
为了进一步探讨其进化过程,研究团队比较了多种茄科植物T2T基因组中45S rDNA的拷贝数量及序列一致性。结果显示,番茄SL-T2T的45S rDNA不仅拷贝数在各物种中最多,其重复单元之间的序列相似度也最高。这表明番茄在与马铃薯分化之后,可能经历过一次相对近期的45S rDNA重复序列扩张事件。除了基因组中鉴定大量完整45S rDNA单元外,作者还在染色体6与11上发现两个仅含部分18S或28S片段的伪45S区域,这些区域富集大量LTR反转录转座子,明显区别于完整45S rDNA区域仅含少量MITEs的特征。伪45S rDNA区域主要由微卫星SlSat53扩增组成,推测其形成源于45S rDNA序列的降解与SlSat53扩展。
四、基因组甲基化分析
表观遗传分析共鉴定到约4849万个甲基化位点,显示串联重复序列中mCG的丰度显著高于基因组平均水平,提示其在维持基因组稳定性中的作用。LTR转座子中mCG与mCHG比例升高,符合其受甲基化抑制的特性;而45S rDNA区域中mCG与mCHG的密度为全基因组最高,可能与其在核仁组织区的特定表达调控相关。
结语
本研究通过超长Oxford Nanopore和Illumina短读长数据,成功构建了番茄Heinz 1706的高质量T2T基因组,与先前的版本相比,该基因组在重复序列和45S rDNA阵列的覆盖上有所增加,并且基因注释得到了进一步优化。研究还表明,番茄在与马铃薯分化后,45S rDNA经历了扩展的进化过程。表观遗传学分析揭示,DNA甲基化在串联重复序列中的分布显著高于基因组平均水平,说明其在维护基因组稳定性方面可能发挥了重要作用。该研究为番茄基因组学研究及遗传改良提供了宝贵的参考资源。

华命生物产品服务一览

华命生物目前已开通微信公众号、抖音、知乎、B站、小红书等线上平台,欢迎感兴趣的老师扫码关注了解更多内容!
