TEL:18327076163

Comms Bio项目文章|河北农业大学枣团队解析鼠李科铜钱树单倍型T2T基因组

铜钱树(Paliurus hemsleyanus)是中国特有的重要树种,兼具生态韧性与经济价值,并作为枣树优良砧木在林业中广泛应用。然而,尽管其在抗旱和抗植原体病害方面表现突出,其基因组资源长期匮乏,限制了对其抗性机制的解析。

河北农业大学中国枣研究团队的杨猛教授于2025年12月4日在期刊Communications Biology上发表了标题为“Haplotype-resolved t2t genome of paliurus hemsleyanus provides insights into rhamnaceae evolution and genome biology”的研究论文,通过构建铜钱树高质量的端粒到端粒(T2T)单倍型基因组,揭示了其NLR 基因簇特征及 AsA 代谢基因表达模式,为解析鼠李科物种的基因组结构、抗性演化与功能研究奠定基础。华命生物总经理李元和生信总监张耀龙作为并列作者参与了部分项目分析工作。

 

 

一、单倍型分型的T2T基因组组装

本研究利用多平台测序数据构建了铜钱树的高质量单倍型端粒到端粒(T2T)基因组。基于 43.06 Gb NGS测序估算其基因组约 299 Mb,并整合 12.5 Gb(41.7×)PacBio HiFi CCS、53.78 Gb(180×)ONT 超长读长及 60.5 Gb(201×)Hi-C 数据完成组装。初始组装的HapA和HapB contig N50均约23.7Mb,经去冗余、Hi-C锚定和HiFi补洞后,两套单倍型均成功组装至12条染色体,最终长度约306Mb,contig N50提升至24.9Mb。多项评估显示组装质量极高:BUSCO完整性达98.9%,HiFi原始数据比对率为99.74%,LAI值约18.6,Merqury QV超51。

表1: 两个单倍型的基因组特征

图1:铜钱树单倍型解析T2T 0gap基因组组装

 

 

二、重复序列与蛋白编码基因注释

研究进一步系统注释了铜钱树两套单倍型基因组的重复序列与蛋白编码基因,HapA与HapB的重复序列分别为145.88 Mb(47.57%)和145.04 Mb(47.37%),转座元件占比均超过91%,其中I类转座元件超过一半,且以Gypsy和Copia最丰富(约12.5%与6.7%);完整LTR比例约3.4%。研究识别出全部端粒序列,主要由LTR-RT构成,着丝粒反转座子在各染色体上普遍富集。基因注释方面,HapA和HapB分别鉴定到29165与29238个蛋白编码基因,约93.6%获得功能注释。

 

 

三、两套单倍型间变异与等位特异性表达

研究对铜钱树两套单倍型HapA与HapB进行了变异比较与等位特异性表达(ASE)分析。结果显示,两者虽保持高度共线性,但仍存在大量序列差异,包括129万余个SNP、34万余个Indels及1.3万个结构变异,影响约66%的蛋白编码基因。共鉴定27865对等位基因,平均一致性达98.57%,其中近半数含非同义突变。基于叶片RNA-seq,约2.98%的等位基因对呈现显著表达偏向,主要富集于防御反应、胁迫应答及植物-病原互作等功能。进一步分析表明,ASE基因在启动子上游区和内含子中积累更多变异,且等位序列差异与表达差异呈显著负相关,说明调控区域的变异可能驱动表达不平衡。在高变异ASE基因中,与精氨酸代谢及细胞壁相关代谢的基因尤为突出,其中PhAASS1在HapA中保持功能,而HapB因外显子插入形成假基因,反映了单倍型差异对基因功能的潜在影响。

图2:等位基因变异和等位基因特异性表达

 

 

四、比较基因组学分析

研究通过比较基因组学分析铜钱树与16种亲缘物种,揭示了其基因组特征和进化历程。研究涉及19个物种,包括葡萄、大豆及多个蔷薇科、鼠李科等物种。结果表明,铜钱树与枣(Ziziphus jujuba)亲缘关系最为密切,二者的分歧时间约为500万至1700万年前。通过核型演化研究,发现蔷薇科物种源自8条祖先染色体,而鼠李科物种则源自12条,且鼠李科物种经历了较少的染色体融合事件,未发生大规模的谱系特有复制。此外,基因组共线性分析及同义替代率(Ks)与四重同义第三密码子转变(4DTv)的比较显示,所有物种均表现出共同的古老全基因组三倍体化事件。

图3:比较基因组学与演化

 

 

五、铜钱树中 NLR 基因的特征及组织表达

铜钱树具有显著的抗逆性,其中一个关键基础是其庞大而多样的NLR基因家族。基因组分析共鉴定到853个NLR基因,分属四个亚家族,在两套单倍型间高度保守,并常通过串联重复形成基因簇。系统发育结果显示CNL、NL和TNL三类基因界限分明,而RNL则分散于NL分支中,体现其独特的进化路径。转录组分析显示NLR基因呈强烈的组织特异性,其中根是主要表达部位;超过200个基因表达量高于全局平均,且仅RNL1在所有组织中持续高表达,根中尤为突出。进一步研究发现,TNL亚家族富含转座元件,其在叶和茎中与基因表达呈负相关,而根中不存在这种抑制效应,根组织可能具备特异的抗TE调控机制。此外,等位基因普遍具有更高表达,一个246kb的结构缺失导致HapB中13个NLR基因完全沉默。跨物种比较显示铜钱树拥有相对丰富的RNL基因,这一特征揭示其在鼠李科中的独特进化轨迹,并为深入研究抗性机制提供重要线索。

图4:NLR 基因的谱系特征与表达模式

 

 

六、AsA 代谢途径的表达与进化

在铜钱树基因组中共鉴定到91个参与抗坏血酸(AsA)代谢的基因,涵盖生物合成、氧化与再生三大途径,其中L-半乳糖与D-半乳糖醛酸途径最为关键,相关酶在根、茎、叶中均有表达,并在茎与叶中显著高于根,与叶片最高的AsA含量相吻合。各途径基因呈现明确的组织特异性:GME、GPP在茎叶中高表达;GaLUR13为唯一根中特异基因;APX基因主要在地上部表达;再生途径中DHAR2与MDHAR3表达最强,而MDHAR2在根中富集。总体来看,仅GaLUR13与MDHAR2的表达模式与根中较低的AsA水平一致。进化分析表明,MDHAR基因家族在蔷薇目内部发生了明显的谱系差异扩张,其中鼠李科表现出最突出的串联扩张,形成了科特异的MDHAR基因簇;相比之下,其他AsA含量较高的物种主要在相对保守的基因组区域发生扩张。共线性结果进一步支持鼠李科MDHAR的串联扩张具有科特异性,为其增强的AsA代谢潜力及相关的适应性进化提供了基因组层面的证据。

图5:AsA代谢通路基因、表达模式及铜钱树中MDHAR的进化

 

 

结语

本研究构建了铜钱树单倍型T2T完整参考基因组,获得两套约306 Mb、各含12条染色体的高质量单倍型序列,并完成着丝粒、端粒与重复序列的系统注释。单倍型比较与等位基因特异表达分析表明,等位序列差异越大表达分化越显著,暗示两个单倍型之间存在潜在功能分化。比较基因组学显示鼠李科核型与基因组结构整体保守,且近期缺乏谱系特异全基因组加倍事件。铜钱树拥有庞大的NLR免疫受体基因库,等位拷贝表达普遍高于非等位拷贝。AsA代谢网络中,生物合成基因在叶/茎显著高表达并对应叶片最高AsA积累,MDHAR再生家族在鼠李科发生串联扩张,可能通过强化AsA循环提升抗逆适应。该研究为解析铜钱树抗逆机制、鼠李科比较演化以及分子育种与资源保护提供了关键基因组基础。

 

 

华命生物产品服务一览

 

华命生物目前已开通微信公众号、抖音、知乎、B站、小红书等线上平台,欢迎感兴趣的老师扫码关注了解更多内容!