TEL:18327076163

NC重磅|茶树泛基因组解析结构变异与驯化

茶是重要的全球经济作物,但长期驯化与育种过程导致栽培茶树遗传多样性降低,形成明显遗传瓶颈。相较之下,野生近缘种具有更丰富的遗传变异,是改良茶树性状的重要资源。结构变异在植物进化和农艺性状形成中发挥关键作用,但受限于单一参考基因组和短读长测序,茶树SV研究仍不充分,尤其缺乏对野生近缘种的系统解析。

安徽农业大学韦朝领研究团队于2025年12月6日在国际著名期刊Nature Communication上发表标题为“Pangenome analyses of tea plants reveal structural variations driving gene expression alterations and agronomic trait diversification”的研究性论文,通过构建茶树泛基因组变异图谱,揭示启动子区结构变异对基因表达和性状分化的调控作用,为茶树育种提供重要遗传资源。
 

 

 

一、代表性茶树的高质量基因组组装

本研究系统解析了野生与栽培茶树的基因组结构及其演化特征,构建了高质量的染色体尺度参考基因组资源。研究选取2个野生茶树近缘种和20个栽培茶树材料开展泛基因组分析,其中5个栽培种和1个野生种基于PacBio HiFi 测序完成基因组组装。组装基因组平均大小为3.18 Gb,contig N50达131–143 Mb,超过96%的序列成功锚定至15条假染色体,BUSCO完整性约98%,LTR组装指数符合高质量参考基因组标准。同时构建了单倍型分辨的染色体尺度组装,显著提升了结构解析精度。

通过统一注释流程对22个基因组重新注释后,整体注释完整性明显提高。基于4,354个单拷贝直系同源基因构建的系统发育分析表明,野生与栽培茶树在约571万年前发生分化,栽培茶树进一步分化为CSA、CSP和CSS三个亚群,其中CSP为嵌套于CSS内的独立谱系。茶树基因组中重复序列高度富集,LTR反转录转座子占据主导地位,Gypsy家族在进化过程中发生显著扩张。转录组分析进一步揭示,启动子区LTR插入与基因表达显著降低相关,表明转座子扩增在茶树基因组演化及基因调控中具有重要影响。

图1:茶树基因组中的系统发育分析与可转座元件动态

 

 

二、茶树驯化过程中的基因获得与丧失

通过Orthofinder聚类分析,发现22个基因组中共有15,216个核心家族,占总基因簇的35.1%。这些核心家族基因占总基因的55.2%,而软核心基因则占20.2%。与可有可无的基因相比,核心和软核心基因具有较长的编码序列和较高的表达水平,且Ka/Ks比值较低,说明这些基因主要受纯化选择约束,进化速率较慢,功能高度保守。

通过对比野生与栽培茶树基因组的共线性分析发现,1132个基因对在CT材料中完全缺失,而1553个基因对在CSA和CSS中缺失。缺失的基因主要与花青素生物合成、异黄酮生物合成、咖啡因代谢等过程相关,而CT材料在349对基因中表现出更高的基因拷贝数,这些基因与类胡萝卜素生物合成、黄酮生物合成和氨基酸代谢有关。这些结果表明,茶树驯化过程中基因的获得与选择性育种的风味提升密切相关。

图2:泛基因组分析及基因获得/丢失模式

 

 

三、茶树基因组中广泛存在的结构变异

通过将26个基因组组装(包括单倍型分辨基因组)比对至参考基因组ZC102hap2并鉴定结构变异,共检测到1,375,161个结构变异事件。其中,存在/缺失变异(PAV)占比最高(68.3%),其次为易位和拷贝数变异,倒位所占比例最低。PAV在各染色体上分布广泛且相对均一,而倒位和易位发生频率较低,呈随机分布。分析还表明,茶树基因组中转座元件高度富集,主要插入于基因间区,是结构变异的重要来源。

基于单倍型分辨基因组的比较分析,鉴定出由结构变异产生的半合子基因,其比例为3.21%–4.76%,其中CSA材料略高于CSS。GO富集分析显示,半合子基因主要参与植物型初生细胞壁形成、纤维素生物合成和胚珠发育等过程,说明结构变异可能通过影响半合子基因,对茶树生殖发育及基因组功能演化产生重要影响。

图3:茶树基因组中的结构变异

 

 

四、PAVs 影响茶树驯化中的代谢基因表达

PAV主要分布于茶树基因组的非编码区域,绝大多数位于基因间区和内含子区,直接影响编码序列的比例极低。转录组联合分析显示,约22%的基因启动子区域携带PAV,且这些变异与基因表达水平显著相关。在栽培茶树中,受启动子区PAV影响而上调的基因显著富集于风味和香气相关通路,包括黄酮类、酚丙素类和氨基酸代谢,以及次生代谢和环境适应相关过程。上述结果表明,启动子区域的PAV通过重塑代谢相关基因的转录调控模式,在茶树驯化过程中对风味性状的形成与优化产生了重要影响。

 

 

五、CtANS3启动子中192 bp插入提高花青素含量

研究继续对275份茶树材料进行结构变异分型,在驯化选择区间内共筛选出91个候选基因。作者发现,位于第14号染色体上的ANS3在野生茶树中的表达水平显著高于栽培茶树。进一步分析发现,ANS3启动子区域存在三种由结构变异形成的单倍型:192bp插入、缺失型和283bp插入,并在不同茶树群体中呈现明显分化。192bp插入主要存在于野生茶树中,在驯化过程中逐渐丢失;CSA群体以缺失型为主,而CSS群体则以283bp插入型固定,反映了驯化过程中启动子单倍型的定向变化。

表型与分子分析显示,野生茶树紫色嫩梢中ANS3的表达水平和花青素含量显著高于栽培茶树,且二者呈显著正相关。PCR与群体分布分析表明,192bp插入是部分野生茶树中保留的祖先型变异。启动子活性实验进一步证实,该192bp插入显著增强CtANS3启动子活性,其缺失会明显降低基因表达水平,而CSS中特有的283bp插入对ANS3表达和花青素积累影响较小。

图4:基于结构变异的茶树群体选择信号

图5:ANS3启动子中结构变异对基因表达的影响

 

 

六、茶树对C. gloeosporioides感染抗性的表型与基因表达特征分析

作者通过炭疽菌C.gloeosporioides接种实验系统比较了CT与栽培茶树CSA、CSS对炭疽病的抗性差异。结果显示,CT材料的病斑面积显著大于栽培茶树,而CSA与CSS之间差异不显著,表明栽培茶树整体表现出更强的抗病能力。鉴于植物抗病性主要由抗性基因(R基因)介导,对22个茶树基因组中的抗性基因类似物(RGA)进行了系统鉴定与分类,共划分为七个家族。其中,RLK-LRR为最丰富的类型,其次为NBS-LRR和CC-NBS-LRR,而CC-NBS和NBS-TIR所占比例最低。与CT相比,CSA和CSS在多类RGA中具有更高的基因数量,尤其是NBS-LRR-TIR和NBS-LRR,其丰度约为CT的1.3倍。共线性分析进一步表明,栽培茶树在驯化过程中发生了抗病相关基因的获得,例如一个在CT中缺失的NBS-LRR家族成员在栽培茶树中广泛存在。此外,结构变异分析显示,在鉴定到的739个R基因中,超过一半在mRNA区域携带结构变异,且约44%的R基因启动子区域存在结构重排,表明R基因的编码区与调控区均经历了广泛变异,可能对基因表达调控及病害抗性响应产生影响。

图6:茶树对炭疽菌感染抗性的表型与转录组特征分析

 

 

七、一个159bp的插入上调了CtLRR1的表达并削弱了病害防御

通过整合病原侵染条件下的转录组数据与结构变异信息,在病原响应基因中鉴定出36个同时携带结构变异的差异表达基因,其中仅LRR1显著富集于亮氨酸重复(LRR)结构域蛋白类别。病原侵染后,野生茶树中CtLRR1的表达水平显著高于栽培茶树。

序列分析表明,CtLRR1启动子区域存在一个野生茶树特异的159bp插入,该插入在栽培茶树中完全缺失,并在部分野生近缘种中呈现保守分布。UTR和CDS区域的变异未影响蛋白编码序列。启动子活性分析进一步证实,159bp插入显著增强CtLRR1启动子活性。功能验证结果显示,抑制LRR1表达可显著减轻病害症状,表明LRR1在茶树对炭疽菌的免疫反应中发挥负调控作用。该启动子插入介导的高表达水平削弱了茶树的病原防御能力。

图7:CtLRR1 启动子中 159 bp 插入在病原防御中的功能分析

 

 

结语

本研究整合多份高质量栽培与野生茶树基因组,构建了系统性的茶树泛基因组变异图谱,系统解析了茶树驯化过程中基因获得、丢失及结构变异的演化特征。结果表明,栽培茶树遗传多样性显著低于野生近缘种,结构变异,尤其是启动子区域的存在/缺失变异(PAV),在基因表达调控和性状分化中发挥关键作用。泛基因组分析显示,风味代谢、花青素合成及病害响应相关基因在驯化过程中受到显著选择。对ANS3和LRR1等基因的功能验证进一步表明,启动子区小尺度结构变异可通过调控基因表达,显著影响花青素积累和病害抗性。该研究从泛基因组和结构变异层面深化了对茶树驯化机制的认识,为茶树遗传改良与分子育种提供了重要理论基础和遗传资源。