华命生物目前已成功完成60+物种的T2T基因组组装,物种涵盖动物、植物、昆虫及同源和异源多倍体等疑难物种,已有多个合作项目在顶级期刊发表和接收,欢迎有需要的老师垂询。联系方式:18371456025。
橡胶树是天然橡胶的主要来源,具有重要经济价值。 经过一个多世纪的选育,橡胶树产量显著提升了六倍以上。然而,在驯化初期快速增长后,橡胶产量似乎已触及瓶颈。育种学者们认为现代栽培品种仅源自9棵祖先树的有限遗传多样性是产量停滞的主因。为应对这一挑战,研究者转向先进的基因组学手段。但现有橡胶树基因组组装中存在的大量缺口和复杂区域未解析问题,限制了基因组工具的准确性。
2025年7月7日,中国热带农业科学院的程汉研究员和中国热带农业科学院/深圳基因组所的周永锋老师团队一起合作,在国际著名期刊《Nature Communications》上面,发表了题为“The haplotype-resolved telomere-totelomere genome and OMICS analyses reveal genetic responses to tapping in rubber tree”的研究论文,研究首次完成了橡胶树单倍型分型端粒到端粒的(T2T)完整基因组组装,两条单倍型均包含完整的端粒和着丝粒区域。并通过整合转录组和代谢组数据,重构了橡胶生物合成途径,这些发现为橡胶树基因组学及其对割胶的分子响应机制提供了新见解。
一、橡胶树单倍型分型T2T基因组的组装
作者通过193.19 Gb HiFi测序数据(122×)、654.04 Gb Hi-C数据(414×)和199.24 Gb超长ONT数据(约314×),采用多种组装方法结合和人工填补缺口等方法,成功组装了橡胶树CATAS 7-33-97完整的单倍型分型T2T基因组。其中hapA包含38,635个蛋白编码基因,hapB包含38,618个蛋白编码基因。
组装质量评估显示:hapA和hapB的contig N50分别达到93.64 Mb和94.38 Mb,基于k-mer的基因组完整性评估值为97.5%,BUSCO基因完整性分析显示hapA和hapB分别达98.8%和99%。LAI值分别为16.45(hapA)和16.7(hapB)。质量值(QV)分别为65.52和65.72,证实了组装的T2T基因组的高质量。
作者通过CENH3抗体的ChIP-seq实验,在每条染色体上鉴定了显著的结合峰,进而确定了所有染色体的着丝粒区域。通过7碱基重复序列(CCCTAAA/TTTAGGG)在所有染色体末端均识别到了端粒序列。
CATAS 7-33-97两套单倍型间存在大量结构变异和单碱基变异。其中8号染色体同源区域存在32.71 Mb超大结构变异区,而且野生种和栽培种的8号染色体同源区也呈现高度变异。作者通过测序数据比对的方式,确定了这个倒位在多个基因组中真实存在。推测这种同源染色体间超大结构变异可能在橡胶树进化中具有独特遗传功能。
图1:CATAS 7-33-97植株和T2T基因组特征
表1:橡胶基因组相关数据统计表
二、产胶基因的比较基因组学研究
为鉴定产胶基因的直系同源群,作者收集了包括橡胶树在内的9个物种基因组,共鉴定27,311个直系同源群,其中8,364个为所有物种共有。通过比较7个大戟科物种(含2个低产胶种蓖麻和木薯,以及5个橡胶树基因组),作者发现产胶相关基因可分为四类:MVA途径基因、MEP途径基因、起始合成基因和橡胶延伸基因。其中橡胶延伸类基因在橡胶树中的数量显著高于蓖麻和木薯,表明该基因家族的扩张是高产胶能力的关键。
CATAS 7-33-97基因组中共鉴定19个REF/SRPP基因,且新发现一个SRPP成员(HbSRPP11)。野生种仅含5个REF和9个SRPP基因,而蓖麻和木薯中未发现REF基因,证实REF/SRPP基因数量与产胶能力正相关。
基于94个REF/SRPP基因的进化树显示,SRPP分为4个分支,REF分为3个分支,提示二者可能通过基因复制事件分化,随后趋同进化形成独立功能亚型。另外橡胶树CPT基因数量显著多于低产胶物种,进一步佐证其在乳胶合成中的作用。
图2:大戟科产胶基因的进化与多样性
三、橡胶树ASE的稳定性特征
基于CATAS 7-33-97的转录组数据,作者鉴定出10,136个具有组织特异性表达的等位基因,其中9,546个(94.18%)呈现稳定的ASE模式。其中hapA上有4,753个等位基因持续高表达,另外4,793个则偏好hapB。仅590个基因(5.82%)表现出动态ASE模式(优势等位基因随样本变化),体现了橡胶树独特的等位基因调控格局。
随后作者分析了五年割胶树乳胶样本(TN),其中4,735个基因显示ASE模式。这些基因功能显著富集于核酸磷酸二酯键水解,推测细胞通过核酸代谢调控维持遗传物质稳定性。尤为关键的是,82个橡胶生物合成相关基因(MVA/MEP途径、起始合成及橡胶延伸途径)中,17个呈现稳定ASE模式。关联分析表明,这种等位基因表达偏好与橡胶颗粒大小存在显著相关性。
图3:橡胶树的等位基因差异表达
四、连续割胶激活MVA途径的分子证据
通过连续割胶实验(T1-T10及五年割胶树TN样本),作者发现干胶产量在前7次割胶中逐步提升,之后趋于稳定。与此同时橡胶颗粒粒径从显著缩小,乳胶蔗糖含量在T7降至最低,而橡胶合成活性显著提升,且T7是橡胶合成活性达到稳态的关键节点。
作者通过多组学分析(T1/T7/TN的代谢组与转录组)发现差异代谢物中,390个DAMs中,氨基酸及其衍生物占比最高,反映乳管排胶后需快速补充细胞质成分。进一步基于T2T基因组完整鉴定的橡胶合成基因显示,MVA途径基因表达量整体高于MEP途径。其中MVK1表达量提升超10倍,MVK底物MVA在T7/TN分别增加14倍和8倍。
通过构建代谢-基因关联网络发现64种代谢物与多数橡胶合成基因显著正相关。MVA作为唯一直接参与该通路的差异代谢物,与44个橡胶合成基因表达显著相关,表明MVA及其衍生物(5-磷酸甲羟戊酸/焦磷酸甲羟戊酸)是乳管中橡胶合成的核心碳储库。
图4:连续割胶对橡胶生物合成途径代谢产物的影响
五、JA信号通路增强橡胶生物合成的分子机制
差异基因表达分析显示三个割胶期(T1/T7/TN)共鉴定6,466个DEGs,其中T7 vs T1差异最显著。而内源JA水平显示动态过程,连续割胶使JA、JA-ILE和OxIAA含量显著上升(T1至T7增幅超4倍)。
作者进一步进行了外源JA验证实验,割胶前24小时施加0.1% JA,结果显示可使T4/T7期的原子百分比显著高于对照组。而且T1/T4期JA处理组干胶产量更高,T7期差异达显著水平。qRT-PCR也证实JA上调了乳胶中MVK1表达。
双荧光素酶报告系统和酵母单杂交实验显示MYC2特异性结合MVK1启动子的G-box顺式元件激活MVK1的表达。
作者推测了相关机制模型:连续割胶→内源JA积累→激活JA信号通路→MYC2上调MVA途径关键酶MVK1→促进橡胶生物合成。
图5:连续割胶过程中的代谢组与激素动态分析
结语
本研究成功构建了橡胶树的广泛栽培品种CATAS 7-33-97的首个单倍型分型、端粒到端粒(T2T)完整参考基因组。这一完整基因组不仅揭示了橡胶树复杂基因组的结构特征,还首次明确了单倍型间的结构变异。此外,T2T基因组使橡胶合成相关基因的进化分析成为可能,并揭示了割胶响应背后的橡胶生物合成调控网络。
华命生物全面汇总了动植物T2T基因组文章,上一期我们分享130+已发表的植物T2T基因组文献合集和30+已发表动物T2T基因组文献合集,我们不仅有按照时间顺序排列好的所有文献原文资料包,也贴心的整理了每篇文章的研究物种、测序策略、组装水平、基因组大小等内容,关注华命生物,后台回复关键词:华命交流群,扫码添加工作人员微信,发送单位+名字,管理员验证通过后拉入群聊获取文本全部资料~
华命生物产品服务一览
华命生物目前已开通微信公众号、抖音、知乎、B站、小红书等线上平台,欢迎感兴趣的老师扫码关注了解更多内容!