华命生物目前已成功完成50+物种的T2T基因组组装,物种涵盖动物、植物、昆虫及同源和异源多倍体等疑难物种,已有多个合作项目在顶级期刊发表和接收,欢迎有需要的老师垂询。联系方式:18371456025。
葡萄(Vitis)是最古老的驯化作物之一,对人类文明发展产生了深远影响。然而,长期的驯化与育种导致现代栽培品种遗传多样性匮乏,在应对低温、霜霉病(DM)及灰霉病等逆境时表现脆弱,对葡萄栽培及整个产业构成潜在威胁。
2025年02月26日, 北京大学现代农业研究院叶文秀研究员和郭立研究员团队在国际著名期刊《Nature Genetics》上在线发表了题为“Super pangenome of Vitisempowers identification of downy mildew resistance genes for grapevine improvement”的研究成果,本研究发布了单倍型解析的完整T2T葡萄基因组及大规模泛基因组,揭示了葡萄属遗传结构特征,并证实利用泛基因组可精准定位霜霉病抗性、水分利用效率等重要性状相关变异,为未来研究及标记辅助育种奠定基础,推动培育满足人类需求的理想葡萄品种。
一、单倍型完整端粒到端粒基因组
本研究首先完成了重要酿酒葡萄品种霞多丽(Chardonnay)的单倍型解析完整端粒到端粒(T2T)基因组组装,为下游变异检测提供精准参考。通过PacBio HiFi (308×)、ONT ultra-long(N50>100kb,117×)及Hi-C读长(180×),经过初步组装和多步骤手工调整,最终获得两个完整单倍型T2T基因组(VHP-T2T),大小分别为501.3Mb与503.73Mb,各含19条完整染色体,38个端粒均完整。采用葡萄特异性CENH3 ChIP-seq,成功解析了VHP-T2T两个单倍型19对着丝粒的精确位置。
VHP-T2T两个单倍型鉴定出9,223个SV,最大差异集中于着丝粒区域。如chr4着丝粒在两个单倍型间在着丝粒区域大小、VvCEN107拷贝数及LTR转座子入侵程度均存在显著差异。全基因组比较显示各染色体着丝粒序列保守性较低,提示葡萄着丝粒在两个单倍型间呈现快速进化特征。
图1:两个单倍型解析的霞多丽葡萄T2T基因组
二、葡萄属遗传与表型多样性解析
为系统解析葡萄属遗传与表型多样性,本研究收集并鉴定了71份二倍体葡萄种质材料,涵盖18个物种,包括25份野生种与46个栽培品种。野生材料含23份东亚种与2份北美种,栽培品种依据系统发育分析划分为22个欧洲种、19个北美种、1个东亚种及4个圆叶葡萄(V. rotundifolia),全面覆盖葡萄属遗传多样性谱系。通过重测序使用SNP构建的系统发育树与PCA分析均显示71份材料明确聚为北美、东亚、欧洲及圆叶葡萄四大类。
通过整合已公开的475份葡萄及其外类群测序数据,构建包含591份种质的扩展数据集。基于SNP构建的系统发育树表明71份核心种质可充分代表葡萄属遗传多样性,因此被选作泛基因组构建的基础材料。
图2:葡萄种质的地理分布和遗传多样性解析
三、葡萄属泛基因组构建和抗霜霉病NLR基因家族解析
为构建泛基因组参考体系,作者完成了71份葡萄种质的单倍型解析染色体级别基因组组装。通过PacBio HiFi测序(~90×)与Hi-C测序(~200×)数据,最终获得142个单倍型基因组(71×2),大小为435.8-651.2Mb,BUSCO、QV、和LAI等评估都表明组装质量非常可靠。
本研究整合144个单倍型基因组(含VHP-T2T),首先采用Pangenome Graph Builder构建泛基因组图谱,基于VHP-T2T hap1参考基因组提取SNP位点整合形成溯祖树。该树清晰显示单体型按三大洲及圆叶葡萄类群聚类,北美与欧洲种质存在广泛组内杂交,而东亚种质无此现象。这与东亚种质极少参与育种(样本多属野生来源)、其他类群以栽培种为主的样本特性一致,本研究所获野生种质基因组信息为遗传改良提供了新资源。
基于144个注释完整的葡萄单倍型基因组,对72份种质进行泛基因组分析,共划分64,517个基因家族。基因家族数量快速增长并在n=125时趋于平台期,表明当前样本集已基本覆盖葡萄泛基因组。核心基因占12.75%,软核心基因占14.34%,非必需基因占71.28%,特有基因占1.63%。非必需/私有基因则主要参与次生代谢物合成与趋化通路。
霜霉病(Downy Mildew, DM)由葡萄生单轴霉(Plasmopara viticola)经气孔特异性侵染引发,是全球葡萄栽培中最具破坏性的病害。NLR基因作为植物免疫系统的关键元件在种质间呈现高度多样性。本研究对72份抗性差异种质进行泛NLR分析,共鉴定到104,046个NLR基因,可划分为8个亚家族,其中核心NLR基因24,236个、软核心49,784个、非必需29,953个、特有73个。葡萄NLR基因多成簇分布于近端粒区。抗性梯度显示:圆叶葡萄>北美种>东亚种>欧洲种,抗性优势类群TIR-NBARC-LRR亚家族在DM抗性中起关键作用。
图3:72个葡萄单倍型解析基因组的组装注释统计与溯祖系统发育分析
图4:葡萄属超级泛基因组构建和抗霜霉病NLR基因家族解析
四、葡萄基因组大尺度结构变异全景解析
本研究基于135个高质量单倍型基因组(134个单倍型+VHP-T2T hap2),以VHP-T2T hap1为参考,在67份真葡萄亚属(Euvitis)种质中鉴定132,518个非冗余SVs(54,784插入/62,652缺失/3,641倒位/11,441易位),大小范围51bp-7.47Mb,构建迄今最完整的葡萄SVs图谱。倒位与易位主要富集于着丝粒及其邻近区域,而插入/缺失无显著基因组热点。
通过Hi-C数据验证了大量存在的SVs的准确性。本研究SVs集合成功捕获葡萄育种中广泛应用的DM抗性分子标记。例如Rpv3位点(UDV305)的112 bp启动子缺失与VvSEC14基因表达上调及感病性增强相关;而在北美种质中发现的59 bp启动子缺失与238 bp 3'UTR插入则导致VvSEC14表达抑制及抗性提升。这些发现为分子标记辅助育种提供了新靶点。
图5:葡萄基因组结构变异全景与pan-SV解析
五、DM抗性相关SV-eQTL鉴定
本研究利用vg流程构建了葡萄泛基因组图谱:整合了VHP-T2T参考基因组序列与67个葡萄基因组中鉴定出的132,518个非冗余SVs。最终获得葡萄属超级泛基因组图谱。通过对113份葡萄种质NGS数据进行SV分型。基于分型结果,结合113份种质的霜霉病侵染RNA-seq数据,采用eQTL分析最终鉴定出63个显著关联信号。
最显著的SV-eQTL信号位于3号染色体,其85 bp插入与VvLHT8的表达量变化高度关联。携带85 bp插入的种质中,VvLHT8表达显著上调。通过SV缺失与纯合种质的表型验证,进一步证实该SV通过降低叶片SA含量影响抗性。SA作为重要植物激素,同时调控气孔运动与免疫应答。P. viticola侵染后VvLHT8表达呈现动态变化,提示其可能通过气孔-SA协同机制调控霜霉病抗性与水分利用效率。除VvLHT8外,eQTL分析还发现多个基因的表达水平与抗病性或气孔性状显著相关,这些基因为葡萄抗霜霉病与节水育种的分子设计提供了重要候选资源。
图6:葡萄属泛基因组与多组学鉴定DM抗性相关SV-eQTL
研究结论
本研究成功组装并注释了72份全球葡萄种质的单倍型解析基因组,基于单倍型系统发育基因组学,揭示了葡萄属复杂的杂交起源之谜,并展现出其庞大的遗传多样性宝库。泛基因组分析表明,对霜霉病更为敏感的欧洲栽培品种,其NLR家族基因库显著缩减。通过大规模SV解析、表型组学评估、113份种质的霜霉病侵染转录组图谱绘制及SV-eQTL分析,作者鉴定出63个与抗病性显著相关的SVs及关联基因。这一葡萄属单倍型解析超级泛基因组资源,将加速抗病优质品种的选育进程,并为葡萄进化与生物学机制研究提供全新视角。
华命生物产品服务一览