华命生物目前已成功完成60+物种的T2T基因组组装,物种涵盖动物、植物、昆虫及同源和异源多倍体等疑难物种,已有多个合作项目在顶级期刊发表和接收,欢迎有需要的老师垂询。联系方式:18371456025。
草鱼(Ctenopharyngodon idella)是一种鲤科大型草食性淡水鱼。作为中国广泛养殖的重要食用鱼类,草鱼被誉为"四大家鱼"之一。尽管其经济价值显著,但由于基因组测序中存在空缺,目前已发布的草鱼基因组组装仍不完整,这在一定程度上阻碍了分子生物学研究及遗传改良工作的进展。
2025年6月18日,西藏大学/西南大学刘海平教授团队,在国际知名期刊《GigaScience》上发表了题为“The telomere-to-telomere gapless genome of grass carp provides insights for genetic improvement”的研究论文,文章成功组装了首个草鱼端粒到端粒(T2T)完整基因组,并对其进行了单倍型染色体T2T组装,代表了迄今最高完整度与组装质量的草鱼基因组。文章第一作者为西藏自治区农牧科学院水产科学研究所助理研究员刘飞,华命生物总经理李元为并列一作,深度参与本项目的测序和T2T基因组分析工作。
一、cyT2T基因组组装和评估
作者采用多平台高通量测序数据构建草鱼T2T基因组。通过PacBio HiFi(73×)+ONT ultra-long(91×,N50=100.9 kb)+Hi-C测序以及二代测序,采用四种策略整合不同计算工具(包括Hifiasm、verkko和NextDenovo)对测序数据进行组装。后续通过补洞和修补端粒以及rDNA阵列修补,最终获得草鱼T2T完整基因组(CyT2T),总长890.9Mbp,包含24条0 gap染色体及48个端粒。通过多种注释策略,cyT2T最终鉴定出27,446个蛋白质编码基因。BUSCO评估显示该基因集完整度达97.5%。功能注释成效显著,93.04%的基因在六大数据库中获得注释。
为验证CyT2T组装的准确性与完整性,作者开展了多维度评估:
1)Hi-C染色质互作图谱显示所有染色体排列方向高度一致;
2)短读长与HiFi读长比对率分别达99.88%和100.00%;
3)BUSCO评估基因组完整度为99.1%;
4)Merqury估算质量值约49.37;
5)T2T基因组GCI评分整体超过99.99%,多数染色体达100%。
综合表明CyT2T基因组具有当前最高可靠性与质量。
图1:草鱼T2T基因组介绍
二、单倍型T2T基因组构建
作者同时成功构建了两套完整的单倍型T2T基因组(HapA与HapB),每条染色体均实现端粒到端粒全覆盖。为评估其质量,作者联合NGS与三代测序数据进行分析,结果显示两套单倍型基因组的比对率与覆盖度均超过99%,此外组装的QV值达到≥50,而GCI评分持续高于99.99%(多数达100%)
图2:两个单倍型T2T基因组组装
三、共线性分析和着丝粒区域分析
相较于已发布参考基因组(GCF_019924925.1_HZGC01),本研究的核心突破在于完整填补了全部150个空缺区域,其中包含12条染色体上108个基因相关区域。同时鉴定并修正了38处基因组变异,这些变异分布于17条染色体上,变异区域长度介于1.02-13.61 Mb之间。通过深度测序覆盖度验证,确保了校正区域的准确性。
基于基因组位置、长度及单体组成特征,本研究系统鉴定了24条染色体的着丝粒结构。各染色体着丝粒长度呈现显著差异:最短为chr17(189,322 bp),最长为chr16(501,158 bp),平均长度约340,000 bp。
图3:cyT2T与之前发表的参考基因组共线性分析和着丝粒区域序列分析
结语
本研究通过构建草鱼高质量T2T基因组,不仅深化了对草鱼生物学和进化的理解,也为更广泛的硬骨鱼类基因组学研究领域做出了贡献。通过充分利用这一高质量基因组的潜力,科学家们可以进一步探索草鱼关键性状的遗传基础,促进育种计划的改进,并为淡水鱼类更广泛的进化动态提供宝贵见解。
华命生物产品服务一览
华命生物目前已开通微信公众号、抖音、知乎、B站、小红书等线上平台,欢迎感兴趣的老师扫码关注了解更多内容!