一、植物T2T基因组篇 /Plant
主要研究内容:作者采用PacBio HiFi、ONT ultra-long和Hi-C数据,通过hifiasm初步组装二倍体基因组的两个单倍型。随后利用Verkko和HiCanu的组装结果填补空缺区域及端粒区,最终每个单倍型被组装成17条染色体。其中分别有18.89和24.13 Mb区域此前未被成功组装。研究首次完成了亚洲梨代表品种‘砀山酥梨’(DS)和欧洲梨代表品种‘Max Red Bartlett’(MRB)的单倍型分型T2T基因组,为梨遗传变异机制提供了新见解,并将加速梨的品种改良进程。
主要研究内容:作者通过整合三个物种的PacBio HiFi测序数据、Hi-C数据及AHG的ONT超长数据,完成了三个物种的T2T基因组组装。Hi-C互作矩阵验证了各物种11条染色体的正确组装。最终基因组大小分别为:APZ 227.90 Mb(N50 20.96 Mb)、AVX 228.79 Mb(N50 20.59 Mb)、AHG 222.39 Mb(N50 21.00 Mb),BUSCO和QV值均显示组装基因组的高质量。
主要研究内容:作者通过NGS数据和24.93 GB的HiFi数据对西南蕨麻进行了初步组装,组装获得基因组为187.88 Mb,contig N50为26.06 Mb,进一步利用Hi-C测序数据,成功将其染色体级别基因组锚定到7条染色体上并获得了gap-free基因组。对于蕨麻,作者通过35.73 GB的HiFi数据(约90×)结合NGS数据和Hi-C数据,成功获得了其gap-free的基因组,基因组大小为431.96 Mb,contig N50为30.08 Mb,基因组锚定到14条染色体,并可进一步分为A和B两个亚基因组。两个gap-free基因组的组装代表了当前物种最高质量的基因组组装结果。本研究首次报道了青藏高原分布的重要藏药植物蕨麻和西南蕨麻的gap-free基因组。通过系统发育基因组学分析,现在西南蕨麻可能是蕨麻的潜在二倍体祖先种。比较基因组分析表明,蕨麻中受正选择基因显著富集于高原极端环境适应相关通路,而西南蕨麻的扩张基因主要关联药用价值,这些发现为理解高海拔环境下的物种分化与基因组进化提供了新视角。
主要研究内容:作者通过采用长读长测序技术,包括PacBioHiFi(27.91Gb,N50=16.59kb,59×)和ONT(21.25Gb,N50=100kb,44×),成功实现了高质量的基因组组装。混合组装过程由Hifiasm完成,接着使用Purge_dups进行冗余序列清除与杂合性降低。随后通过四轮Racon精修,获得由140条contig构成的初步组装结果,contigN50达到49.69Mb。借助Hi-C数据进一步进行scaffolding,去除较短的contig后保留了135条scaffold,其中13条非冗余scaffold被成功锚定至9条拟染色体上。最终构建出C60213的染色体级别基因组,仅剩4个缺口,并通过手动引入超长ONT数据完成填补,实现了无明显缺口的高完整性组装。本研究对萝卜品种C60213进行了端粒到端粒(T2T)基因组组装,获得了472.71Mb的高质量基因组,注释了49768个蛋白编码基因。
二、动物T2T基因组篇 /Animal
1.大黄鱼T2T基因组
主要研究内容:本研究展示了两个来自闽粤东(MYD)和大曲(DQ)种群的端粒到端粒(T2T)无间隙基因组,这两个种群在418万年前发生了分化。其着丝粒的特征是42 bp的串联重复序列(Cen-42)以及内源性逆转录病毒1(ERV1)入侵的长末端重复序列(LTR)。这两个种群均在着丝粒区域表现出转录活性,但在基因数量和组成上表现出显著的分化,这可能是由快速的种群扩张和选择压力所驱动的。该研究发现加深了对大黄鱼(L. crocea)进化的理解,并为其保护和繁殖提供了宝贵的基因组资源。
2.尖吻鲈T2T基因组
主要研究内容:本研究通过整合MGI短读、PacBio HiFi长读、ONT超长读和Hi-C测序技术,构建了亚洲鲈鱼的首个端到端(T2T)无缺口基因组组装。成功地将614.19 Mb的单倍型基因组序列定位到24条染色体上,contig N50为26.57 Mb。Merqury(QV:57.8)、CRAQ(99.45%)和BUSCO(100%)的良好结果表明组装基因组的准确性很高。重复元素占整个基因组的18.18%(111.64 Mb),共注释了25,093个蛋白质编码基因。这一高质量的T2T基因组组装为深入的比较基因组学、种群遗传学、分子育种和亚洲鲈鱼这一经济重要海洋物种的功能研究提供了宝贵的遗传资源。
3.叶蜂T2T基因组
主要研究内容:研究聚焦樱桃蛀果害虫丹凤樱实叶蜂(Analcellicampa danfengensis)。该物种具单倍二倍性(雄性单倍体,雌性二倍体),其种群在沃尔巴克氏菌感染下呈现雄性个体极度稀少的特征,为研究共生菌塑造宿主演化机制提供理想模型。研究成功构建了首个叶蜂科高质量染色体级别的端粒到端粒(T2T)基因组,其中7条染色体实现完全无间隙组装,标志着叶蜂基因组学研究进入了新的精度时代。同时,首次获得了其共生沃尔巴克氏菌株wAnd基因组的完整序列,为膜翅目昆虫演化研究提供新范式。
4.长体鳜T2T基因组
主要研究内容:长体鳜(Siniperca roulei)主要分布在中国东部水域,种群数量稀少且脆弱。本研究通过结合DNBSeq短读、PacBio HiFi长读、Nanopore超长读和Hi-C数据,生成了一个无缺口的基因组组装。S. roulei的几乎端到端(T2T)基因组大小为717.34 Mb,contig N50为30.25 Mb,每条染色体由单一contig表示。总共预测了26,596个基因,其中87.97%进行了功能注释。这些高精度的基因组数据为长吻鮠的种质资源提供了宝贵的见解,提供了阐明鳜科鱼类的分类地位和进化历史的重要信息。
如何获取本文资料包?
关注华命生物,扫码添加工作人员微信,发送单位+名字,管理员验证通过后拉入群聊。群公告中有对应的下载链接。科研群中还有更多科研工具分享,我们会不定期更新文章和科研工具哦!