Nature Communications丨基于三代测序的水稻近完成图
Nature Communication在线发表–基于三代测序的水稻近完成图
5月4日,中国科学院遗传所与发育生物学研究所与四川农业大学研究团队合作于Nature Communications 在线发表了迄今最高质量的水稻参考基因组(蜀恢R498)。未来组作为三代测序技术的领导者,在R498水稻基因组项目中,为研究团队提供PacBio SMRT测序。研究人员基于PacBio SMRT测序技术,结合遗传图谱、fosmid文库测序和BioNano光学图谱对R498基因组测序组装,最终组装出的基因组大小为390.3Mb,Super-Contig数目仅为17个,组装质量明显优于之前组装的日本晴(Nippponbare)和模式植物拟南芥基因组,成为目前所有高等植物中组装质量最高的基因组。
基因组组装质量高
1.基因组完整度和连续性好
经PacBio SMRT测序技术,结合遗传图谱、fosmid文库测序和BioNano光学图谱,R498基因组(2n=2x=24)组装出17条Super-Contig,基因组中有7条染色体被完整组装出,另外5条染色体各由2个Super-Contig组成,存在的gap区域主要是着丝粒或串联重复结构。
经检测评估,R498每条染色体末端都组装完整,仅存在5个gap;而Nip仅有4条染色体两端组装出端粒,且存在239个gap。两者相比较,R498的组装结果比Nip更完整和连续。(Tab.1)
Tab.1 R498和Nip组装连续性和完整度比较
2.组装出了完整的细胞器基因组
除核基因组之外,研究者还组装出了R498完整的线粒体序列。通过和Nip的线粒体基因组进行比较(Fig.1),发现Nip线粒体基因组中存在不少错误,可能是因为含有复杂的重复序列区域,其中有3个重复序列长度超过20kb。
3.组装质量评估
对R498基因组进行组装质量评估,发现其基因组覆盖率超过99%。结合二代短读长数据和RNA-Seq数据进行评估,结果显示其基因组单碱基错误率<0.0017%,大大低于对于人类及其它高质量的参考基因组(如Nip)来说所要求的标准:1/10000。
Fig.1 蜀恢(R498,橙色)和日本晴(NIP.,绿色)线粒体基因组比较
1.R498与Nip基因组间比较分析
通过基因组比较分析可以看出(Fig.2),两个基因组间在染色体水平上有很高的相似性,80.31%的R498基因组能比对到82.73% Nip基因组,但是在基因序列上存在2,548,071个SNP差异。并且研究人员还基于R498基因组的完整性,发现在R498与Nip基因组间存在大量结构变异,例如在6号染色体上存在一个大片段的倒位区域(Fig.2)。另外还对着丝粒、端粒、PVs、rDNA这些区域进行了对比。
Fig.2 R498与Nip.全基因组比较
2.19个水稻品系间的比较基因组学分析
对比R498与Nip的基因组,发现在其基因编码区存在大量的变异(Fig.3a)。同时,在与其他17个栽培水稻基因组比较后,发现水稻基因组中广泛存在不同的PAVs(Presence-absence variations)(Fig.3b)。PAV等结构变异往往与农艺性状表型密切相关,如果基于二代短Reads与参考基因组进行比对,这部分信息往往被遗漏。
Fig.3 a:R498和Nip间同源基因数量 b:水稻基因组PAVs比较
植物基因组因高杂合高重复序列而组装困难,借助PacBio长读长优势,结合BioNano光学图谱和Hi-C技术辅助组装,能够克服这些难题,覆盖端粒、着丝粒、重复序列等区域,大大提升组装指标,为解决后续重要功能基因挖掘和进化研究提供高质量的参考基因组。
未来组作为三代测序基因组中心,已于2016年搭建了 Sequel、BioNano及Hi-C等技术平台。借助平台的搭建,未来组将会为更多合作伙伴提供专业优质的服务。
参考文献
Du HL, Yu Y, Ma YF, et al. Sequencing and de novo assembly of a near complete indica rice genome[J]. Nature Communications, 2017.