一大波病原体来袭,看Nanopore如何接招!
油菜茎基溃疡病菌是甘蓝型油菜中一种子囊菌病原菌,有两个种的基因组已经发布了,其中一种由于短读长测序技术的限制导致富含转座元件(TE)的区域组装欠佳。因此本研究使用了Nanopore测序技术组装、注释了三种油菜茎基溃疡病菌JN3(升级参考基因组)、Nz-T4和G12-14(从头组装),且JN3组装到了染色体水平。高质量的组装注释有助于油菜茎基溃疡病菌、油菜黑胫病原菌和油菜三者之间的交互作用分析。
方法攻略
1.分离两种油菜茎基溃疡病菌JN3和Nz-T4以及油菜黑胫病原菌G12-14;获取JN3近缘菌种JN2的RNA;获取感染了上述两种油菜病菌的不同状态下的油菜样本以及感染病菌的三个不同油菜品种
2.从冻干的感染子叶和真菌菌丝培养皿等之中提取RNA和DNA
3.超声波打断为100-1500bp片段的DNA进行末端修复、加接头等处理用于Illumina测序,RNA构建cDNA文库也用于Illumina测序,同时构建插入片段为8Kb和20Kb的Nanopore文库用于MinION测序
4.离体培养JN2×Nz-T4子代构建饱和的遗传图谱
5.分别进行G12-14和Nz-T4的长读长从头组装并用遗传图谱和下载的光学图谱数据辅助JN3的基因组组装升级,用Illumina数据进行校正,最后用RNA数据辅助注释(见图1)
结果概览
用于组装的Nanopore数据见下表。
表1 三种菌种用于组装的Nanopore数据统计
虽然44.8Mb的JN3参考基因组已经足够连续了,但是仍然含约1.1Mb的gaps,且不论是光学图谱还是遗传图谱都显示有九条组装错误的超级contigs要么分离了要么融合在一起了。因此研究者以升级参考基因组为目标,在光学图谱和遗传图谱的辅助下使用PBJelly组装出了JN3全部19条染色体之外,还将基因组组装到45.99Mb,包含33条scaffolds,scaffold N50为2.43Mb,减少了570Kb的N碱基。在使用150×的Illumina数据进行打磨之后,更将基因组完整度提升到99%。
G12-14和Nz-T4分别为34.95Mb含156条scaffolds和43.42Mb含288条scaffolds,组装流程见图1。另外,通过整合油菜茎基溃疡病菌感染的样本的保守蛋白和RNA数据对基因组进行注释,对JN3、G12-14和Nz-T4分别预测了13,047、14,026和12,678个编码蛋白的基因。
图1 组装流程图示
这份研究最亮眼的地方在于使用长读长测序技术填JN3参考基因组填补的缺口其中了大量的重复区域,而这些重复区域在之前的研究中使用短读长测序技术都没有覆盖到。研究者是首次探测到了其中大小中位数为5.5Kb的63个串联重复基因。研究还使用Illumina reads和Nanopore reads映射到无gap的基因组上以对这些重复区域进行了深入的挖掘,同时也分析了AT和GC区域以探究潜在的基因组分区并评估了基因预测的结果。
植物病原菌的检测和鉴定对于疾病的控制和策略的选择是关键,这份研究从接种过未知病原菌的植物病理组织中提取DNA和RNA进行测序,并检测了200份种子样本,其中含感染两到三种病原体的样本也由感染未知病原体的病理样本。未知病原体感染样本使用Nanopore测序技术进行DNA或直接RNA测序验证了传统诊断的结果,充分展现了该技术的优势:长读长、高效、便携、低成本且适用于任何实验室,十分适宜于常规实验室的诊断工作。
方法攻略
1.收集病原株系:四种细菌、一种植原体、三种真菌以及三种病毒,然后对番茄、甜瓜、长春花、草莓、辣椒、柠檬等进行接种
2.提取种子、木质茎和果实中的DNA构建Nanopore 1D文库,并提取感染样本叶片或者果实中的病毒RNA并构建直接RNA文库;构建barcoding文库,打断、修复、连接barcode接头。对文库进行Nanopore测序
3.碱基识别的结果使用NCBI分类和RefSeq序列构建的参考索引进行分析,最后对未知病原体感染的植物使用不同的方法进行序列分析鉴定
结果概述
已知病原体的植物的症状包括叶和茎的枯萎、叶片有斑点等(见图2)。
图2番茄和黄瓜病理症状
测序进行10分钟后并在使用MinKNOW获得数据后2-6个小时,所有的病原体都鉴定到了种或者属的水平。研究还发现用于样本分析的reads数和样本分类之间差异较大,如93,000条reads能鉴定出42个样本,而15,000条reads只能鉴定出14个样本。但是,即使只有很少的reads也能够鉴定出病原体来,推测是由于reads平均长度较长的缘故。
200个番茄种子的测序分析显示三种病原体鉴定到种的水平,而多个DNA样品使用barcode标记也用于检验同一个芯片上测序多个样本的可能性。结果显示,带有barcode标签的reads数少于没有带标签的。将原始Nanopore reads映射到NCBI RefSeq数据库上,发现映射上的reads平均读长790-6,300bp,对细菌和真菌的平均覆盖深度<1,但是大多数覆盖到了全基因组(见表2)。
表2 使用nanoOK流程进行样本序列分析的结果
对于未知病原体但有症状的4种植物(样本13-16)进行DNA测序,样本13和样本14各鉴定出了一种病原体,为了验证鉴定的准确性,又从感染样本中分离出病原体克隆体进行测序分析,结果显示鉴定的结果是正确的。另外,也从样本15和16中各鉴定出了一种病毒,结果也得到了RT-PCR的验证。
这份研究引人瞩目的地方在于使用Nanopore技术对DNA或RNA测序可以成功的鉴定出细菌、病毒和真菌,但对于未知感染病原体的植物,真菌可能不太容易检测到。主要因为本研究使用到的RefSeq数据库包含了较多的病毒和细菌数据,但是真菌却只有很少,而且大部分还不属于植物病原体。另外一个亮点是,研究发现在加了barcode后,同一个run上进行多个样本的测序是可行的,虽然标记了barcode的reads较未标记的少,但是仍然可以检测到病原体。总之,研究指出使用Nanopore测序进行植物病毒的诊断是可行的,因其实时得到数据、不仅可在实验室操作也可用于野外作业,且不需要深厚的生物信息背景,所以大大缩短了诊断的流程。
https://onlinelibrary.wiley.com/doi/abs/10.1111/ppa.12957
参考文献
[1]DutreuxF,Silva C D, d’Agata L, et al. De novo assembly andannotation of threeLeptosphaeriagenomes using Oxford Nanopore MinION sequencing. ScientificData volume 5,Article number: 180235 (2018)
[2]ChalupowiczL, Dombrovsky A, Gaba V,et al. Diagnosis of plant diseases using Nanopore sequencingplatform. Plant Pathology.(2018).https://doi.org/10.1111/ppa.12957