欢迎来到Oxford Nanopore测序技术新世界
测序技术新时代
自454开启了第二代高通量测序的一扇新世界大门,测序技术飞速发展,高通测序技术呈现出百花齐放的姿态,最后Illumina赢得了第二代高通测序最后的战役,但风云变幻,出现了新的改变者——第三代测序技术PacBio SMRT和Oxford Nanopore Technologies。
ONT的概念从上个世纪80年代就提出来,但从理论到商业化应用,走了二十多年,2014年,ONT对外提供MinION试用项目计划(MAP),随后几年不断对早期版本仪器的高错误率和低通量问题进行改善,从2016年开始,Nanopore平台通量得到较大提升,错误率也显著降低,在基因组中的应用已从小基因组逐渐延伸到复杂动植物基因组中的应用,而更高通量平台GridION X5 和PromethION的发布将对Nanopore在复杂物种中的应用更为简单和便捷。
1 纳米孔测序技术原理
在牛津纳米孔测序技术中,将纳米孔蛋白(Nanopore)插入由合成聚合物形成的膜(Membrane)中,该膜具有非常高的电阻,通过对膜上施加电势,在纳米孔产生离子电流。当DNA分子通过纳米孔时,会形成特征性离子电流变化信号,该纳米反应信号可用于确定DNA分子上碱基的序列。其中,DNA分子上接的马达蛋白(Motor Protein)会附着在纳米孔蛋白上,控制DNA分子以一定速度通过纳米孔,一个纳米孔处理完一个序列后,可重新开始另外一条新的序列。
小提示
- Membrane:该膜具有非常高的电阻,通过对膜上施加电势,在纳米孔产生离子电流。
- Motor Protein:为解旋酶,在构建文库时,马达蛋白会随引导接头一同加在DNA分子上,在测序过程中,马达蛋白会对双链DNA解压和解链,使得单链DNA以一定速度经过纳米孔。
2 Nanopore平台升级
Nanopore平台自2014年进行MinION MAP项目开始,不断从flowcell、纳米孔、测序试剂和信号捕获及碱基识别软件等方面进行升级改进,其中,测序纳米孔最开始为R6,后面不断升级,出现了R7,R8,R9版本,到现在已经升级为R9.4,随之而来的是准确率和通量的提升。
Figure 2 Nanopore平台改进后的数据产量和准确率比较
除从MinION的硬件和软件全方位升级外,ONT还发布了MinION延展性平台GridION X5和 PromethION,在延续了MinION的核心测序技术及操作简单和文库制备快外,弥补了MinION测序仪通量低,及不适用于大批量样本或大基因组测序的不足(Table 1)。
Table 1 Nanopore平台参数对比
3 建库方式
- 在1D 建库中,仅有引导接头(Leading Adaptor),在测序过程中,首先,马达蛋白对双链DNA解压和解链,引导接头通过纳米孔,随后模板链通过。
- 在2D建库中,既有引导接头,还有连接双链DNA分子的发夹接头(Hairpin Adaptor),在测序过程中,首先,马达蛋白对双链DNA解压和解链,引导接头通过纳米孔,随后模板链通过,然后发卡接头和互补链通过。
- 在1D2建库中,DNA双链分别通过纳米孔,但并未如2D测序中通过发卡接头连接。当模板链完成测序后,之后纳米孔会捕获互补链的马达蛋白进行互补链测序。
Figure 3 Nanopore测序中3种建库模式
1D测序优势在于文库构建更便捷,可低至10min,可得到更长read,相对1D测序,2D测序中模板链和互补链序列可以得到高质量的一致性序列。
4 下机数据
Nanopore平台下机数据格式为FAST5格式,每条read都有各自的FAST5文件,除碱基信息,还含有信号数据及其他宏数据,所以read文件大小远大于read碱基大小,FAST5文件需要转化为FASTA和FASTQ格式再进行后续分析。在1D reads中通过判断是否通过平均质量值来确定下机read为“Pass”或者“fail”,在2D reads中,还需要兼顾模板链和互补链的质量。
Figure 4 每条read的FAST5文件示意
5 在基因组组装中应用
ONT和PacBio技术间的读长和错误率有相似性,因此,在ONT基因组组装中会采用PacBio的一些方法,如overlap, layout, consensus等组装原理,这些原理都来源于早期Sanger数据组装应用,目前Nanopore数据分析可适用的分析工具参考下面表格建议(Table 2)。
目前Nanopore数据组装中应用最为广泛的是Canu,有数据校正步骤,不过最后需要用Nanopolish进行polish;Miniasm是PacBio和Nanopore数据组装的一款工具,典型特征就是快,比如线虫基因组组装在16核运算条件下,仅需9分钟完成组装,因为追求速度,也牺牲了组装准确性。
Table 2 常用适用于Nanopore数据的分析工具
随着Nanopore平台不断升级,通量和准确率得到极大提升,不断有研究者开始通过Nanopore数据进行更大基因组组装,如100Mb线虫基因组,再到G级别的番茄基因组,未来Nanopore技术平台在复杂基因组中应用潜力无限。
参考来源
1.Leggett R M, Clark M D. A world of opportunities with nanopore sequencing[J]. Journal of Experimental Botany, 2017: erx289.
2.de Lannoy C V, de Ridder D, Risse J. A Sequencer Coming Of Age: De Novo Genome Assembly Using MinION Reads[J]. bioRxiv, 2017: 142711.
3.https://nanoporetech.com/