三代测序那些事儿(第二期)

上期和大家分享了几个三代测序技术在基因组组装中的应用案例,无论是在大型的基因组组装项目亚洲人基因组计划、还是在复杂致病菌基因组(痢疾杆菌、幽门螺杆菌等)测序项目中,三代测序技术 PacBio SMRT 均有着不俗的表现。

这期,小编将结合几篇文献为大家盘点那些使PacBio SMRT迅速崛起的特殊能力。

NO.1 单分子测序

能力描述:

首先要提到的是PacBio SMRT测序平台PacBio RSII的单分子测序能力,这在其他的两个三代测序平台 HeliScope & MinION 也有所体现,这也成了三代测序区分于二代测序的一个标志性特征。

HeliScope 是 Helicos 公司于2008年推出的全球第一台三代测序平台,但由于读长(35bp)、售价等原因在推出后的几年内便惨淡退出测序市场,Helicos公司也于2012年申请了破产保护。 Oxford Nanopore 公司的便携式纳米孔测序 ( Nanopore Sequencing ) 仪MinION目前还处于早期的客户测试阶段,首批测试数据的平均读长已达到了5.4kb,还是有较好的市场潜力。

单分子测序过程通常无须PCR(二代测序中为了将目的荧光信号从背景荧光中区分出来,测序前需要对单条模板链PCR成簇,以放大检测信号)过程,避免了二代测序常遇到的GC偏好性 ( GC bias ) 问题,因此 PacBio RSII 所产生的数据具有极低的GC偏好性,这种数据对于组装高GC基因组或者基因组中高GC区域是非常有利的。

另外, PacBio RSII 单分子测序的特点也使该平台在碱基读取 ( base calling ) 过程中不会出现二代测序平台常遇到的移相(dephasing)问题,所产生的数据更加准确,目前 PacBio RSII 所产生的数据一致性准确率 ( consensus accuracy ) 可达99.99%,如果使用新型一致性算法Quiver,一致性准确率可进一步提高至99.9999%。

相关案例:

1)PacBio SMRT组装高GC基因组相关案例:

Advantages of Single-Molecule Real-Time Sequencing in High-GC Content Genomes

韩国极地研究所研究团队使用 PacBio RS ( Pacibo RSII 早期型号)平台对一株分离与南极乔治王子岛的 Streptomyces 菌株进行了测序,该菌株基因组 GC 含量高达 71%,之前使用 200X 的 Hiseq 2000 数据进行过组装,仍没有获得完整的基因组,组装产生了185 个 contigs , 随后使用 Sanger 法也仍然无法有效填补。随后研究人员使用仅15 X 的 PacBio SMRT 数据 ( CCS reads + long reads ) 就得到了26个 contig 的组装结果,与二代组装结果比较,发现,二代组装结果中大多数难以填补的Gap多为一些高 GC 区域。

2)PacBio SMRT组装基因组中高GC区域相关案例:

Resolving the complexity of the human genome using single-molecule sequencing

同样地,华盛顿大学的研究团队使用 PacBioRSII 平台对一个人类葡萄胎基因组 ( CHM1 ) 进行了测序,将测序数据 mapping 回人类参考基因组 GRCh37 上,在 GRCh37 GAP区域进行了局部组装 ( local assembly ) ,该研究填补和缩小了人类参考基因组 GRCh37 上接近100个 Gap,这些 GAP 大部分处于高 GC 和重复区域,其中包括一些重要基因表达调控元件。

能力小结:

上述两个案例再次证明了,PacBio RSII平台所产生的极低GC偏好性的数据在高GC基因组或高GC区域的组装中确实有着显著的优势。

对PacBio RSII实现单分子测序的技术原理感兴趣的小伙伴可阅读Stephen Turner ( PacBio 公司创始人 ) 等人在2003年发表在 Science 上一篇关于 ZMWs 的经典文献:

  1. W. Turner, et al. Zero-Mode Waveguides for Single-Molecule Analysis at High Concentrations. Science. 2003

NO.2 超长读长(super long-read)

能力描述:

吸取了Helicos公司在三代测序平台开发上的失败经验,PacBio公司在单分子测序的基础上又进一步开发了一套使其三代测序平台 PacBio RSII 更加完美的长读取技术,主要是利用了一种将荧光染料标记于磷酸链末端的dNTP作为边合成边测序(Sequencing by synthesis ) 时的反应底物,聚合反应时,荧光基团可随着焦磷酸基团被DNA聚合酶自然切除,无需其他化学试剂洗脱,最大限度保护了DNA聚合酶活性。

基于该技术,PacBio RSII使用最新的P6C4试剂使测序平均读长由原来的P5C3的8.5 kb 又进一步提高到了10kb-15kb,而早在2005年就诞生的第二代测序技术的读长水平目前还徘徊在数百bp。

PacBio RSII 目前的平均读长(10-15kb)超过了大部分细菌基因组中最大重复区域长度 & 一些小基因组大小(部分病毒基因组、动物线粒体基因组、大部分质粒) & 普通转录本长度。因此,无论是在对于基因组的组装,还是对于转录组的Isoform识别,PacBio SMRT均有着其他测序技术无法比拟的优势。

相关案例:

1)PacBio SMRT在高重复高杂合基因组组装中的应用案例:

杜仲基因组是一种高重复高杂合的基因组,杂合率>1%,重复序列在66%以上,为了解决这类复杂基因组的组装,未来组生物使用了10X PacBio SMRT 长度数据,通过新开发的组装流程,结合第二代测序数据,使得Scaffold N50达到932kb(第二代测序组装对于解决复杂基因组组装存在一定的瓶颈,一般会导致Scaffold N50 小于300kb),这一成果也在去年的《杜仲全基因组测序重要研究成果》北京新闻发布会上进行了展示。

能力小结:

除过基因组组装外,Pacbio SMRT 也被应用于转录组测序中,由于超长的读长能够使其直接读取完整转录本,无需拼装,该技术已被应用于可变剪辑、基因融合、lncRNA 等转录组分析,从2013年至今,已有数十篇该类文献发表,小编挑了一些比较有代表性的供大家参考。

[1]Sharon, D. et al. A single-molecule long-read survey of the human transcriptome . Nature Biotechnology. 2013.

[2] Tilnger, H. et al. Defining a personal ,allele-specific,and single molecule long-read transcriptome. PNAS. 2014.

[3] Zhang, W. et al. PacBio sequencing of gene families — A case study with wheat gluten genes . Gene . 2014.

NO.3 碱基合成动力学信息记录

能力描述:

PacBio SMRT采用新型的核苷酸荧光标记技术,实现了边合成边测序(Sequencing by Synthesis)过程聚合反应的连续进行,PacBio的工程师们使用了一台内置有帧率100HZ的电子倍增CCD(EMCCD)相机的共聚焦荧光显微系统实现了对这一过程的实时(Real-time)监测,因此Pacbio RSII 在记录碱基先后顺序的同时也记录下了碱基渗入模板链的速度(碱基合成的动力学信息),DNA聚合酶在甲基化修饰或者磷硫修饰位点处反应速度有所降低,在合成动力学信息中,则表现为荧光脉冲信号的延迟(increased interpluse duration,IPD )。基于此原理,PacBio RSII在DNA序列测定的同时获得了其甲基化修饰位点信息。

相关案例:

1)PacBio SMRT在甲基化修饰位点检测中的应用:

Genome-wide mapping of methylated adenine residues in pathogenic Escherichia coli using single-molecule real-time sequencing

布莱根妇女医院(Brigham and Women’s Hospital,BWH)等机构的研究人员利用了PacBio SMRT测序技术对溶血性尿毒病原菌E.coli O104:H4基因组中的化学修饰位点进行了测定(190X测序数据),分析了基因组中的5mC与6mA修饰,由此绘制了全球首张致病菌全基因组水平甲基化修饰位点图谱。

2)PacBio SMRT在磷硫修饰位点检测中的应用:

Genomic mapping of phosphorothioates reveals partial modification of short consensus sequences

来自上海交通大学的研究团队利用 Pacbio RSII 对大肠杆菌基因组中的磷硫酰化修饰(PT)位点进行了测定,绘制了全球首张细菌全基因组水平磷硫酰化修饰(PT)位点图谱。

能力小结:

DNA化学修饰位点检测是表观遗传学研究的重要内容,基于PacBio SMRT 的 DNA化学修饰位点检测技术操作更加简单(无需重亚硫酸盐处理)、表观修饰检测类型更加多样、准确性更高等优点。

小编还意犹未尽,但限于篇幅,今天只能到这里了,下期接着聊。下期将为大家聊那些为三代而生的算法们,敬请关注!

本文原创,若转载,请注明来源。

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注