Nanopore测序可得1Mb的超长读长?!
依据当前高通量测序技术发展,虽说现在仅花费几小时就可以组装出细菌基因组的完成图,但是你是否打开脑洞的想过,我们是否可以不组装,只需要1条read就可得到细菌基因组的全部信息?现在,Nanopore纳米孔测序的超长读长给了脑洞成为现实的可能。
当然,目前一条read就可测得一株细菌基因组信息的脑洞还没法立刻成为现实,但已有研究者通过优化样本提取、建库和上机条件后,可通过nanopore测序数据中的一条read覆盖全基因组序列的1/6。
优化流程
对过夜培养的E. coli K-12 MG1655 经Sambrook protocol提取,得到高分子量DNA(>60Kb),OD260/OD280 =2.0
通过前期测试经验,将建库起始量调整至20ug
最后,文库加载到1个标准的FLO-MIN106 flowcell (R9.4) 上机测序。
下机数据
最后下机总数据量为5,014,576,373bp,共150,604 条read,read N50为63,747bp,平均read长度为33,296bp。其中,前面最长的10条read分别为1,113,805bp, 916,705bp, 790,987bp, 778,219bp, 771,232bp, 671,130bp, 646,480bp, 629,747bp, 614,903bp, 603,565bp。
Figure 1E. coli K-12 MG1655下机数据读长分布
数据比对
经GraphMap工具将数据集比对到参考基因组,其中95.46%的序列可比对到参考基因组上,平均比对读长高达34.7Kb。
前面最长的10条比对读长分别为778,217bp, 771,227bp,671,129bp,646,399bp,603,564 bp,559,415bp,553,029bp,494,330bp,487,836bp,470,664bp,从理论上来说,7条最长的reads就可对4.6Mb大肠杆菌基因组进行覆盖。
Figure 2E. coli K-12 MG1655数据比对后读长分布
Nanopore测序技术中无PCR,无DNA合成,最终得到read长度很大一部分取决于文库模板DNA长度和质量,因此对DNA总量、纯度、完整性要求严格。
参考文献
Loman, N. J. Thar she blows! Ultra long read method for nanoporesequencing accessed 2017-05-08.
发表评论
想参加讨论吗?请尽情讨论吧!