8.复旦大学石乐明教授团队莅临希望组武汉中心参观交流





本次培训班兼顾知识性与实用性,不仅有三代测序原理及前沿进展介绍、科研和医学领域的应用等理论知识,还包含三代基因组组装、注释、转录组分析等大量实践内容,可谓是干货满满。
培训的第一天是三代测序相关理论讲解,重点是让学员对三代测序技术的原理、特点以及在不同领域的应用有一个全面的了解。专业的讲师们用详细的案例向学员们展示了纳米孔测序技术在科研和医学研究中的优势。
第二天和第三天系统培训了如何进行三代基因组组装、注释。眼过千遍不如动手一遍,从常用软件使用到组装、注释实践,大量的实操保证学员能真正掌握所学的内容。
这么多干货学员还需要慢慢吸收,我们特意安排了答疑环节,学员在课程学习过程中遇到的问题与讲师进行探讨。
培训班的最后北京希望组&武汉未来组研究院院长Min Sung Park博士与学员们进行了交流,学员们分享了此次培训班的收获。
紧张又充实的三天培训转眼结束,我们有幸向各位学员分享了未来组在三代测序分析研究的经验与探索,也收到了学员们真诚的反馈,许多学员表示收获满满,并提出了许多对课程的良好建议。未来组将会也会根据反馈意见,在今后的培训活动中不断优化和改进课程,努力为大家提供领域内最好的三代测序与生信分析的知识培训!
“中国园艺学会分子育种分会第二届学术年会暨第八届全国果树分子生物学学术研讨会”将于2019年8月16-18日在上海光大会展中心国际大酒店召开。武汉未来组诚邀各位专家、学者莅临2号展位并参加研究技术沙龙,武汉未来组生信研发副总胡江将在技术沙龙发表“三代测序组装最新策略及其在植物基因组中的应用”的演讲,与科学家们共同交流三代测序组装的最新软件与策略及其在植物基因组中的应用。
会议简介
全国果树分子生物学学术研讨会是由中国园艺学会果树专业委员会发起并主办的园艺学科相关研究学术交流活动,致力于通过举办高水平学术会议,充分展示果树分子生物学研究的最新进展,推动我国果树学研究的深入和果树产业发展。
此次会议已经确定国内果树分子生物学及分子育种领域的杰出中青年专家作大会报告,交流园艺作物分子育种、分子生物学的前沿进展。
未来组林木基因组项目文章
武汉未来组专注于三代测序技术的应用与服务,目前已完成了数百个三代测序科研项目,在林木基因组测序组装方面也经验丰富,在Nature Communications、Molecular Plant、GigaScience等杂志合作发表了苹果、杜仲、木棉等多篇林木基因组文章。
未来组ONT果树组装案例
采用未来组自主研发的Next系列软件对不同大小和杂合度的果树基因组进行组装,连续性(Contig N50)和完整性(BUSCO)均达到较高水平。
三代测序选择未来组,为您的科研道路保驾护航!
本次培训班邀请Science、NG一作科学家专程授课,详细的理论介绍与实际操作相结合,让你与世界经验最为丰富的三代测序实验员、分析师面对面!解决您在三代测序项目过程中遇到的问题,全面提升三代测序实验技能及生信分析水平,还有机会享受项目合作折扣、公司实习名额!
诚邀全国对三代测序分析服务以及
软件算法感兴趣的老师同学报名参加!
培训优势
1、 专业的培训平台,一流的讲师团队。
2、 大量实操!方法阅读三遍不如上手操作一遍!
参加本培训班你将收获
2、从建库测序到数据处理全流程实操
3、掌握纳米孔测序技术原理、建库测序流程及数据处理方法
4、了解动植物基因组三代测序组装纠错策略、分析流程及常用生信工具
5、了解您的项目在未来组的运行过程
课程安排
笔记本电脑配置要求Windows 7、8、10,CPU 2GHz以上,内存4Gb以上,有线网络端口可用。
2.请完成汇款后将您的汇款凭证扫描件或清晰照片发送至:
sales-support@grandomics.com
正文注明:
1)培训学员姓名
2)汇款人姓名(如果培训学员姓名与汇款人不同时)
3)汇款账号
4)培训学员单位
5)汇款金额
6)日期
3.报道通知
报名成功者,将会在8月9日18:00点之前收到会务组的邮件报道通知。如需申请经费可在NextOmics 微信后台回复“会议通知”或“培训通知”提前获取通知。
4.发票
2019年8月9日18:00前付款可在培训期间获取发票。
请务必准确填写报名表单的发票信息,因个人填写信息错误导致发票有误,不予重开!发票信息建议提前与贵单位财务部门确认。
5、退费
如您已经成功付款但临时有事不能参加本次培训,可联系主办方撤销席位全额退费;如在开课前3个工作日内(含3个工作日)要求撤销席位则退还80%的费用。
本次培训班邀请Science、NG一作科学家专程授课,详细的理论介绍与实际操作相结合,让你与世界经验最为丰富的三代测序实验员、分析师面对面!解决您在三代测序项目过程中遇到的问题,全面提升三代测序实验技能及生信分析水平,还有机会享受项目合作折扣、公司实习名额!
诚邀全国对三代测序分析服务以及
软件算法感兴趣的老师同学报名参加!
培训优势
1、 专业的培训平台,一流的讲师团队。
2、 大量实操!方法阅读三遍不如上手操作一遍!
参加本培训班你将收获
2、从建库测序到数据处理全流程实操
3、掌握纳米孔测序技术原理、建库测序流程及数据处理方法
4、了解动植物基因组三代测序组装纠错策略、分析流程及常用生信工具
5、了解您的项目在未来组的运行过程
课程安排
笔记本电脑配置要求Windows 7、8、10,CPU 2GHz以上,内存4Gb以上,有线网络端口可用。
2.请完成汇款后将您的汇款凭证扫描件或清晰照片发送至:
sales-support@grandomics.com
正文注明:
1)培训学员姓名
2)汇款人姓名(如果培训学员姓名与汇款人不同时)
3)汇款账号
4)培训学员单位
5)汇款金额
6)日期
3.报道通知
报名成功者,将会在8月9日18:00点之前收到会务组的邮件报道通知。如需申请经费可在NextOmics 微信后台回复“会议通知”或“培训通知”提前获取通知。
4.发票
2019年8月9日18:00前付款可在培训期间获取发票。
请务必准确填写报名表单的发票信息,因个人填写信息错误导致发票有误,不予重开!发票信息建议提前与贵单位财务部门确认。
5、退费
如您已经成功付款但临时有事不能参加本次培训,可联系主办方撤销席位全额退费;如在开课前3个工作日内(含3个工作日)要求撤销席位则退还80%的费用。
7月22日全球首批早期试用版Nanopore R10芯片抵达未来组测序中心,作为ONT公司投入商用的一种最新型的测序芯片,R10配有两对读取头,纳米孔通道更长,碱基信号读取更充分,测序准确度也因此得到极大提升!
图1 具有新型纳米孔的R10芯片
我们在本次实验中共测试了两张R10芯片,分别检测了1个人类DNA标准样本,及2个加了barcode的DMD阳性参考品混合样本。其中,两个阳性参考品分别为1个点突变及1个缺失突变。我们采用完全相同的实验方法对这两个样本的2.2Mb DMD基因全长区域进行富集,然后分别上机测序。
为了充分测试R10对于准确度的提升,在本次评测过程中,我们采用了实时高准确度(High-Accuracy)模式进行测序。实时测序结果显示,当测序仅开始半小时后,单张芯片产出已达到230Mb,对于单个DNA标准样本来说,相当于DMD基因全长100×的覆盖深度,已经满足后续分析的测序数据量。而当测序继续运行至约16小时后,两张芯片则分别产生3.3 Gb和3.9 Gb数据,远远超出单个样本所需数据量,这就为我们后续临床样本的检测提供了更多策略上的可能性。
通过对测序数据的初步质控,R10芯片在read质量方面的表现令人惊艳不已:pass reads提供平均超过20的质量值(Qscore),而mapping后的reads准确度更是多数分布在95%以上!
图2 R10实测数据Pass read质量分布图
杜氏肌营养不良(Duchenne Muscular Dystrophy,DMD)是一种常见的遗传性神经肌肉疾病,具有X连锁的隐性遗传模式。DMD基因全长2.2Mb位于X染色体上,是人类基因组中最大的基因之一,具有79个外显子,其突变类型主要包括:大片段的缺失或重复、微小突变(包括碱基的置换、重复、缺失或插入)和剪切区突变。由于DMD基因中有超过60%的突变均为大片段SV,为三代长读长测序的天然优势“战场”,那么接下来就随我们一起来看看高质量R10数据在检测DMD变异方面的能力吧!
我们对pass reads数据进行拆分,采用clairvoyante软件默认参数,在其中一个DMD阳性参考品中,成功检出一个C>T单碱基突变位点,排除掉少量由于拆分错误导致的reads错误比对,突变频率接近100%(图3)。
图3 检测到的SNV示意图
以上这两个结果都与我们的预期相符。
图4 大片段deletion示意图
图5 与参考基因组比对read断点示意图
Nanopore准确度是大家关心的一个重要问题,而目前Nanopore测序准确度最高的R10芯片将于2019年7月22号在武汉未来组测序中心全国首发,这是继5月份引进全球首台商业化PromethION 48测序仪之后,未来组Nanopore测序服务的再次升级!R10是牛津纳米孔公司(Oxford Nanopore Technologies)开发的新型纳米孔测序芯片,相比于之前的R9.4.1版本,它的纳米孔通道更长,并具有双读头(dual reader-head),性能大幅度提升。
图1 未来组PromethION 48 测序仪
目前Nanopore测序通用版本R9.4.1有一个纳米孔通道,一个Reader head;而R10具有两个Reader heads,纳米孔通道更长,凭借这一特点R10能够检测更多的碱基信号,极大提升了同聚物区域的测序准确度。
图2 R10和R9.4.1纳米孔在同聚物区域的比较
R10现在可以提供与R9.4.1相当的原始读取准确度,但提高了共有序列准确度。在模拟群落金黄色葡萄球菌(S. aureus)样本上已达到Q50(99.999%)的共有序列准确度,这相当于每100,000个碱基中只有1个错误!
图3 R10和R9.4.1原始读长准确度及共有序列准确度
如图4所示,合并金黄色葡萄球菌的数据集,发现R10和R9.4.1中的错误没有重叠,将两种类型的数据叠加在一起后极大地提高了序列的准确性,只有一个错误位点。因此R10和R9.4.1数据的组合可以相互校正产生更高的共有序列准确度。
图4 R10和R9.4.1错误分布没有重叠
24小时运行时间的数据量比较显示,R10芯片产量在11Gb左右,相对于R9.4.1有所下降,但随着接下来对运行条件的进一步优化,通量还会得到进一步提高。
图5 R10和R9.4.1测序通量对比
以上为R10芯片在微生物等小型基因组上进行的测试,相比R9.4.1,具有双Reader head的R10芯片在同聚物区域的准确度、共有序列准确度方面得到了极大提升。同时R9.4.1和R10不重叠的错误区域,提供了利用两种数据的组合产生更高的共有序列准确性的新思路。
随着测序技术的发展,人们能快捷地获得大多数生物基因组的遗传信息。但是,超大型基因组(≥30Gb)的测序和组装仍是世界性难题。一方面,超大型基因组组装所需的数据量往往达到Tb级别,想要快速获得测序数据则必须要求测序平台具有超高通量。另一方面,超大型基因组的物种往往具有大量高重复区域,这些区域犹如基因组“黑洞”,短读长测序技术难以跨越;同时,海量的短片段导致基因组组装也极为复杂,很难得到理想的效果。因此,急需要一种超高通量的测序仪,一种获得超长片段的方法,以及一套节约资源的组装算法,来攻克基因组测序领域最后的堡垒:超大基因组。
武汉未来组在超大型基因组组装领域持续深耕、发力,升级动植物超大型基因组测序组装服务:隆重推出ONT P48平台+Ultra-long技术+自主算法组合策略,从而将超大基因组的组装质量提升到Mb级别!
Nanopore PromethION 48——
三代测序仪中的产能怪兽!
Ultra-long技术——
获得Mb级别的超长读长片段!
未来组自主算法——
超大型基因组专用生信工具!
三方面的优化整合直击超大型基因组测序、组装痛点,是目前技术条件下超大型基因组组装方案的最优解!
平台升级——ONT P48
读长升级——Ultra-long 跨越重复区域
牛津纳米孔测序技术有多种文库构建方法,其中Ultra-Long Reads的建库方法read N50长度可达50-100kb,Max_read可达Mb级别。采用Ultra-long Reads进行超大型基因组组装有三大优势:
1)轻松跨越重复区域。超大型基因组中的连续重复区域就像一个个“黑洞”,二代测序小短腿直接掉入深渊,三代测序小心翼翼能够跨过,而Ultra-LongReads能够轻松跨越连续重复区域,提供更多的序列信息,更便于组装过程重复片段划分。
2)显著提升组装质量。在基因组组装过程中可以通过增加读长获得理想组装质量[2],加入Ultra-Long Reads数据可以显著提升人类基因组组装效果,填补基因组中的缺口,甚至覆盖端粒重复区域[3]。有了Ultra-Long Reads,超大型基因组ContigN50上Mb不是梦!
3) 节约组装成本。相同测序深度下采用Ultra-Long的建库测序方法,产生用于组装超大型基因组的read数更少,降低了组装复杂度,减少了计算资源的使用,能够节省一定的组装成本。
未来组Ultra-long下机数据展示
*Yield,Read_Avg,read_N50,Pass_Reads_Avg_Score多个文库取平均值,read_Max取最大值。
组装工具升级——NextDenovo+NextPolish自主算法
NextDenovo(https://github.com/Nextomics/NextDenovo)和NextPolish(https://github.com/Nextomics/NextPolish),是未来组自主研发的专为三代测序长读长设计的高效校正组装和抛光算法。NextDenovo校正速度是其他校正软件的2-8倍,校正后的纳米孔数据一致性约为97-98%,大多数剩余误差位于均聚物或串联重复区域。NextPolish用于抛光三代测序长读长组装的原始contigs,修复由噪声read产生的碱基错误。利用NextDenovo和NextPolish再结合其他基因组组装工具,可将基于ONT数据组装的超大基因组contig N50提升至Mb水平!
超大型基因组升级组装策略
超大基因组升级组装流程
不同物种Ultra-Long组装案例
加入Ultra-long数据后可大幅度提升基因组组装指标。
参考文献:
[1] Ron Milo, Rob Phillips. How Big are Genomes?[B]CELL BIOLOGY BY THE NUMBERS, http://book.bionumbers.org/how-big-are-genomes/.
[2] Henson J, Tischler G, Ning Z. Next-generationsequencing and large genome assemblies[J]. Pharmacogenomics, 2012, 13(8):901-915.
[3] Jain M, Koren S, Miga K H, et al. Nanoporesequencing and assembly of a human genome with ultra-long reads[J]. NatureBiotechnology, 2018, 36(4).
新风潮:以ONT PromethION为平台的三代群体SV研究目的与意义
现有研究表明单一的一个参考基因组不能反映整个物种的全部多样性,而群体SV检测则可以提供更多的生物标记来描述群体特征;选择合适的群体与表型,科学家们能识别并验证与农艺性状和表型性状相关的SVs,填补由于短读长技术局限造成的功能SV研究空白。
将三代测序技术应用于群体研究始于2018年,三代测序研究先锋Michael Schatz团队利用Nanopore PromethION测序平台,实现在100天内测序100个番茄基因组的目标。目前在已完成全基因组测序的12个番茄样本中该团队发现样本之间存在显著差异,每个样品具有25,000-45,000个结构变异,大多数为插入和缺失,鉴定出先前使用短读长测序所遗漏的数千种SVs。研究表明[1]SV影响植物的抗病、花期、株高、环境适应等许多重要性状,群体的结构变异分析对优良品种选育、差异性状研究等具有重要意义(表2)。玉米基因组中已经发现了大量的农艺性状受CNV控制,从生物、非生物胁迫响应到株型和杂种优势。水稻是研究基因组SV对性状影响的模式物种之一,迄今已经发现超过2000个注释基因受CNV影响。最近在番茄[2]中发现包含ej2W位点的83kb大片段串联重复,抑制ej2W对产量的负面影响。这些案例都表明了染色体结构变异尤其是基因拷贝数的变异,在动植物的育种过程中的重要应用价值。
表1 SV对不同作物品种的农艺性状具有明显影响[1]
ONT P48平台在 SV calling方面的独特优势
图1 短读长的错误映射导致SV检测的系统性误差[3]
图2 ONT不同覆盖度下的SV检出率和准确性[3]
另一方面,相比其他长读长平台,ONT PromethION 48(P48)在reads长度、群体SV研究周期和应用范围上存在明显优势。
ONT P48的平均read N50长度在25-40kb,而Ultra-Long Reads的建库方法其reads N50长度甚至可达50-100kb,从而使得ONT P48在重复区域有更高的比对能力,能够覆盖更多的完整SV,提升对大片段SV(>10kb)和稀有SV检测的敏感性(图3)
图3长read能够分裂对齐(A)或跨越(B)完整的结构变异[4]
其他长读长测序平台需要多个cell才能达到SV calling所需要的数据量,无法满足群体基因组同时测序多个动植物基因组样本的要求。而 ONT PromethION 48(P48)在群体基因组研究上存在明显的周期优势,P48能最多同时并行多达48个样本,且单Cell产量能达到大部分物种30×的数据量需求,极大压缩了群体测序所需时间,在群体测序周期方面有明显优势。
P48对大片段SV(>10kb)SV和稀有SV检测的敏感性,加上可承担的群体测序周期,使其对群体SV检测的应用范围更广,能够完美应对大群体、复杂基因组样本的SV检测。
表2 不同平台性能及SV检测效果比较
ONT P48三代群体SV应用范围
应用群体
玉米、水稻、番茄、油菜等主要农作物的遗传群体或自然群体;猪、牛、羊等重要家畜遗传群体;人类(遗传疾病及癌症研究)。
应用方向
挖掘全新、稀有、大尺度结构变异;与重要农艺性状相关联的SVs功能研究;基于SV尺度的群体进化研究等。
群体大小
动物样本数≥5,植物样本数≥10。
15×左右,根据实际群体大小和样本情况最终确定。
三代群体SV生信分析基本内容
ONT P48 三代群体SV活动内容
夏天正是万物繁茂的时候,基因组群体SV研究正当时。借本次武汉未来组P48机器服务首发的机会,未来组现全新推出ONT P48三代群体SV暑期特惠活动(已签单旧项目不在本次活动范围内),活动内容如下:
*组装样本基因组不超过4Gb,且不承诺组装指标。
活动价格请联系 153 8703 7487(未来组营销中心) 或者请直接联系未来组当地销售人员
活动邮箱:support@nextomics.org
本次活动最终解释权归武汉未来组所有
[1]I. Gabur, H. S. Chawla, R. J. Snowdon, and I. A. P. Parkin, “Connecting genome structural variation with complex traits in crop plants,” Theor Appl Genet, vol. 132, no. 3, pp. 733–750, Mar. 2019.
[2]S. Soyk et al., “Duplication of a domestication locus neutralized a cryptic variant that caused a breeding barrier in tomato,” Nat. Plants, vol. 5, no. 5, pp. 471–479, May 2019.
[3]F. J. Sedlazeck et al., “Accurate detection of complex structural variations using single molecule sequencing,” Bioinformatics, preprint, Jul. 2017.
[4]W. De Coster and C. Van Broeckhoven, “Newest Methods for Detecting Structural Variations,” Trends in Biotechnology, p. S0167779919300368, Mar. 2019.
[5]Wang, Wensheng, et al. “Genomic variation in 3,010 diverse accessions of Asian cultivated rice.”Nature 557.7703 (2018): 43.
武汉未来组作为全球最大的三代测序应用公司,自2012年来在三代测序及应用领域持续深耕七年有余。自2017年开始搭建Oxford Nanopore测序服务中心,并于同年九月获得Nanopore官方服务资质认证。2019年5月17日,前瞻性引入全球首台商业化的Nanopore PromethION 48(P48)测序仪,成为全球最新纳米孔测序技术服务的先锋!在大型测序平台构建基础上,未来组自主研发了基于ONT数据的系列组装纠错及算法软件NextDenovo,同时与华为云合作,将纳米孔测序数据分析流程整合到云计算平台上,为全球客户提供快速、高效的纳米孔长读长测序计算和存储服务。在高通量测序平台、自主算法、高性能计算集群三重优势加持下,未来组成功突破超大基因组(≥30Gb)的测序组装困难,完成首个ContigN50达Mb级别的超大基因组组装!
PAG会议是国际知名的基因组学盛会,专家们汇集一堂,报告、研讨模式生物、畜禽、水生生物、作物、微生物等各物种领域的基因组学进展,内容涉猎广泛深入,是动植物基因组学领域最高水平的国际会议。由于每年PAG会议都会有一系列新的课题进展和研究方法的发布,已经成为动植物基因组学领域的学者们最为关注的国际盛会之一。
EXPERT PLENARY SPEAKERS
Plenary Lectures
SCHEDULE
THURSDAY,JUNE,2019
FRIDAY,JUNE07,2019
SATURDAY,JUNE08,2019
会议链接:
https://www.intlpagasia.org/2019/index.php/en/