dbSV
10万人Nanopore长读长人类基因组测序
10万人Nanopore长读长人类基因组测序
致病性基因变异,从变异大小来说,可分为单个碱基对的变异(SNVs)、小的插入或缺失(InDels≤50bp)以及结构变异(SVs>50bp)。结构变异,包括DNA序列的插入、缺失、重复、倒位、易位等,是很多癌症、遗传病等疾病的重要诱因。人类基因组中的SVs数量约在20000个左右,目前已知的基因组结构变异可能导致的疾病已经超过1000种,其中不乏我们常常耳闻的自闭症,精神分裂症以及慢性粒细胞白血病等。
研究发现,SVs对基因组的影响比SNVs或者InDels更大,一旦发生往往会给生命体带来重大影响,比如导致出生缺陷、癌症等;SVs与SNPs相比,更能代表人类群体的多样性特征。因此,检测SVs并研究其对基因结构和表达的影响,能大大促进我们对疾病发生及人类群体的多样性的认识。
近年来,基于二代测序技术的全基因组测序方法(WGS)和全外显子组检测(WES)运用越来越广泛,然而,人类基因组中49%为重复序列,二代测序的短读长通常无法单一正确地比对到重复序列,限制了SVs的检出。同时,由于二代测序将DNA打断至小于500bp的片段,破坏了结构变异之间的连续性,因此无法准确检测到一些复杂的SVs。基于以上原因,研究者迫切需要通过新方法来全面的检测SVs。
纳米孔长读长测序技术,也被称为第三代测序技术,凭借其长读长、无PCR过程、可轻松跨越基因组重复区域、高GC区域等优势,弥补了传统测序技术对SVs检测能力的不足,为揭秘更多的致病性SVs提供了有力的支持。
超长读长序列—当前单条读长的记录为2.3Mb。
高准确度—最新的R10版纳米孔芯片在公司内部的小基因组测试中提供了Q50(99.999%的一致性准确度)。
为了解基因组结构变异对人类疾病影响,北京希望组(GrandOmics)开展了一项群体规模的大型测序项目dbSV-100K。该项目旨在利用高通量纳米孔测序,预计三年内完成10万人Nanopore长读长人类基因组测序的目标。项目将为临床应用的研发挖掘可行的机遇,以期最终提供临床基因诊断服务。项目所获得的数据将被用于建立长读长人类基因组结构变异数据库—dbSV。
第一阶段:2019年底,完成20000个人类基因组测序
第二阶段:2020年底,完成50000个人类基因组测序
第三阶段:2021年底,完成100000人类基因组测序的目标
目前,希望组已利用纳米孔长读长测序完成了超1000个人的基因组测序,服务于国内外众多医院及科研单位,得到的测序数据已获得基因组组装和结构变异的新发现,发表文章十几余篇。
北京希望组邀您加入“dbSV-100K”项目,共同推动人类基因组结构变异研究取得更多突破。