【2018年末精选】值得一看的三代基因组文章(动物篇)
图1 已记录的生物基因组大小范围[1]
随着测序技术的飞速发展,近年来越来越丰富的动物基因组研究极大地推动了人们对于人类起源、物种演化、医学、病虫害防治及濒危动物的保护等方面的认知及研究。2018年,运用三代长读长测序技术完成的动物基因组研究也是成果丰硕,逾40个高质量动物基因组被解析。以下组学君精选几篇高分文章,和您一起探讨动物基因组的奥秘~
——低深度三代测序组装完成的超大型基因组,揭示蝾螈断肢再生的秘密
24 January 2018,Nature
1月24日,Nature在线发表美西钝口螈(Ambystoma mexicanum)(~32Gb)基因组组装结果,是迄今组装完成的最大的基因组。研究中利用了三代PacBio测序技术及Bionano光学图谱技术,同时开发了新算法MARVEL,实现了利用低深度三代测序数据(32× PacBio数据)完成对超大型动物基因组的组装。
美西钝口螈基因组中重复序列高达18.6Gb,其中LTR和LINE是最主要的类别,其中不少长度超过10kb,并且组装出的97%的contigs都以LTR元件结尾。通过重复元件的相对形成时间分析得知:美西钝口螈基因组经历了持续时间很长的转座子活跃期,随后发生了近期持续性爆发式的重复序列扩张,大规模的重复序列扩张让美西钝口螈拥有如此庞大的基因组。
HoxA基因在肢体的近远轴(proximal-to-distal)发育中发挥重要作用,并且在断肢再生过程中会被重新活化。本研究中美西钝口螈的HoxA基因位点在单个contig上,含有明显的重复区域,比人类和蛙类的该基因大3.5倍,可能是由于该基因簇中在HoxA3和HoxA4之间存在一段170kb的扩张。
蝾螈的断肢再生功能具有非常重要的临床研究意义,此次美西钝口螈基因组的完成,与以往的单纯转录组数据相比,为研究提供了更为完整的参考信息。
29 January 2018, Nature Biotechnology
08 June 2018, Science
尽管近年来人们在类人猿和人类基因组的测序组装中做了很多努力,但我们对结构差异的理解,特别是对人类谱系特异性的理解,还远远不够。在以往的研究中存在两个基本问题:一是在类人猿基因组中存在相当大的杂合性;二是高质量的人类基因组常常被用来指导非人类基因组的组装,包括序列的顺序和方向,甚至是基因的注释。这造成了其他非人类基因组的“人类化”,结果导致很难发现在这些物种之间的结构变异和转录本差异。
为了解决这个问题,美国华盛顿大学Eichler研究组使用PacBio SMRT长读长测序技术及光学图谱技术,同时结合全长转录组测序辅助基因注释,生成了新的人类和类人猿基因组并着重分析了这些基因组中的结构变异事件。研究结果表明,与人的进化距离越远,结构变异的数目越多。
该研究还进一步研究了人与黑猩猩脑器官差异表达相关基因,研究表明,与黑猩猩相比,人特异性结构变异基因中与放射状胶质神经组细胞相关的基因表达下调。
这项研究充分体现了长读长测序在基因组de novo组装及完善基因组注释中的作用,不依赖于参考基因组的测序组装最大程度地保留了物种的特异性基因组信息,为研究近缘物种的演化及结构变异提供了有效方法。
——揭示考拉独特的“解毒”机制
02 July 2018, nature genetics
考拉又称树袋熊,主要栖息地是澳大利亚东部的桉树林区。近年来,由于栖息地减少、疾病传播等原因,考拉面临着极大的生存挑战,澳大利亚采取了一系列措施保护这一珍稀物种。
澳大利亚博物馆研究所等机构的研究人员和英国、美国等国同行在Nature genetics杂志上发表关于考拉全基因组的研究论文,该研究运用三代PacBio测序技术和二代Illumina测序技术,获得了高质量的考拉基因组,发现了超过2.6万个基因,进一步分析揭示出与考拉饮食习惯、免疫系统等有关的基因调控机制。
研究人员发现考拉对桉树叶片的解毒能力可能是与细胞色素P 450基因家族的扩张有关,这种被称为“细胞色素P450”的酶在生物代谢过程中扮演重要角色。关于犁鼻器和味觉感受器的基因家族扩张也使得考拉能够在众多桉树中找到次级代谢产物较少的叶子以供食用。考拉容易受到衣原体感染,为了保护刚出生的幼崽,考拉的乳汁中含有一种特殊蛋白质,能对抗包括衣原体在内的一系列细菌和真菌。
这一研究成果极大的促进了考拉生理、遗传学研究的系统性和科学性,同时对遏制考拉野生种群数量持续走低也有着积极意义。
—— Trio Binning方法突破单倍型基因组组装难题
22 Oct 2018, Nature Biotechnology
美国国家人类基因组研究所、Pacific Biosciences公司及阿德莱德大学等单位的研究人员开发了一种新技术,通过简单的方法即可实现从二倍体中组装出完整的单倍体基因组,这项新技术是基因组组装领域的重大突破,使研究人员能够鉴别从植物到动物等任何类型基因组中的复杂性,并获得比目前更为精确的参考基因组。该研究成果发表在10月22日的Nature Biotechnology杂志上,一经发布便引起广泛关注。
复杂的等位基因变异阻碍了二倍体基因组中单倍型序列的组装,为此研究者开发了trio binning方法,通过在组装前解析等位基因变异来简化单倍型的组装。与以往的方法恰恰相反,该方法的有效性随着杂合度的增加而提高。Trio binning首先使用来自两个亲本基因组的高精度短读长数据将子代的长读长序列划分为单倍型特异性的集合,然后每个单倍型独立组装,形成一个完整的二倍体重建。这一新方法运用了读长更长的PacBio测序技术,首次给出了每条染色体的真正基因组序列,获得迄今为止最高质量的两个牛亚种基因组。将该方法应用到拟南芥和人类家系中,同样获得了理想的分型效果。
该论文的作者之一John L Williams教授说,trio binning技术已经彻底改变了他们以前的技术,他说:“到目前为止,基因组序列都是由遗传差异最小的个体构建的。Trio binning技术标志着技术能力的重大进步,对研究和医学应用具有广泛的意义。” 并指出Trio binning技术将有助于建立更准确的个人基因组变异信息,这将提高基因测试的准确性,并有助于获得个人独特DNA序列,从而在其临床治疗上提供帮助。
——高质量伊蚊基因组,带来蚊虫防治新思路
14 November 2018, Nature
埃及伊蚊是传播包括登革热、黄热病、寨卡病毒以及切昆贡亚热在内的可怕疾病的载体。由于缺乏高质量的参考基因组,在了解蚊子生物学特性及蚊子防治等方面依然困难重重。
由洛克菲勒大学领导的国际研究团队结合PacBio测序、Bionano光学图谱、Hi-C分析、10x Genomics linked-read测序以及Illumina的短读长测序多种手段大大升级了埃及伊蚊的参考基因组并进行了重新注释,通过锚定物理图谱和细胞遗传图谱,研究者在伊蚊基因组中鉴定出了两倍于已知的、引导蚊子以人类为目标、定点产卵的化学感应离子受体。
研究还发现了有助于深入了解雄性性别决定位点的大小和组成并揭示杀虫剂耐药性关联基因之间的拷贝数变异。使用高分辨率的定量性状位点和群体遗传分析,研究者定位到了新的与登革热传染能力和拟除虫菊酯抗性相关的候选基因。
2018已发表三代动物基因组(PacBio)
2018已发表三代动物基因组(Nanopore)
参考文献:
[1] http://www.genomesize.com/statistics.php?stats=entire#stats_top
[2] Sergej Nowoshilow, Siegfried Schloissnig, Ji-Feng Fei , et al. The axolotl genome and the evolution of key tissue formation regulators.Nature.2018
[3] Jain M, Koren S, Quick J, et al. Nanopore sequencing andassembly of a human genome with ultra-long reads[J]. bioRxiv, 2017: 128835.
[4] Kronenberg, Z.N. et al. High-resolution comparative analysis of great ape genomes. Science 360(2018).
[5] Johnson, R.N. et al. Adaptation and conservation insights from the koala genome. Nature Genetics 50, 1102-1111 (2018).
[6] Koren, S. et al. De novo assembly of haplotype-resolved genomes with trio binning. Nature Biotechnology (2018).
[7] Matthews B J, Dudchenko O, Kingan S B, et al. Improved reference genome of Aedes aegypti informs arbovirus vector control . [J].Nature,2018