超大基因组研究集锦——植物篇

上篇为大家带来了超大基因组动物的项目文章,本文主要为超大基因组植物项目文章。如需了解更多,请咨询当地科技顾问~

01. Reference genome assemblies reveal the origin and evolution of allohexaploid oat

目标物种:燕麦(Avena sativa
发表时间:2022.08
发表期刊:Nature Genetics(IF=41.307)
合作单位:四川农业大学、白城市农业科学院、四川大学和中国科学院遗传与发育生物学研究所
测序策略:Nanopore Ultra-long、Illumina、Hi-C
基因组大小:10.76 Gb
基因组Contig N50:75.27Mb

燕麦作为重要的粮饲兼用型作物,由于其基因组为异源六倍体组成,基因组大(~11G)、重复序列含量高(~87%)且亚基因组间存在大量的交换,导致其基因组组装难度较大。研究者首先选择来自裸燕麦起源中心的传统地方品种“三分三”为材料,基于1028Gb的三代超长序列,并使用650 Gb的二代数据进行校正,组装了10.76 Gb的燕麦基因组,基于1296 Gb的Hi-C数据将99.06%的基因组序列挂载到燕麦21条染色体上。基因组组装从Contig N50(75.27Mb),LAI(18.34)、BUSCO(99.44%)以及与来自六倍体燕麦一致性图谱标记的共线性等多方面进行质量评估,均显示了所组装基因组的高质量。随后研究者进行了主要禾谷类作物的系统进化基因组学分析,通过与以水稻为代表的祖先核型和普通小麦的三个亚基因组进行比较,明确燕麦不同亚基因组的核型进化历史并发现在燕麦中存在大量染色体重排。研究者为了研究燕麦多倍化过程中发生的染色体结构变异,对二倍体、四倍体和六倍体物种进行了共线性分析。结果表明,在燕麦多倍化过程中发生了多次大的易位和倒位事件,并通过荧光原位杂交证实了这些染色体结构变异。希望组参与组装注释以及部分分析工作。

论文链接:https://doi.org/10.1038/s41588-022-01127-7

02. The Cycas genome and the early evolution of seed plants

目标物种:苏铁(Cycas
发表时间:2022.04
发表期刊:Nature Plants(IF=17.352)
合作单位:深圳华大生命科学研究院、深圳市仙湖植物园、中国科学院昆明植物研究所、兰州大学、中国环境科学研究院
测序策略:Nanopore、MGI-SEQ、Hi-C
基因组大小:10.5 Gb
基因组Contig N50:12Mb

该研究选取苏铁类的基部类群,完成基因组测序和组装。基于Nanopore长读测序、MGI-SEQ测序及Hi-C测序技术,基因组组装大小为10.5 Gb,Contig N50为12Mb,结合Hi-C数据,挂载到11条染色体上。共注释得到32,353个蛋白编码基因,BUSCO评估完整度为91.6%,是目前裸子植物中最高质量的基因组图谱。研究者采用对重复基因同义替代分析和系统发育基因组学方法,并使用基因组内共线性区域进行比较验证,发现现存裸子植物的最近共同祖先可能经历了一次古老的全基因组复制事件。最显著扩张的种子生理相关家族是cupin蛋白家族。研究者通过对源于四川攀枝花苏铁国家级保护区62株雌雄苏铁群体测序,表达差异分析,和雄性Y染色体的组装,找到雌雄表达差异最大的一个基因来自雄株的Y染色体,该基因编码一个MADS-box转录因子,推测其调控雌雄苏铁的性器官发育,该转录因子的同源基因也仅能在雄株基因组中检测到,说明了该性别决定机制在苏铁类植物中的保守性。早期维管植物的精子都是有鞭毛,可以游动的。随着演化,鞭毛丢失。在现生种子植物中仅苏铁和银杏保留精子具鞭毛的特征,进一步证实了苏铁在种子植物演化中古老的地位。希望组参与了本研究项目中攀枝花苏铁的测序、组装及初步注释服务。

论文链接:https://doi.org/10.1038/s41477-022-01129-7

03. The Larix kaempferi genome reveals new insights into wood properties

目标物种:落叶松(Larix kaempferi
发表时间:2022.07
发表期刊:Journal of Integrative Plant Biology(IF=9.106)
合作单位:中国林业科学院、国家林业和草原管理局林木栽培重点实验室
测序策略:PacBio CLR、Illumina、BioNano
基因组大小:10.97 Gb
基因组Contig N50:1.09Mb

研究者基于1.30Tb三代测序和0.52Tb二代测序数据,组装完成了大小为10.97Gb的落叶松基因组,Contig N50为1.09Mb,注释了45828个蛋白质编码基因,发现落叶松基因组66.8%由重复序列组成,其中LTR-RT占69.86%。基因组进化分析表明,落叶松与花旗松物种分化大约发生在65.9个百万年前,1139个基因家族在物种分化后发生扩张,而581个基因家族发生收缩。团队从31年生的落叶松全同胞家系中筛选出两组木质素含量显著差异的群体,基于群体转录组学,发现落叶松中的木质素含量差异主要由木质素单体聚合过程决定,且六个基因(LkCOMT7、LkCOMT8、LkLAC23、LkLAC102、LkPRX148LkPRX166)的表达量与木质素含量呈显著正相关。希望组为该研究合作单位之一,提供超长测序服务并参与组装、注释及部分后续分析工作,李净净及全伟鹏等参与该项研究工作。

论文链接:https://doi.org/10.1111/jipb.13265

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注