昆虫之“最”和它们的基因组学研究
昆虫种类繁多,世界上已记录的昆虫有100多万种(其中有害昆虫八万余种),是目前最大的未被充分利用的宝贵资源。昆虫是动物界中最大的一个类群,在所有生物种类中占比超过50%,它们的踪迹几乎遍布世界的每一个角落。
有研究认为昆虫最早起源于距今~479 Mya的奥陶纪,现存的昆虫谱系大多起源于距今~345 Mya的密稳纪,而昆虫主要的多样性分化则出现在白垩纪时代[1]。
对人类健康危害最大的昆虫——蚊
蚊子属于双翅目蚊科,世界上约有3000种。是一种具有刺吸式口器的纤小飞虫。通常雌蚊以血液作为食物,而雄蚊则吸食植物的汁液。吸血的雌蚊是登革热、疟疾、黄热病、丝虫病、日本脑炎等其他病原体的中间寄主。蚊子的分布极为广泛,除南极洲外各大洲皆有蚊子的分布。其中,以按蚊属、伊蚊属和库蚊属最为著名。
相关研究▕疟疾载体——达氏按蚊的基因组研究[2]
按蚊是最主要的疟疾传播载体,在美洲每年由按蚊引起的疟疾有数百万例。研究者对从Coari、AmazonasState和Brazil获得的野生按蚊进行培养,并对其F1代按蚊进行DNA测序,组装出了达氏按蚊基因组。
Fig.1 达氏按蚊与冈比亚按蚊、伊蚊、库蚊和果蝇属的进化关系
研究中共预测了10481个蛋白质编码基因,其中,72%的基因与冈比亚按蚊最接近,21%与其它蚊种相似性较高。尽管经过很长一段时间的不同的进化过程(Fig.1),但研究者还是在达氏按蚊和冈比亚按蚊之间发现了保守的基因共线性现象(Fig.2)。
Fig.2达氏按蚊、冈比亚按蚊和果蝇的基因结构比较
文章还发现了达氏按蚊中大量的SNP位点及转座元件,确定并讨论了直接参与载体-人类和载体-寄生虫之间相互作用的与吸血、免疫和杀虫剂抗性相关的基因。
对农业危害最大的昆虫——蝗虫
蝗虫属直翅目,全世界有超过10,000种,广泛分布于热带、温带的草地和沙漠地区。蝗虫主要包括飞蝗和土蝗。在我国飞蝗有东亚飞蝗、亚洲飞蝗和西藏飞蝗3种,其中东亚飞蝗在我国分布范围最广,危害最严重,是造成我国蝗灾的最主要飞蝗种类,主要危害禾本科植物。全世界常年发生蝗虫的面积达4,680万km2,全球1/8的人口经常受到蝗灾的袭扰。
相关研究▕ 基因组信息揭示蝗虫与飞行和植食性相关的基因家族扩张[3]
在目前已完成测序的昆虫基因组中,最大的为东亚飞蝗,别看它身材小巧,基因组却高达6.5Gb,是人类基因组的2倍。研究发现东亚飞蝗基因组中存在大量的重复序列(至少60%),且这些序列的丢失频率明显比其他昆虫少很多,这是造成其庞大基因组的主要原因。
Fig. 3 迁移飞行过程中与能量消耗有关的基因的扩张
研究者通过基因组比较分析发现东亚飞蝗基因家族的扩张与迁移飞行过程中的能量消耗及其化学感应和消毒机制有关,这些扩张有利于飞蝗长距离飞行及植食性。这项研究揭示了蝗虫长距离飞行能力和植食性的基因组基础。
此外,对东亚飞蝗的甲基化和转录组研究分析发现了在蝗虫变相过程中的复杂的分子调控机制。
最浪漫的昆虫——萤火虫
萤火虫属鞘翅目萤科,是一种小型甲虫。因其尾部能发出荧光,故名为萤火虫。全世界约2000种,分布于热带、亚热带和温带地区,我国较常见的有黑萤、姬红萤、窗胸萤等几种。
萤火虫可以利用荧光的闪烁节奏形成特定的闪光信号,主要用来吸引异性交尾,偶尔也起一定的警戒作用。这种行为与蟋蟀鸣叫,蝴蝶起舞等类似,都可归为求偶行为,因为场面过于浪漫,被人们赋予更多诗意。
相关研究▕ 比较基因组学研究揭示萤火虫荧光素酶基因的起源与进化[4]
为了揭示萤火虫荧光素酶基因的遗传基础及其起源、进化过程,Timothy R. Fallon等人用PacBio+Illumina+Hi-C多技术结合的策略组装出了高质量的北斗七星萤火虫(Photinus pyralis,Lampyrinae亚科)基因组,解决了其中与荧光素酶基因相关的串联重复序列。同时,研究者还对日本萤火虫(Aquatica lateralis,Luciolinae亚科)和发光磕头虫(Ignelater luminosus,叩甲科)进行Illlmina基因组测序并完成组装。通过对这三个荧光甲虫进行比较基因组学和转录组分析,对发光甲虫的发光和化学防御机制在近1亿年来的进化历程提出了新的见解。
Fig.4 萤火虫荧光素酶基因进化模型
通过基因组和转录组比较分析,研究者绘制了萤火虫荧光素酶基因进化模型(Fig.4):串联基因的复制产生了PACS的几个旁系同源基因,其中一个新功能化成为萤光素酶祖先基因(AncLuc)。AncLuc原位产生了Luc1,而Luc2则可能是在1亿年前AncLuc发生了远程基因复制事件形成的;随后发生基因重排从而产生了萤火虫的两个亚科——Lampyrinae亚科和Luciolinae亚科。
此外,研究者还利用RNA-Seq技术对三种发光甲虫不同性别、不同组织部位、不同发育时期的基因表达进行了解析,分析了在荧光素酶代谢过程中起关键作用的基因。
对遗传学研究贡献最大的昆虫——果蝇
果蝇广泛地存在于全球温带及热带气候区,目前发现有至少1000种,在人类的栖息地内如果园,菜市场等地区内皆可见其踪迹。
果蝇只有四对染色体,数量少而且形状有明显差别;果蝇性状变异很多,比如眼睛的颜色、翅膀的形状等性状都有多种变异,这些特点对遗传学研究也有很大好处,是很常用的遗传学研究材料。
相关研究▕ 低覆盖长读测序法快速组装果蝇参考基因组[5]
研究者使用黑腹果蝇D.melanogaster (ISO1)基因组DNA在OxfordNanopore MinION掌上测序仪上测序1个flowcell,以其中长度在1kb以上的reads(测序深度约30×)与二代数据结合进行混合组装,加上Bionano光学图谱数据辅助scaffolding,获得高准确度、高连续度和高完整度的黑腹果蝇基因组:Scafold N50 =21.3 Mb,BUSCO评估97.1%。
Table 1 基因组组装结果
通过与参考基因组进行比较,揭示了黑腹果蝇中的大量结构变异,包括与发育、行为、代谢基因相关的novel LTR 转座元件的插入和复制等,这些结构变异有助于研究后生动物基因组进化。
最顽强的昆虫——蟑螂
蟑螂是属于蜚蠊目的昆虫,世界上约有6000种,主要分布在热带和亚热带地区。少数蟑螂会入侵人类家居,大部分则是生活在野外。家居最常见的蟑螂,大的有美洲蟑螂、澳洲蟑螂及短翅的斑蠊,身长约5.0cm;小的有德国蟑螂、日本姬蠊及亚洲蟑螂,体长约1.5cm,热带地区的蟑螂一般体型比较巨大。
相关研究▕美洲蟑螂基因组——揭示环境适应性的遗传学基础[6]
美洲大蠊是一种杂食性食腐动物。它生长速度快、繁殖能力强,而且具有组织再生能力,因而能够在城市环境中生存。美洲大蠊的摄食范围特别广,这也是它们适应多种食物来源的基础。美洲大蠊能通过一个非常复杂的解毒酶系统解毒,而这正是它们能抵抗各种化学毒素和病原体的主要原因。
中科院植物生理生态研究所詹帅研究组与合作者对美洲大蠊进行了基因组测序, 并在基因组水平分析蟑螂的环境适应性的遗传学基础。
Fig.5 美洲大蠊和其他蜚蠊中参与化学接收和解毒的基因家族
研究者将目光聚焦在美洲大蠊与环境适应性相关的基因家族的分析上,并分析与化学吸收、解毒和免疫有关的信号通路。研究发现美洲大蠊中与化学感受和解毒相关的基因家族都发生了大规模扩张,这大大增加了其对城市环境的适应性(Fig.5)。
此外,研究人员还鉴定出了参与发育和再生的信号传导路径。美洲大蠊有望作为开展蟑螂的生物学研究的模式系统。同时,这项研究也能为美洲大蠊的防治提供一些思路。
昆虫家族如此庞大,其中之“最”远远不只于此,以上列举的仅仅是沧海一粟,更多的昆虫故事可以查阅相关文献资料,以下是近年发表的昆虫基因组文献
已发表昆虫基因组文献汇总表
参考文献:
[1] MisofB, Liu S, Meusemann K, et al. Phylogenomics resolves the timing and pattern ofinsect evolution.[J]. Science, 2014, 346(6210):763-767.
[2] Marinotti O, Cerqueira G C, Almeida L G P D,et al. The Genome of Anopheles darlingi,the main neotropical malaria vector[J]. Nucleic Acids Research, 2013,41(15):7387-400.
[3] Wang X, Fang X, Yang P, et al. The locustgenome provides insight into swarm formation and long-distance flight.[J].Nature Communications, 2014, 5(5):2957.
[4] Fallon T R, Lower SE, Chang C H, et al.Firefly genomes illuminate the origin and evolution of bioluminescence[J].bioRxiv, 2017: 237586.
[5] Solares E A, Chakraborty M, Miller D E, etal. Rapid low-cost assembly of the Drosophila melanogaster reference genomeusing low-coverage, long-read sequencing[J]. bioRxiv, 2018: 267401.
[6] Li S, Zhu S, Jia Q, et al. The genomic andfunctional landscapes of developmental plasticity in the American cockroach[J].Nature communications, 2018, 9(1): 1008.
图片来源于网络|侵删