论文部分内容阅读
传统的基因克隆费时费力,而近年来,由于测序技术的日趋成熟及成本的大大下降,大量物种的序列表达标签(Ma et al.,2009)已经测序,从而为基因的发掘提供了一个很好的有用资源。昆虫的气味结合蛋白(odorant binding proteins, OBPs)和化学感受蛋白(chemosensory proteins, CSPs)在昆虫的通讯方面发挥着重要的作用,研究OBP和CSP,有助于我们研究昆虫与外界环境的相互作用及协同进化关系;而sid-1(systemic RNA interference defective)基因在系统性RNAi通路中发挥重要作用,探索sid-1基因在昆虫中的分布情况和进化规律,有助于我们了解哪些昆虫可以发生系统性RNAi,进而有助于将RNAi技术应用到实际的农业害虫防治中。本文建立了从EST序列中预测OBP、CSP和sid-1基因的生物信息学流程,从来自8个目54个昆虫物种752,841 ESTs数据中发现了142个OBP,177个CSP,其中117个OBP,129个CSP是尚未报道的新基因,在发现的新基因中88个OBP,123个CSP是全长序列。进一步收集了850个OBP和237个CSP序列,进行了motif、C-pattern结构特性和进化分析。除了双翅目昆虫还有一个C-plus OBP亚类外其它各个目昆虫的OBP整体上没有什么大的不同,C-plus这一亚类OBP含有8个保守的半胱氨酸C。在所有昆虫OBP中,典型的C-Pattern是第2和第3个保守C之间有固定的3个氨基酸残基,大多数昆虫OBP中第5和第6个保守C之间有8个氨基酸残基,而其它保守C之间的氨基酸个数都有不同程度的变化。在大多数昆虫中,第4和第5个C的变异程度是最大的,而在膜翅目昆虫中第1和第2个C之间的变化时最大,变异系数是11.66。几个昆虫目相比较而言,双翅目昆虫OBP的变化最大。相对于OBP来说,CSP的C-Pattern更保守一些。在GOBP和PBP进化树中,这两个亚家族主要以目聚类到了一起,表明这些基因大部分是在目分化之后出现的。而在CSP中的情况有些不同,虽然鳞翅目昆虫的CSP都在一个独立的分支上,有些目的昆虫和其它目的昆虫处在同一个分支上,表明有些CSP基因相对古老,而有些基因是在昆虫目进化之后分化而来的。在sid-1基因的预测方面,在18个物种中发现了42条非冗余的sid-1基因同源序列,其中16个物种首次发现。通过对sid-1基因的进化分析,发现不同生物体内sid-1的序列相似性与生物的亲缘关系和进化地位明显相关,表明该基因的起源较早。在双翅目昆虫中至今没有发现sid-1基因,推断双翅目昆虫在进化过程中可能丢失了sid-1基因。对sid-1基因的结构统计分析,显示脊椎动物的sid-1基因普遍比无脊椎动物长,外显子数目也更多。脊椎动物的外显子数目在21~33之间,而无脊椎动物的外显子数目在7-19之间。分析认为,脊椎动物sid-1基因在进化中外显子数目增多,长度增长,表明其表达或功能趋向于复杂化。sid-2是线虫发生环境RNAi现象所必须的基因。对sid-2基因进行了同源搜索,结果没有在昆虫中发现sid-2的同源基因,至今也尚未有昆虫sid-2同源基因的报道。令人感兴趣的是,虽然昆虫体内没有sid-2的同源基因,但许多昆虫也可以发生环境RNAi现象,由此推测,线虫和昆虫中可能分别进化了不同的环境RNAi机制。