基于比较基因组学分析的方法定位及注释双峰驼MHC基因

来源 :中国农业科学 | 被引量 : 0次 | 上传用户:meidoc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】定位并注释双峰驼主要组织相容性复合体(major histocompatibility complex,MHC)基因序列,为进一步研究双峰驼MHC基因提供科学依据。【方法】运用比较基因组学方法,提取人类MHC(HLA)基因编码序列和牛MHC(BoLA)基因编码序列并分别与双峰驼转录本进行blastn基因序列比对,识别出相似度较高的scaffolds,通过分析HLA、BoLA基因序列比对在这些scaffolds上的位置顺序,对多条scaffolds进行拼接,得到双峰驼MHC的Pseudo chromosome;再分别提取HLA、BoLA全基因组序列与双峰驼已拼接的scaffolds进行基因组共线性分析,利用lastz建立起的Pseudo chromosome与HLA、BoLA全基因组序列的线性关系判断筛选出的scaffolds是否准确;然后通过分析MHC基因在两物种间的线性关系,在双峰驼参考基因组中提取出MHC基因序列,并对这些序列进行基因注释;最后根据得到的双峰驼MHC基因绘制系统进化树,研究其基因间的进化关系。【结果】通过对HLA、BoLA基因编码序列与双峰驼转录本用blastn进行序列比对,识别出了相似度较高的3条scaffolds,即NW011511766.1(全长4.1M)、NW011515227.1(全长1.2M)和NW011514613.1(全长15K),对其拼接得到双峰驼MHC的Pseudo chromosome;利用lastz共线性分析,识别出HLA基因序列和BoLA基因序列并比对出其在双峰驼MHC基因的共线性区域。该区域与拼接得到的Pseudo chromosome一致,证明筛选出的scaffolds是准确的。并且发现Class-Ⅰ类和Class-Ⅲ类基因集中分布在NW011515227.1上,而Class-Ⅱ类基因集中分布在NW011511766.1和NW011514613.1上,进一步分析得知Class-Ⅱ类基因主要分布在NW011511766.1的3.5—4.1M的位置;将存在共线性区域的序列提取出来,与比对到双峰驼上的MHC基因的编码序列进行blat分析,结果在双峰驼基因组中共识别出24个与牛BoLA基因高度相似的基因,其中Ⅰ类基因1个,Ⅱ类10个,Ⅲ类基因13个。对双峰驼这24个MHC基因进行信息注释并绘制系统进化树,结果显示注释的Class-Ⅰ类和Class-Ⅱ类基因在同一分支。【结论】通过比较基因组学方法定位并注释了双峰驼的MHC基因,将双峰驼MHC基因序列定位到了3条scaffolds上,找到并注释了24个MHC基因,绘制了双峰驼MHC的Pseudo chromosome,为进一步研究双峰驼MHC基因奠定了理论基础。
其他文献
本文首先就电梯安全隐患发生的主要原因展开了讨论,最后就电梯安全使用系统进行了重点阐述。
沼气发酵有三大好处:一是发酵产生的沼气可作燃料解决农村部分能源问题;二是改善城市、乡村环境卫生;三是发酵后的废水、沼渣可作肥料使用。沼渣养分含量比堆沤肥高,保肥保水
<正>一、初、高中课程标准内容对比分析通过研读《义务教育初中地理课程标准》、《全日制普通高中地理课程标准》,对比、分析发现新课标对于初、高中地理课程在课程性质、基
古诗文教学是高中语文课程体系中的重要组成部分,对语文教材中的古诗文编排情况进行研究,是考察古诗文教学问题的一个有效视角。本文分析了新课标下的文言文教学现状及其原因
在初中英语教学中,口语是英语学习中最为重要也是具有高难度的一部分。分层教学法目前已发展成英语教学必备方法,对学生采取具体分析,吃透学生个性差异与学习基础,以便确立分
江苏省农委近日下发《关于贯彻实施〈种子法〉全面加强依法治种能力建设的意见》,要求加快推动现代种业发展迈上新台阶,全面加强依法治种能力建设。切实抓好《种子法》学习宣
<正>对中国邮政来说,2015年注定是一个公司化运营以来与电商关联度最大的年份,也可能将是邮政电商发展最快的年份。进入2015年以来,中国邮政集团公司高层领导对市场的关注点
汉英语言中存在着巨大的文化差异,其中颜色词的差异很容易导致人们理解的误区。本文着重研究了汉英语言中"黑色"的文化差异及翻译的问题,力求更好地促进民族间语言和文化的交
一组来自行业调查公司的最新数据显示,2017年中国在公共和私人领域共装了1.76亿个监控摄像头,预计3年内,中国安装摄像头的数量将增加至6.26亿个。尽管我国拥有数量如此庞大的摄
报纸