论文部分内容阅读
繁殖力是指动物在正常生育条件下维持正常生殖功能和生育的能力,是衡量动物生产力的重要指标。个体间生育能力差异的遗传基础对哺乳动物,特别是对人类和牲畜的生殖发育具有重要意义。动物从发情期向泌乳期的转变对动物健康、泌乳力和繁殖性能都有重要影响,进而直接影响畜牧养殖的经济效益。因此,探究繁殖力相关基因、阐明其分子机制,对家禽家畜不孕和亚孕的诊断治疗提供指导意义,也为如何提高相关家禽家畜繁殖力的研究提供重要参考。但目前缺乏一个整合了遗传信息和环境等方面因素的平台供相关人员使用。因此,本论文构建了Fif Base(http://www.nwsuaflmz.com/Fifbase)数据库,旨在为相关研究人员提供更加完整系统的繁殖力相关信息。本研究通过对猪、牛、鸡等十个物种繁殖力相关的RNA-seq数据与文本数据整合分析,细致全面地挖掘了与繁殖力相关的基因。在此基础上建立了家禽家畜繁殖力相关基因注释分析综合数据库平台Fifbase,该平台收录了10个物种的繁殖力信息,内含基因的染色体位置、别名、基因描述、基因组版本、文本信息、环境因素、基因结构、GO term、Pathway通路信息、表达信息、PPI(protein-protein interaction)网络、基因组可视化等10余种信息,为用户提供一个便于检索的综合性资源库。1.基于文本挖掘的家禽家畜繁殖力相关基因注释在此过程中,将Pub Med数据库作为数据来源,以75个繁殖力指标及47个环境因素或它们的词汇学变体关键词结合15个物种名称构成主题词,采用文本挖掘技术,获取已知的与繁殖力相关的文献,从中提取与繁殖力相关的基因。最后获取10万多篇与繁殖力相关的文献,其中涉及到的基因有28127个。接着通过人工检索的方式进行过滤,最终筛选了455篇文献,覆盖10个物种,涉及470个繁殖力功能基因。对这些基因做GO富集分析结果表明其均与妊娠、产仔、繁殖等通路显著相关。2.家禽家畜繁殖力RNA-seq测序数据整合分析基于GEO、SRA等数据库,本研究系统收集了家禽家畜繁殖力相关的RNA-seq数据,获得猪、牛、鸡和鸭四个物种共14套与繁殖力相关的RNA-seq数据集。对该数据集做差异表达分析,最终鉴定得到1089个与繁殖力相关的差异表达基因。3.构建数据库平台在以上工作基础上,本研究对文本挖掘数据及RNA-seq数据做了进一步加工处理和注释。在此基础上,本研究基于LAMP架构构建了一个畜禽繁遗传信息相关的数据库。该数据库覆盖了过滤后的10种家禽家畜的组学数据以及具体的与繁殖力相关的基因数据。为进一步完善用户对家禽家畜繁殖力基因数据库的使用需求,该数据库提供了一个用户友好的界面,方便用户浏览、检索和下载繁殖力相关的基因信息。此外,为帮助用户搜索其感兴趣的基因是否与繁殖力相关,本研究还嵌入了BLAST序列比对分析工具,提供给用户序列比对在线服务。数据库中提供的基因组浏览器可以帮助用户查看该基因的详细信息,为用户提供图形化的展示服务。本研究结合文本挖掘和RNA-seq数据挖掘获取繁殖力相关的信息并对其进行整理注释,构建了专注于家禽家畜繁殖力基因的生物信息数据库,一方面为繁殖育种研究提供数据支撑,另一方面为研究人员探索这些基因的功能及其在畜牧业方面的潜在应用提供了参考。