病原菌毒力因子数据分析平台的设计与构建

来源 :北京协和医学院 | 被引量 : 0次 | 上传用户:dfjixie2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传染病是公共卫生安全的严重威胁之一,尤其是近年来新发再发传染病不断出现。尽管病毒性传染病危害严重,细菌性传染病依旧是不可忽视的问题。病原细菌的致病性是由它的毒力因子决定的,研究毒力因子不仅是阐明病原菌致病机制的关键,也是相关传染病防控和干预的重点之一。本实验室于2004年自主构建了国际上首个综合性病原菌毒力因子数据库(VFDB)。最初发布的数据库收集了 24个属100多种重要医学病原菌的毒力因子的组成、结构、功能、致病机理、毒力岛、基因组信息等内容。随后分别于2008年与2012年先后两次更新扩充,进一步引入了比较基因组学数据集,以及不同病原菌同类毒力因子之间的遗传多样性和分子进化关系等重要信息。尽管三次发布的VFDB数据相互关联,但是它们的数据集和用户访问界面都是相对独立的。数据的冗余不利于后续进一步的数据挖掘,界面的不统一也会给用户的访问带来不便。因此,本研究从三个方面对VFDB进行了改进。首先,改进了底层的数据结构,去除了冗余数据,整理生成由已知毒力因子构成的核心数据集和包括所有潜在毒力因子的完整数据集。其次,对核心数据集中的所有毒力相关基因的注释信息进行了审核与精炼,提高了 VFDB数据库的数据质量。最后,使用集成的JavaScript框架ExtJS4.1创建了一个整合的、界面统一的病原菌毒力因子数据分析平台,提供多种在线数据统计分析功能,既减轻了服务器端的压力,又提升了用户体验。本研究工作不仅对VFDB的基础数据进行了整合与优化,去除了冗余,而且对核心数据集中的所有毒力相关基因的注释信息进行了审核与精炼,产生出了适用于大数据快速分析的高质量非冗余毒力因子数据集,并构建了界面友好、功能丰富的全新毒力因子数据分析平台,为VFDB数据库应用于病原细菌相关的大数据分析奠定了基础。
其他文献
审计电算化作为一种提高审计效率和质量的重要方法,其应用的范围正越来越广泛。本文拟从我国电算化审计的现状入手,剖析原因,提出加快实施电算化审计的初步思路。
OA(Office Automation)系统即我们常说的办公自动化系统,它起源于上个世纪70年代的发达国家,现在OA已经广泛的应用于各个行业。本文简单回顾了OA的发展历程并针对OA在企业信
2014年国务院下发相关文件,要求优化行政事业单位的金融资源,用好增量,盘活存量.对于如何盘活行政事业单位财政存量资金作出指示.财政存量资金问题成为财经界和相关行政事业
社区的发展,政府在一些领域的退出,为非营利性组织的发展提供了广阔的前景。社区的非营利性组织大概有四种类型。目前,人们对非营利性组织认识,往往偏重于它对社会的管理作用
发展中国家农村信贷市场的一个显著特征是正规金融与民间金融并存,中国农村亦然。当下,农村民间金融道德风险的生成机理源于信息在农村民间贷款人与借款人、农村民间金融机构
蛋白质组学是后基因组时代生命科学研究的热点之一,它研究生物体细胞、器官乃至组织的蛋白质表达规律,并阐明其生物学意义。蛋白质组学研究的重要技术之一是生物质谱技术,对
针对双河油田稀油老区注水井层位多、夹层薄、层间吸水能力差异大等问题,利用粘弹性表面活性剂在酸液中表现出的粘弹性,以及破胶完全、对地层清洁无伤害的特点,通过配伍性、
目的考察不同厂家生产羟丙甲纤维素的理化性质,并建立羟丙甲纤维素理化性质与缓释效果之间的联系,为其进一步合理应用提供理论依据。方法收集不同厂家羟丙甲纤维素,分别采用
近—段时期,银行会计监督工作由于受到各种主客观因素的影响,在不少银行、尤其是地方管辖银行和基层单位,这一工作不但没有加强,反而有所削弱。
巴西、中国同属发展中的农业大国,在经济发展过程中存在着类似的问题.发展农业经济,提高农民收入,消除地区间的不平衡,是两个国家共同寻求的道路.巴西农业在近期的发展中表现