【摘 要】
:
弯曲菌(Campylobacter spp)是一类能够引起人类腹泻的人兽共患病病原菌。在已发现的弯曲菌种类中,空肠弯曲菌和结肠弯曲菌是引起人类腹泻的主要致病菌,90%以上的病例由这两种病原引起,而其中空肠弯曲菌和结肠弯曲菌分别约占90%和10%。传统生化方法在鉴定弯曲菌时存在步骤多、耗时长、通量低等问题,而PCR方法试剂昂贵,且实验步骤多,容易产生样本间的交叉污染,从而导致假阳性和假阴性结果。近年
论文部分内容阅读
弯曲菌(Campylobacter spp)是一类能够引起人类腹泻的人兽共患病病原菌。在已发现的弯曲菌种类中,空肠弯曲菌和结肠弯曲菌是引起人类腹泻的主要致病菌,90%以上的病例由这两种病原引起,而其中空肠弯曲菌和结肠弯曲菌分别约占90%和10%。传统生化方法在鉴定弯曲菌时存在步骤多、耗时长、通量低等问题,而PCR方法试剂昂贵,且实验步骤多,容易产生样本间的交叉污染,从而导致假阳性和假阴性结果。近年来全基因组测序技术开始被用于弯曲菌研究。测序数据在经处理和分析后可用来表征弯曲菌的不同种系,或用来快速识别群落的基因型特征,例如毒力和耐药性等。本文以弯曲菌全基因组测序数据为基础,构建了能够准确鉴别空肠弯曲菌和结肠弯曲菌的生物信息学方法。主要工作包括:(1)构建了基于全基因组测序数据的弯曲菌识别方法流程,包括测序数据质量控制、基因组序列拼接、全基因组特征提取、基于支持向量机/深度神经网络的弯曲菌识别。(2)研究并比较了测序数据的质量控制方法,采用FastQC方法对弯曲菌的全基因组测序数据进行质量控制测试;研究并比较了基因组序列拼接方法,采用SPAdes方法对弯曲菌全基因组进行拼接。(3)通过对弯曲菌全基因组的特征分析,提取出了空肠弯曲菌和结肠弯曲菌之间的显著差异性特征。特征分析过程包括全基因组序列、基因注释、耐药基因、多位点序列分型、CRISPR-Cas系统等分析。实验结果表明,序列长度、GC含量、密码子序列密度、aspA等位基因编号、glyA等位基因编号和CRISPR重复序列NZCP0178591可以作为区分空肠弯曲菌和结肠弯曲菌的显著性特征,其中重复序列NZCP0178591具有较高的分辨力。(4)以基因组序列长度、GC含量、密码子序列密度、aspA等位基因编号、glyA等位基因编号以及CRISPR-Cas重复序列为特征集合,分别构建了基于支持向量机和深度神经网络的弯曲菌识别模型。实验结果表明,两种机器学习方法均表现出良好的弯曲菌识别性能,而基于深度神经网络的识别方法的性能略优于基于支持向量机的识别方法。综上,本文提出的基于全基因组测序数据的弯曲菌识别方法可用于准确区分空肠弯曲菌和结肠弯曲菌,相关生物信息学方法和流程可用于弯曲菌乃至原核生物的全基因组序列类型分析和研究。
其他文献
城市关键基础设施系统不仅与人民的生命健康和生活息息相关,而且对整个国家和社会的生产和发展起着至关重要的作用。一旦关键基础设施系统遭遇破坏,将会对国家安全、社会稳定、经济发展以及国民健康造成重大的影响。但目前,中国还处于突发事件易多发时期,一系列突发事件的发生,时常威胁着供水系统、电力系统、交通系统等城市关键基础设施系统的正常运转。这要求政府和决策者提前确定保护方案并采取措施对城市关键基础设施系统进
非线性波动方程是偏微分方程中的一个重要研究领域。在物理问题中,非线性,色散及耗散这三种因素影响着弹性杆内波的传播。其中,非线性项会使波前变陡甚至破裂,而色散与耗散可以减少波前斜率,制止波发生破裂,从而使弹性杆内波产生最终的稳态。本文共分为三章讨论带有双色散项的非线性发展方程(组)的初边值问题。本文第一章介绍了带有双色散项的非线性发展方程(组)的问题背景。本文第二章用Galerkin方法研究了一类带
特种设备安全作为安全生产工作的一个重要组成部份,关系经济社会发展和国家的稳定,联系着人民群众的生命和财产安全。研究分析基层特种设备安全监察工作现状与普遍性问题,并
在外语阅读过程中,焦虑作为一种常见的情感因素可能会阻碍学习者获取外语信息。本研究以二语习得理论和外语焦虑相关研究为指导,结合自己的教学实践,对小学六年级学生英语阅
传统防火墙是一台真实物理服务设备,主要控制网络中南北向流量;虚拟防火墙如同具有安全服务的特殊虚拟机,拥有独立的管理员、系统资源、用户认证、安全策略、数据库等。传统的防火墙部署缺陷和应用的不足是虚拟化防火墙产生的关键之一。访问控制系统是防火墙的最中要的组成部分,为了满足用户在不同时间段允许或禁止访问网络资源,访问控制系统中配置防火墙策略时引入了时间的限制,由于时间的增加导致防火墙策略之间存在的冲突类
在WSON骨干传送网中,业务沿着光路径传输会经历各种损伤,这些损伤随着信号传输距离的增大逐渐累积,造成光信号传输距离受限问题。光信噪比(OSNR)是衡量光网络信号传输质量的重要指标。目前WSON骨干传送网中应用最多的物理损伤补偿方式是设置电中继。电中继是建网中的主要成本,合理中继节点的选择及合理的中继方式可大大降低建网成本。为此本文提出了一种基于物理损伤的WSON骨干传送网中继算法(RA),该算法
当前,中国经济已由高速增长转向高质量发展阶段,正处于转变发展方式、优化经济结构、转换增长动力的攻关期。政府加快落实减税降费政策,优化市场环境,激发市场活力,推进经济的高质量发展。企业作为市场经济中最活跃的主体,企业积极转型创新,提升产品质量,清洁绿色发展,承担好各个利益相关者的社会责任,对于促进经济提档升级,实现经济的高质量发展意义巨大。但是,我国企业目前的社会责任实践情况不佳,企业失责事件频发,
随着遥感技术的飞速发展,其越来越多的被应用在国防安全、国土规划、农业和金融等多种领域。对遥感图像进行合理有效的土地覆盖类型识别是诸多应用的基础。应用特征提取与分析的图像处理手段进行土地覆盖类型识别面临着图像特征提取复杂、缺乏泛化性和成本较高等缺点。近年来伴随着深度学习的发展,语义分割技术带来了一种研究土地覆盖类型识别的新视角。深度学习针对大数据自动学习特征,在语义分割的一些应用中取得了出色的成绩,
在经济发展和新社会阶层逐渐形成的背景下,不同阶层具有不同的体育价值观,因此在体育活动和社区体育公共服务的需求方面也不尽相同。另外,在特定的经济发展态势下,针对多类群
协同过滤算法作为一种广泛应用的推荐算法,受到了人们的青睐,它通过利用用户对物品的历史评分等有关信息来预测物品的评分,向目标用户生成推荐列表。基于矩阵分解的推荐算法通过将评分矩阵分解为用户特征矩阵与物品特征矩阵来计算预测评分,但并没有充分挖掘用户与物品的属性信息,为此,本文提出了一种将矩阵分解与神经网络结合起来的方法,并加入属性信息以提高预测精度。信息核是数据集中少数但却有着关键信息的用户,真实信息