【摘 要】
:
数据挖掘融合了可视化、统计学、人工智能等多种技术,在对庞大数据隐藏的潜在价值信息的提取中起着重要作用。随着二代测序技术的发展,基因组数据出现了指数级的增长,中国作为人口大国,在公共卫生和疾病预防等方面的公共数据也迅速积累。布鲁氏菌病作为我国的乙类传染病,从21世纪开始有强烈的回升趋势。为了深入了解布鲁氏菌,以预防其引起的布鲁氏菌病,本文采用数据挖掘和生物信息技术,使用高分辨率的方式进行全基因组分析
【基金项目】
:
国家自然科学基金; 科技部重大专项;
论文部分内容阅读
数据挖掘融合了可视化、统计学、人工智能等多种技术,在对庞大数据隐藏的潜在价值信息的提取中起着重要作用。随着二代测序技术的发展,基因组数据出现了指数级的增长,中国作为人口大国,在公共卫生和疾病预防等方面的公共数据也迅速积累。布鲁氏菌病作为我国的乙类传染病,从21世纪开始有强烈的回升趋势。为了深入了解布鲁氏菌,以预防其引起的布鲁氏菌病,本文采用数据挖掘和生物信息技术,使用高分辨率的方式进行全基因组分析,以确定其种群结构、时空分布、传播路径和功能差异;分析全国布病的流行病调查数据,以得到其时空分布特征、影响因素和时间序列模型;构建可视化的分析平台,以提供基因组和流行病调查数据的可视化分析服务。本文的主要研究内容包含了以下三个部分:(1)基于全球公开的犬布鲁氏菌的基因组数据。共使用了全球的91个菌株,发现了4个系统发育群(PG),基于core-SNPs和分子钟模型构建进化树以进行种群结构和时空分布分析,使用COG功能聚类进行功能差异的研究。发现的4个PG与它们的地理来源显著相关,PG1~3中,存在亚洲到非洲及欧美间的传播,PG4定殖于北美,且抗药基因逐渐缺失;功能基因在4个PG中的存在/缺失谱不同,PG3功能最完整,其它PG各具独特的功能基因缺失,特别是PG2大多缺失ABC型转运系统组分。(2)基于中国大陆地区的布病的流行病调查数据。对空间分布特征的分析,发现牛羊布病在全国有蔓延的趋势,人间布病的发病比较稳定且以北方为主,在全国表现出明显的聚集特征,且内蒙古作为局部聚集高发区长期存在;对人间布病发病率的影响因素分析,发现温度对其具有显著的负向影响,羊存栏量对其具有显著的正向影响;对时间序列的分析,发现人间布病的发病情况在目前和可预见的未来,都存在着明显的季节性周期特征,而且温度是人间布病的格兰杰原因。(3)建立了针对布鲁氏菌的可视化分析平台。就基因组数据的分析,提供了用于基因组拼接、基因组注释、单核苷酸多态性的识别、抗药基因查找和进化树构建的软件服务,通过对这些软件的组合使用,可以实现基因组的流程化分析;就流行病调查数据的分析,提供了对发病率的空间分布和聚集情况,流行率的分时变化、时间分组、地区分组和空间分布的可视化服务,为布病的流行病调查数据的可视化分析,提供了直观、便捷的参考方案。
其他文献
三维目标检测在汽车自动驾驶、机器人环境感知等应用中占有重要的地位,主要研究如何有效地感知三维环境信息,对感兴趣目标进行准确分类和定位。相比于二维目标检测,三维检测由于维度增加更具有挑战性。一方面,各类传感器数据单独应用于三维场景理解时都有不足之处,例如激光雷达获取的点云稀疏且不规则;相机获取的图像缺乏空间深度信息。另一方面,物体在空间中随机分布,当目标距离远或部分被遮挡时,容易出现漏检情况。针对以
随着交通信息量爆炸式地增长,难以仅凭人工处理方式实现对其的管理,以系统化和智能化方式对交通数据进行的操作的智能交通系统逐渐在现代交通管理中占据了重要地位。车辆作为交通中的一个重要组成成分,要完成整个系统的智能化管理,使用各种现代技术处理车辆数据是智能交通中不可或缺的一个重要环节。现阶段用于车辆检测与识别的技术中存在诸如处理计算量较大、效率较低等问题。针对上文中提到的车辆检测与识别技术中存在计算量大
在当今这个数字化、信息化高速发展的时代,“互联网+”技术风靡全球,微电子技术与互联网技术相结合成为许多行业发展的重点,使得电子产品的发展逐步走向微小化、精密化,这也推动了电子产品组装工艺的进步,点胶机在电子产品的表面贴装中起着十分重要的作用。和国外成熟的自动化点胶设备相比,我国点胶机无论是在点胶精度还是点胶速度上都有很大差距。点胶机在点胶加工的过程中会产生多种误差,其中主要包括与机床组件运动过程中
自身免疫性疾病是指由于某些原因造成免疫系统对自身成分的免疫耐受减低或破坏,致使自身抗体或致敏淋巴细胞损伤自身器官组织而引起的疾病。抗核抗体(Antinuclear Antibodies,ANA)作为自身免疫病患者中最常见的一类自身抗体,对相关疾病的分类、鉴别、分型、预测、预后及预防等具有重要的临床意义。传统的ANA检测以手工操作为主,需要人工对荧光显微镜下的ANA图像进行判读,并判断其所属的荧光模
近年来,随着区块链分布式账本的快速发展,区块链上的信息增长迅速,在区块链网络中,为了保证去中心化,每个节点都要独立的保存区块链数据,而不断增长的区块链信息提高了区块链网络中节点的存储要求,同时也给新加入网络的节点带来大量同步以及验证的负担,这提高了成为区块链网络节点的门槛,进而导致保存区块链信息的节点数量减少,对区块链的去中心化造成消极影响,不利于区块链网络的发展,因此越来越多的研究着眼于优化区块
激光选区熔化(SLM)3D打印技术由于其个性化定制、能够成形复杂修复体、成形精度高、能大批量生产修复体、理化性能优异等特点,在口腔修复体领域拥有广泛的应用前景。但是SLM技术也存在一系列问题待以解决,其成形件内部孔隙较多、表面粗糙度较差、残余应力较大,以上这些问题一直困扰着SLM技术在口腔修复领域的临床应用。为解决以上问题,本文首先对SLM钴铬合金的显微组织进行表征,分析其显微组织的特点。然后通过
随着中国科技与经济的快速发展,中国汽车持有量仍在大幅增加,然而交通拥堵、交通事故等一系列道路安全问题也在持续攀升,其中由于车辆异常行为导致的悲剧占据多数,无论是车辆故障还是驾驶员问题引起的车辆异常行为均会给自己或者他人带来致命性的伤害。因此,车辆异常行为识别作为智能交通安全管理与智慧城市交通管理领域重要的关键技术,已经成为当今人工智能研究与应用的重要内容之一。近年来,交通监管技术主要着手于车辆违规
金属密封环作为超高真空阀门中的关键密封零件,其性能将直接影响超高真空系统设备的健康运行与工作效率。随着半导体芯片、特种冶炼、真空镀膜等行业的蓬勃发展,超高真空阀门的应用大幅拓宽,其中的金属密封环也面临着更高性能的需求与挑战。因此,通过性能分析与结构优化提升超高真空阀门中金属密封环的综合性能显得尤为重要。本课题以某型号DN40全金属超高真空角阀的金属密封环为研究对象,基于金属密封环的结构受力与密封机
随着微电子技术、通信技术、嵌入式技术和人工智能技术的飞速发展,这些技术已进入到农业和工程机械领域。当前,我国现代农业机械行业正处于加速发展的重要阶段,人们对联合收割机性能和工作效率的要求越来越高,迫切需要提高联合收割机的自动化和智能水平。目前,国内联合收割机机型的自动化程度低于国外机型,联合收割机作业控制所采用的电控手柄主要依靠进口,虽然部分机型已经采用电控手柄控制方式进行收割作业,但大部分联合收
随着高通量技术应用于生物医学研究,生物医学文献的数量急速增长,使用文献挖掘技术自动从文献中准确的提取知识显得尤为重要。而近年来,预训练语言模型如BERT的兴起极大的推动了生物医学文献挖掘领域的发展,其使用基于深层Transformer的模型结构,并通过特定的预训练任务在大规模通用领域语料库上进行预训练的方式,有效的提升了预训练语言模型的语言表征能力,同时通过任务精调的方式在生物医学命名实体识别任务