基于机器学习的疾病相关miRNA的识别与研究

来源 :广东药科大学 | 被引量 : 0次 | 上传用户:risk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MiRNA是一类长度约为22个核苷酸的非编码RNA,在各类生物进程中扮演着非常重要的角色。越来越多的研究发现,miRNA与疾病之间有着密不可分的关系。因此,识别疾病相关的miRNA,以及与各类疾病之间的关系,有利于加深对疾病发病机制和原理的理解与探索。同时,以miRNA为靶点,探究其与药物或化合物之间的关系,也能为疾病的治疗方案、药物的作用机理以及药物开发与设计带来极大的帮助。在信息时代的高速发展前提下,各类数据库以及计算机技术逐渐成熟,运用机器学习方法识别疾病相关的miRNA,以及与疾病之间的关系,可以使研究人员更加快速地设计相关实验,极大地缩短药物靶点识别和先导化合物设计等各方面研究的时间,加快研究进度。本毕业论文的主要内容如下:1.围绕课题的研究内容,对miRNA在疾病发生中的重要性、识别潜在的miRNA相关关联在生物医学和药学中的意义、miRNA作为药物靶点的合理性、miRNA潜在关联预测的国内外研究现状和机器学习方面进行了综述。2.基于miRNA序列信息和疾病临床症状信息,提出了一种新的miRNA-疾病潜在关联预测模型。该方法分别以miRNA前体的序列二级结构信息和疾病-症状得分值表征miRNA和疾病。通过基于欧氏距离的聚类方法,筛选出了可靠的负样本集,并用于随机森林模型的训练。在该方法中,模型分别获得了98.00%的正确率、99.43%的特异性、96.58%的敏感性、99.40%的精确率和0.9604的马氏相关系数。此外,受试者工作特征曲线和精度-召回率曲线下面积分别为0.9967和0.9975。在个案研究中,对预测出的前25条关联进行分析,结果表明:其中19条miRNA-乳腺癌关联,20条miRNA-白血病关联和15条hsa-mir-21-疾病关联能被文献以及数据库证实。本方法为潜在miRNA-疾病关联预测提供了新的方法和思路。3.基于分子指纹描述符、序列和临床症状信息,以miRNA为桥梁,提出了一种小分子化合物-miRNA-癌症潜在关联识别模型。首先,通过基于相似性的筛选方法,分别获得了小分子化合物-miRNA关联和miRNA-癌症关联的最可靠负样本,并进一步与正样本组合成4类不同的小分子化合物-miRNA-癌症关联。在本研究中,MACCS分子指纹、miRNA序列信息和疾病症状得分值分别被用于表征小分子化合物,miRNA和癌症。利用随机森林算法构建了多分类模型,对潜在的小分子化合物-miRNA-癌症关联进行识别研究。模型获得了93.13%的正确率、93.16%的精确率、93.13%的召回率和93.13%的F1值。受试者工作特征曲线和精度-召回率曲线下面积分别为0.9904和0.9808。分别对乳腺癌、肺癌、5-氟尿嘧啶和hsa-mi R-21-5p进行个案分析,绝大多数关联能被实验和相关信息证实。通过分子对接模拟研究,发现了一些潜在的乳腺癌治疗药物。该方法对小分子化合物-miRNA-癌症潜在关联的研究为癌症相关药物的研发与设计提供了相关参考,具有重要的实际应用意义。4.通过整合小分子化合物相似性、miRNA相似性、癌症相似性、已知的小分子化合物-miRNA关联和已知的miRNA-癌症关联,首先构建出了小分子化合物-miRNA-癌症关联复合网络。随后采用图卷积神经网络获取复合网络中各节点的网络拓扑结构特征。最终,结合自动编码器原理,计算不同小分子化合物和miRNA之间的关联得分,识别潜在的小分子化合物-miRNA关联。基于五折交叉验证,该方法获得了0.8813的受试者工作特征曲线下面积和98.23%的准确率。在hsa-mi R-21-5p为对象的个案分析中,55%的关联得到验证。结果显示,该方法能有效地应用于小分子化合物-miRNA的潜在关联预测,为药物靶点和疾病治疗方案提供帮助。
其他文献
目的:调查腰椎退行性疾病患者疼痛信念、负性情绪与生活质量的现状并分析三者之间的关系;探讨影响患者生活质量的因素,以期为优化患者生活质量提供理论依据。方法:采取便利抽样的方法,选取2019年9月至2020年1月期间承德市某两所三甲医院骨科住院待手术的340名腰椎退行性疾病患者为研究对象。使用一般资料调查表、疼痛信念与感知量表(PBPI)、医院焦虑抑郁测量表(HADS)、脊椎退行性疾病患者生命质量量表
目的:探索pH 2.0~3.0和pH 6.0~7.0的酸性氧化电位水(EOW)对胃肠道手术患者进行术前口腔护理的干预效果,为EOW后续在临床口腔护理的应用提供参考依据。方法:采用临床随机对照研究方法,选取在2019年12月至2020年10月河北省某三甲综合医院胃肠外科进行胃肠道手术的患者为研究对象。随机数字表法分为试验A组、试验B组和对照组。试验A组给予pH 2.0~3.0的EOW,试验B组给予p
目的:本研究调查产褥期妇女社会支持、育儿胜任感与生活质量的现状,明确产褥期妇女生活质量的影响因素,分析产褥期妇女社会支持、育儿胜任感与生活质量的相关性,为提高产褥期妇女的生活质量提供理论依据。方法:采用便利抽样法,于2019年10月~2020年1月在承德市某三级甲等综合性医院产科门诊复查的产后4~6周产褥期妇女作为研究对象,采用一般资料调查表、社会支持评定量表、中文版育儿胜任感量表和世界卫生组织生
目的:以柯卡芭舒适理论为指导,调查冠心病监护病房PCI术后患者舒适状况,分析其影响因素,初步构建并实施舒适护理干预方案,以提高患者舒适度,促进其康复。方法:1.采取便利抽样的方法,于2019年10月~2019年12月期间,在河北省四家三级甲等医院,选择冠心病监护病房接受PCI手术的患者400例为研究对象,应用舒适状况量表,对其舒适状况及影响因素进行调查与分析,有效回收量表386份。2.利用单纯随机
全世界范围内,在众多恶性肿瘤中肺癌具有最高的发病率和死亡率,其中非小细胞肺癌占比约85%,是肺癌的常见类型。非小细胞肺癌具有很强的个体差异性和异质性,恶性程度较高,预后差,通过传统常规的诊断手段难以满足临床的需求,而且具有侵入性、耗时费力、价格昂贵、患者依从性差等不足,因此需要一种使用简便快捷、微创或无创、取样方便和准确性高的方法提升临床诊断性能。血浆中含有人体内大量的、比较全面的蛋白质种类,能够
目的:探讨互动式患者参与在全膝关节置换(Total Knee Arthroplasty,TKA)患者术后康复中的应用研究。旨在为TKA患者术后的院内院外护理提供指导意义,同时为未来开展TKA术后康复护理提供理论和实践参考依据。方法:选择2019年12月至2020年5月在河北省某市某三级甲等医院骨科病区行TKA的患者作为研究对象。严格按照纳排标准筛选,最终纳入符合要求的研究对象70例。将研究对象在入
众所周知,大米作为谷物是加纳消费最多的主食之一。毫无疑问,这使稻米种植业得到了发展,就此而言,稻米业更有利于在该国创造农村和城市就业机会。充满活力和高效的稻米产业也将有助于大大减少该国的进口费用;考虑到该国每年在大米进口上的花费,这是不容小觑的。但是,该国大量涌入的进口大米正在阻碍甚至是扼杀国内这一有前途的稻米产业,并且使大米市场更加复杂。基于此,加纳国内的消费者对所购买大米的质量要求也越来越高,
蛋白稳态失衡是衰老和许多疾病发生的内在因素之一,目前已知热胁迫反应与衰老和蛋白稳态直接相关。作为分子伴侣,热胁迫蛋白可以调节其它蛋白质的折叠、组装、运输和降解,从而维持细胞的蛋白稳态。秀丽隐杆线虫具有生命周期短、衰老特征明显、与人类基因同源性高等优势,已成为衰老和蛋白稳态研究的重要模型。本文以秀丽隐杆线虫为模型,以热胁迫存活率为筛选指标,通过饲喂海参(仿刺参)cDNA文库表达菌直接筛选具有抗热胁迫
随着人口老龄化的加剧,医疗资源发展失衡,我国医疗行业面临较大的供给侧限制,医疗供应链的不平衡问题愈加突出,医保支出压力逐年增大。而数字化技术被广泛认为将成为突破医疗供需不平衡的关键。健康医疗行业有着大量的机会和空间被大数据技术、人工智能等技术深度重构,智能化时代的来临,医疗与科技的碰撞能够产生新的机遇,健康医疗大数据的产业化应用将推动健康医疗行业的变革,为解决我国的医疗困境提供思路。商业模式创新的
在人口加速老龄化的今天,如何延缓衰老、促进健康、降低衰老相关疾病的发病率是当今研究的热点问题。模式生物秀丽隐杆线虫(Caenorhabditis elegans)具有生命周期短、衰老特征明显、相关机制与人类同源性高、衰老相关疾病模型丰富等优势,因此是衰老和抗衰老研究的良好模型。秀丽隐杆线虫衰老的明显特征之一是其运动能力的下降,运动能力也是反映其整体活跃程度的重要指标。因此,本文选择秀丽隐杆线虫模型