基于多信息融合预测单定位和多定位凋亡蛋白质亚细胞位置

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:luqing77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生物体关键的组成成分,存在于细胞中不同区域的蛋白质它们的功能也不一样。所以,预测蛋白质在细胞中的位置能更好的了解它们的功能。我们建立了一个新的单定位凋亡蛋白质数据集,通过特征筛选提取了氨基酸n肽组分信息、蛋白质骨架信息、化学位移信息和蛋白质保守位点的进化信息,并根据蛋白质物理化学特性提取了亲疏水信息,最后将以上各单特征信息进行融合,采用支持向量机(SVM)算法及加权K近邻(K-Nearest Neighbors, KNN)算法对单定位细胞凋亡蛋白质数据集进行分类预测,Jackknife检验下总体预测成功率分别达到了81%和77.9%。以单定位凋亡蛋白质数据集为标准集,本文还构建了一个多定位凋亡蛋白质数据集作为独立测试集,以氨基酸二肽组分信息和蛋白质骨架信息作为多定位凋亡蛋白质数据集的特征参数。结合加权K近邻(K-Nearest Neighbors, KNN)算法对其进行预测,总体预测成功率达到60.9%。
其他文献
随着城镇化不断发展的需要,我国政府出台了一系列盘活农村宅基地相关的政策。2017年中央一号文件指出进一步盘活农村存量建设用地,允许通过村庄整理、宅基地退出等方式满足农
人类基因组计划的顺利完成,新的高效的实验技术的广泛应用,产生了海量的基因序列信息,生命科学方面的研究也正式步入了后基因组时代。蛋白质参与到生命活动的方方面面,蛋白质
近年来,随着激素替代治疗的广泛应用,关于激素替代治疗对绝经后女性心脑血管疾病的影响备受关注。研究证实激素替代治疗能够调节血脂水平,改善血脂谱,进而延缓动脉粥样硬化的发生。而氧化低密度脂蛋白是评估动脉粥样硬化发生风险的一个重要指标,目前针对激素替代治疗对绝经后女性氧化低密度脂蛋白的影响研究较少。目的:通过监测绝经后女性激素替代治疗过程中氧化低密度脂蛋白及颈动脉内中膜厚度的动态变化,探讨激素替代治疗对
学位
本论文的研究内容主要包括两个部分:格子Boltzmann方法的基本理论研究(Lattice Boltzmann Method,简称LBM);格子Boltzmann方法在致密砂岩渗流模拟中的应用——基于格子Boltzm
大量的工程实践表明,利用纤维增强复合材料(Fiber Reinforced Polymer,简称FRP)对钢筋混凝土(RC)构件进行加固能够显著提高结构或构件的承载力和耐久性。近年来,FRP加固技术
本文依托国家现代化测绘基准体系建设一期工程项目“坐标框架的稳定性分析”的需求,结合当前国际范围内普遍缺乏对区域性参考框架稳定性系统全面的评估的现状,开展了一系列关
随着科技发展的日新月异,随着AR、VR、AI、5G等越来越多前沿技术出现在我们每个普通人的生活中,这些都显示出物理与科学、技术、社会、环境的关系密不可分。了解物理学与这些方面的联系就显得尤为重要,即本文所提到的STSE。面对新时代的人才培养需求,全球教育发达地区都在强调科学技术的社会意义,物理教育必然应担起这样的责任和使命,提高每一位公民的科学素养,实现立德树人的根本任务,培养德智体美劳全面发展的
中国房地产市场日趋成熟化,房地产企业之间竞争的激烈程度比以前更加严重。在这种大环境下,如何获得可观的利润,是房地产企业面临的最主要问题。除紧跟市场动向,推出更符合消费者需求的房源外,严格控制开发成本,无疑成为房地产企业的必要选择。基于上述,本文针对房地产行业成本管理问题进行了分析论述。论述中,本文主要运用了案例分析的方法,运用成本管理理论知识对A房地产集团公司成本管理存在的问题及改进措施进行了研究
企业员工离职会给企业增加招聘成本、运营成本和经济损失,针对于此,提出利用机器学习构建员工离职预测模型。基于二叉树的CART算法和多叉树的C5.0算法有直观的分类规则,而SVM能够处理非线性特征之间的相互作用,其预测的准确度达到82%、85%和86%。但传统单棵树模型和SVM算法无法在不平衡数据场景中有效应对,对于不平衡样本,在原始数据不改变的情形下,通过增加对少类样本的学习权重,改变训练数据的权值