【摘 要】
:
细胞核是真核细胞内最重要的细胞器,它是基因复制、RNA转录的中心,是细胞活动的控制中心。蛋白质的功能与蛋白质在细胞内的位置密切相关,因此,如何从大量蛋白质中精确地识别出核定位蛋白,并且进一步预测亚核定位非常重要。本文基于最新更新的UniProtKB/Swiss-Prot数据库,构建了相似性小于等于25%的核定位蛋白和非核定位蛋白数据集,选取氨基酸序列N端单肽组分信息、蛋白质骨架二肽组分信息、氨基酸
论文部分内容阅读
细胞核是真核细胞内最重要的细胞器,它是基因复制、RNA转录的中心,是细胞活动的控制中心。蛋白质的功能与蛋白质在细胞内的位置密切相关,因此,如何从大量蛋白质中精确地识别出核定位蛋白,并且进一步预测亚核定位非常重要。本文基于最新更新的UniProtKB/Swiss-Prot数据库,构建了相似性小于等于25%的核定位蛋白和非核定位蛋白数据集,选取氨基酸序列N端单肽组分信息、蛋白质骨架二肽组分信息、氨基酸指数信息、蛋白质相互作用信息及基因本体注释信息为特征信息,利用支持向量机算法对构建的数据集进行预测。单特征信息中,基因本体注释信息与蛋白质相互作用信息两种特征信息的总预测成功率较好,且总预测成功率都达到了 80%以上,对特征信息进行筛选融合,在5折交叉检验下总预测成功率达到89.11%。本文进一步构建了相似性小于等于25%蛋白质亚核定位数据集N1127和N1044。并选取4种特征信息:氨基酸组分信息、蛋白质骨架二肽组分信息、基因本体注释信息和蛋白质相互作用信息,利用支持向量机算法对构建的数据集进行预测。单特征信息中,基因本体注释信息与蛋白质相互作用信息两种特征信息的总预测成功率较好,将特征信息进行融合,筛选出最优参数组合,发现当四种特征信息融合时达到最好的预测效果,在5折交叉检验下的总预测成功率分别达到69.40%和74.46%。说明通过选择适当的特征信息,并将特征信息进行融合,采用有效的算法,可以得到较好的预测结果。
其他文献
聚合物太阳能电池(PSCs)作为一种极具发展前景的可再生能源技术,因其具有质量轻、制备工艺简单以及可制备半透明和柔性器件等优点备受关注。如何提高其能量转换效率(PCE)依然
近20年来,我国城市的发展迅速,城市的规模不断扩大,虽然人们的生活水平的得到了大幅度的提高,但是面对与之同时产生的城市环境污染问题,如雾霾等严重的空气质量问题,只能望洋
声子晶体作为一种新兴的周期结构材料,具有很多常规材料无法比拟的特性。本文主要研究折叠结构构成的声子晶体中的波动问题,探究其中的各种波动特性,并提出几种能调控波动特性的应用器件模型。大量研究显示折叠结构面对外界的扰动时,不仅会对共振峰和传输等产生不同程度的影响,还会产生比如手性等新现象。为解决外界扰动对折叠结构中弹性波波动特性的影响问题,本文分别进行了以下3部分的研究。第一部分,考虑了带轴向力的薄板
并购重组是资本市场的一个永恒话题,资本市场中很多案例显示,最后成交价格远远超出了标的资产账面价值,高溢价并购在财务处理上是产生巨额的商誉,企业日后很可能面对商誉减值损失的风险,而且高溢价并购行为也会给资本市场带来一定的风险,因此这种高溢价并购行为内在动因十分值得深入研究。目前很多学术研究是基于委托代理理论,强调企业价值增值和经理人个人利益的目标导向引发了高溢价并购行为,但随着现代组织治理架构的不断
为应对化石能源过度开发导致的环境和能源问题,以能源变革和信息技术为动力的第三次工业革命日渐兴起。智能电网、新能源和分布式电源是第三次工业革命的重要课题:智能电网与
目的:慢性疼痛和瘙痒的反复发作,难以治愈,极大的影响了患者的生活质量、危害其身心健康。据统计每五个成人中就有一个正遭受着疼痛带来的痛苦,慢性瘙痒的患病率高达22%。目
作为人力资本的重要组成部分,金融素养会在一定程度上影响传统农户和家庭农场正规信贷需求。但是,影响是否显著,是否对传统农户和家庭农场正规信贷需求的影响有所不同等这些问题需要更深入研究。这些问题的研究有助于了解和提升传统农户和家庭农场金融素养水平,有利于从金融素养角度发现解决传统农户和家庭农场正规信贷需求问题的措施。本文基于人力资本和信贷配给理论,阐述了金融素养影响传统农户和家庭农场正规信贷需求的作用
目的:探讨Tollip对结肠癌的调控作用和意义。方法:收集结肠癌患者癌及癌旁组织标本各30例,免疫组织化学(IHC)、实时荧光定量聚合酶链反应(RT-qPCR)和免疫印迹法检测Tollip及
冬虫夏草是虫草真菌寄生于蝙蝠蛾幼虫而生成的子座与虫体的虫菌复合体,中国被毛孢(Hirsutella sinensis)是公认的冬虫夏草无性型真菌,其功能和成分与冬虫夏草高度相似,已成为野
草莓是蔷薇科浆果果实和基因组研究的模式植物,糖酸组成及其积累水平是其果实风味的重要基础。探究草莓果实糖酸积累特性、糖转运蛋白全基因组鉴定分析和糖转运蛋白与糖积累