【摘 要】
:
固有无序蛋白质在天然状态下缺乏稳定的空间结构,但却在生物体内广泛存在,对生命活动的正常运转发挥着重要作用,同时还与人类的多种重大疾病相关。对蛋白质中无序区域的研究有利于探索相关疾病的发病机制,从而控制疾病的发展。传统的固有无序蛋白质检测方法,大多侧重于氨基酸的理化性质,信息过于单一,而且忽略了氨基酸序列间的特征信息,预测精度偏低。因此,为了提高固有无序蛋白质的分类准确率,本文使用交叉互相关算法分析
论文部分内容阅读
固有无序蛋白质在天然状态下缺乏稳定的空间结构,但却在生物体内广泛存在,对生命活动的正常运转发挥着重要作用,同时还与人类的多种重大疾病相关。对蛋白质中无序区域的研究有利于探索相关疾病的发病机制,从而控制疾病的发展。传统的固有无序蛋白质检测方法,大多侧重于氨基酸的理化性质,信息过于单一,而且忽略了氨基酸序列间的特征信息,预测精度偏低。因此,为了提高固有无序蛋白质的分类准确率,本文使用交叉互相关算法分析残基间的特性,并改进传统检测方法中对滑动窗口的使用,运用嵌套滑动窗口提取氨基酸序列特征,在此基础上本文提出一种基于交叉互相关的局部残基邻域特征提取方法。该方法首先对氨基酸序列构建隐马尔可夫模型(Hidden Markov Models,HMM);其次,通过多序列比对算法得到查询序列的Profile HMM得分矩阵;最后,使用嵌套滑动窗口、交叉互相关算法以及叠加均值法计算局部残基间的邻域特征。本文方法提取的特征包含更多残基间的信息,可以更准确的表达氨基酸序列。本文设计残差神经网络分类模型,通过实验调试神经网络的参数,然后对提取的特征进行分类验证,使用混淆矩阵和ROC曲线等指标验证分类模型的性能,并与支持向量机和随机森林两种分类算法进行比较。在CASP9和CASP10数据集上的实验结果显示,本文设计的残差神经网络分类模型的分类准确率分别达到93.8%和93.2%,比支持向量机和随机森林的分类准确率高出5%。而传统的固有无序蛋白质检测方法:DISOPRED3、PreDisorder和ESpritz等在相同数据集上的准确率在80%左右,本文方法较传统方法提高了13%。结果表明:本文提出的特征提取方法,补充了传统检测方法中氨基酸序列特征的不足,提高了分类准确率。
其他文献
在城镇化进入下半场,存量土地高强度更新的背景下,城市特色空间逐步被侵蚀,城市高度面临失控,通过高度视廊的刚性管控保护山水格局,成为当前城市更新设计的核心内容。研究总
<正>背景与目的帕金森病和癫痫均是神经系统常见疾病,但是帕金森病合并癫痫在临床上十分少见,易误诊漏诊,我们报道一例病例,以期提高临床认识。方法患者为71岁男性,主诉"发作
目的:观察针刺结合火罐治疗失眠症患者的临床疗效。方法:共选取失眠症患者80例,采取随机数字表法将其分为观察组及对照料组各40例,观察组采用针刺结合火罐治疗,对照组采用单纯药物
通过对邯钢一冷轧酸洗线漂洗段存在的问题进行汇总与分析,采取控制最后一级漂洗槽中氯离子含量、提高脱盐水水质等措施,降低或杜绝了带钢出漂洗段表面红褐色铁锈现象;明确各
<正>中国·深圳2018年8月17日-19日第二届交通工程与运输系统国际学术会议IICTETS 2018)将于2018年8月17-19日在中国深圳隆重召开。ICTETS 2018将围绕"交通工程""运输系统"的
<正>目的评价腹腔镜下保留盆腔自主神经的广泛性子宫切除术(laparoscopic nerve sparing radical hysterectomy,LNSRH)治疗早期宫颈癌的手术安全性、根治性及术后膀胱功能恢
摘要药物临床试验全过程必须严格遵循三大原则——伦理原则、科学原则、法律原则进行。在此基础上,本院还将ISO9001质量管理体系的管理理念贯穿于药物临床试验全程质控中,从而
玉米纹枯病、茎腐病是世界性分布的土传病害,近年来危害日趋严重,给农业生产带来了极大损失。本研究以吉林省玉米纹枯病、茎腐病优势菌株立枯丝核菌(Rhizoctonia solani)和禾谷镰孢菌(Fusarium graminearum)为供试菌,从多年生人参根际土壤中分离微生物,通对对峙培养筛选玉米纹枯病、茎腐病生防菌株并进行生理生化和分子生物学鉴定,探究生防菌的抑菌作用及其与玉米膜下滴灌水肥药一体