基于一维卷积神经网络的蛋白质-ATP绑定位点预测研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:wsq27028320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生命活动过程中,蛋白质和配体之间的互相作用是普遍存在并极为重要的。准确定位蛋白质和配体之间的相互作用位点,对于理解蛋白质的功能、药物设计等有着重要的价值。其中,三磷酸腺苷(Adenosine-5’-triphosphate,ATP)是一种重要的配体。ATP可以通过水解断裂高能磷酸键来为生命体提供能量,是生命体中最直接的能量来源。通过湿实验的方法来确定蛋白质与配体的相互作用及绑定位点,存在着成本高且周期长的不足,研发简单高效的智能计算方法来预测蛋白质-配体的绑定位点有着迫切需求。相应地,基于机器学习的蛋白质配体绑定位点预测成为了一个热点问题。本文针对ATP这一特定类型的配体展开相应的蛋白质-ATP绑定位点预测研究,主要工作如下:(1)针对绑定蛋白质和ATP的绑定关系进行研究,提出了使用带有卷积层的神经网络来利用ATP绑定位点的局部性关系特性这一特性;根据绑定口袋的形成原理,选择了使用带有结构信息的蛋白质二级结构和溶剂接触面积信息来参与预测;发现了绑定位点数目较少的数据不平衡问题,并且使用了基于随机下采样的方法解决了这一问题。(2)提出了一种基于一维卷积神经网络用于预测蛋白质-ATP绑定位点的方法:首先,从蛋白质序列出发,从多个视角抽取特征,如位置特异性得分矩阵、二级结构以及溶剂接触面积,进而对每个残基进行特征表示;其次,采用采样算法在原始数据集上构建平衡的训练集,以应对原始数据集中正样本(绑定位点)与负样本(绑定位点)之间的极度不平衡;最后,基于平衡的训练集,设计并实现了一维卷积神经网络模型用于蛋白质-ATP绑定位点的预测。在标准数据集上对所提方法进行了严格的交叉验证与独立测试,并与领域内主流的蛋白质-ATP绑定位点预测模型进行了对比,实验结果验证了本文所提方法的有效性。(3)提出了一种基于残差深度网络的蛋白质-ATP绑定位点的预测方法,基于上一种实验方法,使用残差网络解决了训练数据的长度不定性,并通过每次使用整条蛋白质链来参与训练解决了滑动窗口的限制性。在标准数据集上进行了测试,实验结果验证了深度网络对于蛋白质-ATP绑定位点的有效性。
其他文献
近些年来,机器学习成为一个热门的学科,涉及人类生活的各个方面。其研究目的是从已有的经验或数据中提取、总结出一定的规律,设计出计算机算法以便对更多的未知数据进行处理和分析。正类和无标签类学习(Positive and Unlabeled Learning,PU学习)隶属于弱监督机器学习范畴,旨在仅仅基于PU数据集学习出一个性能良好的分类器。PU学习问题在现实生活中普遍存在,尤其是在负样本收集困难或收
随着现代社会对智能移动机器人的依赖逐渐加深,机器人在周边环境完全未知或部分未知情况下的路径规划能力成为研究者们突破的重要方向;其中主要的研究内容有机器人对周边环境的实时地图构建和自身同步定位(Simultaneous Localization and Mapping,SLAM),以及基于已构建地图和定位信息完成路径规划任务的相关算法。由于小型智能化移动机器人成本和体积的限制,其配备的传感器制约了自
近几年来,智能交通系统以及无人车技术取得了长足的发展。其中,交通标志识别无疑是智能驾驶系统中极为关键的技术之一。本文根据交通标志的特点,采用多尺度特征结合区域目标检测器,进行网络多层特征的融合,并利用筛选过的区域建议进行训练来实现交通标志的定位和分类。本文的工作主要包括以下几点:(1)传统神经网络仅依赖深层特征进行检测识别极易丢失图像的空间信息以及目标边缘像素,针对这类问题,设计了基于区域建议和多
本文对多场景下的图像文本区域检测算法进行研究,从图像分割的角度解决文本区域检测问题,提出了一种改进的全卷积网络模型:U-FCN。可以有效的检测出不同场景图像的文本区域。针对网络合成图像和自然场景图像中字符特性的不同,分别设计两种基于全卷积结果的二阶段文本检测方法,实现了多应用场景下的图像文本检测任务。本文的研究内容如下:1)本文对传统的全卷积网络模型进行了相关改进,设计出一种新的U型全卷积网络模型
在结构化环境下,传统AGV小车能够应对大多数场景,实现物品自动化运输。而在酒店、办公楼等相对非结构化环境下,物品自动化运输需要机器人具备更强的自主移动能力。本课题针对这一应用场景,对一种用于室内环境下的自主运输机器人进行控制系统设计与实现。首先对移动机器人控制系统进行方案设计,确定控制系统包含运动控制子系统、定位导航子系统、任务执行子系统与远程监控界面四个部分,对每一部分分别进行了方案设计。之后完
金属切削工艺在机械制造业中占有特别重要的地位。传统金属切削工艺在加工制造过程中会消耗大量的资源、能源,并产生工业三废和噪声,在制造、使用、处理和排放的各个时期均会对环境造成严重污染。为此,本文开展了金属切削工艺资源环境负荷数据采集及绿色评价的研究,相关工艺绿色评价和应用验证实例可指导进行工艺的优化,对减少资源能源消耗与污染物排放、实现工艺绿色度的整体提升具有重要意义。研制了资源环境负荷数据的采集工
AGV(自动导引搬运车)是一种具有自动化、智能化等诸多优点的现代化搬运工具,被广泛应用在智能车间、仓库等领域,在提高物流搬运效率、降低人力资源成本等方面发挥着重要的作用。多AGV系统的路径规划是AGV应用中需要重点研究的内容。本文以多AGV系统的路径规划与动态避障为主要研究内容,主要做了以下工作:一、针对单AGV路径规划的问题,结合AGV的导航方式,基于栅格地图构建法,对A*算法和Dijikstr
近年来,随着学科交叉的发展,立体匹配理论的研究逐渐丰富。然而医学图像普遍存在噪声多、结构复杂和数据采集困难等特点,传统的双目匹配技术难以获得准确的匹配结果。此外,准确的标签数据获取困难,制约着监督式的训练。针对以上问题,本文将自监督方法引入医学图像立体匹配,利用深度学习来提高匹配精度。主要研究工作如下:(1)针对标签数据难获取的问题,提出了一种自监督图像立体匹配模型SDMNet(Self-supe
驾驶机器人是一种用来替代人类驾驶员实现自动驾驶功能的机器人。由于无需对车辆进行重大改装,驾驶机器人就可以将普通车辆转变为自动驾驶车辆,因此其相关技术可广泛应用于汽车试验、自动驾驶汽车等领域。本文在课题组对驾驶机器人操纵机构结构设计的基础上,针对驾驶机器人操纵机构的性能分析及参数多目标智能优化等方面内容进行了研究。首先,分析了驾驶机器人操纵机构的组成和工作原理。根据驾驶机器人各操纵机构的结构特点,建
双电动缸同步伺服系统具有体积小、大负载、控制精度高、便于布局、响应速度快、便于维修等众多优点,因此在国防装备、航空航天和民用重工业等领域都有广泛的应用。但双电动缸同步伺服系统是一个复杂的非线性系统,它的非线性特性和模型不确定性直接影响着伺服系统控制性能,本文针对双电动缸同步伺服系统中存在的耦合扰动、参数不确定性、时变扰动和死区非线性等问题,展开了以下几个方面的研究工作:(1)介绍了双电动缸同步伺服