基于深度张量神经网络理论预测氨基酸能量

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:davidcao2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过计算机模拟分子的变化及物理化学性质是研究分子的主要理论方法。这其中主要包括分子动力学模拟和量化计算。分子动力学模拟是基于已有力场的来描述分子运动时原子的变化性质。借助于计算机硬件,特别是GPU的发展,分子动力学模拟可以体现上百万个原子的变化过程,但受限于力场,分子动力学模拟无法很好的刻画化学反应。量化计算是通过描述原子周围的电子云来模拟原子的运动和相互作用,这种更加精确的计算可以用于研究化学反应,但能模拟的体系原子数目不大。深度学习是人工智能的重要科学之一。其主要研究方向是在海量数据的基础上,通过经验学习,改善具体算法的性能。受益于理论的框架发展,深度学习在众多传统方法无法很好应对的学科,取得了突破性的进展,这其中包括网络,文本和图像搜索,语音识别以及生物信息学等。同时深度学习也在理解量子系统方面取得类似的突破。本文提出了一种同时基于量化计算和深度学习的理论方法(Quantum Mechanics-Deep Tensor Neutral Network,QM-DTNN),用于合理预测蛋白质中氨基酸的物理化学性质。在QM-DTNN中,采用MFCC方法,通过添加分子帽的方式,蛋白质被分解成独立的氨基酸单元。我们通过Metadynamics的增强采样方法确保数据集的完备性,进而构建训练、验证和测试数据集。DTNN的输入包括氨基酸中原子的成对间距和核电荷。使用量化计算所得到的氨基酸单元的物理化学性质作为DTNN的输出。在深度张量神经网络当中,通过积函数,输入被转换为一组张量。通过卷积提取有效信息,用于网络输出。本文选择多种典型氨基酸,通过DTNN预测能量,其结果与QM数据具有良好的相关性。其中绝对预测误差的平均值和绝对预测误差的标准偏差值偏小,确定整体精度较高。进一步说明,在特定的化学环境中,DTNN方法能够预测原子的能量。与可接受的精度误差的QM计算相比,我们所提出的方案显著减少了计算时间。这项工作的根本是快速准确计算小分子物理化学性质。我们的方法在不同的应用领域被证明是有用的。作为化学相关性的一个例子,本文选择蛋白质中的氨基酸进行研究。我们的模型用于预测分子中的原子能量,证明了机器学习的潜力,揭示了对于复杂量子化学系统的见解。
其他文献
目的:探讨抑酸治疗对合并酸误吸的特发性肺纤维化大鼠病情发展及转归的影响。方法:将36只SD雄性大鼠,随机抽取10只为正常对照组、6只为模型组、抑酸10只为组和10只为糖皮质激
微晶纤维素是一种来源广泛,蕴藏丰富的绿色资源。本课题通过对微晶纤维素进行选择性氧化后得到氧化微晶纤维素,再将所得氧化微晶纤维素与卤胺化合物反应,制备卤胺改性的抗菌
有害藻华是一种海洋生态异常现象,是全球近海水域污染的主要环境问题之一。近年来,世界范围沿海区域富营养化导致有害藻华频繁爆发,对沿海地区养殖业可持续发展、海洋生态安全及人类健康构成严重威胁。当前,有害藻华的爆发、生态效应及防治已经引起人们的广泛关注,寻找能够有效防治有害藻华的方法成为水环境领域的重要研究内容。物理方法和化学方法不可避免的造成了二次环境污染问题,生物法是利用生物本身及其分泌物防治有害藻
半导体薄膜场效应晶体管,具备容易制备,耗能较低,制备的器件各项性能稳定性较好等优点,是集成电路制造中的基础单元器件。因半导体掺杂特性及制备工艺等因素的影响,目前,世界范围内对n型半导体材料的制备和薄膜场效应晶体管器件方面上的研究较多,而对于p型氧化物半导体薄膜场效应晶体管的材料、器件制备及理论分析方面的研究却相对滞后。近年来,p型氧化物半导体薄膜场效应晶体管器件在太阳能电池、光伏器件、透明电子器件
双向的电力流和信息流是实现未来智能电网的重要基础。无线传感器网络(WSN)凭借其低复杂度、低功耗、强自组织性、易于扩展等优点,在智能电网电力数据采集、电力运行监测、电
近年来,在全球范围内海洋石油污染频发,分散剂的投加是一种通用的紧急应对措施,且人们普遍认为分散剂可以提高石油的生物可利用性从而促进石油的生物降解。但近期,国外研究者在分散剂对石油的生物降解是产生促进、抑制还是无明显影响上存在着争议。而在我国,分散剂对石油的生物降解尚未有系统的研究。针对这一问题,本研究通过模拟石油污染,对舟山港和深圳湾附近海域的水体开展培养实验,并采用16S rRNA的Illumi
目的:通过分析李中梓的生平、学术渊源、所属学派、学术理论内涵,研究易水学派医家对于李中梓学术思想的形成所产生的影响以及李中梓对易水学派的发展所做出的贡献,进一步挖掘李中梓的学术思想特色,探讨李氏遣方用药的特点,以期完善李中梓的相关研究内容,同时对当今中医药临床工作有所裨益。方法:本研究以文献研究、理论探析为主,以数据统计、寻找用药规律为辅,并将这两种方法有机结合。首先,追本溯源。以史籍和相关文献为
冠心病是由于冠状动脉发生粥样硬化(脂肪物质和胆固醇的积聚)引起冠脉管腔发生狭窄或闭塞(心脏血液供应受阻),导致心肌细胞缺血缺氧或心肌细胞坏死而引起的心脏病。近些年根据病理解剖和病理生理改变的不同原因以及发病规律和治疗原则不同,冠心病(coronary heart disease,CHD)可分为两大类:(1)慢性冠脉病(chronic coronary artery disease,CAD)(2)急
写作教学是初中英语教学的重要组成部分,《义务教育英语课程标准》(2017版)详细地描述了初中生英语写作技能应达到的标准,但是写作却成为学生的薄弱环节,甚至大部分农村地区的学生达不到课程标准的写作要求。其主要原因之一在于现阶段农村初中英语写作教学中普遍采用强调结果,忽视过程的终结性评价。档案袋评价作为形成性评价的手段之一,主要应用于写作教学,在兼具形成性评价优点的同时能记录学生的写作过程。为探索档案
学位
有机-无机杂化钙钛矿太阳能电池,自2009年诞生以来,凭借着卓越的光电转换效率以及低温溶液的可加工性受到了广泛关注。钙钛矿材料之所以具有优异的光伏特性,是因为其禁带宽度可调、吸收系数高、载流子传输距离长且迁移率高。目前,电池的最高光电转换效率已经超过24%,接近于单晶硅太阳能电池。使得钙钛矿太阳能电池成为高效率、低成本光伏器件的理想选择。对于钙钛矿太阳能电池器件结构主要包括三部分:钙钛矿吸光层、空