论文部分内容阅读
目前,已经有一些研究将机器学习模型以及深度学习模型应用于分子毒性预测任务之中,这极大地提升了分子毒性预测任务的准确率以及缩短了分子毒性评定的实验周期。在这其中,一些工作表明胶囊神经网络在这一任务中取得了优越的性能。胶囊神经网络自提出以来,其在一些任务中取得了显著的成绩,例如图象识别,文本分类等领域。针对于当前的胶囊神经网络研究而言,大部分的研究工作集中在对路由层的改变。目前一些研究表明,针对于一些实数值神经网络架构而言,将其推广到复数域之上,可以获得更好的性能表现。例如在语音识别任务中,复值神经网络相较于实值神经网络而言能够更好地挖掘语音数据的潜在信息。基于此,本文研究了将胶囊神经网络推广到复数域的方法,同时将推广的复值胶囊神经网络应用于分子毒性预测任务之上。本文的主要研究工作及结论主要分为两方面。第一,本文借鉴了量子力学的基础假设,将胶囊神经网络的路由层类比于量子力学中的测量过程,提出了两种基于量子力学假设的复值化胶囊神经网络,基于状态向量的复值化胶囊神经网络以及基于密度矩阵的复值化胶囊神经网络。同时,本文提出了一种将实值数据转化为复值的方法,在这一方法中,利用实值数据中的统计特性产生相应的复值数据,文章设计了实验验证了这一方法的有效性,并与传统的复值化方法在相同网络架构的前提下进行了对比实验。这一实验表明,本文提出的复值化方法在性能上会有所提升。在复值化胶囊神经网络的实验中,本文首先将其应用于图像识别任务之中,验证了其性能表现。实验表明在相同网络架构下,本文中提出的复值胶囊神经网络优越于其对应的胶囊神经网络。第二,本文将提出的复值胶囊神经网络应用于hERG钾离子通道抑制性数据集之上。在这一实验中,本文利用了特异度、敏感度、全局准确率以及Matthew相关性系数衡量复值胶囊神经网络的性能,其相应的指标得分为0.926、0.925、0.925以及0.847。本文将这些衡量指标与现有模型达到的效果做了对比,基于量子力学假设的复值胶囊神经网络在全局准确率以及Matthew相关性系数上均达到了最好的水平。