基于信息熵的限制玻尔兹曼机稀疏化方法研究

来源 :辽宁大学 | 被引量 : 1次 | 上传用户:itbbs123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)在机器学习领域应用广泛,是一种常用的的概率生成模型。由于其在特征提取方面的卓越性能被广泛应用于各种领域,其中,隐藏层神经单元的稀疏化技术是对RBM性能的重要改进。现有稀疏化方法中对于激活神经单元的阈值设定通常基于人为设定,使用全局的或固定的备用参数,并且与输入数据相互独立。然而输入数据通常具有不同的特征和概率密度分布,输入数据之间的差异也包含了大量的有用信息,将这些差异用于稀疏过程是本文的主要研究工作。本文在已有RBM模型稀疏化方法基础上提出了新的稀疏化方法,基于不同数据的特征分布的复杂程度不同,以此条件作为的RBM模型进行自适应稀疏化工作的条件,称为熵值基数限制玻尔兹曼机(EC-RBM)。通过确定EC-RBM模型的稀疏化条件,进而能够以此确定神经元的激活阈值,以激活阈值为限制条件保证神经元被激活的数量不会超过一定的数量,从而实现RBM网络模型的稀疏化表示。本文的主要工作有两方面内容:一方面是使用数据的信息熵作为条件实现了本文模型EC-RBM稀疏化工作的动态变化。在该模型中,使用基于数据信息熵的方法来计算不同类别输入数据的数据类熵,然后使用数据类信息熵来计算不同类输入数据所对应的激活阈值,从而动态地确定激活的隐藏神经单元的数量。这种稀疏化方法能够主动适应不同特征分布的输入数据。首先,分析并确定了不同类数据的分布特征确实存在差异,并且能够通过数据的信息熵来表示这种差异,这为我们之后的工作提供了基础。其次,寻找方法进行未知训练数据的概率估计,本文为了使结果误差更小,选取了Parzen窗非参数估计方法进行计算,然后通过计算得到的概率分布计算得到每一类数据的信息熵作为确定神经单元激活阈值的依据。与此同时,在实验过程中我们发现了在使用输入数据进行多种相关计算时,由于使用高维数据计算不同数据间的空间距离时通常会比低维数据计算时产生的误差更大,并且高维数据的数据量过大导致计算十分复杂费时以及产生很多冗余数据使算法效率不高。对此,我们改进了数据信息熵的计算方法,通过使用隐藏层数据而不是输入数据来进行多种相关计算,从而克服高纬度数据的“维数灾难”问题。另一方面,在具体RBM模型的稀疏化工作实现过程当中,我们引入自组织网络映射的优点,通过神经元之间的竞争机制更好地实现数据特征的稀疏化表示。这种工作模式能够促进我们的模型中的稀疏化工作,引入竞争机制可以使得稀疏化工作过程能够更好地提取特征从而提升实验结果的准确性。所以,我们在激活隐藏层神经单元的过程中,提出了不同的神经单元竞争方法。最后,在两个通用数据集上的实验证明了所提出的方法在分类准确性上具有优势。
其他文献
多智能体系统是伴随着嵌入式技术、网络技术发展形成的新型概念,它能够完成原先单个智能体或者人工无法完成的复杂任务。一致性是多智能体系统中研究最为广泛的问题,其主要包括分布式控制协议和网络通信拓扑结构两部分。在分布式控制协议中,网络拓扑连通性通常是达成一致性的必要条件。然而目前已存在的攻击可轻易破坏这种拓扑连通性。网络鲁棒性或称(r.s)-鲁棒性,是当前常用来衡量抵御攻击能力的网络拓扑属性,但对其评估
集成电路和IP(Intellectual Property)核在快速发展的同时,带来的网络安全事件也是层出不穷,有些网络Hacker会利用IP核设计的缺陷、系统的后门,以及安全漏洞在程序中植入硬件
近年来,随着自旋交换光泵浦、半导体泵浦碱金属激光以及高效全固态激光等的发展,对窄线宽大功率半导体激光的需求日趋迫切。虽然目前窄线宽半导体激光已实现千瓦级输出,但系
切伦科夫荧光成像(Cerenkov Luminescence Imaging,CLI)因具有广泛临床可用的放射性核素探针而成为近年来光学分子影像领域的研究热点。该技术利用切伦科夫效应,通过探测放射性核素衰变时产生的切伦科夫荧光,从而对体内核素探针进行成像。但由于切伦科夫荧光的强度值较弱,在采集荧光信号进行成像时需要较长时间。同时又由于放射性核素在衰变过程中会伴随着大量高能射线的产生,在长时间的采集
目的:本研究将低温等离子体激活液(CPS)分别在不同条件下储存后对黑素瘤细胞(A375)、鳞癌细胞(A431)、基底癌细胞(TE354T)和角质形成细胞(Ha Cat)进行处理,通过测定四种细胞的活力和凋
成像探测技术在传统领域上主要是专注于探测目标的强度相关信息和光谱相关信息。而在现今,目标背景情况愈发复杂,需发展能够探测目标其他信息的探测成像系统,实现在复杂背景下探测目标。偏振成像是一种能够探测目标偏振特性信息的新兴技术,偏振特性信息是与包括光波的波长、相对相位、能量振幅等类似的特有属性。在目标探测中,因为其能够提供在基础信息之上的更多信息,而且因为目标偏振信息一般对强度、温差等不敏感,在探测强
随着国内外互联网的广泛应用,社会得到了飞速发展。企业和智能终端每天都会产生大量的生产数据、网络社交数据等,传统的数据挖掘算法在面对大规模数据时显得力不从心,因此越
本文利用Nevanlinna值分布理论的一些基本知识,研究了f(z)为有限对数级整函数(或亚纯函数),g(z)为有限级整函数时,复合函数f(g(z))的增长性;同时研究了整函数和亚纯函数f1(z)+f2(z),f1(z)·f2(z)的[p,q]-φ(r)级与[p,q]—φ(r)型,全文共分三章.第一章介绍了整函数和亚纯函数的一些基本定义和常用符号,以及Neva nlinna值分布理论的一些定理.第
图像显著区域检测是计算机视觉领域的研究热点,图像显著区域检测的目的是模拟人的视觉注意力机制,选择出图像中最吸引人的部分,为后续的图像处理提供便利。图像显著区域检测在图像分割,目标检测,图像检索等领域都具有非常广泛的应用。随着应用领域的拓展以及应用场景的复杂,显著区域检测技术还在不断的发展。本文对图像显著区域检测的相关理论以及已有的算法进行了分析,并提出了两种显著区域检测方法。基于局部显著信息的频繁
太赫兹(THz)波在穿透成像、物质鉴别、高速率通信等方面都有着重要应用前景。基于晶体参量过程的太赫兹波参量振荡器(TPO)可以在室温下运转输出宽带连续可调谐,时间和空间相干性好的THz波,具有广泛应用前景,但目前THz参量源的输出效率比较低。本文利用硅棱镜耦合出射式(Si-TPO)和垂直浅表面耦合出射式(SE-TPO)两种方式,进行TPO实验研究,探索提升THz波输出效率的实验方案。首先,本文理论