参数嵌入算法在文本分类可视化中的应用

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:fuqinfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何对文本分类的结果进行可视化研究一直是模式识别中研究的重点。在假设文本类别在低维嵌入空间服从高斯分布的前提下,通过朴素贝叶斯分类算法得到数据类别属性的后验概率矩阵,然后运用参数嵌入算法在低维空间可视化文本分类结果。参数嵌入算法是使嵌入空间数据的类后验概率与高维空间的条件概率Kullback Leibler散度和最小化的算法,属于同一类的数据在低维空间中分布较为集中,性质相似的数据之间的距离较近,而不同性质的数据之间距离则较大。其优点在于计算复杂度是数据的类别和相应个数的乘积,非常适合于数据量大,类别数较
其他文献
针对国标中奶茶制品中茶多酚含量的测定中遇到的问题,对国标及其他传统沉淀剂对市售奶茶制品的沉淀效果进行比较分析,最终选用乙酸作为沉淀剂进行方法改进,并分析在测定过程中乙
研究了GMW-序列的三项生成多项式问题,给出了其三项生成多项式的结构和计数,证明了其三项生成多项式个数远远少于同周期的m-序列,这说明GMW-序列在抵抗快速相关攻击的能力方面要
为了有效融合多传感器冗余系统量测信息,使状态的估计值更接近于状态的真实值,实现高精度和高可靠性的状态估计,采取了基于最优加权的最小二乘算法、有限窗加权的最小二乘算法和自学习加权最小二乘算法,分别对多传感器实测数据进行融合处理,融合后数据的方差大幅度降低,估计精度显著提高。并与传统的最小二乘算法进行了仿真对比,结果表明,这3种方法较最小二乘算法融合精度更高,其中,自学习加权的最小二乘融合算法既考虑了
本文根据近几年的食品检测能力验证不合格率,指出我国的检测质量存在的问题。着重强调了测试评价特别是其中的能力验证,在提升检测实验室检测能力、保证检测质量方面的作用和
随着国家的发展,外国学生来华留学已掀起一股新的浪潮,外国学生来华留学也为教育国际化起到了坚实的桥梁作用。要做好留学生教育,就必须先构建一套健全的外国留学生管理工作体系
在PKI体系中,私钥集中存放或私钥托管方式的安全性和方便性依赖于管理员的可信性或者需要一个各行业都能使用和接受的具有权威性的第三方托管机构。借鉴密钥托管的思想,设计了
负载波动是引起无线局域网络吞吐量和稳定性低的直接原因之一,其主要诱因是站点接入密度的大幅度变化和数据冲突程度的剧烈振荡。分析了无线局域网络的数据冲突避免机制,在探究