适于Internet新闻文本实时分类的动态向量空间模型DVSM

来源 :计算机科学 | 被引量 : 0次 | 上传用户:oldfan48
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统向量空间模型(VSM)特征间无关联,且不能动态增量训练,不适合主题和焦点实时变化的Internet新闻信息,为此提出了一种改进的文本实时分类模型--动态向量空间模型(DVSM).通过对VSM的特征提取策略进行改进,提出了特征聚合和增量训练算法.通过将对分类有相同贡献的文本特征词聚合,使用它们共同的分类贡献向量特征模式作为文本特征向量的基本维;采用增量动态训练改变对分类贡献已改变的特征词在文本向量的特征模式中的位置,适应Internet新闻信息的实时特性.使用静态训练集和动态训练集进行的DVSM与传统V
其他文献
随着无线网络的发展和移动设备的日益普及,人们对这种移劝计算模式的应用需求逐渐增多,然而目前无线网络和移动设备同传统的固定网络和计算设备相比有很多局限性,基于传统计
手绘草图是人类最自然的人机交互方式,在普适计算模式下手绘草图将得到越来越多的应用,手绘草图的检索也成为一个新的课题.本文提出一种高效的草图检索方法,该方法以独立于用
本文在仿真试验和理论分析基础上,首先给出了一种自适应IMM算法.再根据变结构IMM思想,把该算法与具体的运动模型相结合,提出了模型集和IMM算法都是自适应的机动目标跟踪方法.
DRM系统的安全性依赖于其信任组件的安全性,该信任组件处于非安全的环境,其安全模型与基于互联网的系统的安全模型有着本质的区别.本文讨论了当前DRM系统的信任组件所采用的
2007年5月29日,青海省建设厅主持召开了青海煤业集团矸石普通砖和矸石多孔砖产品鉴定会,与会专家同意产品通过鉴定,可在全省范围内作为承重砌体墙体材料推广应用。青煤集团是青
对等计算(P2P)可在Internet或者自组网边界进行计算,从而可提供一种全新的应用模式.从对等计算与公平交换的基本概念入手,讨论了协议中的基本假设,设计了一个适合于对等网络
本文提出了一种基于奇异值分解和小波包分解相结合的全新水印算法.综合利用奇异值和方差的特征来对宿主图像进行预处理之后,提取出两个具有不同掩蔽效应的子图,分别对子图的
当前移动电子商务正在从其第一个阶段向第二个阶段发展,安全问题是整个业务成败的关键.WAP协议栈中的WTLS层为移动电子商务提供了一个安全的传输协议,如同TLS对于Internet的
GDOI是一个支持IPSec等数据安全协议保护多播应用安全的组密钥管理协议.本文首先论述了应用IPSec保护多播数据安全的重要意义,接着分析了GDOI协议的工作机制,并讨论了基于GDO