基于核方法的潜在语义文本分类模型

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:mrlee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高.为了提高分类性能,通过引入核函数,给出了一种非线性的潜在语义文本分类模型.该模型比LSC模型能更好地表示文档空间的潜在语义结构信息.在Reuter-21578文档集上的实验结果表明,潜在语义文本分类模型有很好的分类性能.
其他文献
目的:建立妇安消疹洗液中落新妇苷的含量测定方法。方法:采用高效液相色谱法,色谱柱:Diamonsil-C_(18)柱(250mm×4.6 mmn,5μm);流动相:甲醇-0.1%冰醋酸溶液(39∶61);检测波
南朝梁末文人因国家变乱而大量逃入北朝入仕.面对旧国灭亡不能救,反而屈膝侍奉新主人的尴尬局面,身为贰臣的大批梁末入北文人忏悔思想强烈地反映在他们的文学之中.深入分析庾
崔建华,1973年2月生于,1998年毕业于河北师范大学美术教育专业,文学学士学位。现任教于河北省秦皇岛市青龙县第一中学。秦皇岛美术家协会会员。
清代中期,大理白族文化发展,出现了赵氏诗人之家,对这一诗人之家组成情况、文学成就、诗人简历进行介绍,并探讨其形成的社会、家庭原因为社会稳定、家庭重视、白族知识分子对
两宋时期是江西文学创作的繁荣时期,在这个时期,江西出现了众多的文学家,共计1362人。本文拟以两宋繁荣的“江西文学现象”作为切入点,运用文学地理学中作家籍贯地理研究的方
顺势而为的前行2011年冬天,对于家电行业来说无疑是一个寒冬,在保持连续高速增长之后,这年下半年开始出现了“急刹车”,家电产品销量下滑。与此同时,家电企业裁员风波不断,“瘦身”
由于中文分词处理的复杂性在一定程度上限制了中文信息抽取技术的发展,因此,快速有效地抽取中文文本主题的需求越来越突出.该文主要通过中文分词技术、频繁词查找和词性组合
建设国家现代农业示范区,是江苏省泰州市农业农村开启转型升级新征程的重要标志,意义重大,影响深远。第一,这是泰州农业在全国的新定位,要把握机遇、担当使命。全国仅8家以地级市
天网知名度系统是根据用户预定信息提供个性化检索的信息服务系统。该文提出了一种基于概率模型的名人网页相关度评价模型。改进O kap i BM 25公式,引入HTM L标记权重系数针
介绍了具有知识性、过程性、调节性的元认知理论,分析了它对实现操作票模拟培训的实际指导意义.结合上安电厂开发的操作票自动生成系统,运用元认知理论设计实现了具有良好通