基于核方法的潜在语义文本分类模型

来源 :清华大学学报（自然科学版） | 被引量 : 0次 | 上传用户：mrlee

【摘要】

：

在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线

【作者】

：

罗远胜王明文曾雪强

【机构】

：

江西师范大学

【出处】

：

清华大学学报（自然科学版）

【发表日期】

：

2004年期

【关键词】

：

文本分类核方法潜在语义索引偏最小二乘分析核偏最小二乘分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高.为了提高分类性能,通过引入核函数,给出了一种非线性的潜在语义文本分类模型.该模型比LSC模型能更好地表示文档空间的潜在语义结构信息.在Reuter-21578文档集上的实验结果表明,潜在语义文本分类模型有很好的分类性能.

其他文献

妇安消疹洗液中落新妇苷的含量测定

目的:建立妇安消疹洗液中落新妇苷的含量测定方法。方法:采用高效液相色谱法,色谱柱:Diamonsil-C_(18)柱(250mm×4.6 mmn,5μm);流动相:甲醇-0.1%冰醋酸溶液(39∶61);检测波

期刊

妇安消疹洗液高效液相色谱法落新妇苷

“昔尝游令尹,今时事客卿”——梁末入北文人的忏悔思想

南朝梁末文人因国家变乱而大量逃入北朝入仕.面对旧国灭亡不能救,反而屈膝侍奉新主人的尴尬局面,身为贰臣的大批梁末入北文人忏悔思想强烈地反映在他们的文学之中.深入分析庾

期刊

南朝梁末入北文人忏悔庾信

崔建华作品选

崔建华，1973年2月生于，1998年毕业于河北师范大学美术教育专业，文学学士学位。现任教于河北省秦皇岛市青龙县第一中学。秦皇岛美术家协会会员。

期刊

作品选美术教育专业河北师范大学秦皇岛市1998年学士学位第一中学协会会员

吟咏苍洱大地的清代白族诗人之家

清代中期,大理白族文化发展,出现了赵氏诗人之家,对这一诗人之家组成情况、文学成就、诗人简历进行介绍,并探讨其形成的社会、家庭原因为社会稳定、家庭重视、白族知识分子对

期刊

清代白族诗人家族

宋代江西文学家的地理分布

两宋时期是江西文学创作的繁荣时期,在这个时期,江西出现了众多的文学家,共计1362人。本文拟以两宋繁荣的“江西文学现象”作为切入点,运用文学地理学中作家籍贯地理研究的方

期刊

宋代江西文学家地理分布

洪仕斌：洗衣机迈入“双能”时代

顺势而为的前行2011年冬天，对于家电行业来说无疑是一个寒冬，在保持连续高速增长之后，这年下半年开始出现了“急刹车”，家电产品销量下滑。与此同时，家电企业裁员风波不断，“瘦身”

期刊

洗衣机家电企业家电行业产品销量市场变化急刹车寒冬

基于统计学和语义信息的中文文本主题识别技术

由于中文分词处理的复杂性在一定程度上限制了中文信息抽取技术的发展,因此,快速有效地抽取中文文本主题的需求越来越突出.该文主要通过中文分词技术、频繁词查找和词性组合

期刊

中文信息抽取中文关键词提取关联分析文本挖掘中文分词处理

建设国家现代农业示范区开创农业农村发肢新局面

建设国家现代农业示范区，是江苏省泰州市农业农村开启转型升级新征程的重要标志，意义重大，影响深远。第一，这是泰州农业在全国的新定位，要把握机遇、担当使命。全国仅8家以地级市

期刊

现代农业示范区国家农村转型升级示范区建设泰州市江苏省地级市

基于概率模型的名人网页相关度评价

天网知名度系统是根据用户预定信息提供个性化检索的信息服务系统。该文提出了一种基于概率模型的名人网页相关度评价模型。改进O kap i BM 25公式,引入HTM L标记权重系数针

期刊

信息检索相关度评价概率模型相关反馈

元认知理论在倒闸操作模拟培训中的应用

介绍了具有知识性、过程性、调节性的元认知理论,分析了它对实现操作票模拟培训的实际指导意义.结合上安电厂开发的操作票自动生成系统,运用元认知理论设计实现了具有良好通

期刊

元认知电力系统倒闸操作票培训发电厂

基于核方法的潜在语义文本分类模型

其他学术论文