基于一种有监督Isomap算法的Web中文文本分类

来源 :全国第四届Web信息系统及其应用学术会议、全国第二届语义Web与本体论学术研讨会、全国电子政务技术与办公自动化学术研讨会 | 被引量 : 0次 | 上传用户:gcq1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征集约减在Web中文文本分类中具有重要的作用。等距特征映射(Isomap)方法是流形学习理论中一种广泛应用的无监督非线性降雏方法。本文根据Web中文文本训练集中已有的类别信息提出了一种有监督的Isomap算法,该算法通过引入一个类别参数,调整类别之间的测地距离,并运用一种简便的方法将测试集嵌入到低雏空问。实验结果表明,该算法可以进行可视化,直观地获取文本数据的结构信息,并且在较低的维数上保持较好的分类效果。
其他文献
N方的合同签署协议包含多个子协议,并允许N-1个缔约方违背协议的规定进行不诚实的操作,其形式化分析遇到了新的挑战。利用Paulson归纳法,给出了BW多方合同签署协议的形式化描述,
出身贫困农家,入学,没钱交学费,18岁辍学,挽起裤管下地,地头看书,在村里入团、入党,到工厂当打工仔,这是何咭桦作为一名有追求的农村青年却难以绕开的常规发展路线。 From a
本文主要讨论声誉管理系统中现有机制策略设计的不足之处,并且提出一种新的更换策略,比较两种不同的策略在相同环境中各自的特点并分析原因。
本文通过对“净水装置”探索课程的详细介绍,分析了“五步教学法”的课程设计和教学策略,及其对学生形成和掌握科学的思维习惯与实践方法所具有的重要意义.
本文分析了地理信息系统、空间数据和空间数据库的特点,归纳了混合数据库模型、扩展结构模型、全关系模型、面向对象模型和对象关系模型等传统空间数据模型的优缺点,在对象建模
会议