文本分类的字典生成

来源 :南京理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:dalang003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高系统处理开放语料的能力和解决一个概念可由多个不同的单词表达的问题,该文引入义类的概念,设计出一个具有模拟推理功能,同时具有对向量维数进行语义压缩的字典生成算法,构造了一个图结构的字典.利用该字典,可以提高文本分类系统的性能,改善系统的模拟推理能力以及系统的效率.
其他文献
计算机和通讯网络的普及和发展从根本上改变了人类的生活方式与工作效率。但网络中还存在着不可避免的信息安全隐患,在网络广泛使用的今天,我们更应该了解网络安全,做好防范措施
摘要:互联网的飞速发展,为广大用户提供了庞大的信息资源,但要从这么大的资源库中寻找到自己需要的内容却是非常难。本文提出一种利用搜集器来搜集互联网中的多媒体资源,并且从中提取有利于资源描述的文本信息,建立多媒体资源库,为师生提供检索服务。  关键词:多媒体资源库;Web页面;信息提取  中图分类号:TP311.52文献标识码:A文章编号:1007-9599 (2011) 04-0000-01  Mu
该文介绍用双脊波导作信号端制作毫米波宽带混频器的设计方法,实验表明,采用脊波导制作的混频器,蛤频段驻波系数小于2.0,本振端在32.0-38.0GHz内驻波系数小于2.5,当fif=500MHz,本振在32.
在Mayeda的由矩阵实现为图的方法中,当存在多个H子左阵时形成一对M子矩阵较困难,对此,该文研究了连通块的连接性质,提出了利用连通块的邻接概念对H子矩阵进行分类判断,解决了在各种情况下一
针对传统Douglas-Pecuker算法中以点到基线的垂直距离为化简指标的不足,出现的导致某些具有代表性的节点被删除的情况,在分段道格拉斯算法基础上提出了几点改进,采取优化的提取特征点的方式代替单纯的角度限制方式来实现分段Douglas-Pecuker算法。即在传统Douglas-Pecuker算法的基础上以基于提取特殊点的方式保留具有反应曲线走向的点,然后用非递归方法实现分段压缩。然后进行了曲
多媒体作品的交互行为决定了用户如何同应用程序进行交流。用户可以通过鼠标点击、触摸屏触摸和键盘关键字出现等方式对计算机进行控制。人机交互的设计除了要致力于分析、设
本文简单介绍了SDH光传榆系统的概况、然后又将系统维护分为日常例行维护和周期性例行维护进行简述,接着又归纳了系统故障定位的四条原则,最后总结了四种常见的故障处理方法。
该文研究了Weibull分布大样本定时截尾试验,给出了总试验时间的极限分布。在给定任一参数的条件下,利用一种全新的途径得到了另一参数的近似置信区间。设产品寿命x服从Weibull