基于文档结构的特征权重计算方法研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:yanshileia001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引入文档结构矩阵DS。将DS与3种常用权重算法相结合,构造3种新模型,并利用6种模型在实际语料上进行分类实验。结果表明,基于DS的权重算法与原始权重算法相比,能够提高文本分类效果。
其他文献
为了改善学院传统通过手工进行人事数据处理,导致数据高度冗余与不一致,以及工作效率低的现状,前台使用具有独立性与可移植性的JAVA语言进行开发,后台使用安全可靠的SQL Serv
导航路网是实现室内定位与导航服务的关键。现有室内路网生成方法成本较高,且依赖于室内建筑CAD图纸或室内二维平面图等先验知识,数据获取过程繁琐。提出一种服务于室内导航
由于工业生产中的被控对象模型往往都是未知的,这对于系统整体的控制以及控制器参数的整定都带来极大不便,所以得到被控对象的精确等价模型尤为重要。提出了一种针对高阶对象
作为英语专业本科生的基本技能之一,口译能力是口译课程中教师着力培养学生的基本能力,而英汉口译又是口译中的重要一环,因此从英汉口译易错点出发展开的教学策略探讨对于口
摘 要:现在我国大部分医学院对护生的人文素养教育普遍不重视,护生本身的人文素养比较欠缺,所以进行护生的人文素质教育显得非常重要而且很迫切。本文对护生人文素质教育内涵和现状进行了分析,指出目前出现的问题,再结合社会需求,教育状况,对护生人文素质教育提出了一些对策。  关键字:人文素质;教育欠缺;现状对策  引言  护理专业的学生,将来从事的是与人类生命和健康息息相关的工作,跟其他专业相比,护理人员需