规则加权的文本关联分类

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:maoxinlan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于关联规则的文本分类方法受到普遍关注.虽然在一般情况下这种方法可获得较好的分类效果.但当样本特征词分布明显不均时,分类规则在各类别的分布也出现不均,从而导致分类准确率下降.本文设计和实现的基于规则权重调整的关联规则文本分类算法可有效地解决这一问题.该算法根据误分类训练样本的数量定义规则强度.对强规则通过乘以小于1的调整因子降低其权重,而弱规则乘以大于1的调整因子提高其权重.实验结果表明经过规则权重的调整,分类质量显著提高.
其他文献
目的了解医院图书馆的图书污染状况,探讨引起医院交叉感染的途径;呼吁各级医疗卫生部门引起足够重视,控制传染源,切断传播途径。方法分析医院图书馆的书刊污染状况,根据具体
目的对嘉兴地区近平滑假丝酵母菌感染情况进行研究,以指导临床经验性用药和控制医院感染。方法回顾性总结近6年来医院近平滑假丝酵母菌感染率及药敏率,药敏试验用法国生物梅
立足新时代高校教师的特殊使命,审视和归纳了高校教师人力资源管理的特殊性,指出了高校队伍管理现存的问题,提出了针对性的对策,以为高校人力资源管理研究提供借鉴。
临床在进行吸氧、吸痰及胸、腹腔引流等操作时,均采用玻璃接头作中间连接管。玻璃接头因消毒不严、保管不善或长时间不使用未及时重新消毒而导致污染,成为医院感染的潜在污染
本文以带有韵律标注的语料库ASCCD为基础 ,从语音信号分析的角度 ,研究了汉语普通话韵律间断模式在语音的时长、基频和音强等三个方面的表现特征 ,并在大量统计分析的基础上建立了识别分类的决策树模型 ,实验证明 ,这些特征能较好地描述朗读话语的韵律间断模式
韵律短语边界的自动检测,对语音合成中语料库的韵律标注以及语音识别中韵律短语的自动划分都有重要意义。本文通过对影响韵律短语边界的声学、韵律等参量的分析,得到和韵律短语边界关联性较大的一组声学特征参数、韵律环境参数和语法信息;同时引入语音合成中的韵律预测思想,在假定所有音节边界均为非韵律短语边界时,预测每个音节的基频。最后使用决策树模型,将音节边界处的韵律环境信息、语法信息以及预测结果作为决策树的输入
多药耐药菌是医院感染的主要病原菌,随着抗菌药物和免疫抑制剂的广泛应用、创伤性诊疗方法的增多、耐药菌株不断出现造成人体菌群失调、免疫力下降,增加了医院感染的机会,加强对
目的制定并应用消毒供应中心专业技术标准操作规程(SOP),使消毒供应中心各项专业技术操作更加规范化、专业化、标准化。方法以医院下发的护理技术操作规程为模板,根据《WS310.2009
译文质量的自动评价对机器翻译研究具有十分重要的意义.但现有方法主要是针对书面语翻译,没有考虑到口语翻译的特征.因此,本文提出了一种面向口语的新型的自动评价方法,通过
课堂教学是学生学习专业知识主要场所,也是教师传播知识的主阵地,然而,近年来高职学生的生源出现了参差不齐,结构复杂等特点,再加上高职院校教师水平的差异,智能手机等多方面