基于关联规则的中文文本分类算法的改进

来源 :郑州大学学报:理学版 | 被引量 : 0次 | 上传用户:foxylxq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中文电子刊物和Web文档数量的飞速增加,中文文本自动分类工作变得日益重要.将文档视为事务,将关键词视为项,文本预处理时提出特征权重阈值,用构造的分类器对未知文档分类时,采用了CDD(Class Differentiate Degree)改进算法,对基于关联规则挖掘的中文文本自动分类方法进行了改进.实验结果表明,该算法能较快地获得可理解的规则并且具有较好的宏平均和微平均值.
其他文献
给出了Poisson方程的一种Mortar型广义差分法,试探函数空间取为一次有限元空间,检验函数空间取为与对偶单元相对应的分片常数空间,并给出了一个相应的误差分析结果.
采用废旧干电池中的锌皮还原电芯中的高价锰为二价锰,并通过同槽电解的方法,阴极得到金属锌,阳极得到二氧化锰,实现高附加值、低成本综合回收利用废旧锌锰电池的目的.最佳工艺条件
根据城市快速路的特点及数据库、数据挖掘等信息技术手段,提出适用于中国大城市的快速路宏观运行及评价模型.
1引言风是影响海上运输、渔业生产等行业最重要的气象要素之一。改革开放以来,这些行业取得很大的发展。海上风的预报和研究已成为气象部门的重要任务之一。沿海的风向、风速
随着消费时代的到来,学生已成为主流消费群体之一。与此同时,消费教育在目前的学校教育中却是一盲点。如何开展消费教育,已成为职业学校德育课程急需解决的重要问题。本文从
针对有目标对象的遥感图像的特点,将图像分割成目标区域和背景区域,并在检索过程中赋予不同的权重,着重考虑目标对象的颜色、形状及空间信息特征,这样就可以避免当目标对象占整幅图像比重较小时,其特征信息容易被淹没在背景当中而造成的“伪误检”.实验结果表明,当图像中目标对象所占比重较小时,该方法与颜色直方图相比,能够更准确地查找出用户所需内容的图像.
科学教育以培养学生的科学素养为宗旨,教学的核心是学生的思维训练,因此以概念构建为载体,在构建概念的过程中对学生进行思维训练显得尤为重要。重视学生思维发展的课堂才是
华夏文明,  耀眼璀璨。  蔡伦造纸,  世代流传。  改革开放,  神州巨变。  造纸与时代同行,  天翻地覆换了人间。  遥想四十年前,  纸年产不足五百万。  看今朝已破一亿吨大关,  世界第一位置无人能撼。  国有纸企攻坚克难,  改革成效日益彰显。  民营纸企突飞猛进,  带动纸业跨越发展。  改革先驱马胜利,  承包扩张一马当先。  虽是昙花仅一现,  是非成败亦超然。  陈永兴、李建
期刊
【正】 南宁化工厂厂长谭树森,男,现年46岁,汉族,中共党员,1965年8月毕业于广西大学化工系,分配到南宁化工厂工作,先后担任过技术员、工程师、车间正副主任、代理副厂长。198