基于粗糙集理论的文本分类算法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:luck88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是中文信息处理的重要研究领域.给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率.粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过滤掉停用词之后把剩余的词语作为特征项,然后把文本用向量空间模型表示出来,将文本集转化成不带决策属性的信息系统,用粗糙集理论中核心内容属性约简实现对文本的分类.实验表明,该方法的查准率和查全率都有所提高.
其他文献
转基因产品成分检测是转基因生物安全管理和标识的重要支撑,而转基因生物标准物质是获得准确、可靠、具有可比性检测结果的保证。转基因大豆(Glycine max)MON89788为我国批准
本文通过对荣华二采区10
简述了一种钻装机的结构,并详细介绍了其结构特点和功能。该机主要用于矿山岩巷掘进,也可用于铁路隧道施工、饮水洞和国防洞窟施工中的掘进作业,是一种集钻孔,装载,运输,行走
语文教学注重教师在课堂上的引导作用,教师积极发挥主观能动性,培养学生听、说读、写能力。其中阅读能力在课堂上体现得不够明显,大有蜻蜓点水、一带而过之意,高中教学过程中
语文的性质告诉人们:语文学习主要就是学习语言文字的运用,学习运用语言文字。在学习和运用的过程中解决问题,培养思维品质,提升人文素养,形成健全人格,使人明白作为一个真正
期刊
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
挖掘野生棉资源是棉花育种的一个重要方向,而野生斯特提棉含有栽培棉所缺乏的许多优良基因。本研究以陆地棉品种中12为母本与斯特提棉进行远缘杂交,获得不育杂种F1。结果显示
主题公园是当今国内外旅游开发的热点。自1955年7月迪斯尼乐园在美国加利福尼亚州诞生以来,主题公园这种新型旅游目的地形式便在世界各地蓬勃兴起。经过半个多世纪的发展,主题
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥