【摘 要】
:
随着网络技术的迅猛发展,信息处理成为人们获取有用信息不可缺少的工具。文本分类是中文信息处理的一个重要的研究领域。目标是在分析文本内容的基础上,给文本分配一个或多个
论文部分内容阅读
随着网络技术的迅猛发展,信息处理成为人们获取有用信息不可缺少的工具。文本分类是中文信息处理的一个重要的研究领域。目标是在分析文本内容的基础上,给文本分配一个或多个比较合适的类别,从而提高文本检索等应用的处理效率。本文研究利用粗糙集对web文本进行分类的算法。首先,介绍web文本数据挖掘的一些基础理论知识,web文本挖掘的具体过程,重点介绍web文本挖掘中的特征表示与特征提取技术;其次详细说明粗糙集的理论基础及其在知识发现中的应用,重点研究如何利用粗糙集的知识约简理论提取文本分类规则的新方法,并讨论算法的可行性和易于实现性;最后利用仿真实验验证基于粗糙集的文本分类系统的可行性。
其他文献
机器人学的研究进入了一个崭新的发展阶段,近年来,随着应用要求不断增强,机器人技术得到了持续发展。这样延伸出了许多新的技术研究领域,也带动了这些领域的技术水平的提高。
粗糙集理论是Z.PAWLAK 1982年提出的一种处理不精确、噪音的、或不完整的不确定问题的强大工具,在人工智能,认知科学,或者在不精确知识表示及推理,机器学习,知识发现等众多领
随着嵌入式技术的不断发展,嵌入式应用中出现越来越复杂的数据资源需要管理,因此嵌入式文件系统的重要性显得更加突出。和普通的文件系统不同,嵌入式文件系统设计不仅要求满
随着嵌入式系统和信号处理技术的快速发展,音频技术不仅广泛地应用于人们的日常生活当中,在军事领域中的应用也越来越受到重视。本课题研究运用在单兵装备中的声音信号采集和
IEEE802.16的MAC层协议对QoS服务流和参数配置信令体系、基于QoS的调度服务类别和相应的带宽请求/分配信令等进行了定义。但却把接入控制、流量控制、分组调度算法等一系列重
网络联盟制造中跨企业间的有效协作使得现代企业能够快速响应市场的需求,但由于各企业间目标不同、资源有限以及生产过程不协调,使得企业间的冲突是不可避免的。 目前已提出
目前,全球移动通信市场已进入3G时代,各种基于3G网络的新业务层出不穷,而以手机电视、移动视频电话、视频短消息等为代表的移动视频业务无疑是其中最具发展前景的业务之一。移动
成功的特征造型系统,在很大程度上取决于是否能够为用户提供友好的方式来指定和改变特征模型。指定和改变特征模型往往是通过参数得以实现。改变参数的值是一种经常、反复的
软件工程的总目标是充分利用有限的人力、物力和财力,高效率、高质量地完成软件开发项目。随着软件不断产业化地发展,软件产品的复杂度不断增加,用户对软件的质量要求也越来越高
数据挖掘的目的是从大量数据库中发现人们感兴趣的、隐藏的、先前未知的知识。在实践中经常为了考察某个效果与某些因素之间的关联而进行相关的测量实验,得到一些离散的效果