基于粗糙集与神经网络的数据分类研究及应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:amwygah021121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息技术和数据库技术高速发展的今天,数据成了人们工作和生活中必不可少的一部分,然而要从海量数据中提取出有用信息却很困难。数据分类作为一种重要的数据分析技术,可以用于提取描述重要数据类的模型和预测未来的数据趋势,帮助人们总结出数据中隐含的规律,为业务决策和战略发展服务。论文首先介绍了粗糙集理论,并引入了一种基于属性重要度的粗糙集属性约简算法,它能有效地消除冗余信息,达到为输入变量降维的目的。其次,针对多分类问题设计了一个基于动态阈值的神经网络分类器,此分类模型采用了与传统模型不同的动态阈值函数,可以有效提高分类器的泛化能力。另外,还结合理论指导和实际的试验仿真对神经网络的隐层数及其节点数进行了优化设计,采用具有双隐层的BP神经网络作为分类器模型的核心。最后,通过分析粗糙集和神经网络的特点,取长补短,把二者有机地结合在了一起,使用粗糙集作为分类器模型的前端处理器,约简输入变量,达到了科学选择变量的目的,提高了模型的分类性能。电影票房预测是一个典型的非线性问题,通过将其转化成一个分类问题,可以使问题简化,即把影片根据其票房收入的高低划分成了6个档次,预测的目的就是把影片分到相应的类别里面。在成功建模的基础上,确定了影响影片票房高低的因素作为输入变量,然后通过统计的方法确定了其初始值。最后运用所设计的分类器模型解决了该票房预测问题。通过与决策树、支持向量机、RBF网络等方法的比较结果表明,基于动态阈值的神经网络分类器具有更好的预测精度、稳定性以及泛化能力。基于粗糙集的属性约简对分类器的输入变量进行了科学合理的降维,其与神经网络分类器的有机结合取得了良好的效果,预测性能明显优于其它分类模型。
其他文献
期刊
教师职业倦怠    近年来,“职业倦怠”研究从助人行业延伸到了教学领域,逐渐引起广大教育理论研究者和教育工作者的兴趣。随着新课程改革的推进,教师日益感受到面临的压力和挑战。教师逐渐成为职业倦怠的高发人群并日益引起了大家的关注。患有职业倦怠的教师主要表现在:一是长期的情绪上的倦怠感。二是人格的解体。三是较低的成就感。  教师的这种“倦怠的感受正在打击着无数有爱心、有理想、乐于奉献的教师们——教师们已
案例简介    1.来访经过  2007年9月26日,某高校辅导员接到学生心理联络员反映,大二学生张松最近情况有些异常。辅导员遂与张松进行谈话,张松向辅导员讲述了自己在成长历程中妈妈对自己的“迫害”,说妈妈对自己不好,以前总是压抑,但这几天遇到一些不顺心的事情,内心非常怨恨母亲,甚至有过要拿刀砍她的冲动。辅导员意识到问题的严重性,立即与分管本学院心理危机干预工作的心理老师取得联系,帮张松预约了一次
介绍了水轮机导叶修复用机械手系统的基本结构、功能及示教方法.该方法是计算机根据示教开关传递的信息对机械手进行控制,使其按要求动作,动作的位置信息由光电系统反馈给计算机
期刊
期刊
期刊
随着企业信息化建设的进一步深入,对企业信息管理水平提出了更高的要求。目前企业内部有很多与能源使用相关的原始数据,这些数据非常的零散、杂乱,缺乏有效的组织体系,大部分企业
大学生网络心理依赖的基本特征    1.网络交际成瘾、游戏成瘾的行为特征。成都已发现首例网络心理障碍的致伤患者,一名连续32小时“泡”在网上的中年男子,因出现突发性思维紊乱,用水果刀割伤自己的手腕,造成失血性休克。多数恋网成癖者虽未达到如此极端的心理状态,但是过度间断上网仍然会导致名种心理、生理上的不适,西方心理学界称此为“PIU”(网络过度心理依赖)。大学生是网民队伍的主力军之一,有人曾统计了Q