基于粗集的权重确定方法及其在电信客户数据挖掘中的应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:ohshady
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为数据挖掘技术中一种应用广泛的重要分析方法,近年来相关领域的研究相当活跃.随着计算机技术的高速发展,知识与大量观察和实验数据的处理、归纳、分类相联系,波兰华沙理工大学Z.Pawlak教授等提出用粗集理论(Rough Set)研究不完整数据、不精确知识的表达、学习、归纳方法,为信息科学和认知科学提供了新的科学逻辑和研究方法.该文将聚类分析与粗集理论结合起来,针对提高聚类算法的有效性的需求,提出了一种将粗集理论应用于数据挖掘的新思路:利用粗集理论中决定属性重要性的思路来计算数据库中属性的权重,并将得到的权重用于聚类分析.该文的所做的研究工作和创新主要体现在以下几个方面:1.将粗集理论应用于聚类算法中权重的确定,提出了一种有所侧重的聚类权重确定方法,即RSW算法.它的优点在于不依赖于专家的打分,能够充分发掘和利用数据库中的隐含的知识,作为确定权重的依据.与统计方法确定权重相比其特色在于,它不是采取概率的方法来描述不确定性,而采用集合论的方法.利用粗集方法确定权重的方法的适用范围是聚类有较明确的目标,这个目标能够用决策属性明确的表达出来;条件属性与聚类的目的(决策属性)相关,并且对于聚类所起作用的大小有所差异.2.在RSW算法的基础上,与统计的方法相结合,提出了SRSW算法.与RSW算法相比,SRSW算法的特点在于它把粗集方法与统计方法结合起来,充分利用数据库中的统计信息.3.将RSW算法和SRSW算法应用于电信客户数据聚类分析的实践,验证了算法的有效性.
其他文献
期刊
期刊
学好语文不仅需要教师的有效引导,还需要学生的默契配合.课前的预习是学习的重要组成部分,在语文学习中同样如此.小学生在学习语文时,教师可以为其布置有针对性的预习问题,并
语文教学是一切其他科目教学的基础,只有扎实掌握了语言以后,才能够让学生更加精准的理解其他科目的知识点,也才能够让学生更有兴趣的去探索这个未知的世界.那么对于当下的小
BPR是90年代初刚刚兴起的一种全新的管理思想,是来自管理学领域的一场革命。在企业业务流程再造的过程中,虽然不少企业取得了高额回报,但仍有高达70%的再造项目未能取得预期的回
外汇代客理财业务作为商业银行为适应当前国际市场变化形势以及我国加入世贸组织后外资银行大量涌入,对高端客户的争夺异常激烈的市场形势,顺应客户需求,为客户量身定制的,适
三月下旬,我在华北油田工作时的老领导、诗人于英太寄来了他刚刚改定的长诗,时值我工作变动,没有马上阅读.这些天集中精力反复地阅读了这首近300行的长诗.我为于局长(我习惯
期刊
说起法布尔,准确一点为H·J·法布尔,一位在法国乡间溜达的贫穷老头儿,国人知之甚少.要说齐白石,国人乃至小日本国民可谓是妇孺皆知.除齐白石绘画成就之外,单单是他从一位湖
朗读,就是把无声的书面语言转化为有声语言的再创作活动,是用清晰响亮的声音读书,它是学习语文的基本功,是培养语文能力的基础.朗读课文是小学阶段培养学生听、说、读、写能