一般分布区间型符号数据的聚类分析方法研究

被引量 : 0次 | 上传用户:lmwtz7x8f0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代社会中,互联网技术的快速发展带来信息大爆炸和数据的极大丰富,然而传统的聚类分析方法面对庞大的样本空间时有两大局限性:其一,计算的繁琐度和复杂度呈平方增长。其二,研究对象为样本点,焦点的分散导致难以从整体上把握数据特性。符号数据分析方法通过“数据打包”,将数据性质从“点数据”变为“符号对象”,从全局上把握符号对象的内在关系,挖掘深层次的规律。区间数是一种重要的符号数据类型。现有的关于区间数据的聚类分析的研究均假定变量在区间内服从均匀分布,然而实际问题中常见非均匀分布的区间数据,如正态分布。在现有的针对均匀分布区间数据聚类分析的研究成果基础上,本论文以一般分布的区间型符号数据为研究对象,从区间变量的经验密度函数入手,逐步推导了区间变量的均值和方差等描述性统计量,继而研究了区间数据标准化问题;基于Hausdorff距离,定义了针对一般分布的区间型符号数据聚类分析方法中符号对象或类之间的距离。在此基础上,进行了系统聚类分析方法、Hierarchy-Pyramid聚类分析方法、模糊c均值聚类分析方法的研究。针对著名的C2C电子商务网站淘宝商城中主营业务为美容护肤的客户,在中国范围内选取十个有代表性的城市为符号对象,以客户客观发展状况相关指标为变量,形成区间型符号数据。分别应用上述三种聚类分析方法进行了客户分类的应用研究。本论文提出了新的聚类分析方法,同时应用研究表明,针对一般分布的区间型符号数据聚类分析方法与针对均匀区间型符号数据的聚类分析方法相比,聚类结果更加客观、可信。
其他文献
矩阵式变换器是一类性能优良的功率变换器,允许频率单级变换,无需大容量的储能元件,输入功率因数接近1并可自由调节,能量可双向流动。矩阵式变换器本身也是一种柔性的、通用
独立分量分析(Independent Component Analysis, ICA)是解决盲源分离(Blind Source Separation, BSS)问题的主要方法之一。该方法可以在信源信号和信道参数均未知的条件下,仅
郭初阳等新锐教师对语文教材的批判,引起社会各方关注已有时日,本来应积极响应的语文界,反而讨论不多,圈内相关专家一时"失语",一线语文教师则既迷茫又无所适从。最近长三角
随着城市经济突飞猛进的发展和机动化水平大幅提高,城市开始出现诸如资源紧张、环境污染、交通拥堵等各种各样的问题,导致现有城市建成区人居环境的恶化。为了适应城市继续扩
劳伦斯是英国最具影响力的作家之一。劳伦斯不仅是一名出色的小说家,他还是一名优秀的诗人,评论家和画家.尽管劳伦斯作为小说家的名誉超过了其他,但劳伦斯早在少年时代就已经
监管资本和经济资本是现代商业银行可持续发展的基石,在计量等方面二者不断趋于收敛和一体化。本文在介绍经济资本研究最新进展的基础上,分析了构建经济资本预算管理体系的主
<正>机场作为航空运输和城市的重要基础设施,是综合交通运输体系的重要组成部分。经过几十年的建设和发展,我国机场总量初具规模,机场密度逐渐加大,机场服务能力逐步提高,现
<正>有效教学功在课堂,根据《义务教育语文课程标准(2011年版)》的要求,教师要在每天的语文课中安排10分钟的随堂练习。那么把写字教学穿插于课堂教学的哪个环节最为合适呢?
<正>主题单元导读课是一种相对来说比较新的课型,其目的是让学生明确本组课文的学习内容和学习目标,有时还涉及学习方法。从人教版四年级下册第六组课文的"导语"看,学习内容
传统的二极管整流器以及由半可控的晶闸管组成的相控整流器,由于其整流环节不可控,导致网侧功率因数低,电流谐波大,能量不可逆等缺点。采用自关断器件组成的PWM整流器可以实