基于三角模糊数的不确定数据聚类算法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:noonbird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着互联网信息技术不断更新发展,对数据的海量快速存储和分析提出了更高的要求,因此数据挖掘也得到了广泛的关注和研究。  二十世纪以来,由于各种因素引起的不确定性问题,产生出一种新的数据类型—不确定数据。在实际系统中,随着对结果精确度的要求不断增高,不确定数据越来越严重地影响到了系统的可信度和稳定性,所以研究不确定数据的聚类算法就显得很有必要性。针对上述问题,本文做了相关研究和实验,主要的工作和成果如下:  1.介绍了数据挖掘、聚类、不确定数据聚类等综述思想,介绍了国外的相关研究现状并都有文献依据,让读者有所闻有所了然。  2.在不确定数据聚类的大前提下,引进了三角模糊数表示的不确定数据,并经过仔细的分析比较且融合现有的一些理论依据,提出了新的三角模糊数的距离公式,为接下来的算法成型和扩展作了准备基础,也给其他的相关研究提供了一个新的思路。  3.利用提出的新三角模糊数距离公式,结合基础的K-means算法,形成一种新的不确定数据聚类算法UTDK-means,该算法另辟蹊径,具有时间复杂度小,聚类效果良好的优点。  4.因为注意到模糊聚类特有的模糊划分策略与不确定数据的不确定性有较好的契合度,所以尝试将新三角模糊距离运用到经典的模糊聚类算法FCM算法中,形成了新的基于三角模糊数的不确定模糊聚类算法UTFCM算法,该算法也具有时间复杂度小,聚类效果良好的优点。  5.由于FCM的特殊性,该算法中的模糊度参数m对算法运行结果有很大的影响力,并且目前为止还没有文献对该参数确定某个取值,只有参考范围或参考取值,所以本文基于这种情况,在UTFCM算法的基础上提出了基于遗传算法的模糊度自适应筛选算法m_UTFCM,经实验分析,在多次运行算法的基础上,该算法能较有效地筛选出适合当前样本的模糊度参数m,使得之后的FCM算法运行后能得出最佳的聚类效果。
其他文献
不断持续增长的无线业务使得无线频谱的需求持续增加,同时有研究表明现有的频谱并未得到充分利用,这就出现了频谱分配和频谱需求之间的矛盾。认知无线电的出现将会有效的解决
链路预测作为网络科学中重要的分支之一,它主要是利用已知网络中的节点、连边以及其它拓扑结构信息来预测网络中可能存在或将会在未来产生的连边。同时,链路预测还可以通过建立
无线传感器网络作为一种新型信息获取技术,己成为通信领域的一个研究热点,具有较为广阔的应用前景。但由于传感器节点大多采用电池供电,节点的能量受到较大限.制,因此,网络中
近年来,无线传感器网络(Wireless Sensor Networks,WSNs)已深入到我们日常生活的各个领域,影响和改变着我们的生活。无线传感器网络是一种信息获取平台,它是由许多微小的节点自
无线网络是指以无线信道作传输媒介的计算机网络,随着近些年无线网络技术的不断发展使得无线网络的信道稳定性以及连接的速率都大大提升,再加上无线网络具有组网方便,网络升级灵
云计算技术的快速发展使得企业或个人更倾向于依靠云存储提供商提供的服务来存储数据。对于敏感数据,用户会选择加密来保证数据安全。但是加密后的密文数据不具备语义特性,云存
TCP/IP切协议是当前网络的基石,它的存在给人们带来了很多便利,但是其自身的缺陷为隐蔽信道的存在提供了可能性。通过隐蔽信道将机密的信息泄露出去无疑会对网络安全造成很大
图像修复是图像复原研究中的一个重要内容,它的目的是根据图像现有的信息来自动恢复丢失的信息。椒盐噪声图像是一类特殊的缺损图像,去噪是图像预处理的一个基本内容,而去除
通信技术的发展使得通信网络及其通信协议日趋复杂,网络通信协议变得越来越复杂,网络协议的复杂性体现在空间分布性、并发性、异步性、不稳定性和多样性。为了保证网络中各实
本文详细分析了故障诊断专家系统的研究现状及发展趋势,论述了电站机组设备故障诊断的重要意义。传统故障诊断专家系统在台式电脑上开发,难以满足工作人员在外场环境下实时故障诊断的需求,本文研究实施的基于PDA的故障诊断专家系统,是一个能够“走路的”专家,而且它很容易与网络相结合,不但可以“移动”,还可以“协同工作”,适用性很强,是专家系统广受欢迎的形式,具有广阔的发展前景。本论文课题主要包括以下几个内容: