基于密度的聚类算法研究及其在图书推荐系统中的应用

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:cjfandhf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法在数据挖掘、模式识别和机器学习等领域有着广泛的应用,它是数据挖掘技术中的重要组成部分。海量数据的出现,使数据挖掘技术的应用层出不穷,其中聚类分析是大数据处理的基本操作。聚类算法就是将相似的元素划分在一类,将差别大的元素划分在不同类。本文研究了各种经典聚类算法,其中密度聚类和密度峰值聚类算法是着重研究的,在此基础上提出了相应的改进算法,并将改进算法应用于图书推荐系统。具体研究内容包括以下三个方面:(1)针对密度聚类算法计算的复杂性,提出一种利用Warshall算法降低其复杂性的改进算法W-DBSCAN。在密度聚类算法中,相似度高的数据是密度相连的,本文构造了一个矩阵(n×n),其中元素(x,y)标记为1指的是数据x和y是直接密度可达,然后利用Warshall算法计算该矩阵的可达矩阵,可达矩阵指密度相连的数据。通过Warshall算法,将求解密度相连问题转化为求解可达矩阵问题,降低了算法的复杂性。(2)针对密度峰值算法需要在决策图上选择质心点并不适应于所有数据的问题,提出一种新的集成聚类算法IDF。首先,将局部密度最大的数据对象作为第一个质心;其次,从它出发采用W-DBSCAN算法进行聚类,得到第一个簇;然后从剩余数据中寻找局部密度最大的数据对象,即没有划分类别的数据中局部密度最大的数据,将它作为另一个质心,继续用W-DBSCAN算法进行聚类;最后,通过迭代上述步骤直到所有数据被处理,算法结束。(3)针对大学生在学校图书馆中盲目选择图书或者不知道有哪些图书适合自己阅读的问题,利用聚类和协同过滤算法提出了一个高校图书推荐系统,通过IDF算法聚类得到的第一类结果是所有读者最感兴趣内容,将该部分内容对新加入图书馆的读者推荐解决了“冷启动”问题。首先,搜集并整理数据:然后对读者的历史浏览记录聚类,即对读者进行了划分;最后,利用协同过滤算法计算目标读者的Top-n邻居集,并生成推荐。
其他文献
作为第一代半导体,硅和锗半导体的研究和应用一直备受关注。除了在以微电子为主的半导体行业的广泛应用外,硅锗合金材料还在热电转换、光电探测、高速逻辑器件等领域发挥着巨大的作用。值得一提的是在热电应用方面,硅锗材料由于优异的综合性能被运用到最前沿的太空探测器的能源转换器件上。其中备受关注的热传导性质尤其是微纳尺度上的传热机理一直是研究的热点。但是对于硅锗合金薄膜的研究却一直局限于低锗含量即锗组分低于50
本文从意大利的古罗马歌剧院开始,以古罗马歌剧院、罗马歌剧院等,这几所著名的传统歌剧院的建筑声学为例,从传统歌剧院的自然声学结构、声学效果谈起,通过对传统歌剧院的一些
随着科技的进步,计算机视觉在众多领域的应用也得以飞速发展,而前景检测作为解决众多计算机视觉问题的基础与前提,一直是研究的热点。前景检测是通过一定的技术将图像或视频中人们感兴趣的区域或者运动目标作为前景从背景中提取出来。随着前景检测的应用范围越来越广,固定摄像机已不能满足所有场景,由于移动拍摄设备的日渐普及,移动摄像机在前景检测中的应用也越来越广泛。Vibe算法是前景检测领域中常用的检测算法之一,它
《最高人民法院关于适用若干问题的规定(四)》(以下简称《公司法司法解释(四)》)于2017年9月1日实施,该解释第四至六条的规定完善了我国公司决议瑕疵之诉的种类,在公司决议无
屏蔽式核主泵被广泛用于舰艇等小型核动力装置和部分第三代先进核电站反应堆。小型核动力装置用屏蔽式核主泵冷却循环系统中的屏蔽套、双向蛇形冷却循环管和辅叶轮等部件在运
图像分割是计算机视觉和模式识别领域中一项关键的预处理技术,是一个把图像按照一定规则划分为若干个区域的过程。传统的分割方法都有其局限性已不再适应于当今多样化的应用
低功耗蓝牙自组织网络(以下简称蓝牙mesh)是低功耗蓝牙的一种全新拓扑结构的网络。蓝牙mesh网络利用基于传统泛洪算法的路由协议进行数据包的传输,模式简单。但是,采用这种传统泛洪式的广播会造成网络中节点的不必要转发,从而导致节点以及整个网络的能耗较大,这对电池供电、网络数据量较大等mesh网络而言是不适用的。因此,设计并实现合适的路由协议,以优化网络中的能耗,对扩展蓝牙mesh的应用范围有着重要的
基于扩散磁共振的脑白质纤维成像技术是目前研究及分析白质纤维结构的基础,是当前脑科学中的研究热点。在白质纤维成像技术中,传统的纤维跟踪和纤维成像分析方法已经难以满足
番茄(Solanum lycopersicum)是世界范围内重要的蔬菜作物。高产是重要育种目标之一,而果实重量是单株产量的主要构成因素。果实重量是一个数量性状,由多个遗传位点(quantitative
采用接近黄土颗粒粒径的人工制备胶结性土进行试验并分析,能够为黄土胶结特性的一般规律提供参考。基于黄土的结构特性,本文采用100目、200目和325目三种粒径的玻璃微珠作为