FCM算法研究及其在文献推荐系统中的应用

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:ffgghhaz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为数据挖掘中非常重要的一种工具,本质是将数据元素划分为若干组的技术,使得组内的元素具有较高的相似性,而与其他组中的元素不同。聚类算法由于其无监督分类的特点,已经在信息检索、商务智能、数据挖掘和推荐系统等领域得到广泛应用。文献推荐可帮助学者们在海量文献中较快找到所需资料,因此如何更准确高效的进行文献推荐是目前研究的热点。本文主要针对FCM算法存在的不足进行了相应的优化改进,并将改进算法应用于文献推荐系统。具体研究内容如下:(1)针对FCM算法必须人为确定聚类数,且随机生成初始中心对聚类质量影响较大的问题,本文提出一种自动确定类数的改进FCM算法(AMMF)。首先利用近邻传播算法AP对数据集进行粗划分,获取到数据集的粗类数,以此作为搜索最佳类数的上限;其次采用改进的最大最小距离算法获取代表点,并将之作为FCM算法的初始中心;最后使用轮廓系数分析聚类质量,从而自动确定最佳类数。所提算法相较于原始的FCM算法无需预先指定类数,且聚类性能更佳,同时保证了聚类结果的一致性。(2)针对FCM算法只能识别球形分布数据,但对复杂形状和非球形数据聚类性能差的缺点。本文在AMMF算法的基础上,利用密度敏感距离代替欧氏距离计算样本点之间的相似性,提出一种基于密度敏感距离度量的改进FCM算法(AMMF-DSD)。与FCM聚类算法相比,AMMF-DSD算法具有识别复杂非球形分布数据的能力,且聚类结果更好。(3)本文设计并实现了新的文献推荐系统。首先获取数据并进行预处理操作;然后运用AMMF算法对用户历史行为数据聚类,将相似的用户分配在同一个类别中;最后使用协同过滤算法,在目标用户所在的类中计算得到前项推荐集,并生成文献推荐集合进行展示。不仅解决了新用户的冷启动问题,同时降低了数据稀疏性,提高了算法的推荐性能和推荐系统的实时性。
其他文献
虚拟现实技术(Virtual Reality,VR)是近年来发展起来的一种全新的仿真技术。物理实验是学生学习物理科学最形象、最直观的方式,也是激发学生对物理学科产生兴趣的最好方式。STEAM作为一种融合多个学科的全新教育理念,近年来在教育教学领域逐步应用。文中立足于电子技术应用于物理教学,将STEAM教育与虚拟现实技术相结合,设计系列焊接电路实验使得学生可以在虚拟环境下进行实验操作,以期提高学生的
当今时代,科学技术发展迅猛,网络成为人们获取成为人们获取多媒体数字信息的主要渠道,数字图像作为日常交流的主要传输媒介,更是承担着信息传递的重任。保证信息在传播过程中的安全性和完整性便成了目前研究的重中之重,优化图像加密方法,设计出满足社会发展和日常生活需求的加密系统刻不容缓。传统的加密方法可有效地用于文本或二进制数据加密,但对于图像、视频和音频等数字媒体却不是理想的选择。数字媒体的特点是数据量巨大
城市并不总是增长。城市收缩作为当前城市发展的一个新命题,吸引了国内外诸多学者的广泛关注,20世纪80年代,西方学者提出城市收缩概念,用以描述全球范围内的城市转变过程及其影响。对于中国而言,改革开放所带来的经济高速增长在某些地区已不可持续,部分资源型城市、外向型工贸城市、大都市外围城市出现了人口、经济、空间等不同维度、不同程度的收缩现象,给经济、社会、空间等方面带来了诸多不良影响,城市收缩带来的挑战
车牌识别技术在智能交通领域里占据着非常重要的作用,而针对不同类型的车牌,识别方法和效果也有所差距。车牌识别技术主要包括三部分内容,分别为车牌检测、车牌分割和车牌识别,本文根据车牌识别理论基础,对双行车牌识别技术的前两部分做了深入的研究。车牌检测部分,本文提出了一种基于双重概率密度函数的车牌定位方法。首先利用边缘纹理特征,结合双重颜色特征提取方法提取车牌类似区域,然后将所有车牌类似区域进行倾斜角度矫
杨树在我国栽种历史悠久,分布范围广,适用于纤维工业、造纸箱板、农具等。白杨派杨树普遍具有抗旱、抗风、抗寒,喜光、生长快、寿命长等特点,为西北地区平原沙荒造林树种之一。其木材纹理直,结构细,力学强度居杨树木材前列,供建筑、火柴杆等用。本研究采用07-17-18、07-23-23、07-30-11、秦白杨1、秦白杨3、秦白杨5、毛白杨30、新疆杨、I-101以及84K杨十个杨树无性系作为供试材料通过石
随着我国城市化速度的不断加快,因雾霾天气而受到影响的方面开始日益增多。在雾霾天气下,大气中的悬浮物对光进行反射、散射和吸收,使得图像采集设备拍摄的图像质量严重下降,导致图像的细节缺失和对比度下降等问题,对公共交通安全和户外视频监控有了严重影响。因此,图像去雾技术变得尤为重要。本文针对在图像去雾过程中出现的大气光值估计不准确、天空区域颜色过饱和以及边缘光晕效应等问题进行了研究,本文的研究内容如下:(
在计算机视觉领域之中,视频目标跟踪技术是一个比较前沿的研究领域,能够广泛地应用在道路安全、人工智能、军事防御、无人驾驶、人机交互等领域,所以对运动目标跟踪技术进行研究有着相当高的经济价值和广泛的应用场景。自从TLD(Tracking-Learning-Detection)目标跟踪算法被捷克科学家提出以来,得到了广大研究者的关注与研究,TLD目标跟踪算法是一种能够长时间对目标进行跟踪的算法,但是在遇
城市森林在城市生态系统中占据重要地位,它不仅能美化城市环境,还有助于保护生物多样性和维持生态平衡。有效的城市森林经营管理是保证其可持续发展的基本要求。传统的城市森林管理通常需要投入大量物资和劳动力开展实地调研,或借助高光谱遥感数据探测地表植被进行资料统计,这些方法往往受到数据源获取与数据质量的限制。谷歌地球(Google Earth)以直观的三维视角展示全球范围内的地理空间数据,能有效地监测城市森
植物功能性状是植物在进化发展过程中形成的与生存、生长发育和繁殖密切相关的功能特征,可反映植物在不同环境条件下的适应策略。为了探究山脊油松的生态策略,本研究以秦岭中段天然油松成熟林为对象,以非山脊油松为对照,在海拔1300~1600 m、1600~1900 m、1900~2100 m的山脊和非山脊阳坡分别设置3个20m×20m的样方,运用方差分析、逐步回归分析、相关性分析等方法,测定和分析了山脊油松
促进学生深度学习的高中数学课堂教学策略有:从学习境遇的营造来看,设计一个最能调动学生全部的感受力及已有的认知经验的真实情境;从问题引导的方式来看,用逐渐递进的问题搭建脚手架引领学生进行数学思考;从探究问题设计来看,提供含有类似核心任务的、多样化的、具有横向或纵向变式的问题情境;从学习内省组织来看,采取多样化的活动方式促进学生的理解与反思。