基于组合相似度聚类的关联规则电影推荐算法研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:yanghong098
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人民生活水平的日益提高,观影已经成为我国人民非常热衷的休闲、娱乐、生活方式。本文拟研究一个有效的电影推荐方法,在帮助用户迅速找到喜欢的电影同时,还能把电影推荐给更适合的用户,为电影的推广起到积极的作用。本文主要研究工作和成果如下:1、本文提出了新的相似度计算方法——组合相似度。该相似度根据不同的数据集按照特定的比例融合了修正余弦相似度、杰卡德相似系数和评分习惯相似度的优点,从而能够更加准确地衡量用户间的相似度。实验结果表明,在电影推荐场景下,组合相似度的效果确实优于单一相似度。2、本文改进了传统的K-means聚类算法。传统的K-means算法使用欧氏距离衡量样本点之间的距离,但是欧式距离并不适合于电影推荐场景。因此,本研究在衡量数据点距离时采用组合相似度替换欧氏距离,并用对比实验证明,基于最优权值比例下的组合相似度的推荐效果要比欧式距离以及各单一相似度的效果要好。3、研究提出了基于组合相似度聚类的关联规则电影推荐算法。传统的关联规则电影推荐算法直接对所有数据进行关联规则挖掘,然后根据挖掘出的关联规则进行电影推荐。这种方式存在无关数据太多导致挖掘效率低、最终规则太少导致推荐不准确的问题。对此,本文改进了该方法,在进行关联规则挖掘之前,先对用户基于组合相似度进行聚类,之后在各类中分别进行关联规则挖掘。在对一个用户进行电影推荐时,先对其进行类别的确定,再根据其所属类的关联规则进行推荐。实验证明,改进后的算法确实优于传统的算法。本文研究贡献:基于单一相似度计算方式,提出改进后的组合相似度计算方式;以组合相似度替换K-means算法中的欧氏距离;使用改进后的K-means算法改进传统的关联规则推荐。实验表明,组合相似度优于欧氏距离以及单一相似度,基于组合相似度聚类的关联规则电影推荐算法优于传统的关联规则推荐算法,本文提出的优化算法可行。
其他文献
当前市场及顾客想要具备多样性和个性化的产品,为满足用户需求,较多制造企业渐渐选择多品种小批量的生产模式。洪都航空数控H厂多品种小批量的产品另有成本高、精度高的特点,这要求洪都H厂优化质量控制体系。H厂现有的传统统计过程事中质量控制方法无法满足要求。本文介绍了洪都H厂及洪都H厂的质量控制现状,分析了多品种小批量产品加工特点,发现了现有质量控制模式及方法与生产模式不适配的问题;提出解决办法即选灰色模型
近年来,随着国民经济水平的快速提高,人们愈发追求精神文化水平的提升,而旅游作为精神调节活动和集体家庭活动成为了最佳选择,所以旅游业逐步成为支持第三产业乃至国民经济可持续发展能力提升的支柱性产业之一。同时伴随着互联网时代的到来,旅游渐渐与大数据、云服务、5G等先进技术相融合,形成“智慧旅游”,旅游线上代理(Online Travel Agency,OTA)取代传统的旅行社成为新的中介为旅游者提供更便
近年来,社会经济由原来的高速发展,进而转向了如今的高质量发展阶段,加之2020年疫情的影响,人民消费欲望下降,汽车等消费品销量出现巨大的下滑,致使汽车等制造业发展出现较大的挑战和压力。在竞争日益激烈的汽车制造厂,各大生产厂家关注的要点便是整车成本,而整车成本的源头是各部分零件的采购支出,因此当在项目初期进行零部件定点时,供应商在这个过程便会进行新一轮的价格竞争,但是商品价格竞争的背后便可能涉及到零
伴随着经济的全球化浪潮,企业所面对的一系列复杂而又多变的挑战。企业面临着比如成本增加、环境恶化、技术创新不足、高层次创新人才不足等一系列问题。企业的可持续发展评价是可持续发展中的一个分支,它可以为企业的管理者提供一定的决策支持。企业的可持续发展就是在确保企业自身经济能够稳步发展的前提下,同时保证生态环境不会因企业的发展而受到危害,另外企业还需要履行社会责任。由此,为评估企业可持续发展的能力,建立一
自从防范化解重大风险、精准脱贫、污染防治等“三大攻坚战”实施以来,地方政府隐性债务及其风险的治理一直成为各界关注的热点。研究发现:当前学术界对地方政府隐性债务内涵及测量口径尚存争议,隐性债务规模判定争论较大;债务规模不是债务风险的决定因素,债务风险大小主要还是由其债务偿还能力所决定的;隐性债务本质是对地方财政信用能力的一种开发,当前地方政府财政信用与财政债务管理存在明显脱钩,财政信用评价体系的完善
国内市场经济的发展,促使着居民的消费升级,从而推动着餐饮行业的飞速发展。各个企业为满足时代洪流下的新型消费需求,纷纷采取品牌升级的方式进行品牌形象升级设计,以求通过设计的手段吸引目标用户完成消费行为,达到提高品牌竞争力、市场拓展的目的。本文以熊大师牛羊粉为例,运用STP模型对该品牌完成市场定位,并以调查问卷的方式核实该定位于目标消费者中具备良好的接受度。从而围绕该品牌定位确立新的品牌价值、品牌名称
随着经济快速发展和能源问题日益突出,我国风、光等新能源发展迅速,总装机容量世界第一,但由于风、光能源的自身特性(随机性、间歇性以及不确定性),大规模的风、光能源并网给电网带来严峻的考验,包括电网稳定性、电能质量和调度机制。电网企业为接纳更多的风、光新能源并网必须投入更多的辅助设备来保证电网的安全稳定运行,大大增加了成本。因此本文同时考虑消纳的风、光电量和总成本,建立合作博弈模型,求取风、光电厂最优
根据国家发改委颁布的《省级电网输配电价定价办法》,省级电网输配电准许收入由准许成本、准许收益和价内税金组成,而准许成本和准许收益则与电网投资密切相关。此外,新一轮的电力改革制度规定,相关政府监督管理部门以及电网企业自身在每一轮监管周期内都必须严格核实其成本及与其企业发展相对应的计划投资目标。换言之,电网企业必须做到科学测算投资规模,合理安排投资结构,谨慎评估电网投资风险,以提高电网企业投资效益效率
碳循环过程与人类活动息息相关,城市是人类活动的集中区域,城市碳平衡的研究对于区域绿色协调发展战略的实施有着重要意义。江西省在全球变暖的大背景下产生了剧烈的气候变化,十四五期间,江西省将以“碳达峰”和“碳中和”为目标,以“降碳”为抓手来应对全球气候变化,促进区域绿色协调发展。本文根据碳循环理论,通过GIS、ENVI等工具和地理信息相关研究方法,在对江西省三期遥感影像解译的基础上,对江西省2000~2
目的:分析2型糖尿病(type 2 diabetes mellitus,T2DM)患者腹部脂肪分布(abdominal fat distribution)与骨密度(bone mineral density,BMD)和骨转换标志物(bone turnover markers)的相关性。方法:研究纳入104名于2019年7月~2020年11月在南昌大学第三附属医院代谢内分泌科住院的50岁以上(含50岁