Spark平台下聚类挖掘的智能推荐系统

来源 :南京理工大学学报(自然科学版) | 被引量 : 0次 | 上传用户:wangligang987123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高智能推荐系统的性能,采用狼群优化的K-means聚类挖掘实现数据分类,通过协同过滤完成智能推荐.为了提高推荐效率,引入Spark平台多节点完成聚类和推荐.建立用户和资源的K-means聚类模型,采用狼群优化算法对初始类别中心点进行优化,以提高聚类准确度,根据用户和资源的类别属性获得用户-资源评分数据,最后建立协同过滤智能推荐模型.根据推荐效率要求,将推荐模型部署至Spark平台,实现聚类和智能推荐的分布式运算.实验证明,通过合理设置聚类中心点数目,结合Spark平台多节点运算,与常用推荐算法对比,所提算法可以获得更准确的推荐性能,在大规模数据的智能推荐系统中更能满足实时性要求,智能推荐效率高.
其他文献
当前,短视频和直播已经成为用户获取信息、进行娱乐、开展学习、增强社交的重要渠道和手段.如何利用这些全新的媒体形式和手段传播党的创新理论、扩大党的声音、增强思想政治理论的吸引力和凝聚力,让党和国家的政策、方针、思想和理念“飞入寻常百姓家”,特别是向青年一代传播,就成为新型主流媒体和各大互联网平台都要认真思考的问题.为此,在国家广播电视总局的部署下,快手联合多家政府部门和中央级媒体推出了直播答题类节目“快手状元”,很快成为深受年轻人喜爱的传达重要政策信息、回顾国家大事的新形式.节目秉持守正创新的原则,兼顾经济
期刊
金属微滴沉积制造技术采用逐点堆砌方式成型,为斜柱沉积提供无支撑制造方式,具有高度灵活性.本文针对铝液滴斜柱连续沉积过程,建立格子玻尔兹曼模型进行数值模拟,研究液滴在凝固表面上的水平偏移运动.根据表面能充放过程,沉积运动被划分为下落、快速扩张、慢速扩张、回弹4个阶段,其受力状态由表面能、重力势能、动能和黏性耗散趋势得到.液滴内部流动在扩张阶段中表现为滑动状态,而在回弹阶段中表现为滚动状态.液滴偏移运动的加速阶段主要发生在扩张阶段,而偏移距离则在回弹阶段中产生.扩张阶段的受力状态表明偏移运动的主要推动力为重力
评估跨峡谷桥梁的地震性态需要考虑地形效应、行波效应以及土-结相互作用效应.将峡谷-桥梁系统在地震波输入下的反应分析看作波动散射问题,即桥梁及其邻近非规则区域对峡谷场地“自由场”的扰动.基于此思想,本文发展了一套跨峡谷桥梁地震反应分析方法,通过二维模型分析得到峡谷场地的“自由场”,结合人工边界输入到峡谷-桥梁体系,采用土-结相互作用分区并行方法对其进行分析,并编制了相应的分析程序.该方法可在自由场分析时考虑非垂直入射地震波,计入行波效应,因此可综合考虑行波效应、地形效应和土-结相互作用效应.通过峡谷场地分析
为了研究破碎硬岩的高压脉冲放电作用过程,该文利用所建立的放电结构扩展物理-数学模型,从定量的角度对高压脉冲放电破碎硬岩进行数值仿真,所获得的破碎硬岩放电电压和电流波形与试验结果基本吻合.在此基础上,对高压脉冲放电破碎硬岩过程中的放电通道和电学特性进行分析.结果表明,当Marx发生器能量在硬岩内形成的电场强度大于硬岩的临界场强时,高压电极与接地电极之间会形成一条树枝状的放电通道,使得剩余能量进入到放电通道内并促使其急剧膨胀导致硬岩破碎.当硬岩发生击穿时,放电通道内的电压、电流、电阻、能量、功率、最大放电通道
从地理学与海洋学视域出发,在阐述舟山海岛独特性和研究价值的基础上,通过文献计量分析梳理以舟山海岛为研究对象的相关研究脉络,提出了未来舟山研究值得关注的重点,即着眼最基本的生产、生活、生态问题研究舟山地区海洋生态环境变化和工农业技术水平的互馈机制,模拟自然与人文要素的耦合格局、尺度与机理,为海岛可持续发展决策和社会提供动态信息.
为了准确计算复合材料等效刚度,指导复合材料设计过程中铺层角度的选择.该文基于经典层合板理论,建立了考虑拉剪耦合效应的三维层合板等效刚度计算方法.基于该方法对碳纤维/环氧树脂基复合材料板等效刚度随铺层角的变化趋势进行了分析,结果显示:随着铺层角θ1的增加,铺层方式为(θ1)25/(θ2)25的层合板的面内轴向刚度Ex、横向刚度Ey的变化曲线包含变化率显著不同的两个阶段;法向刚度Ez呈正弦变化趋势且当正交铺层时有最大值;面内剪切刚度Gxy在θ1=45°且θ2=135°时有最大值;面外剪切刚度Gxz和Gyz变化
针对电视末制导炮弹在复杂背景下对多目标舰船识别精度不高的问题,提出一种结合经典阈值分割和Prewitt边缘梯度算子的方法,对图像中存在的多个舰船轮廓实现清晰的分割,利用模板匹配,选用加速稳健特征(Speed-up robust features, SURF)算法检测特征点,将处理后的舰船图像与弹载图像进行匹配;针对匹配过程中的错误匹配问题,采用M估计采样一致性算法,有效提升了匹配正确率。数值仿真表
为了精准地识别合成孔径雷达(Synthetic aperture radar,SAR)图像中的不同目标,该文提出了一种结合最近邻和拓展稀疏表示的分类(Nearest neighbor and extended sparse representation classification,NNSRC)方法.首先对图像进行预处理,抑制斑点噪声,归一化图像以保持有用的信息;接着采用二维主成分分析法来提取图像的特征向量,根据识别能力选取特征向量;最后判断SAR图像目标的类别.NNSRC方法拓展了稀疏表示模型,有效解决
黏液菌(Physarum polycephalum)由于其展现出的迷宫寻径、路径寻优甚至构建与人工设计媲美的复杂交通网络等特殊能力而备受关注.该文正是受启发于黏液菌构建复杂鲁棒网络的行为,提出了一种仿生特征选择算法Slime-FS.Slime-FS将特征选择转化成一类最优特征子图求解问题,同时模仿黏液菌觅食机制,结合粗糙集理论构建了一种策略来指导最优特征子图的搜索.算法被应用于文本情感识别问题中,在某慕课平台评论文本数据集上进行了测试,结果显示Slime-FS能有效地选择鉴别特征,去除冗余和无关特征,其表
为定量评估城市低影响开发的环境效应,以宁波海绵城市建设试点区为例,通过构建研究区SWMM模型,研究不同降雨强度下16种低影响开发情景方案对雨水径流量、氨氮(NH3-N)、硝态氮(NO3-N)和总氮(TN)等氮污染物控制的效应.结果表明,生物滞留池、透水铺装单项技术及其组合方案对雨水径流量的削减率分别介于3.41%~41.83%、1.08%~27.77%和5.59%~51.13%;低影响开发对各种氮污染物的削减作用与降雨强度、设施种类及面积有关,生物滞留池对径流量和氮污染物的控制效应强于透水铺装;在小降雨事