基于协同过滤的信息推荐系统研究

被引量 : 5次 | 上传用户:litiemei101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网高速发展的今天,信息超载问题日益严重,互联网技术的下一发展趋势就是解决信息超载问题,针对每个用户之间的差异,为用户提供其最感兴趣的信息。因此,能够根据用户之间的差异,利用相应算法帮用户发现其喜欢内容的个性化推荐技术应运而生。近年来,学术界对推荐系统的研究热度越来越高,已经逐步形成了一门独立的学科,各大互联网公司也都对自己的推荐系统大力投入。但推荐系统中的冷启动、数据稀疏性、可扩展性问题依然没有得到全面、良好地解决,而专门针对推荐系统的推荐攻击方法也日益增多。本文以基于协同过滤的个性化新闻信息推荐系统为研究重点,主要工作为:1)提出高效的聚类及相似度计算方法,在协同过滤的基础上结合频繁队列计算推荐评分,解决了用户评分矩阵的稀疏性问题、可扩展性问题和用户冷启动问题。2)针对新闻信息的特性,根据新闻的不同主题对新闻进行分类,通过用户历史行为预测其当前的主题兴趣,建立用户配置文件,对推荐结果进行过滤。3)基于MapReduce模型实现可扩展的离线聚类算法,使得个性化信息推荐系统能够并行运行,满足了海量信息和海量用户的个性化推荐需求。4)给出了通用的个性化推荐系统的整体设计,包括online部分、offline部分及其工作流程。并根据新闻领域的特点,给出用户主题兴趣预测模块的设计方案。论文最后对上述算法进行了验证,经过MinHash聚类后的推荐效率随着数据量的增加优势越来越明显;基于MinHash和频繁队列的混合推荐算法,对于冷启动用户产生推荐的准确率和召回率相对与传统推荐算法的准确率和召回率均有50%以上的提升;基于MinHash聚类、频繁队列、主题兴趣预测的混合推荐算法,产生推荐结果的准确率和召回率相比与传统推荐算法的准确率和召回率均有10%以上的提升
其他文献
<正> 阴盛阳浮而出现的证候称为真寒假热证,本证在多种疾病特别是在呼吸系疾病中较为常见。因此证呈现某些热象,医者只见其热,不究热之所由生,因而误治者甚多。现根据个人临
期刊
处于社会转型时期的临床教学需要融入医学人文教育。本文分析了在妇产科临床见习教学中融入医学人文教育的必要性,并探讨了有助于培养医学生人文关怀精神以及人文关怀能力的
选聘优秀高校毕业生到农村基层任职,是新形势下党中央根据我国现实国情,做出的一项具有长远战略意义的重大决策。此举既是为加快推进新农村建设、改善农村领导班子结构,为各级党
长期演进(Long Term Evolution, LTE)是目前全球最流行的第四代通信标准。它的产业化应用,标志着全球宽带移动通信时代的到来。作为第三代合作伙伴计划(3rd Generation Partn
城镇化是经济社会发展的必然趋势,也是国家现代化的重要内容和主要驱动力量。伴随着城镇化进程的加快,数以亿计的中国人从农村走向城镇,推动着人类历史上前所未有的社会大转
随着我国金融改革的推进,利率市场化改革得到全面的实行并获得了较大成效,我国金融环境由于利率市场化的改革变得更加开放。商业银行在这种自由化的金融环境中获取了高度的经
目的对比观察腹腔镜切除胆囊与小切口胆囊切除治疗胆结石的临床疗效。方法随机选取我院2009年2月至2013年8月期间收治的280例胆结石患者为对象,随机分为两组(常规组、治疗组)
进入21世纪以来,亚太地区大战略格局发生了深刻的变化。美国战略重心东移,调整亚太战略,重视日本在其中发挥的作用,这种变化迎合了日本国内对华强硬势力的愿望,导致了中日关
改革开放以来,我国经济实现三十几年的高速增长,但在“高投入、高排放、高消耗、低效率”的经济增长模式下,出现资源锐减和环境污染等破坏生态平衡、威胁人类生存的环境问题。企