基于用户兴趣度的网络信息过滤模型研究

被引量 : 0次 | 上传用户:zzjokok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,互联网技术已经成为人们日常生活中的一部分。人们用越来越多的时间通过互联网进行信息查询、学习以及休息娱乐。虽然互联网上蕴涵了丰富的、最新的信息,但是互联网的信息量过大,各种信息泛滥,人们在进行信息的查询时往往得到的结果与自己的兴趣不一致。面对海量信息,如何帮助用户选择自己感兴趣的信息成为研究与应用关注的重点。文本过滤旨在帮助用户获取自己感兴趣的文本,实现信息服务的个性化,因此它具有广泛的应用背景和较高的实用价值。文本过滤从形式上可以分为三种,即:内容过滤、协作过滤和价值过滤。内容过滤主要采用自然语言处理、人工智能、概率统计等技术对文本进行内容分析,然后与用户模型进行相似度计算,主动将相似度高的文本发送给该用户模型的注册用户,但是内容过滤难以区分同一主题过滤结果的内容质量好坏,不能为用户发现新的感兴趣的信息。另外一种方法,协作过滤主要利用兴趣相似用户的评价进行预测和推荐。目前它已经被成功的应用到个性化推荐系统中,但随着系统规模的扩大,它的性能会逐渐降低,暴露出一些问题,比如矩阵稀疏性、扩展性以及早期级别等问题。而价值过滤基于不选择某个主题的代价大于选择某个主题的代价,虽然前景很好,但是目前应用还不是很广泛。本文围绕信息过滤模型的查准率技术指标,对于网络信息过滤的研究背景和研究现状做了分析,指出现在基于兴趣度的信息过滤研究的重点在于用户兴趣模型的形成、更新以及内容过滤、协作过滤和价值过滤的结合。在前人工作的基础上,本文的主要研究工作及创新如下:(1)对网络信息过滤的研究背景和现状做了分析,通过对国内外研究现状的分析,指出用户模型的建立、更新,以及内容过滤、协作过滤和价值过滤的结合是当前研究的重点。(2)对网络信息过滤关键技术进行研究,如:网络信息过滤系统基本组成、中文分词、特征提取以及分类算法等。(3)针对基于用户兴趣的信息过滤,提出了一种新型的用户兴趣模型建立、更新方法,使用户模型可以更好的兼顾用户的长期兴趣和短期兴趣。(4)提出将内容过滤与用户行为结合来形成用户兴趣度的计算方法,使其能及时的捕捉到用户兴趣的变化,比较准确的反映用户对所搜索信息的感兴趣程度。(5)分析了内容过滤、协作过滤以及价值过滤结合的必要性,提出三者结合的过滤方法及模型,此模型可以扬长避短,解决单纯使用任何一种方法的缺点,并且可以提高过滤的准确度。
其他文献
新一轮的基础教育课程改革建立了国家、地方、学校三级课程管理体制。分析地方课程的研究现状,找出地方课程在设计上存在的问题,构建符合素质教育要求,符合新课程改革理念的
目的探讨维格列汀联合二甲双胍对2型糖尿病患者血糖水平的影响。方法将90例2型糖尿病患者随机分为两组,对照组患者给予二甲双胍+吡格列酮治疗;观察组采用二甲双胍+维格列汀进
城市夜景照明的作用日益显著,LED照明技术的发展为建筑照明一体化设计提供了更多的思路和方法。本文总结了建筑照明一体化设计常用的几种方法,并详细分析了北京保利国际广场
[目的]分析和评价辽宁、山东、江苏、广东4个不同地理种群栉孔扇贝的营养成分。[方法]用常规方法分析其软体部一般营养成分 用氨基酸分析仪分析氨基酸组成。[结果]蛋白质含量
简述了絮凝剂和纳米技术的应用和研究进展,把无机高分子絮凝剂与纳米技术相结合,制备了性能良好的纳米型无机高分子絮凝剂,并应用于废水处理的试验研究中。本文主要开展了以
随着国民经济的快速增长,我国公路事业得到了长足的发展,高速公路网已经初具规模,各种等级的公路网度不断加密。同时,公路的施工质量和运营质量问题越来越引起人们的重视。其
为了保证中转旅客的成功换乘,提高机场资源利用效率,文章对登机口分配问题进行了研究。在考虑中转旅客换乘时间尽量短的同时,尽量减少登机口的使用个数。根据转场限定、登机
详细介绍了麒麟寺电站3号机组转轮桨叶和转轮室壁刮蹭的分析处理过程。文中提出的等离子切割桨叶方案,特别是如何在转轮不吊出、检修不升级的情况,对桨叶进行少量的切割工艺,可
超级电容由于具有充放电效率高、循环寿命长、功率密度高等特点,被广泛用于电动汽车、风力发电等应用中。超级电容单体额定电压通常在2.5~3V之间,所以需要将超级电容器单体串
道路交通事故不仅威胁着人们的生命安全,而且也造成了巨大的经济损失。道路交通事故发生后,不仅仅是在物质方面造成了巨大的经济损失,同时也对社会生产的正常运行和受害者的