基于Web挖掘的虚假评论识别与推荐算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:shan850312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
需求是各个领域各个行业技术发展进步的动力,互联网行业也是如此。随着人们对网络的需求不断升级,互联网技术得到了进一步地发展与应用。然而,技术的进步在使人们的需求得到满足的同时,也给人们带来了困扰。虽然便捷的网络接入令人们的生活更加便利,但同时也给人们带来了诸如信息过载、网络欺诈等问题。面对信息数据爆炸式增长的现状,人们对互联网技术提出了新的需求。为破解诸如信息过载、虚假信息等问题,Web数据挖掘技术、以搜索引擎为代表的信息检索技术和以推荐系统为代表的信息过滤技术等Web应用技术被逐步探究并得以快速发展。为了在提高网络数据的真实可靠性的同时给人们提供更加个性化的Web服务,本文将对虚假评论识别技术和推荐技术进行研究探讨,主要做了以下几个方面的工作。第一,采用基于半监督学习的方法进行虚假评论识别。在构建了少量标注集的基础上,进行特征定义,并采用遗传算法进行特征选择;采用改进的协同训练技术对未标注数据进行利用,并基于评论特征和评论者特征两个维度进行虚假评论识别。实验证明,本文提出的虚假评论识别方法在识别效果上有良好的表现。第二,设计了基于项目属性偏好挖掘的协同过滤推荐算法。在项目的多标签属性的挖掘处理上采用了一种新的概率稀释的处理方法;在进行用户相似度计算时,采用了一种双阈值相似度计算方法;将项目属性信息融入用户偏好挖掘过程,在一定程度上缓解了数据稀疏问题。根据实验结果,基于项目属性偏好挖掘的协同过滤推荐技术在推荐效果上优于传统的推荐技术。第三,设计了一个个性化混合推荐方法。该方法采用更全面的数据信息构建更加详细的用户和产品模型,并结合评分数据经过相似度计算得出相似度更高多样性更高的近邻集合;设计协商模型策略整合各推荐方法的推荐列表,提高了推荐结果的可信度、准确度和多样性。实验结果证明了个性化混合推荐的可行性。
其他文献
从全过程项目风险管理角度,对项目生命周期内项目风险的分类、项目风险管理的程序和方法等风险理论进行了论述,并通过案例阐述了项目的风险管理及控制。
根据已发表的禽流感病毒M1基因序列设计合成PCR克隆引物,自接种H5N1亚型病毒的鸡胚组织中提取RNA,反转录后采用高可信度DNA聚合酶(PyobestTM DNA Polymerase)经PCR扩增M1基因
目的:探讨高危新生儿的保健方法及处理措施,旨在提高高危新生儿的生存质量。方法选取我院妇产科出生的高危新生儿55例,回顾性分析其保健措施及处理方法,总结新生儿预后,探讨优质的
2016年11月28日电/美通社/--香港科技园公司日前举办《亚太创新峰会2016:先进物料及印刷电子技术》,邀请相关科研专家和业界翘楚,解构创新物料的发展形势,以及物料对于开发创
2014年世界移动产业正在经历着跨越、转移和升级。根据IDC预测,除了手机、平板电脑,到2020年将有超过500亿台的M2M设备连接到全球公共网络,物联网应用将呈现井喷式增长,成为IT消费新的增长点。移动产业、互联网产业和传统行业在不断寻求合作和共赢,孕育于移动行业的知识和技术正在推动其他行业的融合。随着这一趋势的发展,全面远程管理软件的需
随着经济水平的飞速发展和科学技术的不断提高,电子设备的智能化将成为当今时代的发展趋势。本文首先介绍了智能小车目标识别跟踪系统的组成,在此基础上详细介绍了智能小车对目
针对高层办公建筑节能设计常见的问题,结合实际案例,做了简单的论述,提出了设计优化策略,共享给相关人员参考。经过工程实例研究发现,当前节能设计自然资源没有被充分利用、
沃尔夫冈·阿马迪乌斯·莫扎特Wolfgang Amadeus Mozart一生钟情于歌剧创作并在其人生最后的十年中进入歌剧创作的巅峰时期,《魔笛》创作于莫扎特生前的最后一年,多种风格的