论文部分内容阅读
需求是各个领域各个行业技术发展进步的动力,互联网行业也是如此。随着人们对网络的需求不断升级,互联网技术得到了进一步地发展与应用。然而,技术的进步在使人们的需求得到满足的同时,也给人们带来了困扰。虽然便捷的网络接入令人们的生活更加便利,但同时也给人们带来了诸如信息过载、网络欺诈等问题。面对信息数据爆炸式增长的现状,人们对互联网技术提出了新的需求。为破解诸如信息过载、虚假信息等问题,Web数据挖掘技术、以搜索引擎为代表的信息检索技术和以推荐系统为代表的信息过滤技术等Web应用技术被逐步探究并得以快速发展。为了在提高网络数据的真实可靠性的同时给人们提供更加个性化的Web服务,本文将对虚假评论识别技术和推荐技术进行研究探讨,主要做了以下几个方面的工作。第一,采用基于半监督学习的方法进行虚假评论识别。在构建了少量标注集的基础上,进行特征定义,并采用遗传算法进行特征选择;采用改进的协同训练技术对未标注数据进行利用,并基于评论特征和评论者特征两个维度进行虚假评论识别。实验证明,本文提出的虚假评论识别方法在识别效果上有良好的表现。第二,设计了基于项目属性偏好挖掘的协同过滤推荐算法。在项目的多标签属性的挖掘处理上采用了一种新的概率稀释的处理方法;在进行用户相似度计算时,采用了一种双阈值相似度计算方法;将项目属性信息融入用户偏好挖掘过程,在一定程度上缓解了数据稀疏问题。根据实验结果,基于项目属性偏好挖掘的协同过滤推荐技术在推荐效果上优于传统的推荐技术。第三,设计了一个个性化混合推荐方法。该方法采用更全面的数据信息构建更加详细的用户和产品模型,并结合评分数据经过相似度计算得出相似度更高多样性更高的近邻集合;设计协商模型策略整合各推荐方法的推荐列表,提高了推荐结果的可信度、准确度和多样性。实验结果证明了个性化混合推荐的可行性。