基于形式概念分析的推荐算法研究及应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:xiaoyan_0532
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
做为处理信息过载的有效手段,推荐系统在近些年得到了广泛的研究与发展,推荐系统在各领域应用的成功案例也不断涌现,但是依然面临着很多问题亟待解决。形式概念分析(Formal Concept Analysis,FCA)的核心数据结构—概念格(Concept lattices),是一种数据分析与规则提取的有效工具。外延与内涵做为概念的组成部分使得形式概念展现出了聚类的特性。概念之间存在的偏序关系也揭示了其泛化与特化的本质。随着其研究的不断深入,形式概念分析开始逐步应用于数据挖掘、信息检索等领域。协同过滤(Collaborative Filtering,CF)推荐作为应用最广的推荐策略之一,其中经典的基于邻域的协同过滤算法通常只考虑用户间或项目间的相似关系,而忽略了不同对象之间的内在联系。此外越来越多的研究人员发现,推荐系统往往面对的是无法直观反映用户喜好程度的隐式数据,并且随着产品种类的剧增,用户与项目间产生的隐式数据也会变得极为稀疏。所以由于稀疏数据环境下信息的缺失,协同过滤算法往往获取不到充足的邻域信息,从而直接影响了最终的推荐效果。针对以上问题,本文提出了一种面向隐式数据的基于概念邻域的协同过滤推荐算法(Conceptual Neighborhood-based Collaborative Filtering,CNCF)。该算法针对Top-N推荐问题,以概念格为载体进行推荐问题求解。首先在用户与项目的关系数据转化而成形式背景的基础上进行概念格的构造,将用户与产品分别以对象与属性的形式聚集在概念中,并基于概念格生成相应的起始概念索引,借助索引结构高效地对对象的起始概念进行定位。之后利用概念之间的偏序关系,以对象(用户)的起始概念为起点探索其近邻概念并获取候选项集。最后结合所提出的全局偏好度与邻域偏好度筛选出用户可能感兴趣的推荐列表。通过对CNCF算法的实现,并在两个真实数据集上进行实验验证,相较于传统基于邻域的协同过滤推荐算法,CNCF算法在可以在保持较好的推荐效果同时,更适用于数据稀疏环境下的推荐。
其他文献
随着经济全球化,社会消费结构、消费水平、消费市场随之发生了深刻的变革。为了增强竞争力,企业扩大规模、改变经营模式和生产结构,在生产管理中信息量成倍的增长。高效的仓
由于网络的异构性和接收者需求的多样性,源点需要根据实际情况为不同接收点进行多速率组播。分层组播将原始数据分层,根据不同接收者的情况进行多速率传输,被认为是解决网络
随着大数据时代的到来,互联网每天都会产生大量的文本信息,词语作为文本的基本组成单位,对词语语义的理解是文本处理的基础工作之一。词语相似度计算,是用一个具体的数值表示
如今,人们更习惯通过社交网络来了解时事,发表观点。随着微博的逐渐普及,越来越多的用户开始关注并使用微博,微博成为目前最流行的网络平台。微博话题为人们讨论热门事件提供
随着科技的飞速发展,现代生产和生活中用到的设备越来越先进。设备能否有效的运行,关系着经济效益甚至人们的生命安全。因此,有必要对故障诊断技术进行研究。由于故障诊断知识本身具有不确定性、不精确性,如何表示故障知识以及对其进行推理,是故障诊断系统需要解决的关键问题。Petri网作为一种图形化建模工具,可以很直观地表示系统并发、动态行为,将Petri网引入故障诊断领域,具有重要的理论价值和现实意义。模糊P
随着人们对高性能计算和分布式资源共享需求的增加,传统模式的计算和资源共享已经不能满足人们的需求。人们希望可以像访问电力资源一样随时随地的通过网络获取所需的计算、
无线传感器网络是由大量传感器节点组成的一种无线自组织网络。通过部署在监测区域,实现对该目标区域的实时数据监测和传输。因其广阔的应用前景,受到了人们越来越多的关注。由
在计算机染色配色的实际应用中,我们通常需要根据织物颜色的RGB值来求出相应的染料配比。本文通过对实验数据的分析,利用最小误差平均值法和牛顿迭代法建立相应的数学模型,最
在计算机技术、信息存储技术及互联网高速发展的今天,越来越多的企业提高信息化程度。在企业的实际应用中,数据挖掘正在被频繁的提起,作为一个多学科交叉应用领域的数据挖掘
随着3G网络建设与覆盖的提升,平板电脑的蓬勃发展,国内三网融合的加速推进,由此产生的包括语音、数据、图像等综合多媒体通信业务需求大量涌现。综合通信业务是利用综合多元