概率生成式用户偏好模式挖掘方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:supermilk009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着行业数据的急速增长,推荐系统成为用户获取有用信息的必要工具。通过分析用户历史行为信息,有效挖掘用户偏好模式,实现不同情境和不同任务需求的推荐。针对个性化推荐的研究不仅对用户获取有效信息具有重要的指导意义,同时也具有重要的商业价值,高效的推荐能够有效提升在线服务的市场价值,甚至对社会发展和国家安全具有重要意义。此外,推荐系统相关理论与方法的研究结合了不同学科不同分支,对不同学科的发展起到了促进作用,同时也是产学研相结合的典型代表,有利于促进产业与科研的相互配合,体现综合优势。推荐系统如此重要的同时,也面临着诸多挑战。虽然互联网平台用户量与物品量均以千万甚至亿计,然而针对单一用户,其交互行为常常只占庞大用户物品潜在交互可能中的极其稀少的一部分,从而导致了严重的数据稀疏性问题。此外,即使用户仅仅与少量的物品存在历史交互行为,由于不同物品类别各异,用户偏好也常常呈现出多样性态势,而现有多数推荐方法无法有效刻画用户多样化的兴趣偏好。最后,推荐系统的可解释性是现有仅关注推荐精度的方法所缺乏的,可解释结果不仅能够增强用户的信任,也能为模型设计人员提供改进方向。因此,有效处理数据稀疏带来的挑战,同时针对多样化的用户偏好模式进行建模,实现推荐结果的可解释仍然是现有推荐系统研究的重点。本文针对推荐场景存在的数据稀疏性、偏好多样性以及模型可解释性问题,从主体偏好模式、社交偏好模式、多样性偏好模式和可解释偏好模式四个方面出发对生成式推荐模型进行研究,主要贡献如下:1.主体偏好模式挖掘:生成式推荐模型的核心主要关注用户偏好表示,然而高度稀疏的用户物品行为信息为用户偏好学习带来了挑战。本文提出从用户行为数据特点出发的深度生成排序推荐模型DGR,有效结合了生成式模型灵活性与神经网络强特征表达能力,实现稀疏用户行为数据的有效建模。具体来说,通过定义适用于稀疏数据的贝塔-伯努利生成过程,结合行为数据生成的point-wise重构机制与行为数据偏序对关系的pair-wise排序机制共同实现用户偏好学习。point-wise重构机制致力于对用户偏好行为数据进行重构,而pair-wise排序机制考虑用户行为数据中的正负反馈信息实现偏好正负建模。此外,从理论层面对整体生成模型泛化误差进行分析,保证了模型的有效性。在四个真实数据集上的实验结果表明,DGR模型能够建模稀疏用户行为数据,并有效提升在冷启动用户层面的预测精度。2.社交偏好模式挖掘:稀疏用户行为信息带来的挑战,能够通过有效引入额外信息进行缓解。社交网络作为一种独特的用户信息,有效刻画了不同用户间的关联性。本文提出结合间接社交关系的概率矩阵分解社交推荐模型In SRMF,有效实现了用户社交偏好与行为偏好的统一学习。具体而言,提出泊松-伯努利生成过程对简单二值社交关系的内在关联关系进行建模,其中借助泊松分布离散特性,有效刻画了用户间的潜在社交强度。社交数据生成过程能够与用户偏好数据生成过程有效融合。优化层面,提出基于图计算的并行计算框架实现模型变量的高效求解,使模型适用于大规模推荐数据集。最后,从不同角度展示了模型在真实社交推荐数据集上的有效性。3.多样性偏好模式挖掘:尽管大规模用户量和物品量的增加加剧了用户交互行为的稀疏性,但同时也带来了用户偏好的多样化,尤其是当物品种类呈现丰富性时。针对用户偏好多样性学习,本文从传统贝叶斯生成模型和深度生成模型角度,引入自适应学习机制构建不同偏好用户群体的最优表示,同时引入全局偏好学习共同挖掘用户内在多样性偏好模式。具体来说,本文提出了面向评分预测的自适应局部矩阵近似推荐模型ALo MA,通过有效结合自适应局部子矩阵学习,局部子模型最优秩学习以及稀疏数据非随机缺失机制实现用户偏好多样性建模。提出吉布斯采样的高效推断算法实现模型高效求解。同时,为了结合深度神经网络非线性特征表达能力,本文提出结合全局与局部表示的深度生成式推荐模型DGLGM,通过引入非参数化狄利克雷先验,有效实现用户群体自适应划分。为了有效缓解变分推断优化算法带来的模型误差,引入局部变分优化策略,有效提升模型证据下界,并从理论层面与实践层面确保了模型的有效性。4.可解释偏好模式挖掘:推荐精度的提升并不一定能够带来用户满意度的提升,模型可解释不仅让用户对推荐结果更加信服,也能帮助模型设计人员明白模型内在运行机理,准确优化模型。针对现有传统生成式推荐模型与深度生成推荐模型,本文提出面向数据层面和特征层面的可解释生成机理,实现模型可解释。具体来说,针对概率矩阵分解模型可解释性低等问题,提出度量用户历史行为重要性的影响力机制模型In2Rec,实现用户预测结果可解释、可溯源。此外针对稀疏离散化评分数据,提出离散化高斯分布有效刻画不同评分值拟合过程,通过结合非随机缺失机制,实现对稀疏数据内在生成机理的描述。In2Rec能够通过提出的迭代条件模式算法高效求解。同时,针对深度生成模型可解释性建模In DGRM,提出稀疏因子映射机制,有效关联不同隐表示因子与物品组的关系。此外,针对用户群体划分的非参数化先验不仅有效建模了用户偏好的多样性,也为用户解耦表示的学习提供了便捷。在真实数据集有效验证了模型推荐精度与可解释性方面的性能。
其他文献
可靠性是轨道交通列车运营的前提和核心竞争力,但高密度、复杂技术、强耦合等因素给轨道交通列车可靠性保障及运维管理带来了巨大挑战,传统的列车可靠性评估及运维管理理念、思路、模式和模型方法已难以处理此多元、多粒度、强耦合、非线性的动态不确定性随机变化过程,进而无法准确揭示和分析轨道交通列车复杂系统运用过程中风险产生的机理、变化规律和调控机制。因此迫切需要突破建立全新的轨道交通列车系统可靠性评估及运维管理
目前我国以地铁工程建设为主导的城市地下空间开发利用已经进入高潮。由于城市地下工程的复杂性和不确定性,在城市高可靠性运行要求与极度脆弱的环境条件下进行地铁隧道施工时,如果控制不当很容易诱发各类灾变,造成重大的人员伤亡和经济损失。安全性问题已经成为我国地铁工程建设首先必须解决的关键问题。为了提高地铁隧道施工的安全性,需要对地铁隧道施工灾变机理及灾变链式效应进行深入的研究。本文以地铁隧道、地层和既有建筑
目的 观察茵栀黄颗粒联合蓝光照射治疗高原地区新生儿黄疸(NJ的临床效果。方法 选取
纯电动公交车具有能耗低、零排放等优点,是解决城市公交系统供需矛盾和环境污染的重要手段。推进城市公交纯电动化是实现公共交通系统可持续发展,倡导绿色公交先行的重要内容。随着纯电动公交车的规模扩大,承载的客流量增多,纯电动公交车运营成本高和服务水平低的问题日益凸显。不仅给企业带来了极大的运营压力,也阻碍了纯电动公交车的快速发展。为此,本文从纯电动公交车线网和运营管理等方面入手,确定影响纯电动公交车服务水
城市轨道交通速度快、运量大、安全性强,已经成为缓解城市交通拥堵的最有效手段之一。世界大型城市如纽约、东京、上海等城市的轨道交通系统已进入网络化运营时代。城市轨道交通网络的线路之间以及站点之间的耦合度极大,因此复杂多变的突发事件会对网络化运营的城市轨道交通系统的运行效率以及运输能力产生极大的影响。考虑到城市轨道交通的运输服务属性,精准评估其交通网络中扰动对系统的影响程度以及扰动后系统的恢复能力,对于
近年来,机动车保有量和交通出行量的不断提升,加上违规占道及乱停车等现象屡禁不止,导致学校和医院及周边等重点区域的交通拥堵问题越发严重。学校与医院等城市重点区域往往是居民交通出行的主要区域,城市重点区域的交通运行状态与居民生活息息相关。交通拥堵不仅增加了出行过程中的延误,也使得交通事故发生率提高,严重威胁中小学生与医患人员的出行安全。然而,我国应用的城市交通运行状态识别,主要从宏观角度出发,重点关注
复合地层盾构掘进中地层性质的变异性和复杂性为盾构机的选型与设计带来了巨大挑战,滚刀作为复合地层盾构掘进的主力刀具,其荷载计算与合理配置是盾构选型的重点和难点。同时,复合地层掘进过程中开挖面中广泛分布着高强度、高磨蚀性地层,并且地层性质变化剧烈,使滚刀面临着复杂恶劣的工作环境而容易发生刀圈偏磨、断裂、刀轴损坏、刀盘荷载剧增、掘进困难甚至盾构卡机等不良后果。为了探究复合盾构掘进中开挖面与滚刀之间的相互
可穿戴网络作为物联网的重要组成部分之一,在军事、医疗、工业等领域均有重要的应用。近些年,随着电子产业以及大数据相关技术的迅猛发展,可穿戴网络与各领域的结合更加紧密与深入,对于可穿戴网络中信息的精度也提出了更高的要求。数据融合技术可以利用原始数据的冗余信息进一步提高数据的精度与可用性;数据估计技术则可以根据原始数据的状态信息进行数据的处理,去除或减少噪声的影响。可穿戴网络数据处理中的高精度数据融合估
我国城市轨道交通进入大规模发展阶段,轨道交通已逐渐成为大城市交通系统中的主体和骨干。随着轨道交通规模的持续增长,巨大的建设及运营成本使城市财政承压,但与此同时轨道交通运行效能并未充分发挥,与城市空间发展和土地利用也存在脱节,轨道交通的投入产出效率亟待改善。城市政府作为城市公共政策制定的主体,其管理模式及重心近年来正逐渐由单纯依靠行政手段,转向依靠经济、法律、行政等手段综合施策,经济政策将成为未来政
2μm波段多通道光纤光栅因其出色的滤波特性和优异的兼容性而成为多波长掺铥光纤激光器中滤波器件的绝佳选择。基于多通道光纤光栅滤波器的掺铥光纤激光器具有体积小、光束质量高、抗干扰能力强、与普通光纤兼容性好等诸多优点,其工作波长为人眼安全的2μm波段,该波段中存在高透过率大气窗口和多种气体强吸收峰,因此在光通信、激光医疗、光纤传感及激光加工等领域具有广阔的应用前景。本文结合所参与的国家自然科学基金项目,