Evaluating and improving the interpretability of item embeddings using item-tag relevance informatio

来源 :计算机科学前沿 | 被引量 : 0次 | 上传用户:xieym28
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Matrix factorization (MF) methods have superior recommendation performance and are flexible to incorporate other side information,but it is hard for humans to interpret the derived latent factors.Recently,the item-item cooccurrence information is exploited to le item embeddings and enhance the recommendation performance.However,the item-item co-occurrence information,constructed from the sparse and long-tail distributed user-item interaction matrix,is over-estimated for rare items,which could lead to bias in leed item embeddings.In this paper,we seek to evaluate and improve the interpretability of item embeddings by leveraging a dense item-tag relevance matrix.Specifically,we design two metrics to quantitatively evaluate the interpretability of item embeddings from different viewpoints:interpretability of individual dimensions of item embeddings and semantic coherence of local neighborhoods in the latent space.We also propose a tag-informed item embedding (TIE) model that jointly factorizes the user-item interaction matrix,the item-item co-occurrence matrix and the item-tag relevance matrix with shared item embeddings so that different forms of information can co-operate with each other to le better item embeddings.Experiments on the MovieLens20M dataset demonstrate that compared with other state-of-the-art MF methods,TIE achieves better top-N recommendations,and the relative improvement is larger when the user-item interaction matrix becomes sparser.By leveraging the itemtag relevance information,individual dimensions of item embeddings are more interpretable and local neighborhoods in the latent space are more semantically coherent;the bias in leed item embeddings are also mitigated to some extent.
其他文献
本文根据水电站成套设备生产各阶段的特点,综合运用管理学、项目管理等理论及各种工具,研究分析ZH公司管理存在的问题以及如何采用科学、有效的项目管理模式进行水电站成套设备
Because of using traditional hand-sign segmentation and classification algorithm,many diversities of Bangla language including joint-letters,dependent vowels et
遗传板块中有关自由(随机)交配与自交既是高中生物教学的难点内容,又是历年高考中的热门考点之一.文章结合典型高考真题进行解析与阐释,总结出相应的解题规律.
本文以浙江省高级人民法院为案例,对其工作现状进行分析,指出其现行工作模式存在的问题,分析信息化可以为法院工作带来的种种绩效,论证法院应用管理信息系统的必然性。同时,针对浙
近年来,我国天然气市场的发展不断与国际接轨,发展速度不断加快。天然气作为一种清洁、优质、环保的新型能源脱颖而出,越来越受到社会和广大人民群众的青睐。天然气市场日趋完善,竞争格局逐渐形成,如何提高天然气销量,开拓天然气市场已经成为我国石油企业的一个亟待解决的问题。首先对天然气销售特点及相关理论进行了分析与总结,并介绍了所使用的研究方法,即基于偏最小二乘法的结构方程建模方法。接下来建立了天然气销售影响
园林工程可以通过人为控制手段将自然要素更好地整合并利用,其功能和价值体现很大程度取决于技术手段,故而施工人员就要研究新材料、设计新思路、创造新工艺,如此才能不断地
伴随着信息技术的高速发展,信息网络技术在各行各业中都被广泛应用,而对于正在进行创新改革的教育行业来说,这无疑是机遇与挑战,目前为止信息技术已经走进了各个学段的教学课
本文共分五部分,各部分内容如下: 第一,回顾了与高级管理人员更换因素相关的研究文献。综观国内外研究成果,高管更换存在如下几个方面的因素:经营业绩方面、董事会特征方面、接任
作为一门理论性较强的科目,高中政治的内容大多较为抽象难懂,学生在接触时的抵触厌学性较为明显,课程教学的枯燥无味,使得学生的积极性不高,教学质量下滑严重.与初中的思想政
期刊