嵌入隐式相似群的深度协同过滤算法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:fendynx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]构建能捕获局部关联和表达用户显隐式偏好的深度协同过滤模型.[方法]在显式推荐任务中嵌入利用隐式反馈查找的相似群,通过多层感知机分别同时对用户-项目、用户-相似项目群、项目-相似用户群进行建模.[结果]在MovieLens两个数据集上的实验表明,该模型较各类协同过滤推荐算法的MAE和RMSE降低幅度分别最高达10.94%和11.79%.[局限]使模型达到最佳性能的近邻数在不同数据集存在差异,最佳近邻数的确认问题有待探索.[结论]该模型通过嵌入隐式相似群能有效弥补局限,使推荐结果更准确.
其他文献
[目的]为解决开放式创新社区中因信息过载导致用户创意价值未能及时发现的问题,探索用户创意潜在价值早期发现方法,提高社区创新资源的利用效果.[方法]设计用户创意的双重网络结构,构建基于图注意力网络的用户创意潜在价值发现模型,学习表达双重网络的节点特征及网络间映射关系,实现用户创意潜在价值早期发现.[结果]应用典型开放式创新社区数据进行实证研究,结果表明,基于图注意力网络、使用双重网络结构特征的用户创意潜在价值发现模型的准确率为90.49%,高于其他相关基线模型.[局限]仅在魅族社区数据集上验证模型,未来可拓
[目的]梳理和总结自然语言处理和机器学习技术在自动引文分类中的应用现状.[文献范围]在Scopus数据库以citation classification、citation polarity、citation function、feature selection等关键词为基础构建检索策略,筛选出代表性文献共46篇.[方法]从引文分类流程、引文分类任务、技术方法等角度对当前研究进行分析和评述,并探讨研究趋势和挑战.[结果]引文功能分类研究有从多分类向二分类转移的趋势;深度学习模型可以同时实现引文情感和功能分类
[目的]系统揭示知识图谱表示模型的内在原理和影响因素,探究其在特定任务上的效果差异.[方法]面向链接预测任务,采用对比研究方法,比较基于翻译的知识图谱表示模型和基于语义匹配的知识图谱表示模型在FB15K、WN18、FB15K-237和WN18RR这4个数据集上的效果差异.[结果]在Hits@1指标上,TuckER模型在WN18、FB15K-237、WN18RR数据集上取得最优值(分别为0.946 0、0.263 3和0.443 0);ComplEx模型在FB15K数据集上取得了最优值(0.731 4).[
[目的]研究突发事件网络舆情发展趋势的预测问题.[方法]综合考虑多重不确定因素对网络舆情演化的影响,本文基于数据分解的研究思路,利用自适应噪声完备集成经验模态分解、BP神经网络以及相空间重构理论构建基于CEEMDAN-BP的舆情预测方法,并结合多起突发事件案例进行实证研究.[结果]研究结果表明,CEEMDAN-BP模型能够较好地预测突发事件网络舆情的发展趋势,三个案例事件舆情预测的平均绝对误差分别为8.60%、17.98%、11.97%,其模型的预测性能优于CEEMDAN-SVM、EMD-BP、EMD-S
[目的]构建基于项目类别的神经网络与模糊聚类混合时序预测模型,结合用户兴趣波动幅度的趋势以提升推荐准确度.[方法]对不同幅度的兴趣波动分别采用神经网络和模糊聚类的方法构建趋势预测模型.本文采用神经网络对小幅波动序列数据进行滑动特征提取并预测,而大幅波动序列数据则通过模糊聚类的隶属度划分模糊关系.[结果]通过4组数据的仿真实验,结果表明针对不同幅度兴趣波动的数据特征提取可以获得更准确的预测效果,较其他时序推荐对比算法,RMSE最大降低了 19.18%,Hit Ratio最大提高了45.78%.[局限]由于兴
[目的]针对古汉语领域同义词自动抽取研究较少以及现代汉语同义词抽取方法在古汉语不适用的问题,提出一种无监督抽取古汉语同义词的方法.[方法]构建句子级别古白对齐语料,利用词对齐算法实现典籍语料的词对齐,根据词对齐结果设计规则抽取同义词.[结果]词对齐方法可以用来解决古汉语同义词自动抽取问题,该方法在前四史语料上实现了 16 272组同义词的抽取,抽样评估结果显示第一次序结果词抽取准确率达到40.12%.[局限]该方法难以适用于没有古白句子级别对齐语料的典籍;同时,抽取结果依赖分词算法和词对齐算法的效果,抽取
[目的]研究准确率较高的技术供需文本匹配模型,提高技术供需匹配的效率,促进技术转移.[方法]考虑技术供需文本的标题和正文两种文本结构层次,通过多种方法计算技术供需文本中的词相似度和语句相似度,借助深度学习模型进行融合,构建了基于多层语义相似的文本匹配模型.[结果]实验结果表明不同层次的信息对匹配结果的影响程度不同,多层次信息融合的准确率达到96.50%,高于单一BERT方法的90.70%、DSSM的87.80%以及ESIM的87.50%.[局限]模型只考虑了两个文本结构层次,未探讨更多种结构层次的效果.[
[目的]提出AttentionSBGMC深度学习模型,以提升引文情感和引文目的分类的性能.[方法]采用SciBERT预训练模型得到语料集中句子的语义表示向量,根据文本特点,依次通过BiGRU神经网络和多尺度卷积神经网络(Multi-CNN)提取句子中的时序全局特征和局部关键特征,引入注意力机制对提取出的特征重新分配权重,达到突出关键特征的目的,最后通过线性层实现引文情感和引文目的自动分类.[结果]在Abu-Jbara数据集上,引文情感主客观、引文情感正负面、引文目的三项分类任务的F1值分别为86.74%、
[目的]解决传统方面级别情感分析模型在词嵌入过程中未将上下文与方面词信息融合、需以复杂的下游结构提取特征等问题.[方法]提出一种基于BERT的注意力门控卷积模型(BAGCNN),该模型由预训练B E RT模型生成融合上下文语义的文本和方面词特征表示,并引入多头自注意力机制解决方面词长距离依赖问题,最后利用门控卷积网络并行地选择性提取与方面词信息相关的多层次上下文特征.[结果]实验结果表明,与使用循环神经网络中效果最好的基准模型相比,本文模型精度在Restaurant、Laptop和Twitter三个数据集
[目的]在不同结构的网络中,各链路预测算法的预测效果存在不同程度的差异,通过对多项研究的数据进行统计分析,可以系统挖掘网络结构特征中影响链路预测结果的主要参数.[方法]选取国内外关于链路预测的相关实证研究,最终纳入5篇文献、22个网络、26种算法和278项研究,利用三水平元分析和贝叶斯网络元分析方法探讨网络结构中影响链路预测结果的主要因素及其对各算法预测结果的影响.[结果]纳入研究的算法总体预测的效应量MD=1.183 2(95%CI:(1.000 5,1.365 9)),网络密度、平均度和聚集系数是影响