【摘 要】
:
在大数据环境下,传统推荐方法普遍存在着数据稀疏和冷启动问题。知识图谱作为一种大规模的异构语义网络,具有语义丰富、质量优良、结构友好等特点。许多研究将知识图谱引入推荐系统的研究之中,并基于知识图谱来研究可解释性推荐。然而,已有研究在面临关系稀疏的图谱时,推荐效果往往表现欠佳,并且缺乏一定的可解释性。同时,作为知识利用和创造的纽带,学术领域充斥着大量的知识,需要引入推荐系统来解决信息过载问题。因此,本
论文部分内容阅读
在大数据环境下,传统推荐方法普遍存在着数据稀疏和冷启动问题。知识图谱作为一种大规模的异构语义网络,具有语义丰富、质量优良、结构友好等特点。许多研究将知识图谱引入推荐系统的研究之中,并基于知识图谱来研究可解释性推荐。然而,已有研究在面临关系稀疏的图谱时,推荐效果往往表现欠佳,并且缺乏一定的可解释性。同时,作为知识利用和创造的纽带,学术领域充斥着大量的知识,需要引入推荐系统来解决信息过载问题。因此,本文以学者为主体,分析学者的研究领域、工作单位以及学者之间的关系,利用学者知识构建知识图谱,并基于知识图谱为用户推荐相关学者,对把握学术动向、科技前沿,以及研究工作的开展和人才的引进有着一定的指导意义和实际应用价值。本文的主要工作如下:(1)学者知识采集及结构化表示。首先,针对学者网的半结构化数据,从中抽取需要的实体、关系和属性;对于非结构化数据,使用实体抽取模型BERT-Bi LSTM-CRF来抽取文本中的实体。其次,根据获取到的两组数据,进行数据预处理并构建三元组,之后利用IPTrans E方法对实体进行对齐。最终,根据三元组数据构建学者知识图谱,并使用Neo4j存储知识。(2)针对基于知识图谱的推荐方法在面临关系稀疏图谱时表现不佳可解释性缺失等问题,本文提出了一种基于知识图谱高阶传播的学者推荐方法(Ho PKG)。首先,使用Tran Sparse模型将学者知识嵌入到向量空间中,获取对应的向量表示。然后,根据学者知识图谱的特点,使用注意力机制计算不同节点之间的注意力得分,从而区分不同实体对目标实体的重要性。同时,基于归纳学习的思想,利用高阶传播机制获取知识图谱中的高阶语义信息,进而生成更丰富的实体表示。在此基础上,提出了一种新的实体聚合器,以进一步完善实体表示,从而获取用户的潜在兴趣。经过实验分析,本文的方法在推荐效果和可解释性上具有一定的优势。(3)基于本文提出的推荐算法设计并实现了面向学术领域的可视化验证系统。根据用户的交互历史记录和检索内容,为用户精准地推荐相关领域学者。此外,设计了可视化的学者关系发现功能,从而为推荐提供可解释性依据。
其他文献
随着世界经济的快速发展,一体化趋势逐渐加深,各国对于全球气候变暖、生态破坏和能源短缺问题也愈发重视,如何加快企业技术转型来构建低碳环保社会,受到了各界的广泛关注和讨论。此种背景下,一系列低碳产业、低碳生活、低碳产品等新兴名词进入人类视野,低碳技术在各个行业领域方兴未艾。十二五期间,我国也针对低碳技术规划了相关政策举措,以此来实现节能减排。其中,旅游业作为我国经济体系中重要的组成部分,在促进区域资源
我国社会经济长期稳步发展,人民群众的衣食住行等方面均实现了跨越式提升。物质需求得到满足,随之而来的是群众对于上层建筑方面的渴望。文化馆逐步进入到人们的日常生活。为进一步推进文化事业、文化产业和旅游业繁荣发展,2021年,国家文化和旅游部印发《"十四五"文化和旅游发展规划》,提出到2025年我国社会主义文化强国建设取得重大进展的"十四五"总体目标。数字文化馆顺应形势要求,符合现代化发展趋势,在数字化
李瑞环通过阐述“学习理论、总结经验、研究工作”的重要性,揭示“学习理论、总结经验、研究工作”的统一性,提出并倡导“学习理论、总结经验、研究工作有机结合”的方法。这是他从哲学上总结概括理论联系实际的规律而形成的重要方法,不仅充分体现了李瑞环“学哲学用哲学”思想的方法论特色,更有重要启示意义。
原发性痛经(Primary Dysmenorrhea PD)为青年女性常见妇科疾病,从现代医学而言,月经时子宫中内膜合成以及释放膜前列腺素的含量提升,造成子宫过强的收缩或痉挛等。同时离不开患者心理因素和遗传因素等。从中医学方面讲,原发性痛经和气血相搏、寒客冲任造成子宫和冲任以及气血失畅,所以女性在经前与经期可发生气血冲任、瘀塞等现象。少腹逐瘀汤出自《医林改错》,有温经止痛、活血祛瘀的作用。本文用少
将知识图谱和图卷积网络共同用于协同过滤可以很好地提升推荐质量。原图卷积网络在每层节点更新时使用的特征转换矩阵对推荐任务来说是冗余的,而且现有的基于知识图谱卷积网络的推荐方法使用最后一层卷积层学到的节点表示作为目标节点的最终向量表示,而忽视了前几层目标节点的向量表示。针对这两个问题,提出了简化且多层结合的知识图谱卷积网络推荐算法(LMCR)。该算法在各阶卷积层执行节点更新操作时,去除特征转换矩阵并根
针对传统地形图地理精度质量检验方法存在的人物力消耗大,部分不易达或不可达检验区域地物检验难以进行以及检验结果多为文字描述,拓展应用性不佳的问题,提出一种利用无人机倾斜摄影测量构建实景三维模型获取高分辨率的地物信息进行地形图质量检验的方法。结合甘南州州级基础测绘检验项目,通过无人机倾斜摄影构建实验区实景三维模型,并基于模型获取地理要素信息完成对大比例尺地形图地理精度的质量检验。实验结果表明:实景三维
章建跃博士说过:“概念教学的核心就是概括,概念教学要让学生经历概括的过程,要精雕细琢地设计概念的概括过程”.数学概念的教学核心是培养学生数学抽象的能力,让学生体会从具体感知到抽象形成的完整过程.本文以“弧度制”的教学为例,以背景——定义——表示——联系——应用为主线,从度量的本质出发,引导学生经历整个定义生成、知识建构的过程,探索概念教学的方法和具体的教学环节.现将教学过程记录如下,以供交流研讨.
一、汇报成果,引发质疑师:经过六周的阅读,大家对《红星照耀中国》的内容已经有了基本的了解。课前同学们也都根据阅读任务单制作完成了自己的读书卡片,请同学们先展示读书卡,然后说说还有哪些问题没有得到解决或者解决得不够充分。活动:学生展示读书卡片,交流印象最深刻的章节和人物,并提出疑问。生1:我的疑问是斯诺提到的一个问题,国民党和共产党的基本争论是什么?师:很好,这个问题能不能在书中得到解答?
历史活动的中心是人,人是历史活动的主体,故长期以来,历史人物评价问题一直是史学研究的重要内容。近代中国处于中国历史上的过渡时期,因而带来近代人物评价的复杂性问题。21世纪以来,围绕中国近代人物评价问题,出现了两种偏向:一是贬低,甚至否定近代中国开眼看世界的先进人物;二是拔高,甚至肯定近代中国开历史倒车的落后人物。这两种错误倾向,值得学术界加以关注。马克思主义经典作家对历史人物评价问题有过深刻而全面
调度工作是电网领域的核心业务之一,随着近年来电网信息系统建设,呈现出数据多元结构复杂的特点,为满足高效响应的调度需求,文章提出了一种基于迁移学习的电网领域实体识别技术,研究了基于知识图谱的电网故障处置应用。首先,提出了一种基于迁移学习的电网故障处置文本数据的实体识别技术,该技术可以在少量标注的情况下实现较高准确度的实体识别工作,有效地解决了电网领域小样本数据实体识别准确度较低的问题。其次,构建了电