融合文本多方面语义的图神经网络推荐算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhk42
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,图神经网络由于其强大的表征提取能力在包括推荐系统在内的许多领域得到了广泛应用。目前,一些基于图神经网络的推荐算法利用评论等辅助信息在一定程度上改善了评分稀疏的问题。但是,现有算法很少关注评论中多方面的评价信息,通常从文档级别的文本中提取用户和物品的表征,难以准确捕获细粒度的特征。仅使用标点符号对评论进行分割无法准确提取不同方面的评价信息。一方面,使用标点符号粗分后的短句中仍可能存在不同方面的评价信息,即存在方面特征重叠问题;另一方面,用户可能使用多个短句对同一方面进行评价,造成方面特征分散的问题。针对方面特征重叠问题,设计了一种基于词性标注的语句分割方法,该方法根据单词词性决定是否将子句进一步拆分,能够有效地将子句中多方面的评价信息进行拆分。针对方面特征分散问题,设计了基于聚类的文本多方面语义推荐算法(Multiple Semantics based Graph Collaborative Filtering model using Clustering Algorithm,MSGCF-CA)和基于隐式主题的多方面语义推荐算法(Multiple Semantics based Graph Collaborative Filtering model using Latent Topic,MSGCF-LT)。MSGCF-CA算法通过聚类将具有同方面语义的子句融合,而MSGCF-LT则是将子句映射到K个隐式主题空间,在隐式主题空间实现方面语义的融合。随后,利用图卷积神经网络进行表征学习,将学习到的多方面特征信息融入用户和物品的表征中。最后利用用户和物品表征对评分进行预测。在三个不同数据集上的实验结果表明,融合文本多方面语义信息的MSGCF-LT算法整体性能要优于6种对比算法,尤其是在最稀疏的数据集Video Games上,取得了较大的性能提升。相较于表现最好的对比方法,MSGCF-LT算法在该数据集上的四项指标HR@10、NDCG@10、HR@20和NDCG@20分别提升了2.06%、2.64%、1.59%、2.49%。进一步的实验分析表明,基于单词词性标注的语句分割方式对模型性能有一定程度的提升。
其他文献
关系抽取技术可以从非结构化文本中抽取出结构化信息,是构建信息知识库最重要的环节之一。中文语料数据来源多种多样,关系事实交错复杂,且由于某些领域的数据敏感性,领域内缺少大规模公开数据集,给关系抽取提出了新的挑战。因此,以某领域为例展开了关系抽取模型的研究与应用。设计了一种联合关系抽取模型。在语义表征方面,针对领域内关系抽取任务的特点,通过改造预训练过程的遮盖操作,使用领域内的新闻语料和百科知识进行再
学位
传统的线下教学评价可通过教师之间的听评课进行,评课者针对不足提出改进意见,但说法一般较为笼统、委婉,针对性不强。当前教师听评课中“课堂观察”模式的效用最高。本文以一节公开课为研究对象,利用课堂观察的六大维度对课堂进行评价,形成观察报告,教师通过查看报告反思自己的教学行为,从而改进教学。
期刊
<正>数学概念一般都抽象难懂,对于以直观形象思维为主的小学生来说理解起来非常不容易。在教学中教师要基于学生的年龄特点和生活经验设计教学活动,引导学生亲历概念的建构过程,促使学生理解概念本质,使学习真正发生。“三角形的内角和”是人教版四年级下册的教学内容,是在学生认识了三角形的基础上进行教学的,是进一步研究平面图形性质的基础,是对三角形从感性认识到理性认识的一次提升,是对几何图形从外在特征认识到内在
期刊
文本分类是自然语言处理中的一个重要任务,在文本相似性分析、问句匹配以及自然语言推理等应用中都发挥着重要作用。新闻分类是文本分类中一个热点问题,受到了研究者们的广泛关注。新闻文本因其结构层次的差异性、标签种类的多样性以及高质量标注样本数量的有限性,相比于普通文本,在分类处理上更加具有挑战。通过分析新闻分类中的难点,以卷积神经网络文本分类模型与长短期记忆网络文本分类模型为基础,提出一种基于层次语义与先
学位
新课程改革背景下,要求教师发挥数学课堂育人价值,促进学生核心素养的发展。基于此,教师要重视数学活动、变式训练、思想点化的作用,创新课堂教学模式,发展学生的核心素养。
期刊
跌倒是全球第二大意外伤害死亡原因,在跌倒后及时进行救治,可以极大地减少由意外带来的伤害和损失。传统的跌倒检测方法主要基于可穿戴设备或光学设备,在使用场景或舒适性上受到了很多的限制,而利用无线信号的信道状态信息(Channel State Information,CSI)可以实现无接触的跌倒检测。近年来,虽有许多工作提出了基于CSI的无接触跌倒检测方法,但是这些方法容易受到环境变化的影响,在部署至新
学位
脊柱生理曲度和侧弯是脊柱畸形评估的关键指标,在临床诊断中往往需要对受检者进行X光片拍摄后由医生手动进行指标测量,具有一定的危害性和不确定性。使用深度相机捕获人体图像,并开发一套脊柱畸形检测系统,能够帮助医生快速、准确、无害、高效地诊断脊柱畸形。运用深度学习和图像处理相关技术,设计并实现了一套脊柱畸形检测系统。该系统使用Kinect相机采集人体背部表面的深度图像和彩色图像,采用区域生长的方法提取人体
学位
<正>《数学课程标准(2022年版)》指出:“数学在形成人的理性思维、科学精神和促进个人智力发展中发挥着不可替代的作用。数学素养是现代社会每一个公民应当具备的基本素养。”为有效地提升学生的数学素养,转变学生的学习方式,让学生进行审辩式学习是一种有效的途径。穆传慧老师对审辩式学习进行了系统研究,从一个中心、两个理念、三类素养、四种思维、五学课堂、六项评价等维度进行有理念、有工具、有正确价值观的结构性
期刊
信息物理系统是一种以传感器作为终端设备,感知外部坏境变换,并针对外部环境变化做出响应的计算机系统。在一些特殊场景中,系统所监视的外部对象具有可容忍响应时间属性。一旦所监视对象的状态发生了改变,系统需要在可容忍响应时间内,完成对于此变化的响应。例如,一旦高压电线路中的电压超过额定值,高压电监控系统需要在10毫秒内完成断电操作。现有信息物理系统响应时间控制策略均以降低系统平均响应时间为设计目标,不支持
学位
随着互联网时代信息体量的爆炸式增长,投资者难以快速从海量的金融新闻文本中获取有价值的投资信息。论文以金融新闻文本为研究对象,对事件抽取技术展开了深入地研究,构建了一个面向金融领域的新闻事件抽取系统,以便帮助投资者从海量的新闻文本中快速获取上市公司事件信息。主要的研究工作如下:提出了基于注意力机制的联合事件抽取算法。该算法使用ERNIE与BiGRU作为共享编码层,通过序列标注的方式识别出触发词之后,
学位