多模态课程知识图谱构建与应用研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:pengweimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多随着人工智能的快速发展以及人们对于教育的重视,创新教学方式受到越来越多的关注。大学课堂中,教师的教学方式不再是传统黑板板书,而是转变为包含文本、课件、视频、语音等多种形式的多媒体教学。然而,课程知识的大体框架在课本中主要以目录章节的形式展现,而章节中包含的细小知识点以及各知识点之间的关系却不能一目了然,不利于学生的学习。因此,如何对多种形式的课程资源进行有效的自动整合以及对知识进行更好的组织呈现成为具有重要意义的研究课题。面对以上问题,知识图谱提供了有效的解决方法。本文以大学计算机专业数据结构课程为例,整合不同来源不同结构的数据,提炼出数据中包含的实体及实体间语义关系,构建多模态课程知识图谱,提供一个基于知识图谱的课程多模态检索平台。一方面将知识点以直观清晰的知识图谱形式展现出来,有利于对知识的掌握。另一方面,本文构建的多模态课程知识图谱使得文本和语音模态课程资源之间相互补充,实现多模态资源整合以及课程更底层的知识点的学习路径检索,帮助学生高效学习。本文主要的研究内容及贡献有:1.本文定义了多模态课程知识图谱的数据模式,即实体类型及实体之间关系的定义。将知识点实体定义为结构、算法、相关术语三类,并将语音也定义为一类实体,并在实体之间定义了六种语义关系。2.本文采用融合双向长短期记忆网络和卷积神经网络的命名实体识别模型,将文本的局部信息和全局信息进行结合,采用条件随机场算法对特征序列进行标注,并结合了领域词典,通过对比实验证明该模型F1值有所提高,具有较好的命名实体识别效果。3.在关系分类工作中,本文将词法和句法特征向量结合,作为分类器模型输入,采用基于注意力的双向长短期记忆网络处理关系分类任务。通过与其他模型对比,证明该模型表现最佳,并对提升模型效果的注意力进行了可视化分析。4.本文提出了一个多模态实体链接方法,主要解决知识图谱中的多模态问题。首先通过语音识别技术将老师讲课语音识别成文本,其次通过文本匹配实现语音与知识点实体的匹配链接,并将二者间关系定义为关联,从而完成多模态实体链接工作。实验结果表明,本文的命名实体识别算法和关系分类算法具有较好的效果,可以使得构建的知识图谱具有较高的质量。本文最终基于Neo4j图数据库存储知识,构建出完整的多模态课程知识图谱。为了探究本文构建的多模态课程知识图谱具有很好的应用价值,本文搭建了基于知识图谱的课程多模态检索平台,提供基于知识点的多模态搜索案例,引导学生通过知识间关系进行学习。同时能够提供老师对特定知识点的课堂讲解语音,充分调动学生多种感官,提高学生的学习效果。
其他文献
相比于一元纯金属纳米粒子,许多双金属纳米粒子会具备更加优异的物理和化学性能。已有大量实验和理论研究表明:很多双金属纳米粒子因为元素之间表面能和原子半径的不同而优先
在对模态问题的研究中,卡尔纳普、辛迪卡将可能世界解释为语句的极大一致集合。而大卫·刘易斯认为,“语句的极大一致集”这一表述本身就包含着模态,可能世界不可能是句子的集合。基于反事实条件句的分析,大卫·刘易斯对可能世界做了实体解释,创建了他的可能世界理论。大卫·刘易认为,可能世界是实体的存在,它们是由时空相连的部分构成的。接着,他分析了可能世界的孤立性、具体性、现实性和充裕性特征。面对哲学家们提出的诘
我国《国家赔偿法》中规定了行政追偿制度,但由于立法过于原则和笼统,导致行政追偿制度在实践中的未能发挥其应有的作用,法律规定形同虚设。本文从行政追偿制度本身出发,将行
在实际的应用中,无论是科研人员还是用户,都希望能够了解模型做出判断的依据和过程,以信任模型的决策结果。当模型做出了错误判断后,了解模型判断错误的原因,也对模型的进一步改进和提升有很大帮助。人们在不断应用和创新各种模型并解决了一个又一个问题的同时,机器学习模型缺乏可解释性的矛盾日益尖锐起来。在一些对模型和精度要求较高的领域如医疗专家系统、虹膜身份识别、工业互联网等,可解释性的缺失会给任务带来严重威胁
数据分类是知识发现与数据挖掘领域的一项重要任务。然而,大多分类算法均以数据分布平衡为前提,这并不适用于非平衡数据分类问题。此外,优化模型的求解方法大多采用随机梯度下降,该方法利用单个样本梯度近似代替全梯度的计算原理,虽然减少了一定的计算量,但是单个样本梯度和全梯度之间是存在偏差的,这必然会影响算法的收敛。由上述可知,用于非平衡数据分类问题的新优化模型及其高效求解算法的研究一直是机器学习领域面临的挑
随着人们生活水平的提高,技术水平的巨大飞跃,人们越来越关注水下鱼类的智能养殖监测和水下鱼类生活习性等研究。目前水下鱼监测主要还是通过人工监测,潜水员潜水跟踪拍摄,很多水下环境危险系数高,而且潜水员跟踪可能会惊扰到鱼类,不能反映出最真实的鱼类生活规律和健康等重要数据。因此,不断探索智能化的水下鱼跟踪机器鱼,和其核心的视觉跟踪算法。本文研究应用水下机器鱼进行鱼监测的机器视觉识别和定位的技术,主要包括以
文本与数据挖掘(Text and Data Mining,简称TDM)是大数据时代特有的文本分析与数据处理技术,由于其技术特点,基于文本或者录音、录像等涉版权作品的文本与数据挖掘中涉及到对
传统磁性材料是铁基为主,以钕铁硼(Nd2Fe14B)为例,密度较铝合金大,同时Nd2Fe14B脆性明显,断裂韧性值与陶瓷近似,且加工性能差,室温导电导热性能差。现代轨道交通等用磁性器件
生物素(Biotin)又称维生素H、辅酶R,是维持有机体正常生理功能的重要辅助因子,参与机体内羧化、脱羧和转羧基的反应,现已被广泛应用到医药、食品、饲料等多个领域。本文通过
中曾根内阁成立以来,中曾根康弘提出了“战后政治总决算”的口号以及“成为政治大国”的目标。这标志着日本的国家发展路线发生了根本性的转变。中曾根康弘认为,日本不应该停留在经济大国的地位,必须朝着政治大国的地位前进。因此,中曾根康弘进行了“战后政治总决算”,对行政,财政,外交,防卫以及教育进行了一系列的改革,为成为政治大国解决过去遗留的问题。中曾根康弘的改革取得了一定的效果,为日本的政治大国化奠定了基础