面向知识类短视频的多模态知识图谱构建

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:chenliquanhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动终端的持续普及和网络技术的不断发展,短视频受到越来越多的民众的青睐,而“用短视频来学习”激发了用户对知识类短视频内容的关注度及需求。然而目前知识类短视频在平台中的组织形式比较单一,影响用户体验。而通过知识图谱的形式将其结构化组织起来已成为可能,这不仅为用户提供更好的知识获取体验,同时激发创作者创造优质知识内容,构建良性的知识分享生态。本文的主要研究内容是面向知识类短视频的多模态知识图谱的构建,从海量的短视频入手,通过知识类短视频识别技术从海量的短视频中识别出高质量知识视频内容,基于开源的知识体系通过知识类短视频知识点抽取技术识别出视频知识点,最后通过视频知识点链接技术将其链接到给定的知识体系中,形成体系化的知识类短视频百科知识图谱。本文研究分为以下三个方面:1.知识类短视频的定义与识别。本文首先给出知识类短视频的定义,并提出使用基于预训练模型的知识类短视频识别方法。该方法通过融合短视频中的多模态信息到预训练模型的输入中,并且引入了短视频的主题类别信息以增强短视频的表示。本文还提出使用半监督自训练的方法进行模型训练,充分利用好大量的未标注短视频数据从而提高模型的效果。2.基于开源知识体系的短视频知识点抽取。本文首先给出了知识类短视频知识点定义,并对开源的百科知识树进行预处理得到了知识体系。基于构建好的知识体系,本文提出了基于召回+匹配的知识视频知识点抽取方法,显式的为两阶段模式,并分别进行优化。本文在召回侧增加多路召回以提高召回率,而在匹配侧通过数据增强和知识迁移的方法进一步提高模型的效果。3.基于多任务学习的短视频知识点链接。本文使用了基于多任务学习的知识视频知识点实体链接方法,在传统的实体识别和实体消歧的基础上,增加了实体匹配任务,以增强模型对实体的表示,从而提升模型的效果。本文在公开数据集和视频知识点数据集上进行实验,验证了加入实体匹配任务能够提升实体识别和实体消歧的效果。
其他文献
绘本作为美术与文字融合的实物载体,有利于更高效地帮助儿童掌握生活常识与技能,端正幼儿的世界观、人生观、价值观,也能为父母与孩子的沟通和互动提供便利。艺术与设计的语言没有边界,将综合材料应用于艺术设计打破了传统设计材料的局限,由此产生新的艺术设计形式。该文探索利用综合材料、现代多媒体交互等技术重新研究与实践儿童绘本设计,并从儿童心理、呈现效果等方面总结与其相关的应用实践。
期刊
东西部协作是党中央为消除西部绝对贫困、促进区域协调、实现共同富裕而作出的重大战略部署。在东西部协作政策的有效牵引下,青海与地处东部沿海的辽宁、江苏先后建立了结对协作关系。历经20余年的协同合作,青海最终打赢脱贫攻坚战,实现了社会经济的现代化发展。通过纵向梳理东西部协作在青海地区的贫困治理实践历程,将其划分为全面推进、精准聚焦、转型升级等三个阶段。在此基础上,利用并改进SFIC协同治理分析模型,从条
期刊
实体关系抽取是自然语言处理研究中一项重要的子课题。实体抽取是指从非结构化的文本中抽取有特定意义的相关实体,并将其分配到预先指定的类别中(本文重点关注人名机构名)。关系抽取则关注文本中出现的两个实体之间的语义关系,将抽取得到的实体对分类到预先定义的关系类别中。实体关系抽取在知识图谱构建,信息检索,文本摘要等下游任务中有着重要应用。实体关系抽取最初大多采用基于规则的方法以及基于特征的统计学习方法,这些
学位
党的二十大作出了建设宜居宜业和美乡村的部署,为乡村建设指明了新的方向,提出了新的要求。本文围绕贯彻落实党的二十大精神和中央农村工作会议的部署,阐释了建设宜居宜业和美乡村的重要意义,分析了建设宜居宜业和美乡村的核心内涵,提出了以“和”文化赋能乡村建设的路径思考。
期刊
Text-to-SQL是自然语言处理领域的一个重要任务,该任务将自然语言描述或问题转换为对一个具体的数据库的SQL查询。现如今,数据库技术有着广泛的应用,互联网上绝大多数的信息数据都是保存在数据库中的,Text-to-SQL技术可以帮助更多非专业人士快速地从数据库中获取信息。Text-to-SQL中的一个重要问题是:如何准确快速地解码出SQL语句。因此本文针对Text-to-SQL中的解码问题进行
学位
由于云计算的广泛应用,智能运维吸引了大量的关注,因为它可以协助运维工程师完成大规模云服务中的实时监控、事件分析和IT(Information Technology)服务自动化。智能运维平台是结合大数据和人工智能功能的软件系统,其工作流程一般包括四个阶段:安装配置、数据采集、数据处理和智能运维监测。随着智能运维平台越来越多的被使用,问答社区(Stack Overflow)出现了大量关于智能运维平台的
学位
随着深度学习技术的迅速发展,对话系统也迅速成为学术界和工业界的研究热点。其中,对话系统的一个子领域——对话式推荐系统更是在近几年涌现出大量的工作。对话式推荐系统是对话系统和推荐系统的结合,同时兼具二者的特点。对话推荐系统的目标是通过自然语言的形式与用户进行交互,获取用户的需求和偏好,完成推荐任务。目标规划相当于对话式推荐中的对话策略模块,决定系统回复的对话目标,包括对话目标动作和对话目标主题。在目
学位
数据不一致修复与评估一直是数据质量管理领域最重要的问题之一。随着物联网与移动网络的发展,边缘计算环境下的低数据质量问题,更提高了人们对数据不一致修复与评估的重视。但是过往的相关研究集中于单机环境或云计算环境下的解决方法。这迫使我们找到一种高效地、适合边缘计算环境的不一致修复与评估技术解决相关问题。针对边缘计算环境下的数据不一致修复与评估问题,本文研究并设计了一整套相关模型系统Ecc Dcr。主要工
学位
报纸
视障儿童阅读的推广是全民阅读工作的重要组成部分。通过对目前视障儿童绘本资源、公共服务和法律法规3个维度的分析,探讨视障儿童绘本阅读生态重建的必要性。在此基础上,从“感官信息获取逻辑”和“绘本语义解码与建构”两个方面诠释了视障儿童多感官绘本阅读的行为。研究认为,绘本设计要综合考量视障儿童的生理特点,以其阅读感知特性推动绘本美学风格的转向,并通过“图+文+音”等多模态信息协同来构建认知的语境,丰富推理
期刊