基于语义扩展监督主题模型的多模态社会事件分类

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:linxl151
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络和移动互联网的发展,人们不再需要通过报纸、电视新闻等途径了解最新的社会事件,而是可以方便的从社交网站、移动端应用中获取。社会事件的报导也不再是记者的特权,普通的互联网用户也可随时拿出手机拍摄记录周围发生的一切社会事件,并上传分享到社交媒体网站。上传的社会事件一般既包含文本信息又包含视觉信息(图像、视频),并且会跟某些特定的主题相关。因此,从庞大的社交媒体数据中自动挖掘和分类社会事件的热点话题,对用户更好的浏览、搜索和持续关注社会事件很有帮助。在社会事件分析领域,已经有许多成熟的工作,这些工作大多基于概率主题模型,不仅能够联合建模社会事件的多模态信息,还能有效利用有监督信息得到更具有判别力的事件表示。但美中不足的是,现有模型在主题可解释性上依然不能令人满意。本文主要做了以下两个方面的工作:(1)在现有的社会事件分类方法中,研究人员忽略了有监督语料丰富的内部语义。本文提出了一种融入内部语义的多模态监督主题模型(Sem-MMSTM)用于社会事件分类。该模型利用了两种内部语义,分别为词性语义和类别语义,来提升事件表示的性能和主题挖掘的质量。最后,我们在一个真实的大规模多模态数据集上对所提出的模型进行了评估,与现有模型相比,我们提出的SemMMSTM模型由于引入了有效的语义信息,在分类准确率(ACC)和主题可解释性(PMI)指标上都有显著的性能提高。(2)社会事件文档中包含丰富的知识实体和知识关系,这些知识以向量的形式编码在各个知识图谱中(如Word Net,Freebase等)。本文接着提出一种基于语义和知识扩展的多模态监督主题模型(Pos-KGE-MMSTM),通过词性标注技术引入内部语义,通过扩展一个知识模态引入外部知识,社会事件的多模态数据和扩展的知识模态在文档范围内共享一个主题空间。我们的模型在文本模态利用词性先验避免了主题模型一味地偏向高频词,在扩展的知识模态自动捕获知识图谱中实体之间的关系,并指导模型的主题建模。通过充分利用语料的内部语义和外部知识,可以提高主题的语义一致性,更好地捕捉到文档在主题空间中的表示。我们的实验结果证明了本文所提出方法的有效性。
其他文献
随着当今社会的发展,对室内定位的需求日益增加,由于GPS等室外定位技术在室内定位的应用受到限制,目前室内多采用射频识别(Radio Frequency Identification,RFID)、红外线、超声波、Wi Fi、超宽带(Ultra-Wideband,UWB)等定位技术,其中UWB由于时间分辨率高、穿透性强、抗多径能力强等特点,使得其更适用于室内定位,而其他定位技术大都由于易受环境影响、定
在科技飞速发展的时代,科技文献数量增长的速度越来越快,但是科技文献一般篇幅较长,无法快速掌握核心内容,因此,急需一种科技文献关键短语提取方法。关键短语提取是指从一段文字中标注出能够概括该段文本核心意思的短语或词语。现有的大多数科技文献关键短语提取方法都基于词频信息,并没有包含足够的语义信息;很多方法属于单词级别,没有利用单词之间产生的短语信息,在提取多个单词的较长关键短语上效果不佳。针对上述问题,
关系抽取任务旨在从半结构化或非结构化文本中获取结构化的事实知识三元组,为知识图谱的构建提供数据支持。目前,常用的抽取方法主要是基于特征模式的关系抽取方法与基于神经网络的关系抽取方法。基于特征模式的关系抽取方法依靠手工设计的特征模板对半结构化或非结构化文本数据进行模式匹配而后提取出符合特定模式的关系知识,而基于神经网络的关系抽取方法则依赖于神经网络结构自动提取文本中与事实关系相关的上下文特征以提取关
多模态数据是指同一个事物可以有多种表现形式,包括文本、图像、音频等等。同一类的多模态数据虽然表达的事物相同,但它们之间的表达形式完全不同,存在着巨大的语义鸿沟。多模态数据随着信息技术的飞速发展不断增长,在丰富人们的信息生活的同时也带来了很多问题。如何在海量且无序的多模态数据中搜索需要的信息、识别特定的数据等问题都亟待解决。多模态研究通过一定的技术手段分析和研究不同模态之间的内部联系跨越它们之间的语
目前,生物特征识别技术已经大规模应用,这对生物特征识别技术的安全性、准确性、实时性和交互性都提出了很高的要求。在基于图像或者视频的生物特征识别技术中,感兴趣区域(ROI)的准确定位和提取非常重要和关键。掌纹识别已经成为一个新兴的生物特征识别技术,受到广泛的关注,目前,掌纹识别的ROI提取主要是针对静态图像进行提取,提取算法缺乏交互性,也难以从动态视频中有效提取ROI,为解决这个问题,本文开展了深入
随着音频编辑软件的盛行,人们为了不法目的可以对音频文件进行恶意篡改,为音频的真实性检测带来严峻挑战。其中,复制粘贴篡改是音频语义篡改中最常见的篡改方式,由于其篡改片段的属性与原始音频文件极为匹配,检测难度大,已成为多媒体取证领域研究的热点之一。本文面向数字音频展开复制粘贴篡改检测与定位研究,主要工作如下:(1)提出了一种基于常数Q倒谱系数(Constant Q Cepstral Coefficie
在现代软件工程中,软件系统通常是通过选择合适的、现成可重用的构件,然后用明晰的软件体系结构组装这些构件来进行开发。这项技术由于能够显著降低软件的开发成本和时间,已在实际的软件行业得到了广泛的应用。然而,软件测试几乎要耗费软件开发资源的一半。因此,如何合理分配测试资源,以耗费尽可能少的测试资源,谋求尽可能大的软件可靠性和尽可能少的测试成本,一直是软件工程领域中的一个热点和难点问题。特别是近年来,以美
Android——作为移动设备中主流智能系统,由于系统源码的开放性以及第三方应用市场稽查力度不足,导致Android恶意软件层出不穷,对用户隐私、财产安全等诸多方面构成严重威胁。在此背景下,如何有效地检测真实场景中的Android恶意软件具有重要的理论和实际意义。近年来,研究学者们致力于Android恶意软件检测工作并取得了不错的成果,但纵观整个检测领域,仍存在两点不足:一是现有工作大多是为提升检
科技化发展使得人们的生产生活问题有了新的解决方式。然而,现实生活中仍然存在着许多因供求双方信息不对称、不透明,信息更新不及时等导致的需求匹配困难问题。区块链技术的发展为这些需求匹配问题提供了新的解决思路。区块链技术的去中心化、不可篡改,以及可追溯的特性,天然地适合于解决供求双方间的信任问题。架设于区块链之上的智能合约,也能够在满足预先设置的条件下,安全、高效地得到令需求方满意地结果。虽然研究人员已
作为新一代人机交互平台,虚拟现实聚焦身临其境的沉浸体验,强调用户连接交互深度而非广度。虚拟化身是用户在虚拟场景中所使用的虚拟形象。应用可由用户身体动作直接实时控制的三维虚拟化身(Avatar)一直被认为是实现虚拟现实深度沉浸感的重要手段。由用户身体动作直接控制虚拟化身的常用解决方案是使用动作捕捉设备实时获取人体运动,再将其转化为虚拟化身运动,从而实现对虚拟化身的控制。现如今,随着虚拟现实环境的普及