基于电影内容索引的可视化系统的研发

来源 :天津大学 | 被引量 : 0次 | 上传用户:cykic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言处理技术已被广泛应用于很多领域,其中也包含对电影剧本的分析。近年来看电影成为人们常见的休闲娱乐方式,人们总是希望在看电影之前更多的了解电影内容,判断是否有自己感兴趣的片段,并且希望可以快速的定位到该片段。但目前常用的视频播放软件并不能满足人们这样的需求,不能进行片段的索引,在对片段进行定位的时候人们只能手动的快进或后退拉动进度条,有时候可能会错过自己想看的内容。因此,为了能让用户在比较短的时间内对电影的整体内容有一个比较详细的了解,快速定位和索引自己感兴趣的片段,本文基于电影剧本和字幕进行分析,将视频播放功能和分析结果相结合进行视频索引。首先进行电影片段的划分,提出一种基本要素抽取的方法来提取剧本中的场景、人物、对话、人物动作描述、场景描述等信息,通过剧本和字幕中人物对话的相似度进行匹配,将字幕中的时间信息融入剧本中。其次根据定义的规则将剧本的原始场景合并,划分出电影片段。然后基于电影片段进行重要片段的分析、情感分析、人物关系的分析等。最后研发了电影内容索引的可视化系统,构建了电影播放视图、索引视图、人物关系视图、电影评论视图、人物与电影片段视图,使用户通过一系列的交互操作查找、索引和定位自己感兴趣的电影片段。本文将《Forrest Gump》这部电影的剧本和字幕作为研究对象,通过在系统中进行交互操作,验证了系统的实用性和有效性。
其他文献
AR(Augmented Reality)技术,即增强现实技术,是一种基于真实环境实现虚拟信息叠加的数字技术。随着新媒体与数字时代的到来,纵观国际大环境,AR技术已凭借着虚实结合与实时交互优势逐渐在建筑遗产展示领域得到诸多探索与应用实践,我们也有必要在系统学习、分析借鉴这些实践经验的基础上,针对中国建筑遗产的特点与价值,探索AR技术可以为中国建筑遗产带来的展示方式。此次研究是一次新思维与数字技术视
药物研发耗时费力成本高昂,药物重利用是解决问题的重要途径,其中药物-疾病的关系预测是药物重利用中的研究热点。早期的方法主要是基于文本挖掘的关系链接预测的相关方法,但是无法考虑疾病的潜在机制。为了更好地处理和分析疾病机制中的复杂关系,网络模型被应用到药物-疾病相互作用关系预测研究上。现有的基于网络模型的关系预测方法虽然考虑了复杂关系的整体性,但却忽略网络中的节点差异性。另一方面,现有模型大都采用是以
随着当前互联网环境中各类社交媒体的快速发展,人们在互联网上留下了海量的电子足迹信息,这些信息包含了人们的社会言论、社会关系、社会行为等丰富数据。这些数据为我们构建用户画像,分析社会关系提供了重要的数据支持。社会关系是人类社会的重要组成部分,社会关系分析是社会网络研究的重要基础。传统的社会关系分析研究多倾向于关系的方向、强度和类型,缺乏丰富的语义内涵,因此这些方法所构建的关系画像存在局限性,难以支撑
在信息检索中,最近的研究表明,信息检索系统的平均有效性的提高可能会降低信息检索系统在多个主题的得分的稳定性,这个现象表明有效性和稳定性两者之间存在一个折中。另外,一些风险指标被提出来度量系统的风险,但是这些评价指标是与前面所提到的有效性评价指标是分开定义的。综上所述,目前信息检索评价领域主要存在三个问题:(1)系统的有效性和稳定性尚未在一个统一的框架中进行系统的评估;(2)在这个框架下,这个统一的
目前关于人脸面部表情的研究主要是对静态人脸图片直接分析识别,这种方法往往在实验室环境下的人脸数据集上表现不错,却难以适用于含有有损人脸的野外复杂环境下的人脸数据集,比如低分和有部分遮挡等人脸图片。本文旨在通过人脸修复模型对有损人脸进行修复生成,然后利用人脸面部表情识别模型对修复后的人脸进行面部表情动作单元识别分析。本文主要解决的问题是保证修复生成后的人脸图片的人脸面部表情动作与真实的人脸面部表情动
校园暴力和欺凌已经成为严重影响青少年健康成长的问题之一。目前的预防措施主要依靠个人主动揭发或者学校监督。到目前为止,还没有一个有效的解决方案能够自动检测出暴力欺凌事件。检测暴力欺凌事件的本质就是人体行为识别。目前,人体行为识别在教育、医疗、商业和军事领域已经有广泛的应用。而且,人体行为识别在计算机视觉、可穿戴传感器和基于环境传感器技术方面都有一定的研究。但是,这些技术都有一些设备,场景的限制,无法
三维钻孔可视化是钻孔设计中的重要方面,旨在更形象的展示钻孔的内部结构,方便用户的设计,具有一定的现实意义。本文对三维空间展示相关理论进行了研究,并对系统需求与系统的主要开发技术进行了深入的分析。确定以MVC开发模式为基础,采用Beego框架以及Mongo DB数据库,结合HTML5、Web GL和Java Script等前端可视化技术实现系统功能设计与界面设计。系统划分为计划钻孔展示、实际钻孔展示
知识图谱在描述现实世界中的各种实体和关系方面具有良好的表现形式,它是人工智能领域的一项关键技术,研究热度随着人工智能的发展而不断提高。作为描述大规模知识图谱的标准数据格式资源描述框架RDF,伴随着知识图谱的兴起,也广泛应用在各个领域,与我们生活息息相关。例如,用于帮助搜索引擎找到更符合用户需求的答案、用于优化对一个事物的具体描述。RDF数据的广泛使用导致其数据日益庞大,亟需一个高效的数据管理系统进
世界上有数以万计的聋哑人,如果手语能够通过识别技术转化为语音,将极大地促进聋哑人与正常人之间的交流。为了实现手语领域的人机交互,需要设计出一个可以识别多个身体部位的动作系统。本文研究了基于Wi-Fi信道状态信息(Channel State Information,CSI)的手语识别问题,利用商业Wi-Fi设备实现了一个名为WiSign的原型,实现了单词级别和句子级别的手语识别,并在真实的室内环境中
管线铺设是地浸矿山井场设计中的一个重要环节,开发基于Web GL的井场管线铺设系统能够在三维场景下辅助技术人员进行管线铺设,为管理者的决策提供数据支持,具有一定的实用价值。本文首先对国内外井场管线铺设系统的发展现状进行了分析,研究了相关理论与技术。通过需求分析将系统划分成了地表模建模、地表交线铺设、井场管网规划、管线数据统计等模块。为实现地表建模模块,提出了一种改进的距离反比插值算法,首先使用K均