视频字幕的定位与识别

来源 :厦门大学 | 被引量 : 0次 | 上传用户:dsfsdfdfdsf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、通信技术及多媒体技术的快速发展,移动互联网进一步普及,网络信息化不断升温,数字化进程被快速推进,使得网络视频的内容越来越丰富,包涵着越来越多的重要信息,大量的视频图像在网络上快速传播,网络视频的服务更快、更便捷,但也增加了新的安全隐患,对视频内容进行检索与安全监控变得更加必要。传统的基于关键词、标题的方法,一般采用人工方式进行编写,不仅效率低而且并不能准确的反映视频内容,要从海量的视频数据中快速、准确地查找和监控所需要的视频信息,需要理解视频的内容。视频字幕包含了丰富的高层语义信息,与视频语义有很强的相关性,是理解视频内容的重要线索。通常网络视频的分辨率较低,视频字幕嵌入在复杂图像背景中,成像存在噪声、模糊、透视、字体格式种类繁多等不利因素,由于背景的干扰,无法直接进行OCR识别,因此,从网络视频的复杂场景中自动检测、提取视频字幕能够对视频进行更深入的检索与安全监控,也可对视频字幕进行高效率的翻译,大大提升工作效率,节省人力。基于这个需求,本文设计实现了一个视频字幕定位识别系统,包含了视频字幕关键帧检测提取子系统和视频字幕提取子系统。先通过帧间直方图差值进行镜头分割,并综合考虑文字的各种统计特征,利用边缘密度特征从视频中检测、提取字幕帧,从而减少需要进行字幕定位的图像帧数。然后,利用Sobel边缘检测进行字幕区域的粗定位,再用形态学操作及连通域分析精确定位字幕区域。最后,利用NiBlack算法进行分割,提取出二值化后视频字幕,结合OCR软件进行识别,以便将这些视频字幕文本用于视频的检索和监控、视频字幕翻译等应用中。通过实验验证,系统能有效地提取出具有代表性的字幕关键帧,而且能够较准确的定位提取视频字幕,从而提高了 OCR字幕识别效率,本系统的开发对视频检索、视频编辑具有潜在的应用价值。
其他文献
改革开放40年间,成都的标签从工业文明转向为宜居城市,在这个过程当中,不仅完成了经济的腾飞,更推动了城市的转型发展。以成都东郊区域为例,大到改革开放40年的面貌变化,小到
当前网络教学中存在教学过程评价难以量化、课程教学进度安排缺少数据支持等问题。随着大数据技术的发展,网络学习行为分析已经取得较大进展,但学习内容的跟踪与评价还比较缺
在自由竞争的电力市场中。应用鲁宾斯坦博弈模型.分析了电价制订方与大工业用户通过轮流出价谈判来确定峰谷分时电价的过程.分析结果表明,轮流出价的讨价还价博弈模型可以很好地
买方市场条件下,企业的战略中心正从“以产品为中心”向“以顾客为中心”转变,顾客已经成为企业最重要的资源。拥有顾客就意味着拥有市场和赢得利润。实施顾客价值管理,了解
<正>《砂型铸造生产技术500问(上册)——铸造合金及熔炼技术》黄志光叶学贤主编978-7-122-00913-516开平装324页38元《砂型铸造生产技术500问(下册)——造型材料与铸件缺陷防
六合加萸汤治疗胃食管反流病,效方经验。根据临床观察,胃食管反流病主要病机为肝郁化火,肝胃郁热。采用清金舒肝和胃、行瘀止痛、降逆止反方法,常可收到较好的疗效,值得临床
会议
2014年9月16日,日本航天政策委员会召开第17次会议,会上,日本宇宙航空研究开发机构(JAXA)理事山本静夫和第一卫星应用任务本部先进技术卫星开发室主任中川敬三向参加会议的科学
<正> 网上的一则短消息吹皱了一池春水:北京麦当劳餐厅的45名副店长一级的管理人员将全部到麦当劳香港汉堡大学学习营运管理课程。有评论认为此次麦当劳的人才充电,是跨国公
本文以辨证论治治疗女性不孕症51例,根据临床表现分为瘀血阻滞、寒湿凝滞、肝郁气滞、脾肾亏损等型,均于经后7—14天服药6—15剌,除1例失败外,50例均治愈并怀孕。
通过一对流动人口夫妇在已有一个男孩的情况下又抱养一个女孩的实例分析可见,可以看到造成目前农村较常见的"抱养女孩"现象的根本原因还是农民的养老实际需求.认为"抱养女孩"