多媒体内容管理及可视化系统的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:haihaiboyfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体的蓬勃发展,音频识别技术和视频流图像处理技术也越来越成熟。本人所在实习实验室在语音识别、语种识别、声响识别、话者识别、情感识别等领域取得了一系列研究成果,多媒体内容分析管理及可视化展现系统的主要功能是集成这些研究成果,形成一个整体的、系统化的多媒体平台,并行分析出一段语音中的语音内容、语种内容、声响内容、话者内容、情感内容,利用信息可视化技术来进行直观地展示。本论文详细介绍了多媒体内容分析管理及可视化展现系统的设计与开发的主要技术和方法。多媒体内容分析子系统主要包括了多媒体流分解,多媒体音频流提取、切分,多媒体音频识别模块集成,视频流图像抓取,字幕检测定位,图像分割,单字提取,视频流的渲染播放等关键功能;多媒体内容可视化主要包括了对语音内容、语种内容、声响内容、话者内容、情感内容、上述内容检索结果的可视化以及多媒体播放器等关键功能;多媒体内容管理主要完成了音频识别相关的数据和字幕识别相关数据管理以及定义了多媒体音频识别模块输出内容的存储格式。系统多媒体流的处理采用的框架是Direct Show框架,Direct Show是微软公司提供的一套在Windows平台上的多媒体处理开发包,它为多媒体流的处理提供了许多方便快捷的方法,而且开发人员可以利用Direct Show技术根据需要定制特定组件。本系统采用基于实例的测试方法验证了功能性需求,对关键功能的测试环节,做了大量的测试工作,保证系统功能的准确性与稳定性。测试结果表明,系统实现了需求所提出的功能,具有较好的稳定性和实用性。
其他文献
随着科技的不断进步,我国林业产业迅速崛起,面对机遇的同时也存在风险。林业除受到自身条件的约束外,外界环境也是关键。通过剖析当前云南林业投资面临的困境,探讨了合理规避
为了研究不同联合干燥对山药片的质构与品质的影响,采用热风-冻干、冻干-热风、膨化-冻干、冻干-膨化4种方法联合干燥山药片,分析山药片的收缩率、孔隙结构、硬脆度、复水特
随着新一代网络信息技术的应用和服务越来越多,网络信息安全事件频繁爆发,网络攻击、病毒入侵、信息泄密等事件层出不穷。目前,大部分小型网站对于网络安全重视不足,网络安全
2016年5月25日上午,长沙银行“智造快乐”品牌战略暨“快乐益家”公益项目征集新闻发布会召开。袁隆平院士、文化学者郑佳明,宜农科技、永清环保、远大住工、58同城、高新创投
随着计算机技术的迅速发展,智能电网中对无线传感器的应用日益广泛和深入。为了能够促进智能电网的不断优化升级,提高电力企业的经济效益,需要对无线传感器网络在智能电网中
绝缘栅型双极性晶体管(insulated gate bipolar transistor,IGBT)模块由于线路杂散电感的存在使得在开通和关断的瞬态过程中产生过大的电压尖峰,过压会使IGBT芯片的集电极电
近年来,随着我国高等教育的普及与发展,高校师生人数不断增多,全国各地高校逐步在城市新区建设新校园并翻新改造老校园。高校建设工程占据现阶段城市建设重要的一部分,也是政
[目的]比较太极拳和八段锦改善冠心病病人焦虑、抑郁情绪的效果。[方法]将120例伴焦虑、抑郁的冠心病病人随机分为对照组、太极拳组、八段锦组、太极拳+八段锦组各30例。对照
【目的】检测不同类型迟发型超敏反应性药疹(ni DHR)患者血清CCL-17[chemokine(C-C)motif ligand 17]、CCL-27[chemokine(C-C)motif ligand 27]、肿瘤坏死因子-α(TNF-α)和白介素-10
在“三个代表”和“三个有利于”关系问题上容易产生两种错误认识。一是认为二者是等同的,没有任何区别;二是认为两者存在包含关系。其实,这两种认识都是肤浅的、不正确的。“三