论文部分内容阅读
数字媒体技术与互联网技术的发展与融合,为数字内容产业的发展提供了机遇,但也带来了新的挑战与技术需求。数字媒体中与视觉相关的可视媒体是数字内容创作中最重要的素材,其高效管理与智能编辑处理能有效提升数字内容创作水平和效率。本文主要围绕可视媒体素材管理与编辑技术展开研究工作,重点研究了可视媒体素材库系统架构设计、可视媒体元数据规范、可视媒体素材检索、可视媒体交互式展示、图像与视频素材的交互式分割与无缝合成及人体运动素材的合成等关键技术,并取得了以下创新性成果: 1.提出了基于可视媒体存储与语义扩展检索的高效素材库系统架构,该系统可支持图像、视频、人体运动与三维模型等多种素材的可靠存储、灵活编目、检索与共享服务。设计了可视媒体素材元数据规范,支持各类素材的统一描述与管理;采用了基于语义网络查询扩展的可视媒体素材检索方法,提高了素材检索的查全率。 2.提出了基于层次化帧结构匹配的交互式视频分割方法,该方法将视频对象的分割问题转化成相邻帧对应区域的匹配问题,然后将该问题形式化为求解树的最大覆盖,并设计了动态规划的求解算法。实验结果表明该方法的分割计算效率高,而且分割结果的时空一致性保持较好。 3.提出了基于多层窄带的视频合成方法,该方法首先采用多层窄带的分割技术提取视频的前景对象,然后利用平均光流在最低分辨率层中传播分割结果,接着在多层窄带上逐层精化分割结果,并在原始分辨率帧中实现前景对象的软抠取,最后采用了优化的均值坐标合成方法,将软抠取得到的前景对象无缝合成到目标视频中。实验结果表明该方法分割与合成效率高,有效消除了合成边界模糊与合成区域失色的问题,并且可以较好地保持合成结果的时空一致性。 4.提出了基于结构化运动图的人体运动合成方法,该方法在标准运动图上增加结构化信息,将运动图的遍历搜索转换为运动结构表的查找,并采用了运动过渡空间策略来提升运动图的连通性。实验结果表明该方法减少了运动图构建与搜索的时间,提高了运动合成的效率,并较好的解决了运动的平滑过渡。 5.提出了一种基于Web的三维模型实时展示与交互的技术框架,该技术框架首先对三维模型格式作统一转换,然后对顶点数较多的复杂模型应用模型简化算法,并设计了三维模型尺寸自适应调整方法。实验结果表明,该技术框架可支持三维模型在线实时的旋转、缩放及平移等交互操作。