基于Web的中文新闻视频内容分析

来源 :第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议 | 被引量 : 0次 | 上传用户：jipeng4610190

【摘要】

：

本文提出了一种借助互联网信息对中文新闻视频进行内容分析的方法.其基本思想是:首先对新闻视频进行故事单元分割,抽取故事单元的新闻脚本,然后从新闻脚本中提取新闻故事的关键词,并通过模糊计算词语的相关度和词语与事件的相关度对搜索关健词进行优化,最后利用搜索引擎从互联网上获得与新闻事件相关的网页,经过对网页的分析获得了新闻视频的语义.为了能有效地从具有ASR(Automatic speech Recogn

【作者】

：

庞宗强封化民邱鹍宋国森

【机构】

：

燕山大学信息工程学院,秦皇岛,066004 北京电子科技学院信息安全与保密重点实验室,北京 100

【出处】

：

第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议

【发表日期】

：

2006年8期

【关键词】

：

视频分割网页结构文本过滤模糊计算中文新闻视频搜索引擎

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

普适计算环境下一种基于多Agent增强学习的无线传感器网络自组织方法

为实现在普适计算环境下无线传感器网络运行的协调统一和稳定,提出一种基于多Agent增强学习的自组织方法。首先通过汇聚节点训练网络形成初始优化的自组织结构;然后使每个参与信息传送的Agent保持增强学习,优化路径选择;最后以Agent之间的通告,实现主动的网络自组织结构优化。多Agent增强学习方法使在普适计算环境下的无线传感器网络具有相对平滑的自组织运行过程和高效性能。

会议

无线传感器网络普适计算多Agent增强学习自组织结构

AM广播的频带复用传输

本文提出了一种基于频带复用的AM广播系统,通过对现有模拟双边带调幅的载波进行最小附加波形键控而形成复合调制,在进行模拟音频广播的同时还可以传输多媒体数据.仿真表明,两种调制方式在一定条件下都能获得良好的性能.

会议

调幅广播频带复用传输波形键控直接序列扩频带内同频道

一种H.264的帧内预测模式选择算法

帧内预测编码技术是H.264视频压缩编码标准中的一项关键技术,为了降低帧内编码的计算复杂性,提高帧内预测模式的优化选择速度,本文提出了一种良好的帧内预测模式选择算法。首先,我们认真分析了H.264视频压缩编码标准,主要对预测编码技术尤其是帧内预测编码技术进行了剖析,对快速帧内预测模式选择算法展开研究比较。从快速预测模式选择算法的研究现状来看,还有一定的余地,可以通过更为有效的选择算法达到进一步降低

会议

H.264标准帧内预测编码模式选择算法星型算法视频压缩编码

中国民歌的地域风格分类

对于音乐数据自动分类技术的研究,是音乐信息检索领域中一个重要的研究课题.本文采用支持向量机技术,研究了对中国民歌的地域模式分类方法.论文将中国民歌按地域风格特点,分为10大类别,使用支持向量机方法,完成了10个地域500首民歌的多组地域风格分类实验.通过实验,研究了特征提取中采样率对分类结果的影响,各特征参数及其组合在地域民歌分类中的影响。实验结果表明:采样率与分类准确率并不成正比,16KHz采样

会议

音乐信息检索特征抽取乐曲流派乐曲风格自动分类中国民歌地域风格分类支持向量机

3D虚拟人脸的自动生成及情感表达

首先从正面图像中自动检测并定位人脸面部特征点,并根据正面人脸属性估计特征点的深度信息,再根据特征点坐标进行体形变处理,实现网格个性化,最后通过对人脸图像进行的柱面纹理映射,完成三维虚拟角色自动生成并实现表情可控表达.本方法在一定姿态变化范围内可获得理想的视觉效果,同时具有快速、方便、无需人工干预和硬件设备要求低等优点.

会议

三维虚拟角色生成面部特征点提取深度信息估计体形变柱面纹理映射3D虚拟人脸

基于3组对应点的相机外参定标

相机外参定标在运动分析、三维物体重建、纹理映射等领域有着广泛的应用,这是最近几十年来计算机视觉和虚拟现实的一个研究热点.目前算法可以分成两类:即闭形解和最小二乘迭代拟合。前者通常快而简单,精度更高,所需的对应点也更少.后者需要初值足够接近结果,以避免陷入讨厌的局部极小点并节约宝贵的计算时间.因此,本文研究了相机定标的闭形解.相机外参可以用外参矩阵(或者RT矩阵)E表示,它又可以分解成6个独立的参数

会议

虚拟现实纹理映射相机定标计算机视觉外参定标直接求解闭形解

基于启发式规则的多媒体主题信息挖掘

随着Internet的发展,web上信息呈爆炸式增长趋势,呈现方式也愈发多种多样,这就给多媒体内容的检索,信息提取等计算机处理带来了巨大困难.针对信息提取后,网页的多媒体内容的不一致性,该文提出了一种web网页多媒体信息提取的融合算法.该算法通过对图像和文本的语义的融合.判断通过信息提取后的网页中的各种形态的内容是否一致。对来自30个网站的307个网页进行测试后的实验表明.本文提出的方法是可行的.

会议

内容挖掘语义检索融合模型启发式规则多媒体信息提取

虚拟手的实现及其抓取概率

本文在对手的结构和运动特点进行分析的基础上,采用层次结构方法建立了手的几何模型;并针根据现实中手在不稳定状态下的抓取动作,定义了虚拟手在不稳定状态下的抓取规则,通过实例说明抓取概率的应用有效的提高了虚拟手的仿真效果。

会议

虚拟现实虚拟手抓取概率不稳定状态层次结构

面向行为分析的前景目标的持续检测

普适计算大环境下的计算机视觉处理包含运动检测和前景提取,目标跟踪,行为(事件)分析,现场存档和及时报警等多个相辅相成的步骤。前景目标的检测和提取是其中的第一个步骤。目前的运动检测和前景提取方法主要有时域模板法,高斯混合模型法,非参数核密度估计方法,光流法,Wallflower,贝叶斯分类法等等,但是它们都假设出现频率最高的像素亮度值为背景亮度值,从而无法对实际前景目标进行持续地检测。实验证明,这些

会议

运动检测前景分割背景减法行为分析计算机视觉目标跟踪

中文视频问答系统研究

文本文档的问答系统的研究已经取得了一定的成绩.但除了文本,其他媒体如视频,图像,音频中也存在大量有用信息,这对问答系统提出了新的机遇和挑战.视频问答系统是信息检索、自然语言处理、视频分割、语音识别等多领域的综合.对中文视频来说,要求更高.在本文中,我们提出基于中文视频问答系统的框架,对中文新闻视频的实验表明,我们提出的方法是可行的.

会议

中文视频问答系统信息检索视频分割自然语言处理自动语音识别

基于Web的中文新闻视频内容分析

与本文相关的学术论文