基于内容的多媒体课件检索的研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:bltong861
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几十年里,在线多媒体学术课件的应用取得了巨大增加,这些教育资源潜在地改变着人们的学习方式,而且随着文本检索技术和语音识别技术的日益成熟,如何更有效地在这些多媒体课件中找到感兴趣的资源也得到了研究者们的广泛关注。从国内外目前的研究工作来看,多媒体课件的检索还是处于起步阶段,大部分工作都是基于语音识别技术,通过挖掘语音文件中的音频内容来获得更多的有用信息,并尝试将一些文本检索的方法结合进来,从而提高检索性能。本次课题系统地讨论了语音检索过程中所要解决的主要问题,并提出了一些相应有效的算法,最后通过实验来对算法进行分析。具体工作如下:1)研究并对比当前针对语音文档检索的主要方法和关键技术,并分析了在语音检索过程中所要处理的主要问题。2)重点讨论了在语音文档检索中,语言模型和词表自适应的相关技术,并提出了一个基于n-gram上下文的语言模型自适应算法,为了减少不在词表中的词,本文提出了一个二级词表的策略,同时提出了一个新词发现的方法。3)结合索引点的时序位置,提出了一个基于后验概率的音频索引建立方法;并针对查询方式的不同,利用向量模型提出了两种相关性判断准则;为了处理词的OOV问题,提出了后验概率的子词索引表示,并利用基于词和子词的级联索引,提高检索性能;最后,又提出了两个音频索引的剪枝算法,用来去除索引中的冗余。4)基于HTK开发工具包,实现本文提出的语音文档检索模型,并通过大量的实验来对模型的每个过程进行分析。
其他文献
国学是我国优秀传统文化的精髓.国学社团既是学校素质教育的集中体现,也是促进优秀传统文化发展、传承的重要途径.技工院校是培养专业技术人才的主阵营,其社团的建设与发展则
大学英语CET4新题型中听力理解的分值由改革前的20%上升到现在的35%,且考试形式丰富、内容难度加深。本文拟从图式理论着手,厘清听力理解过程的“自下而上”(Bottom-up proce
在教学硬件和软件两方面都有很大提高的今天,学生的英语水平在不断地提高同时也出现很多的问题。本文对当前英语教学中存在的一些问题进行阐述并针对不同问题提出适当的改进
一、党章在党的生活中具有重要地位党章在党的生活中的地位,是由党章的性质、内容及其产生程序所决定的。从性质上说,党章是党的根本大法,是党的整体意志、利益和发展水平的
《通用技术》是一门新兴学科,相对于其他学科来说,它在生活实践方面的经验以及资源都相对较少.新课改在普通高中教学改革中收获了较好的效果,201 6年教育部针对高中教材修订
随着互联网技术的迅速发展以及WEB2.0技术的普及和大范围应用,对互联网海量数据的存储和读取已经成为诸多网络应用的重要负载。在WEB2.0应用的诸多文件格式中,Atom Feed应用
为了研究水稻发育的分子机制,我们利用γ射线对粳稻品种9522进行诱变,共诱变了3 000 g种子,M1代单株收种,M2代移栽5 963个株系于上海农科院.在M2代中筛选突变体,并在M3代中复
传统的呼叫中心主要针对电话用户进行服务,随着实际生活中语音网从传统单一向开放、互连的一体化网络的转变,传统呼叫中心已不能满足日益多样化的用户需要。本文使用软交换关
CCTV7上榜企业,山东卫视、《大众投资》、《现代营销·经营版信息版》、《创富指南》等媒体报道,客户满意合作对象……枣庄英才教育,圆您财富梦。英才教育让孩子轻松上大学,
信息物理系统(Cyber-Physical System,CPS)被定义为提供计算、网络和物理过程的集成的系统。CPS领域已被确定为研究的一个关键领域,预计CPS将在未来系统的设计和开发中发挥重要作