基于HMM的自动唱词定位系统的设计与实现

被引量 : 1次 | 上传用户:greatteset
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字幕唱词信息帮助观众对音视频内容进行理解,在音视频文件中有着非常重要的作用。本文针对唱词定位系统的要求和特点,采用基于隐马尔可夫模型(HMM)的训练算法,实现了可以在复杂背景噪声的情况下,从连续的音频信号中提取语音端点,并结合唱词进行精确定位最后生成字幕的自动系统。本文简要介绍了HMM在语音处理中的应用,并针对大词汇量,非特定人的汉语连续语音模型训练的特点,研究了系统中声学模型的构造和音频参数的选择,采用39维的MFCC参数和对音素建模进行汉语语音HMM模型的训练。在此基础上,利用唱词文件提供的字幕文本信息,将音素HMM模型前后级联成语句HMM模型,并采用令牌传递算法对音频句子进行分割,实现唱词与音频的对齐功能。最后实现了自动生成字幕的唱词精确定位系统,进一步验证了本文提出技术的可行性。
其他文献
城与文化如影之随形。中国古代历史名城经历了独特而漫长的历史发展道路 ,形成了东方城市文化的独异特色 ,为世界所瞩目。中国古城仿生学与西方的城市学是分属于两种学科体系
<正>食物不耐受的研究始于1905年,食物不耐受可引起各系统慢性疾病[1],发病机制与特异性IgG抗体的产生有关[2]。食物不耐受为许多疾病病因的确定又提供了新的方向和方法。目
指明了可靠性设计与试验的反复进行 (迭代 )是实现机械产品可靠性的一般途径 ,并具体说明了可靠性设计、设计技术、试验、预测和评估中的某些问题。
<正>宋元时期有一类酒具,内有机巧:杯底覆有一盖,作覆杯状,盖底镂空数口为注水口,盖顶亦镂一孔,盖内罩有一小瓷偶,头露于孔外,注酒则瓷偶升起,旋转浮舞于波光之中。今常称其
赏识教育是一种体现着人文关怀的、以人为本的新型教学理念,旨在通过教育工作者用赞扬、欣赏的方式去发掘、鼓励被教育者自身的潜能。从近年来关于赏识教育的研究来看,大多数
目的:探讨不同方法建立糖尿病肾病(diabetic nephropathy,DN)模型的差异,以确定建立糖尿病肾病大鼠模型的最佳方案。方法:清洁级健康雌性SD大鼠30只,随机分为3组,每组10只。A
<正>"镜头语言"是影视艺术的造型语言,它给人以直接的视听感受,具有非常强的艺术感染力。无论是哪种影视作品,都是由一个个镜头按照一定的规律剪辑而成的,这些镜头根据镜头语
<正>水彩画在绘画范畴上属于西方绘画艺术,是西方文化与西方文明长期发展的产物,水彩画最初传入中国是在18世纪,是西方传教士向中国传播西方教义的过程当中传入中国的。水彩
<正>在地理教学中只有使学生形成一种以创新的精神吸取、运用地理知识的性格,激发学生学习的主动性、灵活性,为地理问题寻找尽可能多的答案和解决问题的方式,才能培养出其创
<正>我国《刑法》第64条规定:“犯罪分子违法所得的一切财物,应当予以追缴或者责令退赔;对被害人的合法财产,应当及时返还;违禁品和供犯罪所用的本人财物,应当予以没收。没收