汉语连续语音数据库的语料设计

来源 :声学学报 | 被引量 : 0次 | 上传用户：eidolonfish

【摘要】

：

质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持．在目前阶段，汉语语音数据库应限制在朗读言语

【作者】

：

祖漪清

【机构】

：

中国社会科学院语言研究所!北京，100732

【出处】

：

声学学报

【发表日期】

：

1999年03期

【关键词】

：

连续语音语音识别系统语音合成系统三音汉语语音共振峰音联声学特征语言学知识描写语

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持．在目前阶段，汉语语音数据库应限制在朗读言语（readspeech）的音段方面。为了描写语流中的音变现象，考虑如下语音单元：（1）不计声调的音节（401个）。（2）音节间的双音子415个。（3）音节间的三音子3035个，这是根据37个基本音子，利用音节间共振峰过渡的研究结果，按规则规纳的结果．（4）所有音节间过渡段的韵母一声母结构，采用和同三音子相同的归并方法，共781个．为了增加不同的韵律结构，并考虑语音识别系统的后处理，语料还包括汉语的17类基本句型．选用1993、1994两年的“人民日报”、“百家报刊精选”及若干电视剧本、词典词库作为语料库的原始语料，从中选出2185个句子和388个短语作为朗读语料，它们覆盖了99．8％个无调音节，100％的双音子，99．6％的三音子，以及17类句型。 Good quality speech recognition systems or speech synthesis systems require the support of high-quality, scientifically sound, concise and effective continuous speech databases designed under the guidance of phonetic and linguistic knowledge. At this stage, the Chinese phonetic database should be limited to reading segments of readspeech. In order to describe the phonetic variation in the speech stream, consider the following phonetic units: (1) Silenced syllables (401). (2) Two syllables between syllables 415. (3) Three syllables between syllables, 3035, based on the results of the study, based on 37 basic sonotropes, using formant crosstalk transition studies between syllables. (4) The vowel consonant structure of all the transitions between syllables adopts the same merge method as that of the same three tones, a total of 781. In order to add different prosodic structures and consider the post-processing of the speech recognition system, the corpus also includes 17 types of basic sentence patterns in Chinese. The author selects 2185 sentences and 388 phrases as the reading corpus from “People’s Daily”, “Selected Best Newspapers and Periodicals” and several TV scripts in 1993 and 1994. The dictionary dictionary is used as the original corpus of the corpus. 99.8% toneless, 100% dual tone, 99.6% tri-tone, and 17 patterns.

其他文献

当前城镇社区发展面临的主要问题及对策

近年来,我国城镇社区发展很快,各种类型的新兴城镇社区蓬勃发展,以社区为单元的城镇公共服务设施建设逐步完善,社区的自治精神不断提升,社区资源优势受到重视并得到积极开发

期刊

城镇社区理性审视社区资源服务设施居住小区社区管理体制社区居委会社区自治组织社区公共事务工作专业化

女强人权——印度彩色故事片

赴英国留学的西登岚,学成回国后,接替父亲纳拉亚恩,使他经营不善的一家公司一跃成为国内首屈一指的实业公司,并以她的芳名命名。优越的社会地位,使其染上独断专行、骄奢蛮横

期刊

拉亚社会地位拉姆公司合并拉什则奸民斗争到底轧伤收网达里

毛主席像版画

“文革”藏品因其独特的历史背景受到收藏界的重视。毛主席像章、“文革”邮票、语录粮布票、小红书、毛主席著作等成为人们收藏的热点。近日,笔者收集到一本64开的《毛主席

期刊

一本历史背景出版单位延安整风文艺战线印刷物人物形象中学时代历史时期

一切都在他心里——访韩刚

在全国各电视台竞相播出电视连续剧《宰相刘罗锅》,该剧后20集导演韩刚的名字频频出现在电视荧屏上之后,23集电视连续剧《咱爸咱妈》在中央电视台黄金时间的播出,又使导演韩

期刊

电视荧屏北京电影学院金虎奖刘罗锅商业片电视观众欧登塞历史题材国际电影节平民意识

3Cr2W8V钢球轧辊表面激光淬火的工业应用研究

采用大功率CWCO_2激光器对轧辊表面进行激光淬火的工艺流程,延长轧辊使用寿命2倍。 Using high-power CWCO_2 laser surface of the laser laser quenching process, extend

期刊

激光淬火轧辊表面轧辊使用激光器工件表面调质处理硬化层热轧工艺钢球轧制辊耗

合资企业注册资本的“水分”

法定注册资本金是合资企业设立的最基本条件。按规定,投资者可以用货币投资,亦可用实物、非专利技术等作价出资,但必须足额缴纳公司章程中规定的各自所认缴的出资额。而最近

期刊

企业注册资本合资企业欺骗手段违反合同银行贷款机器设备注册资金验资国际市场行情汇款人

固体深层渗硼

本文介绍了用自行研制的固体粉末深层渗硼剂对45钢进行渗硼,再经扩散处理,可分别获得560μm和660μm深的渗硼层。进行了组织和相结构分析,并简要介绍了耐磨性能。 In this p

期刊

渗硼粉末渗硼深层扩散处理耐磨性能浅层渗层渗层深度结构分析渗剂

膜隔电解法处理硝酸—氢氟酸酸洗废液试验

我所用HF-HNO_3酸洗合金材料后有大量废液,废液中残酸高达19.4克/升(以HF计),镍高达6.4克/升,铬高达7克/升,钴高达0.65克/升,铁高达18.9克/升,为了保护环境,治理三废,我们对

期刊

酸洗废液电解法处理隔膜电解离子交换膜残酸氢氟酸试验研究酸洗合金硝酸

费雷罗

服装球衣型号: Sergio tacchini Iorans polo球裤型号: Sergio tacchini Iubin材料:100％纯棉颜色:白/黑/蓝优点:易于吸汗,使球员在比赛中始终保持清爽。球裤有加强的腰带

期刊

费雷罗球感

1999:深圳经济迎接新挑战

刚刚过去的１９９８年是世界经济形势变幻莫测的一年，“亚洲金融危机”成为经济界使用频率最高的词汇之一。这场危机使得全球经济前景显得扑朔迷离，国际货币基金组织和世界银行频繁地调

期刊

金融危机需求不足外向型经济世界经济形势特区经济全球经济前景市场潜力世界经济格局经济增长目标战略地位

汉语连续语音数据库的语料设计

与本文相关的学术论文