中文口语理解中关键语义类模糊匹配方法的研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:zhengwwwchao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对人机交互过程中语音识别引起的发音变异以及用户表达关键信息不完整情况,提出一种模糊匹配方法.该方法分两步,第一步,通过条件随机场进行序列标注,定位查询语句中的关键语义概念,并得到其初步类别;第二步,利用几种相似度计算方法,寻找与领域词典中发音相似度最大的字符串对错误的语义概念进行替换,并标注出具体类别.另外针对最优模糊匹配结果不一定满足用户需要,进行了多个候选的实验.实验结果证明:无论使用哪种相似度计算方法,基于拼音的模糊匹配方法比基于字的模糊匹配方法在语音识别的文本上都具有更好的性能,而且在多候选的结果上也仍旧适用,说明该方法对于提高口语理解系统的鲁棒性上是有效的. Aiming at the variation of pronunciation caused by speech recognition in human-computer interaction and the incomplete information of key information expressed by users, a fuzzy matching method is proposed in this paper. The method consists of two steps. In the first step, The second step is to search for the string with the most similar pronunciations in domain dictionaries and replace the wrong semantic concept with the specific category by using several similarity calculation methods. Experimental results show that, regardless of which similarity calculation method is used, the Pinyin-based fuzzy matching method is more effective than the word-based fuzzy matching method in speech recognition Text has better performance, and still applies to the results of multiple candidates, indicating that this method is effective in improving the robustness of the spoken language comprehension system.
其他文献
近年来,氧化物薄膜晶体管(Thin-film transistors, TFTs)凭借着高电子迁移率、低成本、与柔性衬底兼容性好且能大面积生产、透光性能良好等优势,引起了广大研究者的兴趣。在众多
在非线性系统的状态估计中,不同测量值采样频率不同、过重的计算负荷和某些关键量的测量延时等原因会导致不完全量测现象的出现,非线性滤波算法中如何有效利用不完全量测信息
档案是历史的见证,是客观真实的第一手史料,也是编史修志的原始资料,“为党管档、为国守史、为民服务”是档案工作者职责所在。做好档案保护工作,才能为国家守住历史。纸质档
瘟疫是导致人类大量死亡的烈性传染病,是人类健康的大敌。所谓“疫,民皆疾也”,即是古人对瘟疫的客观描述。在明代,江西地区瘟疫多发,对当地社会经济产生了深刻的社会影响。
<正> 遗貌取神 作画要求“形神兼备”,但在中国画论中提到“遗貌”,不是不要形象表面的特征,只是意味着在造型艺术上,不拘泥于外表的形状。京戏表演,舞台上不设门,只凭演员的
期刊
一座成功的桥梁设计必须自然、简洁、新颖,并与周边环境协调。美观不是桥梁的附属品,而是桥梁设计中不可或缺的一部分。在桥梁的概念设计阶段,必须将结构外形与美学有机结合
目的:建立了同时测定鸡肝中磺胺嘧啶、磺胺甲基嘧啶、磺胺二甲氧嘧啶及磺胺对甲氧哒嗪等8种磺胺类药物的高效液相色谱检测方法,比较和优化了提取及色谱条件。方法:样品经乙腈
随着现代科学技术的日新月异,电力系统的规模逐渐壮大。在电力系统中,配电网的安全可靠运行有着举足轻重的作用。近年来配电网中电缆线路使用的越来越多及架空线路持续加长,
认知无线电的提出为当前频谱缺乏问题提供了一种有效的解决方法,近几年来认知无线电已经成为最热门的研究领域之一。频谱感知是认知无线电最关键的技术,是实现认知无线电的先决
发光二极管(Light-Emitting Diode, LED)与传统的光源相比,具有节能、高效率、低压、高可靠性、长寿命等一系列优点,已广泛应用于显示、指示和照明等领域,是提倡低碳生活的首选