面向会议场景的声纹识别技术研究与系统实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:shuangsssss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的会议记录方式存在记录时间周期长、记录内容不准确、难以分辨说话人等问题。在机器学习迅速发展的今天,利用机器学习技术改进传统的会议记录方式,并通过对会议语音的智能记录,最终形成准确的会议记录报告。这种新的会议记录方式满足了会议场景下对会议记录的诸多要求,将具有非常大的实用价值与市场竞争力。立足于此,本文采用声纹识别技术实现对会议的智能记录、研究并开发面向会议场景的声纹识别系统,本文工作简述如下:一、研究声纹识别系统的基础理论:首先,研究声纹识别系统的基本概念、发展历史、基本步骤、基本特点;其次,研究声纹识别系统目前的理论研究进展和系统开发进展,为下文提出的两种算法与系统开发提供理论依据和开发指导。二、研究小样本条件下准确声纹识别算法:首先,研究会议场景下小样本训练产生的原因,并分析小样本训练存在的问题;其次,提出新型特征提取方法和基于会议场景模型训练方法用于小样本条件下提高系统识别准确率;再次,将算法融入到声纹识别系统中,并介绍算法的执行流程;最后,对算法的有效性进行验证分析,为小样本条件下实现准确的声纹识别目标提供理论依据和实际开发指导经验。三、研究强噪条件下可靠声纹识别算法:首先,研究会议场景下噪声的来源及特点,并对会议噪声按其特点进行分类;其次,提出新型分类噪声去除方法和会议背景噪声学习补偿方法用于去除会议噪声;再次,将算法融入到声纹识别系统中,并介绍算法的执行流程;最后,对算法的有效性进行验证分析,为强噪条件下实现可靠的声纹识别目标提供理论依据和实际开发指导经验。四、开发并实现智能会议记录系统:首先,对智能会议记录系统进行需求分析;其次,介绍系统的架构,并在此架构基础上,分别阐述终端侧模块、通信模块、服务器侧模块的具体实现流程;最后,对系统功能、系统性能进行多方面的测试验证其实用性和功能性。
其他文献
新世界的人类现在基本依靠的是信息时代中高科技来生活,而处于这样一个庞大的市场竞争之中,直接影响到企业生存与否的关键就是其技术水平好坏。而针对这一点,这篇文章就企业
医疗机构是在发生突发公共卫生事件时提供医疗和心理服务的关键场所,其应急能力的强弱直接关系到整个防治突发公共卫生事件的成败。对各级医疗机构目前突发公共卫生事件应对
生物质能源是一种清洁能源,燃烧排放的二氧化硫、氮氧化物等污染物很少,但大量燃烧依然会对环境造成一定的影响。鉴于当前国内缺乏生物质燃烧相关标准,本文主要介绍了典型生
分别控制5.0 m3/h、3.5 m3/h两种通气水平下进行L-色氨酸分批发酵,考察了两种通气水平下谷氨酸棒杆菌HYH3-1发酵过程参数变化。实验结果表明,当通气量为5.0 m3/h时pH变化幅度
任何危机在发生之前,都会出现某些预兆。财务危机也不例外,在其发生之前,会在生产经营及财务管理方面,出现一些异常现象。本文仅对企业发生财务危机前,从生产方面、经营方面、销售
塔河油田奥陶系碳酸盐岩油藏主要以裸眼方式完井,并通过裸眼封隔器和悬挂127mm尾管实现裸眼井分段试油,同时采取了打水泥塞、填砂+投灰、丢手裸眼封隔器+打水泥塞等方法在裸眼井
目的研究雌激素对去卵巢(OVX)大鼠学习记忆功能及海马神经元的保护作用。方法切除雌性SD大鼠双侧卵巢制作OVX大鼠模型,给予雌二醇(E2)200μg/kg(OVX+E2组)皮下注射,每周2次,共5周。
<正>在淡水池塘养殖中,水质的优劣往往可从水色上看出来,而水色的好坏又可通过浮游生物的种类、有机溶解物、悬浮颗粒的多少等因素体现出来。在养殖生产的全过程,广大养殖者
目的观察丹红注射液联合舒血宁治疗急性脑梗死的疗效。方法选取我院2008年2月—2011年1月急性脑梗死患者148例,随机分为A、B、C 3组,3组患者均给予相同常规治疗。A组患者用丹
目的了解过敏性鼻炎(AR)对独生子女人格的影响。方法应用明尼苏达多相个性调查表(Minnesota Multiphasic Personality Inventory,MMPI)调查分析独生子女AR患者35例,并与非独