基于联邦学习的声纹识别技术研究

来源 :王阳谦 | 被引量 : 0次 | 上传用户:guannipishiwori
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹识别是一种根据语音特征自动识别说话人身份的识别技术。基于概率统计的声纹识别方法和基于深度学习的声纹识别方法是目前的主流研究方向。这两类方法在模型训练阶段都需要大量语音数据参与训练,然而语音数据中常包含能够反映说话人身份相关的语音敏感特征,如口音、音调等。在《个人信息保护法》等隐私保护条例的推行下中心化的模型训练方式将变得不可行,因此当前的声纹识别研究面临数据稀缺和隐私保护的挑战。考虑到联邦学习能够在保护数据隐私的前提下,缓解机器学习模型中的数据稀缺问题,本文设计了基于概率统计和基于深度学习的两种新型联邦学习声纹识别框架。在基于概率统计模型的声纹识别方法中,本文提出的基于高斯混合模型的联邦学习声纹识别框架(Federated Speaker Verification based on GMM-UBM,Fed GU)可以在保证声纹识别精准度的前提下缓解模型参数传递过程中导致的隐私泄漏问题。在Fed GU中,我们首先设计了一种针对声纹识别场景下的语音数据脱敏方案(Selecting and Hiding Sensitive Informaton,SHS),该方案可以从语音数据中选择并隐藏语音敏感特征。其次,在对客户端语音数据进行脱敏后,中央服务器协同客户端共同构建声纹识别背景模型(Universal Background Model,UBM)。最后,各客户端接收中央服务器模型参数并进行本地模型参数的自适应学习,从而得到该客户端的声纹识别模型。在基于深度学习的声纹识别方法中,本文首先通过实验验证了在声纹识别场景下语音异构数据会对传统联邦学习的精准度带来负面影响。其次,针对以上问题本文提出了基于端到端的联邦学习声纹识别框架(Federated Speaker Verification based on End-to-End Architecture,Fed ETE),该框架可以缓解因数据异构导致的声纹识别精准度低的问题。在Fed ETE中,我们设计了一种新型的局部数据自平衡模块(Local Data Rebalance,LDR),该模块通过对客户端训练顺序进行重新排列以构建一个偏向性更低的虚拟数据集,从而缓解局部数据的异构程度提升声纹识别的精准度。
其他文献
本文以丁日昌治理江苏官吏因循疲玩为中心,对丁日昌整治官吏“因循疲玩”的方法和措施进行探索,以挖掘丁日昌江苏吏治实践过程中展现社会治理精神,为当今国家治理体系现代化提供某些历史借鉴。“因循疲玩”这一政治生态“顽疾”在中国古代普遍存在并逐渐演变为一种官场文化,这种官场文化在晚清官场政治中尤为司空见惯和肆虐蔓延。从字面上理解“因循疲玩”即指官员的懈怠玩忽,具体表现就是欺上瞒下、敷衍推诿、因循苟且。作为地
学位
論文主要依據最新出版的唐代墓誌文獻,分爲四個部分進行整理與研究。第一部分爲墓誌釋文,以《河洛墓刻拾零》、《秦晉豫新出墓誌蒐佚續編》兩部拓片集爲材料來源,對初盛唐卒葬墓誌進行釋文,以期補充初盛唐石刻文獻的整理工作。《河洛墓刻拾零》出版於2007年,收錄墓誌拓片509幅,其中唐代墓誌430方;《秦晉豫新出墓誌蒐佚續編》出版於2015年,收錄唐代墓誌拓片770余幅。兩部拓片集所著錄墓誌均多爲民間發掘和收
学位
随着经济发展,人类对矿产的需求越来越大,对矿山的开发活动也越来越频繁,这就产生了大量的废石、废渣和酸性矿山废水,严重危害了生态系统,给人类健康带来重大威胁。在酸性矿山环境形成的过程中,铁的氧化与还原在其中扮演了一个重要角色。本论文以一株分离自安徽铜陵狮子山酸性矿山环境中的铁还原菌AMDY2-9-2为研究对象,对其还原Fe(Ⅲ)的特性进行研究,并利用iTRAQ技术对其在有铁和无铁环境下蛋白质组进行研
学位
“一带一路”倡议体现了中国继续敞开对外开放大门的决心,是中国在发展新阶段对外开放的升级和深化。现有的国际争端解决机制主要是西方发达国家主导的产物,在解决政府间争端、投资争端和普通商事争端中都有不足。“一带一路”建设和发展需要一套行之有效的争端解决机制保驾护航,中国主导并参与“一带一路”专属的争端解决机制符合我国作为“一带一路”牵头国的地位。“一带一路”争端解决机制并无可以完全复制的先例,新的争端解
学位
中国古代对于《论语》“君子怀德,小人怀土;君子怀刑,小人怀惠”的解读,既有解为“以位言”,也有解为“以德言”。就“小人怀土”“小人怀惠”而言,“以位言”的解读实际上并不反对百姓“怀土”“怀惠”;而在“以德言”的解读中,虽然都讲君子小人的对立,但皇侃《论语义疏》只是反对“唯安于乡土”、“唯知安利惠”,邢昺《论语注疏》只是反对“唯利是亲”,尤其是,朱熹《论语集注》“以德言”的解读明确反对“溺其所处之安
期刊
近年来,科幻逐步成为热门话题。科幻元素从影视、建筑、游戏等方方面面渗入人们的生活。艾萨克·阿西莫夫,俄籍美国人,是著名的科幻小说作家和科普作家,一生著书500余本,享誉四方。自1980年起到目前为止,他的科幻作品在中国的译介历经四十载,影响深远。他在科幻界具有深刻的影响力,却鲜有人开展对其作品的研究;就翻译学领域而言,近年来仅有一篇硕士论文。基于科幻热门和科幻作家作品研究冷门的情况下,本文应运而生
学位
针对传统测绘技术存在耗时长、误差大等缺点,提出将GPS-RTK技术应用于某公路工程测量,利用GPS-RTK技术进行工程的四等GPS控制网测量、四等水准测量和地形图测量,并进行实测数据质量分析。结果表明:GPS-RTK技术测量所得数据精度均小于规范限制,将GPS-RTK技术应用于公路工程能够显著提高测量精度和工作效率;GPS-RTK技术应用于地形图测量的平面互差小于50 mm,高程互差小于100 m
期刊
连续运行参考站(Continuously Operating Reference Stations, CORS)系统观测数据的质量直接影响其网络差分定位(Network RTK,NRTK)服务的性能,因此,有必要对其进行评价与分析。本文利用TEQC(Translation Editing and Quality Checking)软件对昆明市卫星定位综合服务系统(简称KMCORS)22个基准站,2
期刊
随着物联网技术的发展和应用,越来越多的智能设备被接入到了网络边缘。但其中不少智能设备受限与电池容量与硬件成本,往往缺乏足够的计算能力,为了解决这个问题,移动边缘计算(Mobile Edge Computing)应运而生。移动边缘计算作为云计算的拓展,将资源与服务从远离终端用户的云计算中心下放到更接近终端设备的边缘基站,从而辅助终端设备更快地完成计算任务,并有效降低服务的访问时延。然而受限于边缘基站
学位
光束扫描技术在激光雷达(Light Detection and Ranging,LiDAR)、卫星光通信、三维成像等众多前沿的科技领域中具有广泛的应用前景。近年来,随着大规模集成硅光子学制造工艺技术水平的快速提高,集成硅基光学相控阵光束扫描技术由于其体积小、稳定性好(无机械运动)、成本低等优点逐渐成为研究的热点。作为光学相控阵中光的发射单元,发射光栅天线对光学相控阵的性能起到至关重要的作用。然而由
学位