王宁敏:嘈杂世界的声音捕手

来源 :方圆 | 被引量 : 0次 | 上传用户:jin226330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  与检察机关的控诉职能相适应的,王宁敏常做的项目叫“说话人同一认定”,也就是狭义上的“声纹鉴定”,其鉴定意见常成为检察机关作为呈堂证据的关键
  
  警匪片常有这样一组经典镜头,在一个看似天衣无缝的杀人犯罪现场,黑暗的场景,红色的鲜血舒张画面,警察多天侦查仍苦于无法找到犯罪证据;而后,几枚淡化于肉眼之外的痕迹成了破案的关键;他们在犯罪现场找到并提取了这几枚指纹,带回实验室,一一比对,结果显示,凶手就是之前怀疑的某某某。
  每个人都拥有与其他人不同的指纹,代表了人的独特的身份特征。但是,指纹可以伪造,例如再贴上一层指纹,或者干脆把手指上的这一层层脉络去掉。但还有一种东西也是每个人独一无二的特质,并足以验明犯罪嫌疑人身份。
  那就是人的声音。
  8月30日,《方圆》记者采访了最高人民检察院检察技术信息研究中心高级工程师王宁敏,了解声音的秘密。
  王宁敏是一位声纹鉴定专家。声纹鉴定的关键,就是在嘈杂的世界里捕捉说话人声音的细节,而且灵敏度要高,因为它们或是说话人某种特别的语音特征,如他的鼻音、赘语等,或是他说出的某些字的音节,与检察机关所掌握的语音材料暗合,等等——这些细节,往往存在于几分之一秒内。
  
  声纹鉴定击破“零口供”
  2009年底,王宁敏曾经接到过一个来自湖南常宁的求助电话。
  “这是一起走‘极端’的‘两无’案件,要么无罪释放,要么按照其贪污金额有可能达到无期徒刑。”该办案人员表示。之所以“两无”,是因为关于贪污的所有关键证据都已经被当事人销毁,而案情又只涉及两个人,即使另一位涉案人认罪,没有其他证据佐证,也难以认定贪污行为。 贪污金额达到100万可能达到无期徒刑,但没有证据,嫌疑人将被无罪释放。办案人员一下陷入困境。
  涉案犯罪嫌疑人郭衡峰是湖南省常宁市财政局经济建设股原股长。2008年年初,南方地区遭受了严重的冰雪灾害,湖南是受灾地区。于是,常宁市政府对受冰雪灾害影响较大的企业实施灾后重建补助。而补助款的审核大权就落在郭衡峰手上。这是一项数千万元的基建专项资金和国债专项资金的审核权。
  郭衡峰在审核有着10万元的补助指标的常宁市某民营自来水厂时,虚列其他单位的补助项目,并向该厂法人代表雷延生称,“这些项目虽有补助指标,但是没有公存账户,需要通过你的水厂的账户领取补助资金。”
  雷延生当然知道这意味着什么,于是,他填写了虚假的财政拨款申请书和用款计划表。
  随后,郭衡峰仿冒、骗取有关负责人签字,从2008年7月至12月,分5次共计拨款100万元到该民营自来水厂。
  事实上,这100万元中没有一分钱出现在这家自来水厂的账目中,其中的90万元现金分别由郭衡峰以借条、借款的形式陆续提走,余下的10万元现金,则以“过道费”的名义留在雷延生处。
  据办案人员统计,自2008年7月至12月,郭衡峰分别从重建基金中贪污近100万元。
  但是,自2009年2月接到对郭衡峰的举报,调查一开始便陷入僵局。对于侦查人员的讯问,郭衡峰始终没有回答;对于该案的证据,早被郭衡峰销毁——从雷延生那儿拿到灾后重建的基金后,他称有关负责人安排他帮助雷延生将自来水厂的账目“平账”,将雷延生手中的借条取回,付之一炬。
  于是,虽然本案案情清晰,雷延生也认罪,但对郭衡峰的贪污行为的指控却证据不足。
  此时,常宁市检察院反贪局侦查人员从雷延生处得知,他曾经与郭衡峰交易时保存了一段通话录音,就存在自己的手机里。
  很快,办案人员就获取了雷延生手机中保存的通话录音,并将录音送至最高人民检察院司法鉴定中心司法语音及声学实验室。
  王宁敏及其工作团队通过对送检语音材料反复语音辨听和视谱分析,对该录音真实性作出了认定——手机里的电话录音未经过剪辑。录音内容则证明了郭衡峰虽已从该民营自来水厂收回了借条原件,但并未归还“借款”。另外,检察机关也通过技术鉴定证实了借条复印件的字迹为郭衡峰的字迹。
  于是,办案人员将声纹鉴定资料及其他资料一同交到法庭。2010年1月,湖南省衡阳市中级法院经审理认为,郭衡峰以借条形式“借”走90万元,在没有归还的情况下又将借条收回并销毁,明显具有非法占有的目的,贪污罪名成立,一审判处其有期徒刑十五年,郭衡峰没有提出上诉。
  最终,这单“零口供”案终于被一份声纹鉴定击破。
  
  “半路出家”学声纹鉴定
  声纹鉴定,又叫司法语音及声学检验,有广义和狭义之分,狭义上仅指说话人同一认定,广义则包括了语音同一认定、降噪和提高语音性噪比、语音资料真实性识别、噪音分析和语音人身分析。在郭衡峰案件中王宁敏他们所做的就是“语音资料真实性识别”这个项目。
  其实,王宁敏对声纹鉴定的研究是“半路出家”。
  1996年《刑事诉讼法》修改,将法医活体检验鉴定的工作规定为省级人民政府指定的医院实施,之前在最高人民检察院从事法医活体鉴定的王宁敏“失业”了,接手了那时刚起步的声纹鉴定。
  谈及“声纹”,王宁敏告诉《方圆》记者,“声音具有相对稳定性和个人特异性,它也可以像指纹一样作为个体特异的标识,而目前声纹鉴定的确率能达到99%以上。”
  1962年,美国贝尔实验室的物理学家克斯塔于《说话人鉴定》中首先提出“声纹”概念,它是人发音器官解剖学和言语习惯的生理心理动力定型。声音的相对稳定性和个体差异性使其成一种认定个体同一的有效方法,与“指纹”类似,故称为“声纹”。
  声音只能听,但“声纹”,其实像指纹一样能够被看见。通过声谱仪显示,“声纹”如湖面上粼粼的波纹,只是有的“波纹”被拉长并且排列紧密,一深一浅如夕照之下湖边的树影和湖面反射的光亮;有的“波纹”则被压扁,并延绵成峰。
  王宁敏每天的工作就是,把耳朵沉入这些嘈杂陌生的声音世界,眼睛直盯着电脑屏幕里声音图谱进行分析。而分析的依托则是VS-99工作站。
  王宁敏打开这个工作站,向记者介绍“声纹”。“它是语音声波的多种声学特征图谱的集合,是通过声谱仪显示的、携带言语信息的语音声波图谱的通称,有带状谱(包括了宽带、窄带)、曲线谱、线状谱和连续谱、分离谱等。”王宁敏说。
  “人的声音的个体特异性则来自我们的生理特征和后天的成长环境。”王宁敏接着解释道。
  生理特征指的是,我们除了青春期、老年期等的生理性变嗓,或者因为声带损伤等带来的病理性变嗓外,个人语音变化是缓慢的,几乎没有趋向性变化;另外,人的呼吸系统、发音器官的生理结构,如声带生理结构(长度、厚度、张力等)、声道生理结构(长度、截面积)及其状态,在一定时间内也不会发生显著变化,尤其是在发育成熟后的相当长时期内稳定不变。
  并且,由于对人的语音特征的形成起决定作用的是发声系统的解剖学形状和发音方法的动态个人特点,不同人的呼吸系统、发音器官的生理结构及其机能不可能完全相同,再加上后天的作用,就会产生不同的语音特征和言语习惯特征。这就是个人语音特征的特殊性。
  王宁敏说,“但也正是因为稳定与个人特殊性都是相对的,与指纹、DNA等稳态特征的研究不同,声纹鉴定更复杂,研究和应用关键在其自身内在的特点和规律上。”
  不过,高检院的声纹鉴定专业开展得比较早,在当时检察系统已是先例,也是全国司法鉴定领域的前沿。至今,王宁敏及其实验室共鉴定案例200余件,承办和会检了多起全国有影响的案件。
  
  声音捕手
  在声音的世界里,声纹鉴定犹如林中小兔竖起两只耳朵捕捉敌方的信息,敌人的声音夹杂在森林的沙沙风声及其他声音中,稍纵即逝,关键就在于细微处声音与声音的区别。
  王宁敏就是嘈杂世界里的声音捕手。
  我们都有这样的经验,接起电话时听到对方的声音,如果是自己熟悉的人,则能准确猜出对方是谁。在司法实践中,这种通过听陌生人的声音判断其性别、年龄、长期生活的环境的技术,叫语音人身分析。
  王宁敏介绍道,这种技术是利用方音、方言、语调、词汇、语法、口头语、职业用语等语音声学特征和言语习惯特征,对未知说话人进行人身状况分析,从而推断未知案犯的性别、年龄、生活地域、职业和文化程度等。
  不过,语音人身分析其实在王宁敏的工作中很少遇到,因为检察机关与公安机关职能不同,它主要是公安机关为侦查所需而进行的工作,如为侦查提供方向或缩小犯罪嫌疑人范围。
  与检察机关的控诉职能相适应的,王宁敏常做的项目叫“说话人同一认定”,也就是狭义上的“声纹鉴定”,其鉴定意见常成为检察机关作为呈堂证据的关键。
  “这部分工作占了我们工作团队所接受案件中的70%。”王宁敏说。
  说话人同一认定即是指,利用声谱仪对未知话者语音材料(检材)与已知话者语音材料(样木)进行听辨、声学分析、言语分析的比对检验和综合评断,作出两者是否同一结论的过程。
  最近,王宁敏及其工作团队刚用了一个半月做完一起“系列佯爆”案。犯罪嫌疑人李峰(化名)在过去半年的时间里打了数次110报警电话,称某经营场所有炸弹,让公安机关迅速去排查。公安机关屡次赶到现场并疏散人群,但都寻找炸弹无果。
  后来,再次接到李峰的报警电话时,公安机关怀疑李峰为佯报险情,通过警方排查险情达到破坏谎报地生产经营的目的。于是将该案的唯一证据——李峰拨打的110的报警录音送到王宁敏这儿,通过声纹鉴定看这数次的报警是否均为李峰所为。
  王宁敏他们拿过公安机关送来的录音一看,发现这是九份检材音频和一份样本音频,在过去的半年里,发生了九起报警,都是声称同一地点有炸弹,让警方去排查。但是报警人有时带方言口音,有时故意加快或减慢语速,单听声音并不能马上判断是不是同一个人。
  对于这份该案的唯一证据,王这敏非常谨慎。
  她和鉴定人李佳首先进行听觉检验,把录音通过VS-99语音工作站清晰地放出来,辨听说话人的声音有没有伪装,以及寻找声音里的个人语音特征。
  接着进行视谱比较,通过VS-99工作站将音频制作成图谱,观察分析检材和样本中说话人的频谱特征,进行视谱鉴别及定量分析检材与样本的相同语音材料(语句、短语、语词、音节、音素)的语音声学特征和声学模式,作出相似或差异程度的评价。
  王宁敏介绍道,他们一般通过至少三种图谱分析,韵律特征图、宽带语图和光标间功率谱。“在这些图谱里,在某个音节是多少分贝(表示音量)、多少赫兹(表示声调)都可以测量出来,不仅具体到说话人说的每个人句、词、字,而且必须细化至每个字的每个音节。”王宁敏说。
  也就是说,声音捕手必须足够灵敏,因为需要捕捉的不是句、词或字,而是字中的音节。
  接着,王宁敏说,“把它们的共振峰参量、振幅曲线参量、基频曲线参量、音节时长、长时平均功率谱参量(30秒以上)、长时平均声调参量等均测量出来,检材与样本一一比对,当两个声音的差别落在特定标准(SPPD-A-1-2008)的某一个范围内时,就意味着声音发自同一个人,得出两者语音同一的结论。”
  在这些严格的定量检测下,综合分析结果显示,这九次报警声音具有同一语音的声学特征,均指向该犯罪嫌疑人李峰,报警录音被作为本案的唯一证据在法庭上公诉。
  
  从“捕手”到“教授”
  除了上文的语音同一认定,“降噪及提高语音性噪比”这个项目也占了王宁敏他们的工作较大部分。
  顾名思义,工作的内容是对环境噪音进行降噪,对微弱语音进行增强处理,但是,对噪声的处理则常常是枯燥、烦闷的。
  王宁敏他们需要的是在这些噪声中保持高度的灵敏度,并且因为案件期限的限制,每份声纹鉴定都赶着完成,她曾经处理过来自沿海某地检察院送来的录音资料,就是在规定的两周内,没有休息过一天,甚至在实验室加班至十二点。这一份四个多小时的音频,降噪需要细化至每个字、每个字里每个音节,甚至还必须具体到音节里的韵头、韵腹和韵尾,将它的噪音去掉,而对需要的声音进行加强。
  在王宁敏所在实验室,这五个项目均获得国家认可的。2008年她作为司法语音及声学检验专业技术负责人和授权签字人,起草并制定了司法语音及声学检验的作业指导书、鉴定文书、设备评估报告、实验管理制度等文件,也带领本专业人员完成其他需认可的工作,最后,王宁敏所在的声纹鉴定专业成为国家实验室认可的专业。这在全国检察系统是首次,在高检院的专业里,和法医、文证专业也是第一批。
  2010年,高检院的司法鉴定中心被评为国家级司法鉴定机构,王宁敏及其团队成了声纹鉴定的“国家队”。
  早期,捕手仅为捕手,声纹鉴定只是一门技术,但现在,它已发展为包含司法语音和司法声学的综合性学科,司法语音学部分的语音人身分析以及语音同一认定,还有司法声学的内容,如降噪及提高语音性噪比、录音资料真实性识别和噪音分析等。
  最近,王宁敏及她的团队刚完成一项科研突破,“利用声纹鉴定技术进行音频信号传输设备性能检测的运用”,同时也申报了2011年高检院检察技术信息研究中心“运用声纹鉴定技术对音频信号传输效果定性、定量分析的检测方法研究”重点科研课题,王宁敏担任项目负责人。
  这个研究是利用声纹鉴定技术,通过定性、定量分析的方法,对传输前后音频信号进行比对,找出受到影响的音频信号参数,以此建立起评价音频传输效果的指标。
  因为,长期以来,检察机关信息化建设中对音频、视频传输设备的选择都是依靠人耳听觉分析,具有很强的主观性和不稳定性,这项研究则是将声纹鉴定技术应用于涉及有关语音仪器的检测项目中,用“数据说话”成功地选择了竞标仪器。
  责任编辑:张羽
其他文献
关于3G最新的消息是来自法新社对中国移动的一则报道。报道称,中国移动将在今年10月底前全面推出基于TD-SCDMA技术的3G服务;计划将追加投资150亿元人民币大面积组建TD-SCDMA网
如果只追求醋的“酸味”,那么用冰醋酸来勾兑,更加简单快捷。醋的价值只是调味,只要不那么追求“风味”,合格的勾兑醋与酿制醋,至少安全性上并没有差异    山西醋产业协会副会长王建忠最近踢爆了一个“醋坛子”——目前市场上95%的山西陈醋是勾兑醋。真是“你方唱罢我登场”,最近不少行业都被卷入不光彩的新闻里,从双汇门到红十字会,从铁老大到乳业标准、水玻璃碱面……消费者心中的醋,是“纯粮精制”的天然产品,不
近来,诸如“数字化时代”、“新媒体”、“网络传播”、“第四媒体”、“第五媒体”这样一些词语,几乎每天都挂在传播业界和学界人士的嘴边、出现在传统媒体和互联网上。尽管各
我正在做的事情,既是为应聘者争取一个机会,让他们能展示自己的能力,也是给招聘者一个机会,希望他们能凭真实见闻改变歧视的观念
将500万元砸向自己个人博客的推广,浮出水面的袁智勇是傻子、疯子,还是骗子?互联网所制造的又一起光怪陆离的事件背后,给我们带来更多的是关于博客价值的理性思考。
开放型网络给人们交流思想提供了极大的便利,但同时也应看到,一些蔓延于网络的“情绪型舆论”,有时产生的负页影响也很大,需要引起社会的高度重视。
患者,女,75岁.1998年11月因右肾盂癌、膀胱癌行右肾输尿管切除、膀胱部分切除术.术后2个月尚未行预防肿瘤复发治疗,即又反复血尿.1999年先后行开放性膀胱电灼止血1次、经尿道
我猜的啊,苏州人比合肥人有钱。早晨到人民路的陆长兴面馆,里面挤挤挨挨都是土著,都在讲苏州话。男女老少熙攘如菜市场。看到两个老头,穿得破破烂烂就似五保户模样,轻车熟路相携到柜台,怀里摸出钞票来,一张张摊在台面上,我在旁边替他默数:十块,二十块,三十块,叫的是一碗面两个浇头,虾仁加焖肉,老人家胃口可真好。这几家老店的面条都蛮贵的,一碗爆鳝焖蹄面能要到三十五,依我的消费观,只能偶尔吃吃吧,像我爸那样的退
论坛的舆论引导简单地说.起码包含论坛舆论形成和论坛舆论管理两个有机部分.两者相辅相成.缺一不可。
网络色情的隐蔽性对网络色情的治理力度仍需加强。尤其要防止色情网站的反弹。同时为了更有效的打击网络色情活动,对有关法律出台司法解释已是当务之急.甚至应该考虑在时机成熟