生物特征识别系统高可信评测的样本量确定方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:wangbaosen321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物特征识别技术作为一种新型的身份验证技术,拥有广阔的市场前景。新的生物特征识别技术层出不穷,呈现出百花齐放的景象。很多生物特征识别技术都被宣称能达到99.99%甚至更高的识别率。然而,当系统被真正投入应用时,它的实际性能并不能达到所宣称的程度。这主要是因为研究成果在市场化过程中缺少可信的评测。  生物特征识别系统评测是一项很复杂的技术,其主要任务包括定义评测指标、确定评测流程、确定评测样本量、设计评测样本的采集方法等。目前,评测指标已经有一定标准,每种生物特征识别技术也已经有专门的评测流程和方法。但是与评测结果是否可信相关的问题(例如如何确定样本量、如何设计样本采集方法等),目前仍然未被解决。  本文针对与评测可信度最相关的样本量确定问题,展开一系列研究。研究中,作者就如何估计评测结果的可信度、评测样本量与可信度有怎样的关系、如何确定样本数量和如何采集评测样本等问题,提出了有效的解决方案。其中主要的工作包括:  1、提出基于二重分割的置信区间估计方法  具体来说,生物特征识别系统评测的可信度,可以用该评测的评测指标的置信区间来表示。本文采用的基于二级分割的非参数抽样方法对评测指标的置信区间进行估计。这种方法充分考虑了成对数据样本的相关性(即对于A、B、C三个用户,A与B的相似度和A与C相似度之间存在着相关性)问题,因此可以得到比传统方法更为可信的置信区间。  2、给出基于关系结构的评测样本量与置信区间之间的关系推导  本文分析了非参数随机抽样方法所推算的置信区问w与对应样本量n之间的关系,推导出如下方程:w2=β1/n2+β2/n,并在万人级别的北京大学手指静脉数据库上验证了这个方程的正确性。  3、提出基于置信弹性的评测样本量确定方法  本文发现了扩大样本量对可信度的提高具有边际效应递减的规律。我们用置信弹性来衡量样本采集的性价比。置信弹性,即置信区间的缩小倍数与其对应的数据扩容倍数之比。本文根据置信弹性给出了样本量的确定方法。  4、提出基于多重回归的增量式样本采集方法  本文所给出的样本量确定方法是在已经采集了一定测试样本的基础上给出的。本文提出了增量式的样本采集方法,对样本进行多次采集,从而正确地确定高可信评测所需要的样本量。
其他文献
在国有企业的改革阶段内,人力资源的管理问题一直都是阻碍国企稳健发展的关键因素.本文从人力资源管理中的现存问题切入,并基于此探讨了相应的有效措施,希望可以为业内人士提
通过不断学习、勤奋学习来提高自己的能力,是古今中外人才成长的一个普遍规律。对学习问题,不能仅仅把它作为做好工作的基础和前提去认识,更要把它看作一种重要的工作方法去
化工企业是安全事故多发的领域之一,化工原料多具有易燃、易爆、强酸性、强碱性剧毒、强腐蚀性等,严重威胁员工的人身安全和企业的财产安全,在生产过程中,化学原料之间的反应
地质勘探单位跟随时代的发展,为了提升单位的经济收益,带动了工作人员的积极性,通过在收入分配制度上做出的改变,加强完善绩效和薪酬制度,但是在优化的过程中,带来了一些负面
近年来,随着IT行业的不断发展,大型系统里的业务场景越来越复杂,各系统里重复的数据也越来越多,信息孤岛现象越来越严重,旧有的数据仓库和数据复制已经难以满足要求,为了保证
节能与新能源汽车是中国成为制造强国的战略目标之一,在当今世界的发展走向下,新能源汽车是必然趋势.中国新能源汽车也依托国家政策的有力支撑,得以实现快速发展.而在2016年
传统的网络安全防护措施已经不能满足当前的网络安全管理的需求,以有效、直观的显示方式实时、准确监控网络的安全态势感知技术已经成为目前网络安全领域的研究热点。   网
中共中央政治局委员、书记处书记、中央组织部部长、中央先进性教育活动领导小组组长贺国强最近在各地区各部门各单位先进性教育活动办公室主任座谈会议上强调,深刻领会中共
企业为了实现长久稳定发展目标,必须认识到财务管理工作的重要性,成本管理属于重要内容.通过成本管理措施,有助于提升投资预算实施效果.在企业经济管理中,目标成本管理的应用
在大数据时代背景下,为企业供应链管理创新提供了新的思路,打开了新的模式.促进企业供应链管理的不断完善,使得企业在获取市场供需、订单配送以、制定生产计划以及物流等方面
期刊