论文部分内容阅读
熙熙攘攘的车站里,一位着装利落的风衣男子一边疾步逆人流而上,一边左右环顾。在外人看来,他与一般旅客无异,实际上,他的隐形眼镜上不断出现迎面而来的每位旅客的个人信息。不到一分钟,系统就锁定了一位男士……好莱坞大片中总是充满了各种炫酷的高新科技,刚才的场景就是《碟中谍4》中的一幕特工采用面部识别隐形眼镜追捕目标的情节。或者美剧《越狱》、经典科幻大片《终结者》中,开启保险库大门的密码都是人脸——由摄像头对脸部特征进行扫描,如果符合则大门自动开启,否则警铃大作。
陌生而熟悉的识别技术
人脸识别技术诞生于20世纪60年代,在计算机科学领域,一直都是持久热门的课题,它属于生物特征识别技术的一个子集。生物特征识别的研究对象包括脸、指纹、掌纹、视网膜、语音等方面的识别技术。
人脸识别这个词儿看似很高科技,但实际上它对我们来说一点儿也不神秘与陌生,说不定你每天都会“被识别”很多次,因为现在很多安防监控的摄像头就有人脸追踪和身份识别的功能。还有一个常见应用就是大家平时使用的数码相机,很多都带有人脸识别功能,能抓住拍摄画面中人的脸部位置,用方框提示出来,使得拍照的人更容易抓住对焦点。这些普普通通的应用,都是基于各种复杂的或者简单的面部识别算法来实现的,而随着现代计算机技术和光学成像技术的蓬勃发展,需要进行大数据量计算的识别算法逐渐被研究和开发出来。
在电影中,包括我们认为的人脸识别实际上是一系列跟人脸有关的复杂技术。首先是采集人脸图像,然后从这些图片或者视频画面中定位出哪部分是人的脸,这个步骤叫人脸定位,接下来才能进一步识别出到底是谁的脸,也就是特征识别和身份确认。怎样进行识别
那么人脸识别到底是怎么一回事呢?一部不会思考的机器究竟如何识别甚至“认识”出人脸呢?
第一个重要环节是“人脸定位”,也就是先找出图片或者视频中哪些部分是人脸。眼睛、鼻子、嘴、下巴、颧骨等部件构成了一张脸,虽说每张脸都不一样,但又都是相似的。早期的研究人员就是通过研究大量人脸的共同特性,通过各个重要器官的形状、大小以及结构的关系来总结出一个经验值,由此来定位出画面中具体哪部分是人脸。
第二个重要环节是人脸特征值提取,这是计算机“认识”脸的核心过程。毕竟世界上没有两片—模一样的叶子,所以人面部重要器官的形状、大小和结构上的各种差异使得世界上每个人的脸都不一样,而对这些重要部件的几何描述,便可以作为人脸身份识别的重要特征。例如,每个人的脸都可以看作是由一个独一无二的模子“刻印”出来的,知道了这个模子的样子就能知道它对应的脸是什么样子的。然后通过提取人眼、口、鼻等重要特征点的位置以及眼睛等重要器官的几何形状来做分类,由此去识别人脸的身份。不过这种分类的效果并不好,识别的效果也不尽如人意。后来有人改进了这个方法,设计了一个器官模型,就像一个橡皮泥捏成的可变型模板,并定义了一个复杂的特征函数来描述这个模板的样子,通过调节特征函数的参数使得这个模型能够对应上每一张脸,而这些参数就成了描述这张脸的特征值。想想看,这个算法看似很靠谱,其实并不太实际,它需要去匹配每个人的脸得到不同的特征值,并且需要很多经验的东西去确定这些参数,实际应用几乎不可能。
在实际使用的产品中,人们往往采用较为简单方便的算法,先用数据库存储多张标准人脸照片,并事先计算出这些照片中每张脸的独一无二的特征值(facepdnt),目每一张睑部跟一个身份信息对应起来。然后依靠摄像头捕捉待识别的人脸,实时生成特征值,用这个特征值去数据库检索匹配,以确认到底是谁。
人脸识别的应用
人脸识别已经广泛应用到各个不同的领域,比如现在的银行、机场、体育场,甚至是大型超市的摄像头,很多都连接着人脸识别系统,用于安全监控。特别是2008年北京奥运会,在鸟巢和很多比赛场馆中,已经实现了全方位无缝式摄像头监控。在所有奥运会场馆的入口处,监控摄像头都与面部识别系统相连,以每秒钟五十万张的速度将通过入口的观众与数据库中的资料照片进行对比。在香港和澳门,很多中小学校也都安装有人脸识别系统来为学生进行每天的出席点名记录。
有意思的是,我们自己也可以很轻易地体验到人脸识别系统的神奇,如果同学们经常上网的话,可以试试GoogIe搜索引擎的图片搜索功能,找一张人像照片进行搜索,就可以看到很多与搜索图片相似,或者同一个人的很多不同照片。全球最大的社交网站Facebook花了几千万美元收购了一个专门进行人脸识别的网站face.com,更是掀起了一股人脸识别相关的创业潮,很多有才华的年轻人把智慧和精力投入到其中,创造出了很多有意思有价值的产品。
去年,由一群麻省理工学院和波士顿大学的中国留学生创办的Orbeus公司推陈出新,发明了更细致的算法,让计算机可以像人类一样更准确地辨别所看到的物体。它们的产品已经可以识别性别、年龄、表情、商标、物品等等。比如,当你上传一张食物的照片,Orbeus不仅会告诉你上传的是一盘蔬菜,而且还能进一步说出这蔬菜是什么种类。
陌生而熟悉的识别技术
人脸识别技术诞生于20世纪60年代,在计算机科学领域,一直都是持久热门的课题,它属于生物特征识别技术的一个子集。生物特征识别的研究对象包括脸、指纹、掌纹、视网膜、语音等方面的识别技术。
人脸识别这个词儿看似很高科技,但实际上它对我们来说一点儿也不神秘与陌生,说不定你每天都会“被识别”很多次,因为现在很多安防监控的摄像头就有人脸追踪和身份识别的功能。还有一个常见应用就是大家平时使用的数码相机,很多都带有人脸识别功能,能抓住拍摄画面中人的脸部位置,用方框提示出来,使得拍照的人更容易抓住对焦点。这些普普通通的应用,都是基于各种复杂的或者简单的面部识别算法来实现的,而随着现代计算机技术和光学成像技术的蓬勃发展,需要进行大数据量计算的识别算法逐渐被研究和开发出来。
在电影中,包括我们认为的人脸识别实际上是一系列跟人脸有关的复杂技术。首先是采集人脸图像,然后从这些图片或者视频画面中定位出哪部分是人的脸,这个步骤叫人脸定位,接下来才能进一步识别出到底是谁的脸,也就是特征识别和身份确认。怎样进行识别
那么人脸识别到底是怎么一回事呢?一部不会思考的机器究竟如何识别甚至“认识”出人脸呢?
第一个重要环节是“人脸定位”,也就是先找出图片或者视频中哪些部分是人脸。眼睛、鼻子、嘴、下巴、颧骨等部件构成了一张脸,虽说每张脸都不一样,但又都是相似的。早期的研究人员就是通过研究大量人脸的共同特性,通过各个重要器官的形状、大小以及结构的关系来总结出一个经验值,由此来定位出画面中具体哪部分是人脸。
第二个重要环节是人脸特征值提取,这是计算机“认识”脸的核心过程。毕竟世界上没有两片—模一样的叶子,所以人面部重要器官的形状、大小和结构上的各种差异使得世界上每个人的脸都不一样,而对这些重要部件的几何描述,便可以作为人脸身份识别的重要特征。例如,每个人的脸都可以看作是由一个独一无二的模子“刻印”出来的,知道了这个模子的样子就能知道它对应的脸是什么样子的。然后通过提取人眼、口、鼻等重要特征点的位置以及眼睛等重要器官的几何形状来做分类,由此去识别人脸的身份。不过这种分类的效果并不好,识别的效果也不尽如人意。后来有人改进了这个方法,设计了一个器官模型,就像一个橡皮泥捏成的可变型模板,并定义了一个复杂的特征函数来描述这个模板的样子,通过调节特征函数的参数使得这个模型能够对应上每一张脸,而这些参数就成了描述这张脸的特征值。想想看,这个算法看似很靠谱,其实并不太实际,它需要去匹配每个人的脸得到不同的特征值,并且需要很多经验的东西去确定这些参数,实际应用几乎不可能。
在实际使用的产品中,人们往往采用较为简单方便的算法,先用数据库存储多张标准人脸照片,并事先计算出这些照片中每张脸的独一无二的特征值(facepdnt),目每一张睑部跟一个身份信息对应起来。然后依靠摄像头捕捉待识别的人脸,实时生成特征值,用这个特征值去数据库检索匹配,以确认到底是谁。
人脸识别的应用
人脸识别已经广泛应用到各个不同的领域,比如现在的银行、机场、体育场,甚至是大型超市的摄像头,很多都连接着人脸识别系统,用于安全监控。特别是2008年北京奥运会,在鸟巢和很多比赛场馆中,已经实现了全方位无缝式摄像头监控。在所有奥运会场馆的入口处,监控摄像头都与面部识别系统相连,以每秒钟五十万张的速度将通过入口的观众与数据库中的资料照片进行对比。在香港和澳门,很多中小学校也都安装有人脸识别系统来为学生进行每天的出席点名记录。
有意思的是,我们自己也可以很轻易地体验到人脸识别系统的神奇,如果同学们经常上网的话,可以试试GoogIe搜索引擎的图片搜索功能,找一张人像照片进行搜索,就可以看到很多与搜索图片相似,或者同一个人的很多不同照片。全球最大的社交网站Facebook花了几千万美元收购了一个专门进行人脸识别的网站face.com,更是掀起了一股人脸识别相关的创业潮,很多有才华的年轻人把智慧和精力投入到其中,创造出了很多有意思有价值的产品。
去年,由一群麻省理工学院和波士顿大学的中国留学生创办的Orbeus公司推陈出新,发明了更细致的算法,让计算机可以像人类一样更准确地辨别所看到的物体。它们的产品已经可以识别性别、年龄、表情、商标、物品等等。比如,当你上传一张食物的照片,Orbeus不仅会告诉你上传的是一盘蔬菜,而且还能进一步说出这蔬菜是什么种类。