论文部分内容阅读
摘要:人工智能迎来了第三次科学元年,这次科技浪潮给社会各行各业带来不同程度的改变,百度人工智能机器人“小度”与最强大脑选手在人脸识别项目上展开对决,“小度”展现出了强大的实力,而背后却是人工智能,深度学习技术在人脸动态识别上的应用。并且“小度”
已经具有了基本的推理能力。
关键词:人工智能;深度学习;人脸识别
前言
当最强大脑碰见人工智能会碰撞出怎样的火花,百度将人工智能技术植入到“小度”与最强大脑名人堂的选手分别在人脸识别,声音识别进行三局两胜。最后“小度”取得了两胜一平的好成绩。人机大战第一局,人工智能机器人“小度”战胜了名人堂毫无败绩的名人堂顶尖高手王峰,当百度深度学习实验室主任被问到是如何做到的,他回答当一个视频,计算机会对人脸进行检测和跟踪,跟踪完成之后算法会去选几张算法觉得质量比较好的送给识别的程序,然后识别的程序会去识别这几张照片里面是哪个人。
动态人脸识别技术
系统主要有两部分,一部分是前面得到检测跟踪,这部分用到了一些深度学习的方法然后自动的学出适合于人脸检测和跟踪的一些特征。第二部分是人脸识别,这个特征也是通过深度学习得到的,因此这些算法很少再去人为的再去定义一些特征,基本上是靠深度學习从海量的数据里面去学习出来的。人脸探测面临人脸将有不同的角度,因此这里面需要算法去把不同的角度的脸探测出来,特别在动态的情况下也会有较模糊的情况,因此这都会是一些挑战,这样就需要算法在很多的视频帧里面去挑出质量比较好的,然后拿这些质量比较好的进行识别。主要挑战的地方在于怎样更好的检测然后对图片的质量做一些判断,因为一秒就是三十帧,你如果每帧都去识别的话那就可能非常的慢,因此就需要很好的检测的算法能够基本上实时的去探测人脸,这些跟静态的都是区别,因为静态的可能只需要处理一张照片,动态的话需要处理很多张照片,那就这里怎么选择最好的信息来做识别。
人工智能“小度”现在这套系统就针对弱光的还有遮挡的,比赛中使用到的还是基于两个步骤来做的,第一个步骤还是用了200万个人2个亿的照片训练了,这本身是非常大的数据需要非常大的计算量来计算,当然也需要很好的算法,使用并行计算能够在多台GPU机器上做非常高效的并行计算,使得“小度”训练了人脸识别的基础能力,在这上面的话可能有不同的场景比如说第一期中的跨年龄,第二期针对的是暗光和有遮挡的情况,会再收集一些这方面的数据再进一步优化深度学习通用的模型,使得模型能够在暗光的情况下或者有遮挡的情况下也能做非常好的识别,相对来说这块的数据集会小很多,因为这个数据比较难收集,百度在小一万个人这个级别。
人脸识别在比赛中的应用
在比赛中基本上条件唯一输给机器的就是图像,那图像或者说视频,那算法它基本上把要考虑到的因素应该考虑的都考虑了,最后机器得到的是一个置信度的分数,分数比较高的机器就觉得是最有可能的情况。所以机器就是什么分数就是什么分数,没办法回头再去想,比如第一期双胞胎的情况,基本上也就是机器最后决定的分数。而人不一样,他可能會从他除了看图像他可能还会联想到一些东西,然后这些东西他可能会综合去考虑,但是这方面也有好的地方,也有可能有不好的地方,有时候会带来好的结果,也有时候会有不好的结果。在与“水哥”的比赛中,“小度”会决定哪一块是被遮挡到什么程度,会在脸上分大概7个部分,比如说鼻子嘴左眼右眼,每个部位都会从深度学习输出一个特征来形容那块被遮挡的情况,这些都会成为最后决策的一些信息。系统它其实有一点点的推理能力在里面,它能知道哪些是已经被遮挡了,这些遮挡的信息改怎么去用。而整个来说,百度训练了一个端到端的模型,它希望系统能够自动的做决策,自动的得到结果。在人脸识别任务上,“小度”已经有一些基本的推理能力,比如说戴口罩戴墨镜这些被遮挡的情况,系统会去看哪一个部位是别遮挡了,然后在这种被遮挡的情况下怎么去做最好的识别。因此,在这里面就有一定的推理能力,而具体是怎么去推理出来的,百度也是通过从海量数据里面学习所得到的。“小度”在别的任务上可能能力就会强很多,比如说智能驾驶的情况下。
结语
随着深度学习与大数据的进一步发展,用计算机来模拟人的思考、推理、规划等思维过程和智能行为取得长足的进步。人工智能的重要特征就是拥有学习的能力,也就是说系统的能力会随着经验数据的积累不断演化和提升。
已经具有了基本的推理能力。
关键词:人工智能;深度学习;人脸识别
前言
当最强大脑碰见人工智能会碰撞出怎样的火花,百度将人工智能技术植入到“小度”与最强大脑名人堂的选手分别在人脸识别,声音识别进行三局两胜。最后“小度”取得了两胜一平的好成绩。人机大战第一局,人工智能机器人“小度”战胜了名人堂毫无败绩的名人堂顶尖高手王峰,当百度深度学习实验室主任被问到是如何做到的,他回答当一个视频,计算机会对人脸进行检测和跟踪,跟踪完成之后算法会去选几张算法觉得质量比较好的送给识别的程序,然后识别的程序会去识别这几张照片里面是哪个人。
动态人脸识别技术
系统主要有两部分,一部分是前面得到检测跟踪,这部分用到了一些深度学习的方法然后自动的学出适合于人脸检测和跟踪的一些特征。第二部分是人脸识别,这个特征也是通过深度学习得到的,因此这些算法很少再去人为的再去定义一些特征,基本上是靠深度學习从海量的数据里面去学习出来的。人脸探测面临人脸将有不同的角度,因此这里面需要算法去把不同的角度的脸探测出来,特别在动态的情况下也会有较模糊的情况,因此这都会是一些挑战,这样就需要算法在很多的视频帧里面去挑出质量比较好的,然后拿这些质量比较好的进行识别。主要挑战的地方在于怎样更好的检测然后对图片的质量做一些判断,因为一秒就是三十帧,你如果每帧都去识别的话那就可能非常的慢,因此就需要很好的检测的算法能够基本上实时的去探测人脸,这些跟静态的都是区别,因为静态的可能只需要处理一张照片,动态的话需要处理很多张照片,那就这里怎么选择最好的信息来做识别。
人工智能“小度”现在这套系统就针对弱光的还有遮挡的,比赛中使用到的还是基于两个步骤来做的,第一个步骤还是用了200万个人2个亿的照片训练了,这本身是非常大的数据需要非常大的计算量来计算,当然也需要很好的算法,使用并行计算能够在多台GPU机器上做非常高效的并行计算,使得“小度”训练了人脸识别的基础能力,在这上面的话可能有不同的场景比如说第一期中的跨年龄,第二期针对的是暗光和有遮挡的情况,会再收集一些这方面的数据再进一步优化深度学习通用的模型,使得模型能够在暗光的情况下或者有遮挡的情况下也能做非常好的识别,相对来说这块的数据集会小很多,因为这个数据比较难收集,百度在小一万个人这个级别。
人脸识别在比赛中的应用
在比赛中基本上条件唯一输给机器的就是图像,那图像或者说视频,那算法它基本上把要考虑到的因素应该考虑的都考虑了,最后机器得到的是一个置信度的分数,分数比较高的机器就觉得是最有可能的情况。所以机器就是什么分数就是什么分数,没办法回头再去想,比如第一期双胞胎的情况,基本上也就是机器最后决定的分数。而人不一样,他可能會从他除了看图像他可能还会联想到一些东西,然后这些东西他可能会综合去考虑,但是这方面也有好的地方,也有可能有不好的地方,有时候会带来好的结果,也有时候会有不好的结果。在与“水哥”的比赛中,“小度”会决定哪一块是被遮挡到什么程度,会在脸上分大概7个部分,比如说鼻子嘴左眼右眼,每个部位都会从深度学习输出一个特征来形容那块被遮挡的情况,这些都会成为最后决策的一些信息。系统它其实有一点点的推理能力在里面,它能知道哪些是已经被遮挡了,这些遮挡的信息改怎么去用。而整个来说,百度训练了一个端到端的模型,它希望系统能够自动的做决策,自动的得到结果。在人脸识别任务上,“小度”已经有一些基本的推理能力,比如说戴口罩戴墨镜这些被遮挡的情况,系统会去看哪一个部位是别遮挡了,然后在这种被遮挡的情况下怎么去做最好的识别。因此,在这里面就有一定的推理能力,而具体是怎么去推理出来的,百度也是通过从海量数据里面学习所得到的。“小度”在别的任务上可能能力就会强很多,比如说智能驾驶的情况下。
结语
随着深度学习与大数据的进一步发展,用计算机来模拟人的思考、推理、规划等思维过程和智能行为取得长足的进步。人工智能的重要特征就是拥有学习的能力,也就是说系统的能力会随着经验数据的积累不断演化和提升。