深度解密:人机大战——网红脸识别

雷锋网按:本文作者为Slyvia,ARC增强现实(微信ID:arinchina)文章详细的分析了1)机器和人类在人脸识别方面的不同点;2)人机大战结果的原因分析。

继「围棋」人机大战——以李世石为代表的人类,输给了阿尔法狗代表的计算机后,人类又发起了「人脸识别」之人机大战。这一次是诞生于杭州的人脸识别机器人蚂可,对战「鬼才之眼」王昱珩。

王昱珩是谁?

15 年「最强大脑」中,在同质同量同源的 520 杯水中,他成功指出评审选中的那杯,并精准说出水杯旋转了 15 度,中间经人手,从此,「水哥」一战成名。

这次,对上「万变不离其宗」的网红脸,人类可以一雪前耻么?

结果揭露前,先了解计算机「看人」的套路。

人眼和计算机,都喜欢瞄「点」。只不过,人眼在辨别物体时,往往通过不同点来判断。而计算机则相反,它找的是相同点。

通过摄像头「观察」目标,计算机将拍摄到的物体,以图片形式传给计算机,这就是图像识别过程。淘宝的图片搜索、百度的图片识别功能,都属于这类应用。

在识别中时,计算机会找一些「与众不同」的点,来和「脑海」中的图片进行匹配。这些「鹤立鸡群」的点,通常被称为「角点」或「关键点」。这些点在图像中具有一定特征,如局部最大或最小灰度(即图像亮度)、某些梯度特征(描述图像灰度变化情况的量)。

比如人脸上的一颗痣,在计算机识别时就会被当成参考点。那么计算机是如何找到这些「角点」的?

角点图

计算机在查找某个像素点时,是遵行逐个查询的规则。为了判断一个点是否为「角点」,会选取一个大小合适的窗口(比如 3*3 的窗口),让窗口中心遍历(即依次访问)整个图像像素,同时,判定中心点与它的周围点是否有明显不同。

因此,当窗口在平滑区域(图 a),窗口在各方向上移动时,图中三个窗口内部的图像无变化。当窗口在沿边缘方向上移动时(如图 b),三个窗口内图像也是不变的。当窗口在「角点」处时(如图 c),窗口无论朝哪个方向移动,三个窗口内部图像均不一样,因此判断该点为「角点」。

不同的「角点」检测算法使用地窗口不一样,采用圆形窗口检测「角点」的 FAST,和采用 16*16 采样窗口的 SIFT 算子中,是图像特征点检测的两大算法。

「配对」又是怎么一回事?

找到特征点后,对它们进行描述后,才能开始图像匹配。描述的大前提是,我们需要利用特征点周围像素的梯度方向分布特性,为每个关键点指定方向。

比如在 SIFT 算子中,将采样点与特征点的相对方向,通过高斯加权后得到一个 4*4*8 的 128 维特征描述子。

一系列加工后,就成了上图这个「鬼样子」

有了特征点描述子,就可以和模板图的特征点描述子进行比较,得分最高的就是最佳匹配点。然后对所有特征点进行遍历。计算机的「人脸识别」就是基于以上理论。同时,它还会进行一些纵向比较,比如通过图片上五官的分布距离,来进行比较。

所以,结果是?

第一局,从 150 张网红照片中找出 3 人,蚂可胜

第二局,从 300 张网红照片中找出 3 人,「水哥」胜

第三局,从 80 张网红童年照中找出 2 人,「水哥」胜

三局两胜,「水哥」代表的咱人类胜利了~ 蚂可能胜一局,说明计算机在图像识别的未来可期,但最终失败,也说明还存在一些问题。

胜败分析这次比赛挑选的识别对象——网红脸,看上去都是从一个模子里刻出来的,无疑增加了比赛的难度。

面对这些千篇一律的网红脸,蚂可在识别近照时尚可,但到了童年照就有点吃力。

蚂可在识别人脸时,部分程序是通过五官之间的距离来判断的。但是,人在幼年时五官比较居中,随着年龄增长会分散开些,「长开了」。更不用说,有些网红还进行了「微整」,连亲妈都认不出了,何况是蚂可。

第三局失败情有可原。但为什么蚂可还能赢第一局?因为快

如果你仔细看上文视频,可能对这句话还有印象:计算机识别时,先将照片划分为四个区域,再分成几百个关键点。

这是加快图像识别的关键一步,在所有的图像识别中,几乎都采用了这种方式。图像识别中有个专业名词来形容,称为「图像金字塔」

图像金字塔

图像金字塔最初用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低的图像集合。底部是待处理图像的高分辨率表示(上图 G0),而顶部是低分辨率的近似(上图 G3)。当向金字塔的上层移动时,尺寸和分辨率就降低,识别速度得以提高。(注:分辨率越高,图片越大越清晰)

同时,人在比赛中会受到外界干扰,心理作用比较大,但计算机没有。所以「水哥」在开始失利,也有非专业因素在内。

但是,后面蚂可连输两局,还有更深层次的原因

比赛中,两位选手都需要通过自身移动来识别图像,这对蚂可是很不利的。因为摄像机移动时图像识别会不稳定,就像我们坐在车中看窗外景色,随着车速增加,景色越模糊。

同时,现场灯光组给力,反光很强,也会影响蚂可的识别。

生活中,当我们背光看屏幕,由于反射光太强会导致看不清屏幕,这时我们会拉上窗帘或用手遮光,来降低光的反射。而计算机就得对现实环境亮度进行实时检测,根据检测结果对图像亮度阈值进行调整后,再进行比较。

目前,机器对光的调节作用还赶不上人眼的调节,又碰上「水哥」,只能甘拜下风了!不过,即便这次蚂可败给了「水哥」,但「水哥」只有一个,蚂可还有很多。下一次,我们还会赢么?

雷锋网(公众号:雷锋网)注:本文由ARC增强现实(微信ID:arinchina)授权雷锋网发布,如需转载请联系原作者,并注明作者和出处,不得删减内容。

更多文章:1. 解密:智能美妆和动效自拍背后的技术

                 2. 解密:面部特征点检测的关键技术

                 3. 人脸检测发展:从VJ到深度学习(上)

                 4. 人脸检测发展:从VJ到深度学习(下)

                 5. 深度学习在人脸识别中的应用——优图祖母模型的“进化”

本文作者:陈圳

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-19 10:05:10

深度解密:人机大战——网红脸识别的相关文章

深度解密:三好网高续费率的背后

本文讲的是深度解密:三好网高续费率的背后,从2013年开始,在线教育异军突起,成为投资界的宠儿,在高峰时段,在线教育机构的出生率记录是2.6家/天. 然而,出生率是"小道理",存活率是"大道理",高续费率则是当之无愧的"硬道理".验证在线教育机构存活率的指标全在"业务数据线"上--获取客户的成本.客户贡献值.用户留存率等. 据悉,K12在线教育知名品牌三好网的续费率高达61%,究竟是什么造就了这一传奇? "学生好&q

最强大脑“人机大战”第二轮战平,吴恩达详解背后技术原理

如果说在上一轮人机大战的人脸识别对决中,由于小度对阵了并不擅长人脸识别的王峰,令比赛意义打了折扣,那么昨天进行的第二轮声音识别的人机大战,虽然最终只是战平,但对于AI 界的意义却似乎更大. 原因有两点:一.公认实力顶尖的对手:二.业界公认困难的比赛内容. 在对手上,此次迎战百度小度的是名人堂公认最擅长声音辨别的选手孙亦廷,他辨别声音细节的能力在名人堂无出其右,能通过水球从0~70米高空坠地破碎的声音,来准确辨别水球下落时的高度.这相当于在一根70米长的琴弦上拉奏任意位置,他都通过音高准确辨别拉弦

人机大战机器胜!这次是智能语音识别技术!

昨天,在阿里云的一场年会上,真枪实弹的上演了一场人机大战.一张大屏分两边,一边实时滚动的是出自阿里著名的快男姜毅的文字速记,一边出现的是阿里云iDST的科学家们在短短一年时间打造出来的语音识别系统支持下的语音转文本记录. 人机大战一触即发,随着阿里云总裁胡晓明的演讲展开,屏幕两端实时出现了各自的文本记录,从现场效果来看,难分伯仲.如果不是提前告知,观者很难感知到擂台的一端是机器人,因为可以实时的看到机器人除了记录之外,还能根据演讲人语境的变化,返回来对前面的记录进行调整. 结果评估取孙权前八分钟

Master 真实身份终于揭晓,随后百度高调展开一场人机大战丨AI科技评论周刊

雷锋网按:本周 AI 圈的大新闻不断,最引人关注的无疑是 Master 终于公布其真实身份,最终果然是人们猜测已久的 AlphaGo.在 Master 公布其身份不久后,江苏卫视马上播出了百度大脑对战最强大脑王峰的节目,小度以 3:2 的成绩战胜王峰. Master 真实身份终于揭晓 本周神秘的 Master 终于宣布自己就是就是 AlphaGo,而代为执子的就是 AlphaGo 团队的黄士杰博士! 雷锋网了解到,从 2016 年 12 月 29 日晚起,一个注册为"Master".标

“人机大战”捧红人工智能 新时代的HPC玩家需要什么能力?

连续的胜利让谷歌人工智能(AI)"阿尔法狗"变成了科技圈儿和围棋界的网红,掀起了一轮轰轰烈烈的讨论狂潮.犹如百家争鸣,流派众多.阴谋论有之,技术流有之,理性派有之,科幻派有之-甚至连开复老师也忍不住谈了谈对AI的见解. 热闹非凡,我也来凑凑热闹. 我并不想讨论李世石九段的心理阴影面积,也不想解读"阿尔法狗"背后的黑科技,而是想讨论一些看得见.摸得着的东西,譬如那套峰值有0.28Pflops的超级计算机系统. 毫无疑问,"阿尔法狗"最为核心的技能莫

阿里云年会人机大战-技术大揭秘

引言 在上一篇文章中人工智能PK金牌速记员之实战录,我们讲述了阿里云年会人机大战背后的故事.技术Geek们可能就好奇了?现场的实时转录系统是怎么回事? 其中核心的语音识别系统到底是什么,工作原理是什么? 阿里云iDST的语音识别系统准确率为什么可以做到这么高,有什么独得之秘?本文将会将这些问题的答案一一揭晓. 人机大战之现场   阿里云年会现场,图中左边屏幕显示的是语音识别,右边屏幕显示的是人工速记 上图是视频的截图,展示的就是阿里云年会人机大战的现场情形, 阿里云的掌门人孙权在台上演讲,自动语

特邀 | 围棋人机大战一周年:如何让AlphaGo更快更轻盈

去年今日,AlphaGo 一举击败围棋世界冠军.韩国九段棋手李世乭,开创了人工智能的新纪元.一时间,人工智能成为贯穿全年的热门话题. 值此围棋人机大战一周年之际,我们特别邀请到卡耐基梅隆大学博士.北京大数医达科技有限公司 CEO-邓侃,为大家带来对 DeepMind 公司创始人 Demis Hassabis,以及大腕儿 Oriol Vinyals 的最新论文的读后感. 一周前,2017年3月6日,Google 旗下的 DeepMind 公司,发表了一篇题为<神经情景控制 Neural Episo

北京邮电大学计算机与围棋研究所所长刘知青:AlphaGo与柯洁人机大战展望

5月18-20日,由中国电子学会主办,ZD至顶网协办的第八届中国云计算大会在北京国家会议中心隆重举办.在20日上午的主会场中,北京邮电大学计算机与围棋研究所所长.教授刘知青分享了主题为"AlphaGo与柯洁人机大战展望"的精彩演讲. 北京邮电大学计算机与围棋研究所所长.教授 刘知青 刘知青在演讲中详细讲述了AlphaGo与李世石人机大战的前因后果,并进一步展望了AlphaGo与柯洁的人机大战场景.他讲到:"作为圈内的知情者来看,阿尔法狗的技术进展完全是基于早期的研究成果,当然

德州扑克人机大战,AI 有着压倒性优势,局势几乎不可逆转

在德州扑克人机大战中,四位职业牌手与 CMU 开发的人工智能系统 Libratus 进行了激烈对抗. Libratus是卡耐基梅隆大学的托马斯·桑德霍尔姆和诺姆·布朗(Noam Brown)开发的.他们以前开发的机器人 Claudico 在 2015 年的德州扑克比赛中没能击败职业牌手. 此前雷锋网(公众号:雷锋网)也曾报道过,"一对一无限注德州扑克"就是两个人玩的赌博游戏,因为事先会给每位玩家分发 2 张底牌,所以对方"底牌信息"你是不知道的,对于计算机来说,就是