【模式识别国家重点实验室】深度学习教你 “以貌取人”

与人交往时,潜意识里我们习惯“以貌取人”。看脸的时代,颜值很大程度上决定了别人对你个性和智商的评价。为找到人格特征、智力水平和外貌之间的关系,来自中科院自动化所模式识别国家重点实验室的胡占义教授团队首先建立了一个由面部图像、个性测量数据和智力测量数据组成的数据集。而后,构建端对端卷积神经网络研究个性和智力是否可以通过外貌准确预测,首次将深度学习运用到个性和智力测量上。结果表明:1)人格特征中的自律性和紧张性可通过外貌准确预测;2)智力水平很难通过外貌预测;3)在预测人格特征时,卷积神经网络优于传统手动描述器。

自古以来,人们就试图找到面部特征与人格特征之间的联系,这就是我们常说的“面相”。心理学研究证实:在对他人做出评判时,外貌起着决定性作用。长相在很大程度上会影响性格品质评判,在一些重要场合,比如选举或法庭判决,长相往往可以左右最终结果。有研究表明,亲和力、责任心、外向性和控制欲这四种品质可以通过外貌准确推断。

8月,IJAC第4期正式出版,来自中科院自动化所模式识别国家重点实验室的胡占义教授及其团队教你用深度学习推断个性、预测智商。研究首先采集了186名在校大学生(94名男性,92名女性)的正面照片,每位大学生会对自己的人格特征进行评价,并接受智力测验,基于此,借助深度学习技术,本文进一步研究了面部照片是否可以测量智力水平和人格特征的问题。早前,在测量人格特征和智力水平时,通常借助手动特征描述器从面部照片中截取面部特征,而后使用典型的机器学习方法来训练模型。与之不同的是,本文利用端对端卷积神经网络(end-to-end convolutional neural network, CNN)来测量人格和智力,面部特征可从正面照片中自动获取。我们设计的多任务神经网络(multi-task neural network)可同时测量人格和智力。在过去的20多年里,人脸识别发展迅速,深度学习技术在人脸识别的应用上也取得了很大成功。但至今为止,还没有研究使用CNNs,通过人脸测量人格和智力,本研究可谓实现了“零的突破”。

图片来自IJAC官网

我们的实验结果显示,部分由基因决定的人格特征可以从面部图像准确推断,而部分受环境影响的特征却无法推断,回归实验中得到的预测分数与自测人格和智力得到的分数间不存在明显的线性关系。本研究主要有以下两点创新:一、我们首次设计端对端神经网络来截取特征、完成分类,从人脸照片中测量人格特征和智力水平;二是建立东亚人数据集,找到人格特征、智力水平和面部图像间的相互关系,该数据集由脸部照片、人格测量及智力测量数据组成。

数据集

本文构建了“面相数据集”(physiognomy dataset)来研究人格特征(及智力水平)与面部图像之间的关系。该数据集由面部照片、人格测量数据及智力测量数据组成。当前的大多数研究数据都来自高加索人种(Caucasian race),与此不同的是,本文的研究数据来源于东亚人种(East-Asian race),包括186位志愿者的面部照片,其中有94名男性,92名女性。采集照片时,要求每位志愿者都坐在白色背景墙前,表情自然放松。

人格测试

本文采用了“卡特尔16种人格因素问卷”(简称16PF)来测量志愿者的人格特征。16项人格因素为:乐群性、聪慧性、(情绪)稳定性、恃强性、兴奋性、有恒性、敢为性、敏感性、怀疑性、幻想性、世故性、忧虑性、实验性、独立性、自律性、紧张性。所得到的测试数据,经由北京师范大学教育培训中心研发的软件进行处理后,可对每一种人格作出1--10分的评分。在16个人格因素的基础上,卡特尔进行了二阶因素分析,得到了4个二阶公共因素,即适应与焦虑性、内外向性、感情用事与安详机警性、怯懦与果敢性。本文的实验综合使用了上述20种人格特征来分析每位志愿者的人格特征。

图片来自文章

智力测试

本文采用了英国心理学家瑞文1938年设计的“瑞文标准智力测验”(简称SPM),旨在测试志愿者的观察力及清晰思维的能力。为表示受试者的智力水平,测试结果被转换成了百分数。整个测试由60个问题组成,分为ABCDE五组,每组12个问题。从第一组到最后一组,难度逐渐上升,每组内部的问题也是由易到难。完成每组题目所需的思维能力均不相同,参与本研究的186位志愿者全部完成了该智力测试,得到的分数用于智力水平分析。

图片来自文章

数据预处理

首先,基于本文作者前期研究的方法,将照片中的瞳孔设为面部特征点。而后,基于这两个特征点,再对数据集中的所有照片进行旋转或缩放调整,使其处在水平面的固定位置上。此外,为去除照片中的无关信息,本研究只选取了照片中的局部,保证眼睛处在同一水平面上, 并且露出一定量的脖子。

图片来自文章

基于CNNs的人格特征预测

本文将人格预测问题转化成分类问题和回归问题。为构建分类标签(classification labels)和回归目标(regression targets),人格特征分数和智力测量分数都转换成了相应的值。本文利用CNN来解决上述两个问题,输入信息是面部图像,其对应的人格特征和智力水平在测试阶段(training phase)作为标签使用。

在分类问题上,本研究将21种人格特征分成了两大类。每种人格特征的分数都在1至10之间,因此,规定6至10分为“具备特征段”,1至5分为“不具备特征段”。同样地,在进行智力水平分类时,为平衡两大类中的样本数量,规定智力得分等于或小于75%的样本为一类,高于75%的为另一类。分类的准确性用于评估分类模型。在回归问题上,本文直接将每种人格特征的分数和智力水平的百分数值作为回归目标。均方根错误(root mean square error, RMSE)用于评估回归模型。

图片来自文章

实验结果

1. 人格和智力分类

实验结果显示,“自律性”(Rule-consciousness)和“怀疑性(Vigilance)”两项得分的准确度高于机会水平(chance levels)。“怀疑性”(Vigilance)的准确度达到77%,“自律性”(Rule-consciousness)的准确度高达82%。高准确度表明:这两项人格特征与面部特征紧密相关。对于智力预测,准确度略高于机会水平,由此可知:通过面部特征预测智力水平是一件非常困难的事情,可能性微乎其微。

图片来自文章

心理学家曾对双胞胎做过相关实验,最后发现人类近50%的人格特征受基因影响,另一部分受社会环境影响。同时,生物学家也证实人类的面部特征很大程度上由基因决定。因此,由基因决定的人格特征与面部特征关系密切,并且可以通过面部图像准确预测。

2. 人格和智力回归实验

回归实验中,本文直接将每种人格特征的分数和智力水平的百分数值作为回归目标(regression targets)。

图片来自文章

实验结果显示:“自律性”(rule-consciousness)、“乐群性”(openness)、“有恒性”(perfectionism)、“紧张性”(tension)的错误值较其他人格特征小,而“世故性”(social boldness)、“怀疑性”(vigilance)和“内外向性”(introverted or extroverted)则更大。这意味着后三种人格特征与面部特征关联较小。相比之下,智力的拟合误差(fitting error)高,因此很难通过面部图像准确预测一个人的智力水平。

网络照片预测人格特征

上文中,我们使用CNN研究通过面部图像是否可推断人格特征和智力水平。回归实验和分类实验结果表明:特定人格特征可由面部图像准确推断。为进一步验证实验结果,本文又建立了一个新的数据集,包括两组从互联网下载的正面照,照片中人物表情自然放松。一组为明星,一组为教师。本文构建了相应模型展开实验,试图回答具有相似社会行为的个体是否具备相似人格特征这一问题。之前建立的“面相数据集”(physiognomy dataset)用于训练神经网络,这一新数据集用于测试。

实验结果表明:同一组样本表现出若干相似的人格特征。明星组在“聪慧性”(reasoning)和“兴奋性”(liveliness)上得分较高,在“情绪稳定性”(emotional stability)上得分较低。明星通常学得快、反应也快,这就印证了“聪慧性”的高得分。相比之下,得分低的两项表明他们的情绪缺乏稳定性、性格活泼热情,这正反映了数据集中明星的个性特点。与之不同的是,教师组在“兴奋性”(liveliness)和“外向性”(extrovert)上得分较高,日常生活中,他们往往精力充沛、善于表达、懂得与学生沟通,与实验结果相差无几。

图片来自文章

通过以上分析可知,预测人格和真实人格之间存在一定关联。本文提出的模型可预测同组受试者的共有相似人格。未来研究可将3D面部特征与深度学习结合。此外,应建立更大的实验数据集,把更多不同职业、不同种族的人群包括在内,而不仅限于在校大学生。

原文发布时间为:2017-09-13

时间: 2024-10-23 15:03:52

【模式识别国家重点实验室】深度学习教你 “以貌取人”的相关文章

运用深度学习教机器人理解自然语言

雷锋网按:本文作者Jonathan是21CT的首席科学家.他主要研究机器学习和人工智能如何使用在文本和知识中让计算机变得更智能.他在德克萨斯农工大学获得心理学学士学位和工商管理硕士,在德克萨斯大学获得计算机博士学位.译者/赵屹华 审校/刘帝伟.朱正贵 责编/周建丁. 在深度学习出现之前,文字所包含的意思是通过人为设计的符号和结构传达给计算机的.本文讨论了深度学习如何用向量来表示语义,如何更灵活地表示向量,如何用向量编码的语义去完成翻译,以及有待改进的地方. 在深度学习出现之前,我们书写的文字所包

安防大数据挖掘的利刃:模式识别和深度学习技术

人工智能的概念提出已经很多年,但最近一次大热是在"人机大战"战胜世界围棋高手李世石的Alpha Go.同样,近几年安防行业热门的深度学习和模式识别的概念也频频出现在公众的视野当中,那么它们是如何应用在安防领域中?目前最前沿的应用又有哪些?以下将为您一一解答. 安防大数据挖掘 平安城市从2010年在全国推广至今已经6年,目前各地平安城市建设即将进入扩容改建期,需要更加综合与智能的整体解决方案.公共安防已不再局限于扩张视频监控覆盖广度和密度以及清晰度,而是由扩密度的传统安防时代向注重视频大

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

独家丨2017全国深度学习技术应用大会回顾:传统的AI研究方法,在DL时代该如何变革?

雷锋网(公众号:雷锋网)按:2016年无疑是深度学习最为火热的一年,深度学习在语音.图像.自然语言处理等领域取得非常突出的成果,成了最引人注目的技术热点之一.雷锋网也报道过多次关于Google.Facebook.微软.百度在内的各大技术巨头都在不遗余力地推进深度学习的研发和应用. 2017年深度学习的势头依旧迅猛,并以更快的速度渗透在各个行业当中,对世界产生深远影响. 深度学习不但使得机器学习能够实现众多的应用,而且拓展了人工智能的领域范围,并使得机器辅助功能都变为可能.其应用领域正在加速渗透到

专访 | 清华大学朱军:深度学习“盛行”,传统方法何去何从?

朱军博士是清华大学计算机系长聘副教授.智能技术与系统国家重点实验室副主任.卡内基梅隆大学兼职教授.2013年,入选IEEE Intelligent Systems的"人工智能10大新星"(AI's 10 to Watch).他主要从事机器学习研究,在国际重要期刊与会议发表学术论文80余篇.担任国际期刊IEEE TPAMI和Artificial Intelligence的编委.国际会议ICML 2014地区联合主席.以及ICML.NIPS等国际会议的领域主席. 清华大学计算机系长聘副教授

中国人工智能学会通讯——后深度学习时代的人工智能

1956 年,在美国达特茅斯学院举行的一次会议上,"人工智能"的研究领域正式确立.60 年后的今天,人工智能的发展正进入前所未有的大好时期.我今天作的报告,将通过分析时代的特点,这个时代下人工智能与计算机的可能命运,来重新认识人工智能.认识我们赖以生存的计算机,还有我们自己. 后深度学习时代的前提 我们看到如今人工智能的春天又来了,不过和 30 年前日本兴起的人工智能热潮相比,发生了如下变化:时间不同.地点不同.主题也不同.这次人工智能的大发展与深度学习紧密相关,体现在:① 从知识情报

浪潮科大讯飞Altera用OpenCL实现FPGA深度学习语音识别加速方案

11月17日,在正在举行的2015全球超级计算大会(SC15)上,浪潮联合全球可编程逻辑芯片巨头Altera,以及中国最大的智能语音技术提供商科大讯飞,共同发布了一套面向深度学习.基于AlteraArria 10 FPGA平台.采用OpenCL开发语言进行并行化设计和优化的深度学习DNN的语音识别方案.同时,此次发布也标志着浪潮成为全球领先的具备GPU.MIC和FPGA三项HPC异构计算应用能力的HPC系统厂商. 深度学习,需要HPC"提速" 让计算机拥有接近人类的智能水平是IT行业最

周志华KDD China技术峰会现场演讲:深度学习并不是在“模拟人脑”

编者按:12月18日,KDD China技术峰会在深圳举行,雷锋网(公众号:雷锋网)根据周志华教授当天会上所做报告<关于机器学习研究的讨论>,摘取其中亮点内容整理成本文,由亚萌.亚峰.宗仁联合编辑.此前,在今年10月21日CNCC 2016大会上,周志华教授也曾做了一次精彩演讲,感兴趣的读者可以点击链接<CNCC 2016 | 周志华 57 张 PPT 揭开机器学习本质>. 周志华, 南京大学教授,校学术委员会委员,计算机软件新技术国家重点实验室常务副主任.AAAI Fellow,

山重水复疑无路,最快下降问梯度(深度学习入门系列之七)

更多深度文章,请关注:https://yq.aliyun.com/cloud 系列文章: 一入侯门"深"似海,深度学习深几许(深度学习入门系列之一)人工"碳"索意犹尽,智能"硅"来未可知(深度学习入门系列之二)神经网络不胜语,M-P模型似可寻(深度学习入门系列之三)"机器学习"三重门,"中庸之道"趋若人(深度学习入门系列之四)Hello World感知机,懂你我心才安息 (深度学习入门系列之五)损失函数减肥