「用 AI 识别 xxx」,真的靠谱么?

最近不少人工智能和计算机视觉的学者,带着自己的机器学习技术投身于心理学研究。出发点很好:用更新的技术探究问题。但是他们的成果让人担心。前有用人工智能分析潜在罪犯,后有用人工智能分辨性取向。这些论文都引发了轩然大波。不少人抨击之点就是伦理问题。其这些文章的科研问题也存在。相比于安防领域的面孔身份识别广受赞誉,那一类分析潜在罪犯潜在性格的机器学习研究其实都有值得推敲指出。

简单粗暴一句话:目前「用 AI 识别 xxx」一类研究,没想象中靠谱,不要轻信。

就让我们从斯坦福大学学者训练人工智能识别性取向说起吧。这篇文章无论从伦理角度,还是科研本身的角度都有问题,可能唯一没有问题的就是作者的专长机器学习了吧。让我们先说伦理部分,再说统计部分,最后就是致命的研究基础的缺陷。

之前我已经在华沙:斯坦福大学「识别同性恋 AI」是怎么办到的?可能引起哪些伦理争议?下吐槽过,这一次详细谈一谈。

回顾下这篇研究(论文:Deep neural networks are more accurate than humans at detecting sexual orientation from facial images.)两位作者收集到大量社交网络上的图片,以及图片所有者的性取向,训练出一个识别性取向的‘机器’。尽管动用了 DNN 神经网络等计算机技术,但是整套系统的基础却是基于认知心理学与生物学的。作者也承认,他们训练出来的分类器的原理是区分一下两个与性取向相关的特征点,我们可以总结为:

1. 荷尔蒙(雄、雌性激素)影响下面孔特征(面孔比例,比如宽高比,下巴长度等);

2. 不同性取向者喜欢的发型、胡型、以及妆容、甚至眼镜等配饰。

尽管在机器学习方面,这篇文章做得很好,但是其余领域暴露出不少遗憾。这我可以归结为认知心理学与计算机科学的差异,至少在认知心理学方面伦理是极其需要看重的,所以我们先从伦理出发。

首先让人担心的就是选择图片的伦理问题。文章说近三十万张图片来自于一个美国婚恋网站。很难让人相信这三十万张面孔,以及性取向信息都获得了主人的允许。这些头像虽然出现在婚恋网站上,被允许以约会目的来互相看,但并不等于被允许基于试验用途。认知心理学的实验,既需要学校伦理委员会的认可,也需要被实验者(或者图片提供者)的许可;不当使用他人图片难免有泄漏和其他的风险。科研伦理可能不是所有专业的必修课,但是至少在心理学科研领域是重中之重。图片选择过程让人觉得遗憾。

诚然人工智能对于生活与科研都有极大帮助。但是如此的结果不由得让人不安:我们的大量数据都在科技大鳄手中,通过分析,是不是他们能掌握我们所有的特点,然后精确的投放广告,或者用二级价格歧视榨取我们身上钱财。你看,这个能分辨性取向,明儿也能分辨爱不爱花钱(从面孔的化妆程度:科学家怎么研究化妆品呢?),分辨你爱不爱买特定品牌,甚至分析你什么时候最捂不住钱包,什么时候耳根子最软,滥用起来就是能榨干消费者。

其实,技术本身应该是中性的,但是解读和利用是我们需要认真讨论的。没准在未来,到处都是针对每个人(从面孔,消费记录,个人经历分析而来)的量身打造消费陷阱了。所以说这项研究,在没有扎实的理论支持下(我们之后谈理论问题),很有可能被误解被误读。

不容小觑的误读,正是基于统计层面的。有时候单纯的统计数据并不能直接反应效用。作者声称,他们的分类器相比真人更准确分辨性取向:对男性正确率为 81%(真人只能达到 61%),对于女性能达到 61% 正确率(真人准确率仅为 54%)。看似此项分类器效果显著。但是由于在实际生活中,异性恋的比例超过 95%。;考虑到很有可能的基本比率谬误,所以把此项分类器用在真实生活中,正确率并不会有那么高。作者也承认,这么高准确性仅会出现在:明确知道有两张性取向不同者照片时。但是真实生活中哪有这么良好的判断环境。

其次此项研究还有一个要命的问题,既是实验的不足,也是许多人误读的来源。让我们用统计角度。如果简化整篇文章,作者做了三步:1. 寻找训练集中不同性取向者的面部特征;2. 训练机器识别这些特征;3. 在测试集面孔上此类特征,并预测性取向。不过,男异性恋者有 x 类胡型的概率,并不等于有 x 类胡型为男异性恋者的概率。所以说,不少人看到论文给出的图片,就用图上特征推断性取向会是极大地误读。

最大的遗憾来自于理论基础和实验。

文章作者也承认,训练集是来自于网上图片。特点是多样,生活化。但是缺点就是控制性。相比计算机视觉学者更喜欢这样自然、通用的数据。我们认知心理学、神经科学工作者更倾向于控制的数据。看似前者更有用,但是别忘了,大千世界中,互相影响的因素众多。倘若不加以控制就难以得出清晰的结论。

虽然有人说不能按照心理学严格标准去要求此类基于大数据的研究。但是我得说一句,不仔细要求就会错误百出!

此项研究中使用了大量自己上传的图片。所以图片的光源,面孔朝向均无控制。然后作者用我们国家自主研发的 Face++(给国产点个赞!)对五官进行了标记。就这简单两步可能错误百出。因为图片是二维的,所以光源朝向都可能会 ‘扭曲’ 五官相对位置,从而干扰结果。Kramer(2014)的论文中就提到,同一个摆出不同的表情以及转动脑袋都会影响二维图形上的面孔比例。所以此项研究没有控制面孔图片,会给分析带来不少的未知干扰因素,削弱结论的强度。

我们再举几个例子。英国的科学家 Burton 和 Jenkins 曾经长期研究过一个人面孔在不同环境下差异(可以读读我这篇专栏文章: 神秘博士圣诞特辑的一次脑洞展开)。

这是 Bruce 与同事们在 1999 年的论文中的一个例子,这一堆面孔披头盖脸的忽闪上来,真心不太好判断左边那张面孔属于右边十个人里面的谁。原因之一就是不同环境。光源,甚至拍摄角度都会影响面孔的形态。别忘记了:头像照是你的三维面孔向二维图像的投影。你面孔上的宽高信息会随着光线和面孔朝向变化。

不同的镜头有不同的光学特性,同样的面孔在不同焦距下也不一样。面孔的“两性异性”也会变化。难道镜头变化,所以你的性取向就变了么?

其次,不同角度会有透视问题。低头抬头都会让面孔宽高比变化,也会让下巴宽度变化。难道这也会改变性取向?

再比如小李子。随着年纪增长,他的脸颊见宽,胡子见多,下巴见方。倘若按照本文的理论基础去分析,难道奥斯卡影帝的性取向随着年纪在那变化么?

作者也承认,他们分类器对于男性面孔结果更清晰。一个原因就是胡须在男性面孔上的鲜明(关于鲜明性,可以看这个回答:华沙:大脑是如何做到自动过滤出颜值高的女孩子的?):材质特殊,高对比度,占据面积大。因此不同性取向者不一样的蓄胡须方式,会在此项判断上占据主导地位。所以说,此项分类器,倘若训练时依靠发型、胡型、以及妆容、配饰,而面孔特征;那么照片本身会极大影响此分类器的效用。

左边两个为异性恋,右边两个为同性恋。男性的两张明显可见胡须的差异。明显可以看到男性的面孔有眼镜。所以说,只针对白人的研究可能没有控制教育水平这个因素。

仔细看一看,是不是左边的男性更仰头,右边的男性更低头。仰头和低头本身就会在拍摄过程中改变图像上面孔比例,因此结果需要打一个问号。

再说荷尔蒙。虽然说有不少学者认为在胎儿期的荷尔蒙水平会影响性取向。的确有很多学者承认荷尔蒙水平会影响面孔的特征,所谓两性异性(如 Rhodes 在 2006 综述文章,也可以翻一下我的文章:看脸这事儿上,男女有别。)。比如雄激素更多的男性,胡须旺盛,下巴坚毅宽阔;和此研究的数据结果吻合。但是,此项研究应该说用机器:1. 发现了荷尔蒙对于面孔形状的改变,2. 然后借用一个理论‘荷尔蒙和性取向相关’,3. 最后推论说能够发现性取向。仔细想想看,第 2 步是整个实验的逻辑核心;但也是解读时容易犯错之处。

另一个角度看,别忘记这个荷尔蒙水平还会影响食指和无名指长度比较。也就是说,这个实验的原理,在某种程度上可以说是与 ‘通过看手指长度判断性取向’ 类似。更要命的是,之前有不少论文抨击过「荷尔蒙与面孔比例」的关系。比如 Bird 和同事们(2016)发现,分析大样本数据后,面孔宽高比与荷尔蒙没啥关系。因此,假如面孔比例不能预测荷尔蒙分泌,难么此研究基于的荷尔蒙 - 性取向假说不可能在面孔上被反映出来。总之,这篇文章的基础值得怀疑。

倘若这些研究是利用在分析面孔探究皮肤病我会双手赞成。但是如果分析人的特征,性格,我觉得计算机视觉的学者还是要找一个心理学工作者一起研究。机器学习用途广大,但是不加以分辨的使用会带来误解和谬误。只有理论基础扎实的研究,只有伦理方面无忧的研究,才能给我们的生活给以帮助!

本文作者:AI研习社

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-11-01 04:42:55

「用 AI 识别 xxx」,真的靠谱么?的相关文章

「2017 AI 最佳雇主」评选,多家顶尖互联网企业已报名,关乎全球25万人工智能人才的未来

4 月中旬,雷锋网联合旗下人工智能频道 AI 科技评论.环球科学 和 BOSS 直聘,共同重磅推出 AI 领域第一份雇主评选榜:「2017 AI 最佳雇主」榜单. 榜单一经推出,就受到人工智能业界极大关注.报名启动一个月,已经有超过 70 家国内顶尖人工智能企业报名,其中代表性的企业有(此处介绍按首字母顺序排列): 360:中国领先的互联网络安全企业,汇聚了国内规模领先的高水平安全技术团队,并依托大数据.云计算平台.人工智能技术打造一系列智能硬件及提供多种互联网服务. 阿里云:提供云端运算服务的

平安科技亮相重庆,「AI人脸识别+健康医疗」首秀

9月1日,平安科技亮相重庆,参加由中华医学会.中华医学会健康管理学分会主办的第十一届中国健康服务业大会,其「AI人脸识别+健康医疗」解决方案在本次大会上首秀.平安科技与深圳市天方达健信科技股份有限公司(以下简称天方达)以联展的形式,向外界展示其日益精进的人脸识别.声纹识别.大数据分析.体检智能录入系统等产品及技术解决方案. 「人脸识别+健康医疗」解决方案  "刷脸就医"的时代已经到来. 如果说智慧医疗是医疗领域的重大创新,改变了传统的就医流程,那么,「人脸识别+健康医疗」则是在此基础上

解读|百分点凭啥能推出「中国首个行业AI决策系统」

好大的口气,即使按照狭义来定义人工智能公司,国内少说也有几百家,做智能决策产品和解决方案相关的也不在少数.Deep Matrix凭什么敢称为「中国首个」「行业」「AI决策系统」?我们分别来解读下. 先听一下百分点集团董事长兼CEO苏萌对于智能决策的背景阐述和理解. 背景 苏萌从决策的进化.智能革命所带来的鸿沟开始讲起.他认为中国之后的下一个世界工厂将是无人工厂:成本和技术优势决定选址,拼的是智能技术.大数据和人工智能的结合,以及是否能提供智能机器人所需的低廉能源. 这轮智能革命所带来的冲击将远远

GAP一日超强促销「线上讲价系统」为何让人好想买下去?

有些企业想要的创意行销活动,希望做出「促购」效果,所以,创意人员的脑袋瓜,拼命问自己,到底要「哪一种画面」,才能将这些消费者「带到」实体店面.或线上购物车? 我们想过好多好多点子,要大家天天来打卡,或者要大家去询问身边的达人(譬如3C或http://www.aliyun.com/zixun/aggregation/17945.html">面膜产品来安心购买),或者让买过的人写证言--- 这周 看到一场更简单的促购型行销活动 ,让人吓一跳:「原来促购的创意,可以这么简单!」,这是来自常搞奇怪

对话「平衡车之父」:把Solowheel带回中国

1986年,崔健在北京「纪念国际和平年百名歌星演唱会」上吼出了<一无所有>,来自西方的摇滚乐第一次在中国大陆扎下了根,在那个特殊的历史时期,「迎进来」和「走出去」成了东西方文化融合与交流的重要符号,也是在这一年,Shane Chen(陈星)在北京农业大学获得农业气象学学位之后,前往美国闯荡. 次年,日本学者Kazuo Yamafuji教授创造出的一种基于陀螺仪的灵论平衡装置,并且在日本申请了一项专利,也就是最初平衡车的雏形,但当时只是停留在了实验室阶段,没有商业化,当初谁也没想到平衡车在二三十

「为极致 敢追求」魅族校园行正式启动!

"你敢不敢追求极致?"5月起,http://www.aliyun.com/zixun/aggregation/24427.html">魅族科技携手网购潮(wanggouchao.com)和XDACN社区(www.xda.cn)席卷华中华南60所高校,在有"九省通衢"之称的武汉 举行大型巡展宣讲活动--"为极致•敢追求魅族校园行". 活动于5月12日开始,活动内容包括线上线下两环节,线下环节有大型路演体验.精彩的街舞表演.有趣的游戏

俊美狼人泰勒-洛特纳佩戴伯爵出席「暮光之城3:月蚀」纽约首映会

Altiplano系列白金超薄腕表,18K白金表壳.RMB:108,800 好莱坞最热门的新星泰勒•洛特纳(Taylor Lautner)在新片「暮光之城3:月蚀」纽约首映会上证明他是最迷人的狼人:他身着灰白西装.深色衬衫,搭配一只Piaget Altiplano 40mm腕表,白金表壳配上深邃的黑色面盘更挥洒出无限的巨星风范.Altiplano充满古典情怀的造型及与时俱进的超薄设计不仅是泰勒•洛特纳的完美选择,更立刻使得他为伯爵着迷.[page] 限量版Piaget Polo Fortyfiv

【AI版狄仁杰】爱丁堡大学团队教AI识别犯罪剧中的罪犯,正确率达60%仍不及人类

马路的尽头竟然有一具尸体,凶手是谁?或许AI可以解决这个问题. Lea Frermann是爱丁堡大学的一名博士后研究员,她所在的团队通过<犯罪现场调查>系列电视剧的相关视频.音频和文本训练AI学习识别每一集中的罪犯. AI识别犯罪剧中罪犯,准确率达60% 研究人员将五季<犯罪现场调查>(共39集,59个案件)的录像.脚本和背景音映射成电脑可以读取的格式.数据被输入到一个计算机模型中,随着每个事件的展开,AI学习如何处理情节,并不断修正罪犯的身份. 在每集电视剧结束前10分钟,AI达

微信公众平台发布「公众号数据助手」官方小程序 方便手机查看公众号运营数据

昨晚,微信公众平台又搞事情,发布了「公众号数据助手」官方小程序,支持公众号管理员及运营者在手机端更方便.及时地查看运营数据.以后就可以在微信小程序就可以查看了,不用再用电脑登录才能访问.怎么操作呢?首先在小程序那搜索"公众号数据助手",点击进入( 哪里找到小程序 ) 01.帐号登录 已注册或绑定公众号的用户(包括公众号管理员.长期运营者和短期运营者),打开小程序首页可直接在列表中选择公众号登录.登录后点击帐号头像可以返回首页列表切换公众号. 02.用户分析 1.支持查看公众号的实时粉丝