EMNLP最佳长论文作者独家解读:别让机器学习放大性别偏见,其实男人也喜欢购物!

近日,自然语言处理领域顶级国际会议 EMNLP 于丹麦哥本哈根举行。EMNLP是自然语言处理三大顶级会议(ACL, EMNLP, NAACL)之一,已经于前段时间公布了录用论文及最佳论文名单。详情可参见雷锋网(公众号:雷锋网)AI科技评论此前文章:

万字长文,深度解读11篇 EMNLP 2017 被录用论文

EMNLP 2017 最佳论文揭晓,「男人也爱逛商场」获最佳长论文

其中,弗吉尼亚大学赵洁玉、王天露、Vincente Ordonez、张凯崴及华盛顿大学的 Mark Yatskar 凭借「Men Also Like Shopping: Reducing Gender Bias Amplification using Corpus-level Constraints」摘得最佳长论文。雷锋网AI科技评论邀请了第一作者赵洁玉对此论文做了独家解读。

原文地址:https://arxiv.org/abs/1707.09457

概要

包含语言的视觉识别的任务,例如图片标题标注,视觉问答系统以及视觉语义角色标注任务已经成为从图片中获取信息的不同途径。这些任务通常依赖于大量的数据集、结构化的预测方法以及深度学习提取图片及语言中的丰富信息并以此解决这类问题。其中结构化的预测方法允许机器学习模型用标注之间的关系来提升预测的准确度。例如视觉语义角色标注任务(vSRL),需要对给定图片中所展示的动词以及与该动词相关的几个角色(工具,地点等)值进行预测。例如在图1中,考虑到铲子是一种常见的烹饪工具,结构化的预测模型会有很高的几率将“tool”预测为“spatula”。

图1 

尽管结构化的预测方法可以为我们提供较好的预测结果,但是这类方法会学习到数据集中存在的偏差 (bias)。如果不对模型进行修改限定,此类模型会做出具有偏见的预测。例如在上图中,模型从数据集中学习到女性与做饭之间的联系,即便给定一张描述男性做饭的图片(1.4),模型仍然会预测其为女性。这种将女性与做饭之间联系更紧密的情况,反映了一种社会成见,对不同的性别均有不良的影响。

在本文中,我们针对男女两个性别进行研究,通过实验发现,模型不仅会学习到数据集中的偏差,并且会放大该偏差。我们提出了RBA算法用于解决被放大的偏差,并且验证了我们的算法可以有效的减少放大的bias同时几乎保持了原有的模型性能。

模型对偏差的放大

我们针对以下两个任务进行研究:基于imSitu数据集的视觉语义角色标注(vSRL)任务以及基于COCO数据集的多标签物体识别(MLC)任务。本文中将以vSRL(如上图1)为例进行解释。该任务的目标在于预测所给定图片中的动词,以及图片中的其它角色。

在研究模型放大偏差的过程中,我们定义了测量集合以及属性集合。前者包含了所能预测的动词,比如cooking,washing等;后者则是一些人口特征,例如性别,年龄等。我们定义针对某动词的性别比例,该比例取值[0,1],越接近于1,表明该动词越倾向于男性。

我们也定义了如何计算放大的bias。例如在训练集中,cooking的性别比例为33%,偏向于女性,但是在预测结果中,该比例变成了16%,表明这种bias被放大了17%。实验结果如下图2所示:不同的动词对不同的性别表现出不同的偏见程度。例如上文所提到的cooking更倾向于女性,此外“购物”,“洗衣”等都更偏向于女性;“驾驶”,“射击”以及“指导”则更偏向于男性。分析结果表明在vSRL任务中,所有动词平均放大的bias率为5%,在MLC任务中,该值为3%。  

图2 

对模型的修订

验证了模型对bias的放大作用后,我们提出了RBA算法对模型进行修订以减少所放大的偏差。我们先从训练集中获取每个动词的性别比例作为参考标准,并以此限制预测的结果,即每个动词预测的性别比例应当在相应参考标准的特定范围内。通过引入这些限制条件,我们将原有的模型变成一种具有限制的预测模型。

我们提出利用拉格朗日松弛方法对此类模型求解,该方法的优点在于我们可以利用原有的预测方法而不必重新构造算法训练模型,并且在所有限制条件均满足的情况下,该算法可以保证达到最优解。具体来说,我们对每一个限制条件设置了一个拉格朗日算子,循环地根据当前的预测结果更新所有的算子,根据这些新的拉格朗日算子来更新预测算法所利用的因子值,从而可以得到新的预测结果。当所有的限制条件均满足或者已经循环了足够多的次数后,算法停止。

实验结果(图3)表明我们的算法可以有效的减少放大的偏见,并且不失原有模型的准确度。具体来说,在vSRL中,我们减少了40.5%的平均放大bias值,在MLC任务中,该值为47.5%。在准确度上,两个模型几乎保留了原有的准确度,应用算法前后只有0.1%的差距。 

Bias on vSRL without RBA                                                      Bias on vSRL with RBA

图3 算法在vSRL数据集上的结果

本文作者:奕欣

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-11-05 20:35:39

EMNLP最佳长论文作者独家解读:别让机器学习放大性别偏见,其实男人也喜欢购物!的相关文章

EMNLP 2017 最佳论文揭晓,「男人也爱逛商场」获最佳长论文

雷锋网 AI 科技评论按:2017年 EMNLP 自然语言处理实证方法会议(Conference on Empirical Methods in Natural Language Processing)将于2017年9月7-11日在丹麦哥本哈根市召开.EMNLP是自然语言处理领域的顶级会议,由ACL学会下属特殊兴趣小组 SIGDAT(ACL Special Interest Group on Linguistic data and Corpus-based Approachesto NLP)组织

ACL 2017 最佳长论文,带你创造一门优雅的新语言

雷锋网 AI科技评论按:在昨天结束的ACL 2017大会的正会上,分别公布了今年的终身成就奖和五篇最佳论文奖.本篇文章雷锋网将带你一块儿来解读其中的最佳长论文<Probabilistic Typology: Deep Generative Models of Vowel Inventories>. 在了解这篇文章之前,首先需要了解一些语言类型学的知识.根据语言类型学的研究,发现任何一种人类语言都有元音,例如英语中的[i], [u], [æ]等,把所有语言中的这些元音收集起来(目前收集的大概有6

CVPR 2017最佳论文作者解读:DenseNet 的“what”、“why”和“how”|CVPR 2017

雷锋网 AI 科技评论按:CVPR 2017上,康奈尔大学博士后黄高博士(Gao Huang).清华大学本科生刘壮(Zhuang Liu).Facebook 人工智能研究院研究科学家 Laurens van der Maaten 及康奈尔大学计算机系教授 Kilian Q. Weinberger 所作论文<Densely Connected Convolutional Networks>当选 CVPR 2017 最佳论文,与苹果的首篇公开论文<Learning From Simulate

自然语言处理顶级会议 EMNLP 最佳论文出炉,聚焦神经网络 (下载)

2016 年自然语言处理(NLP)领域的顶级会议--自然语言处理实证方法大会(Empirical Methods in Natural Language Processing,EMNLP)将于11月 1 日至 5 日在美国德克萨斯州奥斯汀市举行.今年网上报名时间10月22日截止,因此本届大会参会人数暂时还无法确定.不过,去年和前年的 EMNLP 大会都有来自学术界和产业界上千人的参与. 根据一位评审的Twitter透露,本次 EMNLP 大会共收到来自 50 多个国家和地区近千篇论文投稿(包含无

SIGIR 2017:微软包揽最佳长短论文,清华获最佳学生论文(附作者讲解视频)

ACM SIGIR 是国际计算机学会主办的信息检索领域顶级会议,近日在日本东京举办.雷锋网(公众号:雷锋网)AI科技评论消息,SIGIR 2017 的最佳论文及最佳学生论文奖已经颁布,结果如下. 最佳论文 最佳论文得主 BitFunnel: Revisiting Signatures for Search Bob Goodwin (Microsoft), Michael Hopcroft (Microsoft), Dan Luu (Microsoft), Alex Clemmer (Heptio

你点一次广告,会创造多少价值?|KDD论文核心算法独家解读

近日,来自阿里妈妈精准技术团队的论文<淘宝展示广告中的OCPC智能调价算法>被国际数据挖掘领域顶级会议KDD(Knowledge Discovery and Data Mining)收录. 该论文围绕OCPC智能调价,创新地提出了一种双层优化形式,将优化广告主价值转化为首要约束条件,将系统根据预估收益对广告进行排序作为内层优化问题,将用户体验和平台收益的最大化作为外层的寻优问题,并提出了相应的求解方法.最终达到不仅广告主效果优化,平台商业收入和用户指标也获得优化的三位一体目标. 研究问题:传统

IJCAI 2017 最佳论文明日公布,华人已承包最佳学生论文奖

雷锋网AI科技评论按:研讨会开了几天,IJCAI 2017正会终于要开始了,接下来的几天将是一系列激动人心的特邀演讲和各种奖项的确定和颁发. 在明天早上的开幕典礼上,将从6篇入围的论文中确定期待已久的两项Distinguished Papers奖.这6篇论文当中,3篇Distinguished Student Paper全是华人学生的论文,而Distinguished Paper中也有一篇是中国学者的工作.所以前一个奖项已经被中国学生包了,后一个也很有可能会是中国学者获奖.在颁奖之前,我们不如先

IROS多项奖项公布!中国队伍称雄抓取竞赛,华人学生获最佳学生论文奖

9月27日,在温哥华举行的第30届IROS大会进入正会最后一天,在当天中午,大会也颁布了多项奖项. 颁布的奖项包括:IROS创新技术奖.IROS杰出服务奖.IROS青年专家奖.JTCF娱乐文化最佳技术论文奖.IROS 2017竞赛奖.IROS 2017 创业企业优胜奖以及多项最佳论文奖项.获奖者如下: IROS创新技术奖:Kevin M. Lynch(西北大学),获奖原因:在机器人操作方面的杰出贡献: IROS杰出服务奖:Nancy M. Amato(德克萨斯 A&M大学): JTCF娱乐文化最

KDD 2011 最佳工业论文中机器学习的实践方法-翻译

作者:黄永刚 Practical machine learning tricks from the KDD 2011 best industry paper 原文链接:http://blog.david-andrzejewski.com/machine-learning/practical-machine-learning-tricks-from-the-kdd-2011-best-industry-paper/ 研究机器学习的论文通常倾向于提出一种新理论或算法,对于问题背景.数据表示.特征工程