让机器告诉你故事的结局应该是什么:利用GAN进行故事型常识阅读理解

论文作者 | 王炳宁,刘康,赵军(中科院自动化所)

特约记者 | 吴桐(东南大学)

深夜,父亲捧着故事书来到小儿子的床边,温柔的念到:“……王子看着躺在面前的睡美人,轻轻的俯身吻了下去……”“爸爸,睡美人是还没醒吗?”父亲轻声地说:“刚才爸爸讲了什么来着,王子出发之前吃了四碗韭菜大蒜馅的饺子,所以睡美人终于还是忍不住醒了。”

故事型常识阅读理解(Story Cloze Test (SCT))是近几年新提出的一个文本理解任务,在这个任务中,给定背景的四句话,我们需要从两个候选句子中选择出哪一个可以被前四句话推导出来。要完成这个任务,我们需要深入理解背景的四个句子,进行推理。

▲ 图1:训练数据集样本

▲ 图2:测试数据集样本

如上图所示,这个数据集的训练集和测试集存在偏差,而且在训练集中只有正样本,没有负样本。这使得常规的判别模型难以得到应用。

来自中国科学院自动化研究所模式识别国家重点实验室的王炳宁同学,刘康老师和赵军老师在 IJCAI 2017 会议论文“Conditional Generative Adversarial Networks for Commonsense Machine Comprehension”提出了一种新的模型,使用对抗式生成网络(GAN)产生负样本,从而使分类器能够得到充分训练并在该任务上表现不俗。

模型的整体思路如图 3 所示:

▲ 图3:系统结构图

在系统流程中,生成器(generator)读入长度为四句话的故事前情(context),然后生成一个伪样本(fake)。判别器有两个输入,其一是故事前情(context),其二是训练正例(true)或是生成器(generator)产生的伪样本(fake),判别器将输出概率值以表示样本能够从故事前情中推导得到的可能性。

具体地,判别器的模型图如图 4 所示:

▲ 图4:判别器模型图

对于生成器,由于目标函数是判别器的分数值,而生成器的输出是根据 argmax 得到的一个个离散的词语,因此无法直接求导。本工作中使用了一种温度算法来近似 argmax 操作。具体来说,在预测每个词时,首先会经过 softmax 对词表中的每一个词求一个概率:

其中是第 πj 个词未经过 softmax 归一化的分数。然后对这个分数进行缩放,使大的更大,小的更小:

其中 τ 是缩放因子(温度系数),当它越大的时候,系统的输出越不确定,即每个词的概率都差不多,当这个因子很小的时候(特别的,趋近于 0 的时候),绝大部分都近似于 0,只有一个最大值近似 1。最后当前的输出为:

由于输出就由最大的那个值确定,因而可以看作是 argmax 的一种连续的近似。

随着判别器和生成器不断迭代的训练。最后得到的判别器可以判断当前输入的句子是不是可以被背景四句话推出。因此在测试阶段,本工作直接用判别器来输出一个概率来给出两个候选的可能性。这也是本工作的亮点之一,和以往 GAN 的应用不同,对抗过程中提升的主要目标是一个高性能的判别器,生成器在模型中仅起到一个辅助作用。

最后的实验结果(正确率)如下图所示:

实验中,文中将该模型同几种传统的分类模型进行对比,该模型取得了显著的性能优势,并且可以看到,在加入了关注机制以及对抗样本之后,模型的效果更进一步的提高了。该工作对于处理正负样本不均衡的分类问题具有较高的借鉴意义。

欢迎点击「阅读原文」查看论文:

Conditional Generative Adversarial Networks for Commonsense Machine Comprehension

关于中国中文信息学会青工委


中国中文信息学会青年工作委员会是中国中文信息学会的下属学术组织,专门面向全国中文信息处理领域的青年学者和学生开展工作。

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

来源:paperweekly

原文链接

时间: 2024-09-16 15:57:54

让机器告诉你故事的结局应该是什么:利用GAN进行故事型常识阅读理解的相关文章

《中国人工智能学会通讯》——7.9 机器阅读理解评测数据集

7.9 机器阅读理解评测数据集 现阶段,和阅读理解相关的数据集主要有以下五个. 1 . MCTest 微 软 研 究 院 的 研 究 员 Richardson et al [1] 在2013 年的 EMNLP 上发布了一个数据集.在这个数据集中,所有的文档都是一些叙述性的故事.它考察的推理能力被限定于一个 7 岁儿童可以接受的范围内,包含有许多常识性的推理,这些推理既包含事实性的,也包含非事实性的.这个数据集包含有两部分,一个是 MC160,还有一个是 MC500,分别包含 160 篇和 500

《中国人工智能学会通讯》——7.8 什么是机器阅读理解

7.8 什么是机器阅读理解 阅读理解对大部分人来说都不陌生.我们大都参加过高考,在大学里可能也都参加过四 / 六级英语考试,在语文.历史.地理等考试中阅读理解的题型经常出现.维基百科对于阅读理解的定义是:阅读理解是一种阅读一段文本并且对其进行分析,并能理解其中的意思的能力.而机器阅读理解顾名思义就是让机器具备文本阅读的能力,准确理解文本的语义,并正确回答给定的问题. 阅读理解任务中有三个核心的组成部分,一个是文档:还有一个是问题:最后一个是选项.其中文档通常为给定的一篇文档或者几段文本.而问题根

PaperWeekly 第十九期 --- 新文解读(情感分析、机器阅读理解、知识图谱、文本分类)

引 本期的PaperWeekly一共分享四篇最近arXiv上发布的高质量paper,包括:情感分析.机器阅读理解.知识图谱.文本分类.人工智能及其相关研究日新月异,本文将带着大家了解一下以上四个研究方向都有哪些最新进展.四篇paper分别是: 1.Linguistically Regularized LSTMs for Sentiment Classification, 2016.11 2.End-to-End Answer Chunk Extraction and Ranking for Re

Ian Goodfellow回忆GAN诞生故事:几杯啤酒喝出“20年来最酷的深度学习想法”

当Ian Goodfellow解释他在谷歌大脑所做的研究时,他引用了原子物理学家.加州理工学院教授兼畅销书作家的这句格言.但是,Goodfellow不是指自己,也不是Google内的任何其他人.他谈论的,是机器:"AI不能创造的,便是它不明白的(What an AI cannot create, it does not understand)". Ian Goodfellow在推特上转发这篇文章: 关于GAN的诞生往事 Goodfellow是世界上最重要的AI研究人员之一,在Elon

2010年最新令人无语语录

1.种草不让人去躺,不如改种仙人掌!­ ­ 2.我心眼儿有些小,但是不缺:我脾气很好,但不是没有! ­ ­ 3.人和猪的区别就是:猪一直是猪,而人有时却不是人! ­ ­ 4.原来只要是分开了的人,不论原来多么熟悉,也会慢慢变得疏远. ­ ­ 5.去披萨店买披萨!服务员问我是要切成8块还是12块?我想了想说:还是8块吧!12块吃不完! ­ ­ 6.男人忽悠女人,叫调戏:女人忽悠男人,叫勾引:男女相互忽悠,叫爱情. ­ ­ 7.政府想着怎么合理征税,老板想着怎么合理避税,而我想着怎么合理多睡! ­

程序员的“认知失调”

"不可能啊"."一定是服务器的原因"."我的程序不应该有问题啊",这些年工作听到的最多的就是这些话了,程序员都是比较自信的,总是觉得自己的程序肯定没问题.点击进入我的博客. 程序就是程序员的自我延伸,花了几个小时甚至几天时间构建的结果,最后它以"正确"的形象印入你的意识里,你自然不希望别人找出什么纰漏,即便找出什么纰漏了,自己也意识到了"不足",感情上很难接受,所以大部分人都会习惯性的"辩护&qu

生活数字化!小故事告诉你什么是大数据

工具类厂商蓄意炒作大数据,以达到售卖产品的目的,但导致的结果是很多人对大数据这一概念云里雾里.实际上,大数据就发生在你我身边,虽然你看不到它,但它却时时影响着我们的生活. 现阶段,和大数据相关的企业有三种.一种是工具类公司,他们宣传得最卖力,并且把大数据吹出了泡沫,原因是它们希望把自己的产品卖给企业:一种是依托于大数据从事咨询服务类的企业:还有一种就是实实在拥有大数据的公司,它们和我们休戚相关,也就是下面的小故事所要阐述的内容. 第一个故事,百货公司知道女孩怀孕 美国的Target百货公司上线了

学习Flash制作《黑色故事》里的一个场景

前言 我们看到鸟儿在天上飞,花草随风飘动,水里鱼儿畅游,老者蹒跚踱步,孩子们嬉戏玩耍,,,,,所有这一切,我们的眼睛都准确无误地把它们捕捉,经过大脑的计算分析,之后我们发现这些物体都按照自己的规律运动着,它们的运动是那么的不同,只因为它们都有着自己的特性.如果眼睛看到这些物体不按自己的规律运动j就会向我们报告:"发现异常情况"--现实中你不可能看到鱼儿在天上飞----这是神话,老人们穿房越脊上窜下蹦-----那是武侠,让肥猪象猴子一样奔跑-----那猪必须疯狂减肥,一头驴突然对我说&q

卧室变鬼屋,售货机变“提款机”,XPwn 破解秀告诉你“城里黑客”的新玩法

     我们体验好奇时,愿意离开熟悉的事物以及常规惯例并且敢于冒险.即使这样会让我们感到焦虑和不安. 作为一个好奇的探险家,我们接受不确定性,把我们的生活看作是一个愉快的探索.学习和成长的旅程. 这正是首届 XPwn 黑客破解秀的宣言.在国内外诸多黑客破解大赛中, XPwn 是比较特别的.它的独特之处在于:没有规则. 怎么叫没有规则呢? 例如请来16位网红一起来见证奇迹. [腿腿腿腿腿腿腿腿腿腿] 当然,没有规则还意味着,一切都可以成为破解的对象.事实也证明,黑客们使出了浑身解数,展示了无数异