台湾大学黄意尧:深度残差网络下的弱监督关系抽取

在今年的 EMNLP 2017 上,台湾大学黄意尧与加州圣塔芭芭拉大学 (UCSB)William Wang 教授有一篇合作论文被录用。受雷锋网(公众号:雷锋网) AI 科技评论邀请,黄意尧撰写了关于这篇论文的研究历程,以供学习与参考。雷锋网 AI 科技评论做了不改动原意的编辑与修改,将繁体字转换为简体,并将一些台湾常用表述转换为大陆的通用说法。

论文名称:Deep Residual Learning for Weakly-Supervised Relation Extraction

论文地址:https://arxiv.org/abs/1707.08866

近年来,越来越多人关注在关系抽取 (Relation Extraction) 的题目上,大部分的研究集中在使用更复杂、更结构化的神经网络,并测量在 SemEval 2010 的关系抽取数据库上。

但在这个数据库上,最大的问题是数据太少,总共只有 10,717 条数据,导致大部分的模型参数不能太多,要不然会有过度拟合 (over fitting) 的现象发生。

相较於另一个数据库,NYT dataset,总共有 695,059 条数据,採用半监督式学习:distant supervision 来收集数据。这个数据库有足够大的数量来进行大型神经网络的实验。

出於这个动机,本文进行大型神经网络在 NYT dataset 数据库的实验,并提出深度残差网络来解决 distant supervision 带来的噪声干扰。

问题探讨

我们使用卷积神经网络来进行关系抽取,取经於计算机视觉与深度卷积神经网络的成功,我们透过增加层数,来增加神经网络的参数,希望可以帮助关系抽取的学习。结果如图一:

图一、各式卷积网络的结果

但我们却发现,使用 9 层卷积神经网络 (CNN-9) 的效果,并没有单层 (CNN) 的好。这个结果跟过往的经验违背。我们猜测原因是,在 distant supervision 的数据裡面,有太多错误标签的数据,这些数据带来太多的噪声,而这些噪声随著越深层的神经网络而被放大,导致 9 层卷积神经网络 (CNN-9) 的结果比单层 (CNN) 更差。为了解决这个问题,我们使用残差网络,来帮助网络的特征学习。

残差网络在半监督式学习的应用

基於上面的实验,我们知道浅层网络在 distant supervision 的数据库中,能学习到比较好的特征。於是,我们设法让浅层网络的特征,可以跳跃传递至深层网络。

图二,残差网络在关系抽取的架构

如图二所示,我们使用拥有两层卷积网络的残差区块,将浅层网络的特征传到较深层的网络。特过这样的设计,我们可以依照数据库的大小,来堆迭网络架构,让网络可以选择较不被噪声影响的那层网络特征来进行关系分类。

结果

这篇文章,提出一种,解决 distant supervision 噪声对大型网络影响的方法。在表一,我们可以看到,9 层的残差网络,与 state-of-the-art(PCNN+ATT) 的模型,有差不多的结果,并在高顺位候选的关系上,有更棒的效能。证明,利用残差网络,可以在 distant supervision 的数据库中,抽取更有用的特征。

表一,残差网络与其它网络结构的结果比较

结论

本篇文章提供读者、研究人员可以在 distant supervision 的数据库使用大型深度神经网络。但要注意,此种半监督式学习的噪声,会影响到实验结果。利用残差网络可以解决这样的问题,这篇文章在关系抽取的研究上,证明其结果。

文章趣事

本篇文章是我在加州圣塔芭芭拉大学 (UCSB),做交换学生时完成的作品。其实圣塔芭芭拉是一个充满阳光,很美的海滩,每天都可以冲浪、晒太阳、玩水,加上当时课选很少的情况下,觉得生活过得太安逸,决定加入当时新晋教授 William Wang 的实验室,学习相关领域的知识。但没想到,我是实验室前 5 个进来的学生,导致所有知识都要靠自己来,自己吸收与学习。幸运的是,教授有许多时间,跟我讨论题目,但另一方面,我也好像在过一个博士班学生单独奋斗的生活,每天死盯著论文,想理解关系抽取到底发生了什么事。很幸运地,最后我把文章完成,并且顺利的投上 EMNLP。很感谢 William Wang 教授愿意给我机会,与我进行大量的讨论。William Wang 教授在知识图谱的相关研究很厉害,有兴趣的同学,可以申请到他的实验室进行研究。

本文作者:奕欣

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-12-05 00:18:00

台湾大学黄意尧:深度残差网络下的弱监督关系抽取的相关文章

秒懂!何凯明的深度残差网络PPT是这样的|ICML2016 tutorial

联合编译:Blake.高斐 雷锋网注:何凯明博士,2007年清华大学毕业之后开始在微软亚洲研究院(MSRA)实习,2011年香港中文大学博士毕业后正式加入MSRA,目前在Facebook AI Research (FAIR)实验室担任研究科学家.曾以第一作者身份拿过两次CVPR最佳论文奖(2009和2016)--其中2016年CVPR最佳论文为图像识别中的深度残差学习(Deep Residual Learning for Image Recognition),本文为何凯明博士在ICML2016上

深度学习网络大杀器之Dropout(II)——将丢弃学习视为集成学习之我见

首发地址:https://yq.aliyun.com/articles/110002 更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 关于dropout的分析,可以见博主的另外一篇文章: <深度学习网络大杀器之Dropout--深入解析Dropout> 1.引言 随着2012年Hiton的文章<ImageNet classification with deep convolutional neural networks>[1]的问世,掀开了学

弘成教育CEO黄波:从美国网络教育中嗅到商机

如何发现http://www.aliyun.com/zixun/aggregation/26984.html">网络教育这样一个发展机会的?有什么样的一些故事可以和我们网友一起分享分享. 黄波:我90年代一直在美国,从94年开始,非常喜欢上网,95年以后我当时在做管理咨询的时候我给迈克尔公司做了一些网络教育的交流,对于美国的网络教育是比较了解的,99年回国我最早做电子商务,但是在做电子商务的过程中,感觉到一个是付款,一个是传递和其他的一些环节上的问题就中国所存在的问题,当时刚好看到中国网络

h5-H5在手机端3G4G网络下上传图片等信息很慢

问题描述 H5在手机端3G4G网络下上传图片等信息很慢 用户在移动端3G.4G网络的情况下,填写信息,包括选择图片,然后上传图片 和文字表单信息到服务器,这一过程有的人花了好几分钟才接收到"提交成功"的提示. 这是什么问题,需要怎么处理? 前端在图片这一环节,已对图片进行压缩处理.后端php该如何处理? 最关键的是:用户要等很久,才又反馈信息. 解决方案 服务器端调试下,看看从收到响应到返回花了多少时间.dns解析.网络传输.服务器处理.客户端界面渲染等都可以存在问题,要调试才知道.

4g-求教:只有 iphone6 plus 4G网络下打不开网站

问题描述 求教:只有 iphone6 plus 4G网络下打不开网站 测试手机是:iphone6 plus 服务器环境:windows 2003 网站部署环境:IIS6 我查看了,IIS,该网站访问的日志:#Software: Microsoft Internet Information Services 6.0#Version: 1.0#Date: 2015-12-07 01:54:23#Fields: date time s-sitename s-ip cs-method cs-uri-st

android app 在移动网络下无法连接服务器

问题描述 android app 在移动网络下无法连接服务器 我们的服务器在电信托管,现在开发了一款app应用,如果不使用wifi用移动网络不能访问服务器的数据了 但是在联通网络下却可以,在移动网络下面拿手机去访问官网也可以,唯独在app里面不能访问,以前我们的项目部署在阿里云服务器的时候没有任何问题.最近公司自己购买了一台物理服务器就出现这样的问题.就是手机卡是移动的,打开流量能上网,用手机自带的浏览器也能访问我们的网址,即我们的项目,可是app却访问不了.各位程序员兄弟遇到过吗?知道怎么解决

app-androd H5混合开发 当无网络下,android怎么加载H5界面

问题描述 androd H5混合开发 当无网络下,android怎么加载H5界面 利用webview 套H5开发app,本人是实习生,有一下几个问题: 1.当无网络下,android怎么加载H5界面,不可能都把H5界面存放在本地吧,如果存放部分,怎么实现有网的时候进行替换. 2.怎么可以实现更好的自定义错误界面来替换自带的 解决方案 加载web页面就用webview组件,你可以捕获返回的网络错误码,自己跳转到其他页面 解决方案二: 首先你得对网络进行判断,初次有网进入的应用的时候就把内容缓存保存

一文读懂深度适配网络(DAN)

这周五下午约见了机器学习和迁移学习大牛.清华大学的龙明盛老师.老师为人非常nice,思维敏捷,非常健谈!一不留神就谈了1个多小时,意犹未尽,学到了很多东西!龙明盛老师在博士期间(去年博士毕业)发表的文章几乎全部是A类顶会,他在学期间与世界知名学者杨强.Philip S. Yu及Michael I. Jordan多次合作,让我非常膜拜!这次介绍他在ICML-15上提出的深度适配网络. 深度适配网络(Deep Adaptation Netowrk,DAN)是清华大学龙明盛提出来的深度迁移学习方法,最

android-安卓手机能不能在3G或4G网络下,进行点对点socket通信?

问题描述 安卓手机能不能在3G或4G网络下,进行点对点socket通信? 我试过在wifi的情况下,两个安卓手机可以进行点对点通信,但是在3G或4G网时就不行了,想实现通信必须通过pc服务端. 3G或4G网络下,两台安卓手机能否进行socket点对点通信,如果能的话,是用什么办法呢,有什么例子 解决方案 android 3G网络下Socket通信 解决方案二: 可以的,但是还是需要一个服务器负责建立连接. 解决方案三: 最少有一个设备在公网上啊,或者有一个公网上的服务器中转.或者两个设备在同一个