阿里人工智能连夺两项世界冠军

不久前的云栖大会上,马云宣布成立“以科技创新世界”的阿里巴巴达摩院。

最近,达摩院iDST自然语言处理团队在自然语言处理技术取得的两项新成绩:在全球顶级的知识库构建测评KBP2017中,斩获英文实体发现测评全球冠军;在中文语法错误自动诊断大赛(Chinese Grammatical Error Diagnosis,以下简称 CGED)三个level中全面夺得冠军,核心指标比其他参赛机构高出一倍。

比赛中使用的分词、词性标注和句法分析等基础NLP工具都是由该团队自主研发的AliNLP 平台。这个平台支持阿里大生态的每天多达600亿次的自然语言处理需求。

这次参赛的是阿里巴巴iDST自然语言处理首席科学家司罗以及iDST自然语言处理团队。

司罗

司罗是全球权威机器智能学者,曾担任美国普渡大学计算机系终身教授,主持的20余个项目得到美国政府、工业界资助,先后获得美国国家科学基金会成就奖、雅虎、谷歌研究奖等。

语法错误自动诊断大赛夺冠

中文语法错误自动诊断大赛(Chinese Grammatical Error Diagnosis,以下简称 CGED)是自然语言处理领域的权威赛事,由IJCNLP联办,今年已是第四届。阿里巴巴iDST在三个level中全面夺得冠军。即便是最难的level,核心指标F1(综合考虑准确率与召回率)依旧达到了 0.2693,比其他参赛机构高出一倍。

“组办方给我们一个题目,然后由我们研发系统,然后测评,就是给我一个句子,我挑出出错的那个地方。” iDST自然语言处理团队主力成员李林琳表示,这次组办方给的比赛的背景是:学习中文的外国人数不断增加,由于中文的博大精深,外国友人在中文写作中会出现各式错误。主办方挑选了一些外国友人写的中文作文片段,希望参赛者用人工智能算法自动识别里面的语法语义错误。

赛题中包含的错误分为四种类型:多词(Redundant)、缺词(Missing)、错词(Selection)和词序错误(Word Order)。系统性能的评估也由易到难分为3个level:detection level(识别句子有没有错误)、identification level(识别错误句子的具体错误类型)和position level(识别错误的位置和对应类型)

比赛要求诊断的四种错误类型

比如,“我要送给你一个庆祝礼物。要是两、三天晚了,请别生气”这句话,在第3个Level,AI需要明确指出“两、三天晚了”存在错误才能得分(正确用法应该是“晚了两、三天”)。此外,团队还结合了分词、词性、依存句法等特征,同时将language model等无监督的知识embedding到神经网络。依靠RNN结构以及词性、依存等特征,不光能识别短程的语法错误,比如“一头牛”好于“一只牛”;也能识别比较长程的语法错误,比如“虽然父母很辛苦,而且对孩子照顾得很好”中“虽然”和“而且“不搭配。此外,他们针对比赛的3个不同level,设计了不同的基于神经网络的snapshot emsembles方法。

基于深度学习的结果

将被用于这些方面

据了解,这次比赛中主力成员李林琳,谢朋峻,杨毅等通过在深度学习中引入无监督的语法知识,同时结合了集成学习等方法取得了好成绩。

李林琳说,中文语法诊断的挑战性在于,中文语言知识丰富、语法多样;人在判断一句话是否有错误的时候,会用到长期积累的知识体系(比如一句话是否通顺、两个词是否可以搭配、语义上是否成立等)。相比之下,比赛提供的训练数据非常有限,仅通过训练数据来识别错误是很困难的。

“这是一个基于深度学习的结果。”李林琳说,深度学习有很多基础模块,比如做了中文词汇切分的积累,就是让AI首先知道什么是一个词,比如给AI一句话“我是中国人”,AI可以将这句话切分成“我”“是”“中国人”三个词,然后要对词性做一个分析,知道“中国人”是一个名词,和动词“是”搭配就是“动词+名词”,即动宾短语。如果是副词+名次,就不对了。这哥基础模块就是让AI系统学习词性的使用方法。

“还有基于更深度的句法分析,就是要检查整个句子的语法输入是否正确。”李林琳举例说,如果整个句子里面,有个主语是名词,加动宾短语,就是名词+动词+宾语,这就是一个合理的句法结构,如果少了动词,语法上就不正确 。

“整体来说,这次比赛是我们长期在AliNLP方面的积累、能力方面的综合体现。” 李林琳说,比赛中使用的分词、词性标注和句法分析等基础NLP工具都是由该团队自主研发的AliNLP 平台。

中文语法错误自动诊断会被运用在什么地方?李林琳说,AliNLP 平台支持阿里大生态(新零售、金融、物流、娱乐、旅行等)的每天多达600亿次的自然语言处理需求。比如现在大家使用的SNS软件和对方语音聊天,在一些环境下,不方便听,或转换成文字,“这个转换成文字的过程中,经常会有很多语法错误,中文语法错误自动诊断就能自动纠错,使语音转换的文字更加好理解。” 李林琳说,还有很多网络媒体的内容质量审核,即需要审核文字内容时,也可以运用到这项技术。

AI不仅能看懂英文

还能做到对文章上下文的理解

另外一项比赛,KBP是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院)指导、美国国防部协办的赛事,主要任务为从自然书写的非结构化文本中抽取实体,以及实体之间的关系。

这项测评要求AI算法在“读完”一篇英文文章后,构建一个物理世界的命名实体和实体之间关系的知识库,如“克林顿和希拉里之间是夫妻关系”、“克林顿毕业于耶鲁法学院”这样一个个实体的关系。

司罗介绍,阿里的算法可以做到对文章上下文的理解。比如,文章出现了Apple,再出现Jobs,就可以辨别出这个Jobs指的是乔布斯,而不是工作。再比如,文章出现了Microsoft,那么Apple就更有可能是苹果公司,而不是一种水果。

“另外,我们构建了一个算法去学习不同领域之间共同的部分,通过迁移学习提升我们学习的准确度。对于不同领域数据,我们取其精华,去其糟粕,进行智能学习”,司罗说。

在这次测评中,iDST团队采用经过改良的深度神经网络架构对文本进行理解。改良的架构有三个主要特点:首先该模型可以自动阅读海量文章(如维基百科)并从中汲取经验;其次,该架构可以智能选择训练数据集以保证训练数据的准确性;最后,我们采用post regularization的办法保证模型结果的一致性。

参赛机构比赛成绩公布

对于KBP2017的成绩,司罗表示:“很荣幸能够同全球的同行分享阿里巴巴的研究成果,人工智能在机器阅读理解和知识库构建上还处在起步阶段,我们正在积极和同行业顶尖机构学习交流,推动行业发展。比如我们内部建设的信息抽取平台AliIE项目就在同斯坦福大学展开积极合作”。

阿里巴巴正在将这样的信息抽取技术广泛的应用到实际业务当中,并致力于让更多的中小开发者从中收益。他们搭建的信息抽取平台AliIE拥有最顶尖的AI技术,并从一开始的架构设计就考虑到平台的开放性和可扩展性。可以让更多的开发者、研究员共同开发,并将成果回馈给这个社区。

原文发布时间为:2017-11-27

本文作者:汪佳婧

时间: 2024-09-30 09:09:06

阿里人工智能连夺两项世界冠军的相关文章

MIT评全球十大突破性技术 阿里连摘两项

本文讲的是MIT评全球十大突破性技术 阿里连摘两项[IT168 资讯]2月21日下午,美国权威科学杂志<麻省理工科技评论>(MIT Technology Review)发布2017年全球十大突破性技术榜单.在与Google.微软.IBM等科技巨头的较量中,阿里巴巴分别入选"强化学习"和"刷脸支付"两大突破性技术榜单. 作为全球最为著名的技术榜单之一,<麻省理工科技评论>全球十大突破性技术具备极大的全球影响力和权威性,至今已经举办了超过16年.

MIT评出全球十大突破性技术 阿里巴巴连摘两项

免费开通大数据服务:https://www.aliyun.com/product/odps 2月21日下午,美国权威科学杂志<麻省理工科技评论>(MIT Technology Review)发布2017年全球十大突破性技术榜单.在与Google.微软.IBM等科技巨头的较量中,阿里巴巴分别入选"强化学习"和"刷脸支付"两大突破性技术榜单. 作为全球最为著名的技术榜单之一,<麻省理工科技评论>全球十大突破性技术具备极大的全球影响力和权威性,至今

阿里人工智能实验室王刚:找到合适的应用场景是实现人工智能商业化的关键点

编者按:由中国人工智能学会.阿里巴巴以及蚂蚁金服联合主办,CSDN.中国科学院自动化研究所承办的第三届中国人工智能大会(CCAI 2017)将于7月22-23日正式召开,届时,阿里人工智能实验室杰出科学家王刚博士将分享人工智能应用的前沿趋势.在此之前,阿里云作为独家直播合作伙伴对其作了专访. 在刚刚过去的6月份,阿里人工智能实验室迎来了成立一周年的纪念日.这是一个比阿里iDST还神秘的部门,业界鲜有人知道它的存在,直到日前实验室首款终端产品天猫精灵X1的发布,这支神秘之师才正式成为镁光灯下的焦点

揭秘阿里人工智能实验室首款智能音箱——天猫精灵X1

7月5日下午,阿里人工智能实验室在北京正式发布了旗下首款智能设备--天猫精灵X1,据介绍,这款产品采用了阿里人工智能实验室自主研发的中文语义理解引擎,内置第一代中文人机交流系统AliGenie,并且依托阿里云的机器学习技术实现智能家居控制.语音购物.手机充值.音乐播放等功能. 以下是关于天猫精灵X1以及AliGenie的问答! 一.关于天猫精灵X1 Q:天猫精灵X1是什么? A:天猫精灵X1是阿里人工智能实验室推出的首款智能语音终端设备,内置第一代中文人机交流系统AliGenie.AliGeni

【ICCV 2017华人雄起】何恺明包揽两项最佳论文,40%投稿来自中国

计算机视觉顶会ICCV 2017各大奖项公布:何恺明包揽两项最佳论文奖:贾扬清率Caffe团队获"无私贡献奖":DeepMind CEO 哈萨比斯导师Tomaso Poggio获得终身成就奖.沿袭CVPR的势头,ICCV 2017华人表现依然强劲,有40%的投稿来自中国,清华大学投稿数量在所有机构中位居第一. 两年一度的计算机视觉领域顶会ICCV 2017正在意大利威尼斯召开.由于计算机视觉及相关领域的快速发展,本届ICCV参与度创历史新高,共收到2143篇论文投稿,比上届增加了26%

阿里微贷的“四项基本原则”

阿里微贷的"四项基本原则" 阿祥 中小企业融资难,催生了小额贷款的迅速发展,已经引发金融巨头之间的激烈竞争.由于种种原因,中小企业无法顺畅地从商业银行获得贷款,这就为小额信贷业务提供了市场,并且蕴藏着巨大的商机.面对渣打银行和花旗银行等中外资银行小贷服务,阿里小贷之所以形成一定规模,是因为恪守国家政策,并在技术和服务上不断创新,逐渐显示出旺盛的生命力. 一是完全符合国家金融政策 目前,阿里金融旗下有两家小额贷款公司,这两家公司都是经政府批准设立的正规小额贷款机构,资金来源与放贷均受央行

帝度洗衣机连夺五项大奖

从品牌到产品,连夺五项大奖,帝度洗衣机在当下萧条的行业市场环境下就像一缕春风一样让行业人士感觉到难得的温暖和希望.近日,在由国家信息中心信息资源开发部联合中国家电网举办的"2012中国洗衣机行业发展高峰论坛"上,帝度洗衣机依托变频技术优势与强大的产品创新能力,一举荣获2011-2012年度洗衣机行业变频洗衣机市场占有率第一.2011-2012年度洗衣机行业变频洗衣机领导品牌.2011-2012年度洗衣机行业行业节能之星.2011-2012年度滚筒洗衣机变频之星.2011-2012年度滚

辰信领创荣获“2016中国IT风云榜”两项大奖

近日,由中国信息产业商会.比特网.比特CIO俱乐部联合IT行业各界人士组织.参与,历时三月评选出的"2016中国IT风云榜"榜单正式出炉,国内新兴信息安全厂商辰信领创与旗下产品"景云网络防病毒系统"分获"2016中国IT风云榜·信息安全领域创新企业奖"."2016中国IT风云榜·信息安全领域创新产品奖"两项大奖,成为2016年国内网络安全行业一颗冉冉升起的新星. 辰信领创于2016年7月成立,由国内两大老牌安全企业启明星辰和北

【两项业界最佳】普林斯顿新算法自动生成高性能神经网络,同时超高效压缩

神经网络的结构对其性能有极其重要的影响.目前主流的神经网络结构搜索法仍然是试凑法,该方法存在三大问题: 训练过程中神经网络结构是固定的,训练并不能改善结构 时间和计算消耗巨大 生成的网络通常很冗余,计算和存储成本过高 为了解决以上问题,普林斯顿大学研究人员仿照人类大脑的学习过程,提出了一种自动生成神经网络的算法.该算法从一个种子结构(seed architecture)开始,这个种子结构类似于初生婴儿的大脑. 在训练过程中,先根据反向传播算法获得的梯度(gradient),连接和生长(grow)