动态 | AI能看懂英文,阿里巴巴夺实体发现测评全球第一

AI科技评论消息,全球顶级的知识库构建测评KBP2017日期公布了最新排名。阿里巴巴人工智能研究机构iDST斩获英文实体发现测评全球冠军,在准确率和召回率上均表现出色,核心指标F1达到0.811。这次测评吸引了全球20多支顶尖团队参与,包括IBM Research, BBN, Stanford Univ, CMU Univ, UIUC Univ, Columbia Univ, 腾讯等。

KBP是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院)指导、美国国防部协办的赛事,主要任务为从自然书写的非结构化文本中抽取实体,以及实体之间的关系。

这项测评要求AI算法在“读完”一篇英文文章后,构建一个物理世界的命名实体和实体之间关系的知识库,如“克林顿和希拉里之间是夫妻关系”、“克林顿毕业于耶鲁法学院”这样一个个实体的关系。

阿里巴巴iDST自然语言处理首席科学家司罗介绍,他们的算法可以做到对文章上下文的理解。比如,文章出现了Apple,再出现Jobs,就可以辨别出这个Jobs指的是乔布斯,而不是工作。再比如,文章出现了Microsoft,那么Apple就更有可能是苹果公司,而不是一种水果。

“另外,我们构建了一个算法去学习不同领域之间共同的部分,通过迁移学习提升我们学习的准确度。对于不同领域数据,我们取其精华,去其糟粕,进行智能学习”,司罗说。

在这次测评中,iDST团队采用经过改良的深度神经网络架构对文本进行理解。改良的架构有三个主要特点:首先该模型可以自动阅读海量文章(如维基百科)并从中汲取经验;其次,该架构可以智能选择训练数据集以保证训练数据的准确性;最后,我们采用post regularization的办法保证模型结果的一致性。

对于KBP2017的成绩,司罗表示:“很荣幸能够同全球的同行分享阿里巴巴的研究成果,人工智能在机器阅读理解和知识库构建上还处在起步阶段,我们正在积极和同行业顶尖机构学习交流,推动行业发展。比如我们内部建设的信息抽取平台AliIE项目就在同斯坦福大学展开积极合作”。

阿里巴巴正在将这样的信息抽取技术广泛的应用到实际业务当中,并致力于让更多的中小开发者从中收益。他们搭建的信息抽取平台AliIE拥有最顶尖的AI技术,并从一开始的架构设计就考虑到平台的开放性和可扩展性。可以让更多的开发者、研究员共同开发,并将成果回馈给这个社区。

阿里巴巴iDST自然语言处理首席科学家司罗

司罗是全球权威机器智能学者,曾担任美国普渡大学计算机系终身教授,主持的20余个项目得到美国政府、工业界资助,先后获得美国国家科学基金会成就奖、雅虎、谷歌研究奖等。

由他领导的自然语言处理团队目前支持了阿里巴巴大生态每天多达600亿次的自然语言处理需求,团队横跨杭州、北京、硅谷、西雅图(新加坡)多地,成员大多拥有10年以上的研发经验。检索招聘网站可以看到,他们依旧在不断扩充团队。

时间: 2024-10-31 03:50:32

动态 | AI能看懂英文,阿里巴巴夺实体发现测评全球第一的相关文章

中文的习题解答中国人看懂, 英文的习题解答外国人能看懂

中文的习题解答中国人看懂, 英文的习题解答外国人能看懂. 接到好几个老外的邮件了...

【首发】阿里巴巴夺中文语法大赛全球冠军,iDST自然语言处理团队解读技术细节

11月24日消息,阿里巴巴iDST在中文语法错误自动诊断大赛(Chinese Grammatical Error Diagnosis,以下简称 CGED)三个level中全面夺得冠军.即便是最难的level,核心指标F1(综合考虑准确率与召回率)依旧达到了 0.2693,比其他参赛机构高出一倍. 参赛机构比赛成绩公布 CGED是自然语言处理领域的权威赛事,由IJCNLP联办,今年已是第四届.比赛的背景是:学习中文的外国人数不断增加,由于中文的博大精深,外国友人在中文写作中会出现各式错误.主办方挑

AI 能看懂漫画吗?它的脑补能力比人类差远了

读漫画对人工智能太难了 随着人工智能的不断发展,它似乎已经在很多方面赶超了人类--面部识别.物体识别,还有象棋.围棋.各种视频游戏. 人们不禁要问,还有什么事是 AI 做不好的呢?它在哪方面比不过人类?现在,马里兰大学帕克分校 ( UMCP ) 的一项研究告诉你,读漫画可能就是其中之一. 据国外媒体报道,马里兰大学 Mohit Iyyer 教授对 AI 读漫画书的能力进行了测试.结果显示 AI 在这一领域远远比不过人类. 漫画由一系列单独的图画构成,每部分都搭配文字解释,图文符合度很高.这样一来

【AI+娱乐】一图看懂爱奇艺大脑增强版,智能视频峰会有AI更有爱

深度学习和强化学习在视频领域的应用会是下一个AI热点,情感计算会让智能视频的世界更有温度,爱奇艺世界未来有AI更有爱.--新智元创始人杨静 6月9日,爱奇艺世界·大会第二天,聚焦探讨AI与娱乐深度融合.相互激发的智能视频高峰论坛盛大开幕,爱奇艺CTO汤兴博士.杜比实验室全球高级副总裁John Couling.北京电影学院未来影像高精尖创新中心首席科学家.山东大学计算机学院院长陈宝权博士.英特尔中国研究院院长宋继强博士.中影国际文化传媒公司董事长.CEO唐季礼.新智元创始人杨静等业界专家.企业家共

一组图看懂阿里巴巴势力护城河

一组图看懂阿里巴巴势力护城河

六张图看懂 Amazon Go智能购物,专利文件解密AI 核心技术细节

亚马逊Go推广视频:1分钟,颠覆你对线下实体购物的认知 几天前,就在亚马逊迎来可能是公司史上最大的 Holiday Season时,亚马逊发布了一段介绍旗下新的零售商店 Amazon Go 的视频,消费者可以直接走进商店,拿下货架上的货物,然后离开.整个过程不需要排队,也不用结账. <福布斯>的记者 Ryan Mac 说:"这看起来非常有趣,充满了未来感,但是,至少目前为止,这一切还都只是宣传." 每年从感恩节到圣诞节的长假中,亚马逊都会成为媒体上的最大赢家.2013年,B

【重磅】一图看懂阿里云两个新大脑:ET 医疗大脑和 ET 工业大脑

3月27日至29日,阿里云2017年第一场云栖大会在深圳拉开帷幕.29日上午的主题演讲由阿里巴巴副总裁.阿里云总裁胡晓明带来.在题为<通往智能之路>的演讲中,他与现场数百名开发者.媒体和合作伙伴分享了阿里云.阿里巴巴集团一年来的变化. 一分钱 VS 一个亿?胡晓明怼上马化腾   胡晓明在演讲中提到一件值得关注的事:腾讯本月以一分钱的报价成为厦门市政务云外网云服务提供商.他认为这是对行业的破坏. 他说:"我要对马化腾说:随着云计算已经越来越多地成为大企业选择的时候,我们要想如何为用户提

看懂SqlServer查询计划

原文:看懂SqlServer查询计划 对于SQL Server的优化来说,优化查询可能是很常见的事情.由于数据库的优化,本身也是一个涉及面比较的广的话题, 因此本文只谈优化查询时如何看懂SQL Server查询计划.毕竟我对SQL Server的认识有限,如有错误,也恳请您在发现后及时批评指正. 首先,打开[SQL Server Management Studio],输入一个查询语句看看SQL Server是如何显示查询计划的吧. 说明:本文所演示的数据库,是我为一个演示程序专用准备的数据库,

走近比特币:一个故事看懂“区块链”

本文讲的是走近比特币:一个故事看懂"区块链",区块链是比特币的底层技术和基础架构,本质上是一个去中心化的数据库.区块链是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一次比特币网络交易的信息,用于验证其信息的有效性(防伪)并生成下一个区块. 狭义来讲,区块链是一种按照时间顺序将数据区块以顺序相连的方式组合成的一 种链式数据结构, 并以密码学方式保证的不可篡改和不可伪造的分布式账本. 以上定义摘自百度百科.很多菜鸟朋友看完这段解释依然满脸懵逼,到底什么是"区块链&q