艾伦人工智能研究院开源AllenNLP,基于PyTorch轻松构建NLP模型

艾伦人工智能研究院(AI2)开源AllenNLP,它是一个基于PyTorch的NLP研究库,利用深度学习来进行自然语言理解,通过处理低层次的细节、提供高质量的参考实现,能轻松快速地帮助研究员构建新的语言理解模型。

AllenNLP能让设计和评估新的深度学习模型变得简单,几乎适用于任何NLP问题,通过利用一些基础组件,你可以轻松地在云端或是你自己的笔记本上跑模型。

关于AllenNLP的详细信息,可以参见论文AllenNLP: A Deep Semantic Natural Language Processing Platform,地址:http://allennlp.org/papers/AllenNLP_white_paper.pdf

模型对比

 下面是AllenNLP模型与相关模型的对比,前者在合理的训练时间下均能取的较好的表现:

  • 机器理解

机器理解(Machine Comprehension,MC)模型通过在文本内选择一段内容来回答自然语言问题。AllenNLP MC模型能重现BiDAF(Bi-Directional Attention Flow)的效果,后者在SQuAD数据集上跑分已经接近state-of-the-art。AllenNLP BIDAF在 SQuAD dev数据集中的EM分为68.7,只比原始BIDAF模型的67.7分多一点点,两者同样在p2.xlarge上训练了4个小时。

  • 语义角色标注

语义角色标注(Semantic Role Labeling,SRL)模型分析句子中各成分与谓词之间的关系,建造表征来回答关于句义的基本问题,如“谁对谁做了什么”等。AllenNLP SRL模型能重现深度BiLSTM模型的效果,在CoNLL 2012上能得到78.9的F1分数。

  • 文字蕴涵

文字蕴涵(Textual Entailment,TE)模型分析两个句子,分析一个句子中是否蕴涵了另一个句子的知识。AllenNLP TE模型能重现可分解注意力模型的效果,后者在SNLI数据集上有接近state-of-the-art的表现。AllenNLP TE模型得到了84.7分,可以与可分解注意力模型得到的86.3分相提并论。

本文作者:Non

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-29 07:30:36

艾伦人工智能研究院开源AllenNLP,基于PyTorch轻松构建NLP模型的相关文章

如何基于数据快速构建用户模型(Persona)?

用户模型(Persona)是Alan Cooper在<About Face:交互设计精髓>一书中提到的研究用户的系统化方法.它是产品经理.交互设计师了解用户目标和需求.与开发团队及相关人交流.避免设计陷阱的重要工具. 但在现实中,一般只有很少的成熟公司,产品经理.交互设计师或用户研究人员才会花时间构建用户模型,个人认为之所以这样,至少包含两方面原因: 一个主要原因在于,按照传统方法构建用户模型的成本高.时间长,不是一般公司和团队所能承受的; 另一个原因在于,传统方法对用户模型构建者的要求很高,

如何基于数据快速构建用户模型(Persona)?

户模型(Persona)是Alan Cooper在<About Face:交互设计精髓>一书中提到的研究用户的系统化方法.它是产品经理.交互设计师了解用户目标和需求.与开发团队及相关人交流.避免设计陷阱的重要工具. 但在现实中,一般只有很少的成熟公司,产品经理.交互设计师或用户研究人员才会花时间构建用户模型,个人认为之所以这样,至少包含两方面原因: 一个主要原因在于,按照传统方法构建用户模型的成本高.时间长,不是一般公司和团队所能承受的; 另一个原因在于,传统方法对用户模型构建者的要求很高,尤

《玩转3D打印》——2.2节基于图像构建3D模型

2.2 基于图像构建3D模型 玩转3D打印 前文中给出了一些3D建模软件的介绍以及通过3D软件进行建模的步骤,基于建模软件的3D建模方法主要针对于创新性事物的建模工作,要求操作人员要具有丰富的专业知识,熟练使用建模软件,而且操作复杂,周期较长,且最终构建的3D模型真实感不强. 除了利用3D建模软件进行建模工作外,我们还可以利用2D图像进行3D模型构建.这种建模方法需要提供一组物体不同角度的序列照片,利用计算机辅助工具,即可自动生成物体的3D模型.这种方法主要针对于对已有物体的3D建模工作,操作较

苏州园区牵手中科院共建人工智能研究院;特异性达99% 浙大睿医糖网病 AI 研究取得突破成果

苏州园区牵手中科院共建人工智能研究院 雷锋网 AI 掘金志消息,昨天,苏州工业园区管委会与中国科学院计算技术研究所签署战略合作协议,双方共建中科院计算技术研究所苏州人工智能产业研究院.省委常委.市委书记周乃翔,中科院计算所所长孙凝晖,中科院计算所党委书记李锦涛出席签约仪式. 根据协议,中科院计算所苏州人工智能研究院未来将重点围绕人工智能产业优势领域,针对寒武纪深度学习处理器.视觉识别核心技术.深度基因测序数据存储分析.医学影像处理及云服务.未来网络信息系统等产业化方向发力,通过整合中科院和地方创

10个开源的基于WEB的文件管理器

目前,随着因特网的广泛普及,对文件管理的需求变得更多.对很多人来说,用一个应用程序来有效管理你在网络上的文件是必不可少的.因此,下面列出你会用到的10个最好的开源的基于WEB的文件管理器. eXtplorer: 这个程序为你提供了移动.复制.编辑.搜索.删除.下载和上传功能.此外,你也能用 eXtplorer 创建和提取档案,文件夹和新文件.它的主要功能是让你通过 FTP 访问文件.你可以选择 Mozilla 公共许可或者 GPL 协议.为了正常使用这个文件管理器,服务器的PHP最低版本要求为

万象人工智能研究院成立,上市公司+基金+科技公司组合凭什么玩转AI研究院

2017年3月30日,万象人工智能研究院宣布成立,它由东方网力.京山轻机.汤臣倍健三家上市公司与成员单位物灵科技.格灵深瞳以及奇点汽车联合真格基金共同发起,计划将出资不超过5亿人民币,在北京.武汉.深圳.硅谷设立研究与孵化机构,参考基金模式运营的创新性,以多元化和开放式的结构,帮助科研成果在多个行业和跨产业中开花结果,打造成为产业应用驱动的人工智能加速器.   这个不常见的组合(3个上市公司+3个科技公司+1家基金)是怎么想到要一起做一个人工智能研究院呢?研究院还可以怎么玩? 刘光:拿到人工智能

Intel开源了基于Apache Spark的分布式深度学习框架BigDL

Intel开源了基于Apache Spark的分布式深度学习框架BigDL.BigDL借助现有的Spark集群来运行深度学习计算,并简化存储在Hadoop中的大数据集的数据加载. 在Xeon服务器上运行的测试结果表明,BigDL比其他开源框架Caffe.Torch和TensorFlow有显著的性能提升.BigDL速度可与主流GPU匹敌,而且能够扩展到数十个Xeon服务器. BigDL库支持Spark 1.5.1.6和2.0版本,并容许将深度学习嵌入在现有的Spark程序中.BigDL库中有把Sp

开源的库RestSharp轻松消费Restful Service

现在互联网上的服务接口都是Restful的,SOAP的Service已经不是主流..NET/Mono下如何消费Restful Service呢,再也没有了方便的Visual Studio的方便生产代理的工具了,你还在用HttpWebRequest 自己封装吗?Restful Service还有授权问题,自己写出来的代码是不是很不优雅?通常Restful Service返回的数据格式是XML或者Json,还要设置服务的输入参数等等,使用起来很复杂.本文向你推荐一个开源的库RestSharp轻松消费

开源的基于Android的电子书阅读器FBReaderJ和制作

今天整理资料,看到以前调研的电子阅读器的资料,分享一下 开源的基于Android的电子书阅读器FBReaderJ http://www.fbreader.org/ 支持epub fb2 html格式等,不支持pdf 主要的功能包括: 目录管理.查找.放大缩小.快速导航.书签等等,具体的使用参考如下的截图 电子书制作 以上的FBReaderJ软件是基于标准的epub fb2格式,因此制作需要独立的工具,具体的有: http://www.jedisaber.com/eBooks/editors.as