Facebook推开源软件平台ParlAI,能否解决机器人灵魂缺失问题?

雷锋网AI科技评论按:5月16号,Facebook官网公布,推出全新开源软件平台ParlAI, 致力于打造一站式对话研究商店,加快提高聊天机器人的智能聊天水平。雷锋网编辑认为这必将会给整个机器人制造业带来新的机遇和革命式的发展。

人工智能的一个长期目标就是希望能制造出可以和人类自然交流的聊天机器人。现在生产出来的机器人虽然有时候可以完成具体的单个任务,但是在理解多个句子或者把多个子任务联合起来形成一个主任务上有很大的困难。像比较复杂的对话,例如,预订酒店或和它聊体育新闻。这就需要它能理解多句意,并且能够推理来进行下一轮谈话。因为人类对话很复杂,在很多有关联的任务中使用的是相同的输入输出格式却需要的是不同的知识技能,机器人一定会被这些任务打败。为了实现这个目标,开发一个软件用来整合这些任务,以及可供代理学习是很有必要的。

找到了这个需求后,Facebook的AI研究团队开发了一个新的开源平台用来一次性跨越多任务,训练和测试对话模型。ParlAI是一站式对话研究商店,研究员可以在这里提交新任务,对单个对象训练算法,共享存储空间。它和Mechanical

Turk结合来数据收集,训练,和评估,也可以让ParlAI中的机器人和人对话。这个项目的目标是将现有对话数据集和学习系统整合,包括人机之间的真实对话。

ParlAI补充了现有的Facebook AI研究团队的文本研究。像FastText, 它是快速和有效的文本分类工具。还有CommAI,它是用来通过日益复杂的任务来开发通用人工智能的框架。

ParlAI中的任务

超过20个公共数据集包含在此版本中,如下图左边所示

任务分为五类

    • 问和答:这是最简单的对话框形式之一,每个说话者只有一轮。问和答这种方式是特别有用的,因为评估比其他形式的对话框简单:如果问题的答案是已知的(即,数据集被标记),那么我们可以快速检查答案是否正确。

    • 句子完成(完形填空):在这个测试中,代理器必须在对话框中的下一个语句中填入一个缺失的单词。虽然这是另一个专门的对话框任务,数据集采集很便宜,评估很简单。

    • 目标导向的对话:一个更为现实的对话类别涉及到达到一个目标,例如,一个客户和旅行社讨论航班,一个人向另一人推荐电影,两个人约定何时何地一起吃饭,等等。

    • 聊天对话框:有些任务不一定有一个明确的目标,更多的是讨论;例如,两个人谈论体育,电影,或一个共同的兴趣。

    • 视觉对话:这些任务包含图像和文本。在真实世界中,对话框通常以物理对象为基础。在未来,我们计划添加其他感官信息,如音频。

在ParlAI选择一个任务和在命令行中指定它一样简单。如果数据集尚未使用,ParlAI会自动下载它。因为所有的数据集都在ParlAI都会以相同的方式处理,对话代理可以在它们的训练和测试之间切换。你也可以通过提供一个以逗号分隔的列表进行一次性多任务指定;例如命令行
-t  babi, squad 用了两个数据集,所有的QA数据立刻集合-t #qa; 或者ParlAI中每个任务立刻集合-t #all,目的是为了让构建和评估一个丰富的对话模型变得简单。

多重世界;代理;老师

在ParlAI主要的概念(类)是多重世界,代理,和老师。世界是说话者所生活的环境,可以从简单的双向对话变化到更复杂的场景,如反应性游戏环境。代理是可以在世界上表演和说话的东西。代理可以是一个学习者,如机器学习的系统,或一个硬编码的机器人,用来与学习者互动,如游戏中的非玩家角色。最后,老师是一种和学习者交流的代理,例如,实现了以前列出的任务。

所有代理使用一个单一的格式-观察/操作对象(一个Python)-交换文本,标签,并与其他代理互相奖励。

代理发送此消息来说话,并通过接收到相同形式的消息来发现在环境中的其他说话者。这使我们能够解决各种对话问题,从强化学习到完全监督学习,同时保证所有的数据集符合相同的标准。当研究人员建立新的模型,他们可以很容易地应用在许多任务上。

在定义了一个世界和它的代理之后,主回路调用其中的函数 world.parley ( ).运行用来训练,测试,或显示,世界。在左边的面板显示的一个例子,主回路的框架,右边是parley ( )实际代码。

第一版发布的工具栏里包含工具代理,像简单的IR基带,同时还有两个完整神经网络案例:一个端到端的存储网络,在Lua
Torch 中执行,还有一个是长短时记忆模型DrQA, 是在Py Torch
中执行,在SQuAD数据集和其他数据集之间有一个强大的效果。我们期待在未来的版本中添加一些新的任务和代理。

Mechanical Turk

制造聊天机器人,人机对话是训练过程中很重要的一部分。这就是为什么ParlAI支持和Mechanical
Turk 整合来数据收集,训练和评估。这也使得研究小组的Turk实验可以对比,这在以前是困难的。在ParlAI中,Human
Turkers也可视为代理。他们可以轻松地与机器人交谈,以帮助训练和评估他们。随后,人-人 ,人-机
或多人和机器人聊天都可以在标准框架内进行交互。在切换所需的角色过程中,代理不用更改代码。这是因为Turkers可以通过同一接口的印刷版接收和发送。

  • QA收集器:通过和Turkers对话来收集问题和答案,给定上下文建立一个QA数据集的代理。
  • 模型评估器:基于机器人在给定任务中的性能表现,从Turkers中收集评级的代理。

在一个地方可以收集所有重要的对话任务,这还是第一次。ParlAI为研究人员提供的这个场所不仅使这些任务单独地更容易迭代,也使得可以轻松地使用所有的数据来训练机器人,并通过那些技能来对机器人评估。研究员通过检查存放处的代码,共享他们的AI学习代理,直接复制对方的实验结果,来进行彼此工作之上的研究,共同推进这个领域前进。最后,Mechanical
Turk的整合意味着人类可以很容易地投入到与机器人交谈的循环之中,以帮助训练和评估他们。人类之间的对话对制造可以和人类交谈的机器人也很有必要。

对于AI来说,解决对话问题仍然是一个长期的挑战,对于这一目标的任何进展都有可能对我们今天所制造的产品带来短期利益,任何技术的进步都可能对其他行业领域带来好处。ParlAI是一个平台,希望将做AI代理执行对话框的研究人员聚到一起共同推动对话研究达到世界最先进水平。

via Facebook;  雷锋网(公众号:雷锋网)编译

本文作者:杨文

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-25 11:09:54

Facebook推开源软件平台ParlAI,能否解决机器人灵魂缺失问题?的相关文章

Facebook 使用开源技术,CIO 能从中学到什么?

[51CTO.com 快译]Facebook 在继续致力于开放其所有代码和技术架构的源代码.这个社交媒体巨擘将这一点明确无误地传达给了近日出席 该公司第二届 @Scale 年度开发者大会的 1800 名管理人员和工程师,希望向推特.谷歌.Box.Pinterest.微软及其他公司的知名程序员学习 经验. Facebook 的全球工程和基础设施副总裁 Jay Parikh 表示,出席今年这次大会的程序员代表 400 家公司,迄今为止这些公司已为 4500 多个开源项目贡献了代码.他表示,其中至少

深度解读Facebook刚开源的beringei时序数据库

Facebook最近开源了beringei时序数据库.beringei是用来解决其内部监控数据存储和查询需求的数据库,其特点是读写速度快,属于内存数据库. beringei是如何做到的呢,其压缩算法上有哪些独到之处? 阿里云数据库高级专家叶翔借着源代码和论文,对beringei原理进行了解读,同时也介绍了它在Facebook的应用情况. 扩展阅读: 1.阿里云专家带您探寻MongoDB技术内幕 2.云数据MongoDB官网

Facebook推App Center应用商店服务

Facebook推App Center应用商店服务(腾讯科技配图) 北京时间5月10日消息,据国外媒体报道,Facebook今天发布"应用中心"(App Center),向用户提供社交网络.桌面和移动应用,而非仅仅Facebook应用. "应用中心"将向9亿Facebook用户提供最佳的iOS应用.Android应用.Web应用.移动Web应用,甚至桌面应用.一名Facebook代表今天在接受科技博客网站VentureBeat电话采访时表示,"我们的目标是

Facebook推游戏内置订阅功能 Zynga增创收渠道

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 Facebook悄然推游戏内置订阅功能(腾讯科技配图) 腾讯科技讯(明轩)北京时间8月22日消息,据国外媒体报道,科技博客BusinessInsider作者欧文·托马斯(Owen Thomas)周二撰文称,社交网站Facebook已在本月初为游戏服务悄然推出一项新功能,此举有望对Zynga这样的公司注入新的活力. Facebook此次增加了游

Facebook推图片编辑应用Stickered可让照片萌到曝

Facebook推图片编辑应用Stickered12月22日消息,据国外媒体报道,Facebook的Messenger团队近日推出了一款图片编辑应用Stickered.该应用允许用户在编辑照片时,使用Messenger上广受欢迎的卡通表情贴纸,让照片呈现出最萌的一面.目前,这一App仅有安卓版.使用Stickered应用时,用户可以选择个人喜爱的卡通表情贴纸,叠加在照片上,并且不限叠加次数.这些经过编辑的照片,可以通过Messenger等聊天工具发送给好友.Stickered不仅允许用户编辑新照

Facebook将“开源”其存储系统

导读:没有管理者,没有惩罚,更不用承担错误,开源正在成为越来越重要的协作形式.大家为了一个共同的理想和努力,Linux.Wikipedia无不是这种协作的结晶.http://www.aliyun.com/zixun/aggregation/1560.html">Facebook希望将开源拓展到服务器.存储乃至数据中心,除去那些昂贵而且不必要的组件来降低成本,企业不需要养活那些寄生虫了.Dell.Netflix.Rackspace都参与了此项目,看IBM和Oracle的笑话的时日已经不远了.

Facebook 宣布开源新版本的 Swift SDK for iOS

Facebook宣布开源新版本的Swift SDK.现在,该版本还处于Beta测试状态,其目标是让开发人员可以更轻松地将Facebook服务集成进他们的iOS应用. Facebook Swift SDK for Swift支持许多Facebook服务,包括Facebook分析.Facebook登录.分享到Facebook和Facebook Graph API.该SDK以现有的Objective-C Facebook SDK为基础构建了一套封装器,旨在提供一种原生的Swift API和更简单的开发

“Facebook推中文站”不实 系网站炒作

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 12月20日,据域名圈人士披露,日前网络流传的"Facebook推中文站www.taxiang.net"一事属虚假消息,实为该网站自我炒作. 12月18日,有网站发布消息称,"据外媒体报道,美国社交网站Facebook官方即将正式对外宣布进入中国大陆市场,并启用新域名www.taxiang.net".

Facebook推手机只是一次折腾冒险

中介交易 SEO诊断 淘宝客 云主机 技术大厅 最近媒体已经将Facebook的新闻炒爆了,主要内容就是周二Facebook将要召开 的号称最神秘的新品发布会.而新闻炒作的核心在于,几乎所有人都预测 Facebook将在本次发布会推出自主智能手机,因此,一时间网络上各种概念机 样品也集中爆发除了,甚至连Facebook的股票都应声上涨.但在我看来,这其 实只是一场浮华空虚的表演,因为Facebook推手机只是在自己浪费精力,也是 公司的一场大冒险. 移动互联网是一块是非地,Facebook一口吃