OpenAI 发布增强学习算法测试开源工具包

去年成立的非营利性人工智能研究机构OpenAI得到了包括Elon Musk在内的多个硅谷巨头的支持，因此在人工智能领域颇受瞩目（编者按：Musk是人工智能威胁论的支持者，投资OpenAI是为了随时掌握AI的发展动态）。

近日OpenAI发布了成立来的第一个产品：增强学习算法的开源测试平台Gym（Beta版本）。

Gym可以在本地运行，用于在各种实验环境中测试增强学习算法，Gym也可以作为web服务用于分享测试结果。Gym能够自动给出评估分数，同时还支持用户查看和分享这些结果。

据OpenAI研究人员在博客中介绍，开发Gym的初衷是为了加快OpenAI自身的增强学习研究。目前网络上也有一些平台可以展示和比较算法性能，例如Algorithmia，但这些都是通用代码库。OpenAI的Gym更专注于深度学习的热门领域——增强学习（RL），这也是谷歌DeepMind研究团队在AlphaGo程序中使用的技术。

但是目前此领域的深度学习技术缺乏测试基准和标准，这也是OpenAI Gym试图解决的问题。

====================================分割线================================
文章转载自开源中国社区[http://www.oschina.net]

时间： 2024-08-01 09:22:41

OpenAI 发布增强学习算法测试开源工具包的相关文章

Intel发布开源增强学习框架Coach

本文讲的是Intel发布开源增强学习框架Coach, 今天,英特尔发布了一个新的开源增强学习框架Coach.该框架利用多核CPU处理能力,用于训练和评估增强学习Agent.Coach包含一些领先的增强学习算法的多线程实现,适用于各种游戏和机器人环境.它能够在台式计算机上高效地训练强化学习Agent,而无需任何额外的硬件. 自从2016年推出用于深层加强学习的异步方法以来,许多算法通过在许多CPU内核中并行运行多个实例,能够更快地实现更好的策略.到目前为止,这些算法包括A3C .DDPG.PPO.

OpenAI发布“宇宙”平台，用1000+训练环境赋予AI“类人智力”

当人工智能领域大牛在西班牙NIPS会议酒店吃早餐的时候,Open AI 宣布开源了其新平台"宇宙"(Universe).这家由伊隆·马斯克资助的非赢利性AI开源组织,在周一的上午搞了个大新闻,相信NIPS的餐桌上一定热闹非凡.当然,Open AI后续也在NIPS的会场展示了自己的成果. Open AI 联合创始人Greg Brockman 在Twitter上说道,"这个AI 训练架构,是我们从Open AI建立之初就在计划着的".可见Open AI对这个平台的重视.

增强学习与无人驾驶

增强学习简介增强学习是最近几年机器学习领域的最新进展.增强学习的目的是通过和环境交互学习到如何在相应的观测中采取最优行为.行为的好坏可以通过环境给的奖励确定.不同的环境有不同的观测和奖励.例如,驾驶中环境的观测是摄像头和激光雷达采集到的周围环境的图像和点云,以及其他传感器的输出(如行驶速度.GPS定位和行驶方向).驾驶中的环境的奖励根据任务的不同,可以通过到达终点的速度.舒适度和安全性等指标确定. 增强学习和传统机器学习的最大区别是增强学习是一个闭环学习的系统,增强学习算法选取的行为会直接影响

增强学习小白？本文带你入门了解增强学习

更多深度文章,请关注:https://yq.aliyun.com/cloud 机器学习算法,特别是神经网络被认为是新的AI革命的起因. 在这篇文章中,我将介绍增强学习的概念,不过技术细节有限,只能使具有不同背景的读者能够理解该技术的本质.功能和局限性. 在本文末尾,我将提供一些实现RL的资源链接. 什么是增强学习? 从广义上讲,数据驱动算法可以分为三类:监督式.非监督式和增强学习. 前两个通常用于执行诸如图像分类.检测等任务,虽然它们的精确度是显著的,但这些任务不同于我们所期望的"智能"

(转) 深度增强学习与通用人工智能

深度增强学习前沿算法思想 CSDN 作者: Flood Sung 2017-02-16 09:34:29 举报阅读数:3361 作者: Flood Sung,CSDN博主,人工智能方向研究生,专注于深度学习,增强学习与机器人的研究. 责编:何永灿,欢迎人工智能领域技术投稿.约稿.给文章纠错,请发送邮件至heyc@csdn.net本文为<程序员>原创文章,未经允许不得转载,更多精彩文章请订阅2017年<程序员> 2016年AlphaGo计算机围棋系统战胜顶尖职业棋手李世

TensorFlow Agents日前开源，轻松在TF中构建并行强化学习算法

用于在TensorFlow中构建并行强化学习算法的高效基础架构范例TensorFlow Agents日前开源,这个项目是由谷歌的两位研究员James Davidson.Vincent Vanhoucke,以及Danijar Hafner共同研发的.关于这个项目的开源信息他们在GitHub上进行了介绍,雷锋网 AI 科技评论将内容进行编译整理. TensorFlow Agents TensorFlow Agents为强化学习提供了优化的基础架构,它将OpenAI gym接口扩展到多个并行环境,并能

干货 | 算法工程师入门第二期——穆黎森讲增强学习（二）

雷锋网(公众号:雷锋网)按:大牛讲堂算法工程师入门系列第二期-穆黎森讲增强学习(二),上一讲内容主要涉及增强学习基本概念及Deep Q Learning的相关内容,本讲除了Deep Q Learning的相关拓展内容.DQN和近期的一些进展. 传送门:干货 | 算法工程师入门第二期--穆黎森讲增强学习(一) Beyond Deep Q Learning DQN将一个强大的工具deep neural network 引入RL,解决了这中间遇到的很多新问题,收到了很好的效果.自从这篇工作以后,一方面

PaperWeekly 第二十五期 --- 增强学习在image caption任务上的应用

引言第二十二期的PaperWeekly对Image Captioning进行了综述.今天这篇文章中,我们会介绍一些近期的工作.(如果你对Image Captioning这个任务不熟悉的话,请移步二十二期PaperWeekly 第二十二期---Image Caption任务综述) Image Captioning的模型一般是encoder-decoder的模型.模型对$p(S|I)$进行建模,$S$是描述,$I$是图片.模型的训练目标是最大化log似然:$\max_\theta\sum_i \l

【重磅】AlphaZero炼成最强通用棋类AI，DeepMind强化学习算法8小时完爆人类棋类游戏

世界最强围棋AI AlphaGo Zero带给世人的震撼并没有想象中那么久--不是因为大家都去看谁(没)跟谁吃饭了,而是DeepMind再次迅速超越了他们自己,超越了我们剩下所有人的想象. 12月5日,距离发布AlphaGo Zero论文后不到两个月,他们在arXiv上传最新论文<用通用强化学习算法自我对弈,掌握国际象棋和将棋>(Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algori

猜你喜欢

在Word2010文档中创建电子邮件超链接

Word2010文档中的超链接除了可以指向网页或其他文件意外,还可以指向电子邮件地址.当用户点击Word2010文档中的电子邮件超链接时,将自动打开本机中的电子邮件客户端程序(例如Outlook)编辑 ...

用PHP写的身份证验证程序

程序写了几个身份证方面的函数,个人感觉挺有用的,特别是在网络问卷调查时,对个人信息里的身份证进行验证很有用,但是应者寥寥,还是收在自己的blog里算了. <?php// 计算身份证校验 ...

小刀：给电商圈比赛SEOer的三点小建议

本来按照上次的说法是每天在各大SEO论坛找一个出现次数较多的问题,然后根据自己的经验与想法和大家做一个分享的.但今天为什么我突然把话题拐到电商圈上来,因为我觉得虽然这是一次商业性质比较明显的SEO比赛 ...

Delphi6函数大全(5)

<<Delphi6函数大全5-SysUtils.pas>> 首部 function InquireSignal(RtlSigNum: Integer): TSignalStat ...

JS控制文本框textarea输入字数限制

<html> <head> <title>JS限制Textarea文本域字符个数</title> <meta http-equiv=" ...

Photoshop快速打造光感极强质感字体

此次设计的海报主要以光感和质感为主,希望大家多多支持V2老黑! 我们先看下最终效果: 现在开始分析制作步骤吧! 1.新建文档 600x800px 如图: 先选定颜色,把前景色和背景色设置好,如图 2. ...

巧用抠图功能制作人物镜像效果

镜像效果很漂亮平时大家都知道利用ps做镜像效果,今天就教大家利用可牛影像做双胞胎效果先看一下效果图: 第一步打开一张图片执行编辑--抠图换背景第二步开始抠图第三步抠完图后设置一 ...

Word 2007多种样式页码的插入

默认情况下,在Word2007文档中插入的页码是普通阿拉伯数字样式的页码,且未做任何修饰.为了使Word文档更美观,用户可以在Word页码样式库中插入多种样式的页码,操作步骤如下所述: 第1步,打 ...

给Flash加一个超链接(推荐使用透明层)兼容主流浏览器_javascript技巧

今天要给星烛网上的一个Flash加一个超链接,原想直接在object外直接套一个超链接即可,试了之后却发现不是这么回事,求助百度,问题解决,记录如下: 原因:Flash默认是最高层.所以,我经常会遇见 ...

it-java eclipse工具切换工作空间后，eclipse样式变得不同了

问题描述 java eclipse工具切换工作空间后,eclipse样式变得不同了切换之前是彩色的切换之后是黑白的了求大神帮解答谢谢解决方案我遇到过,跟jdk的版本有关系解决方案二: 这 ...

Hadoop的过去、现在和未来

Hadoop是目前大数据分析领域中应用最广泛的一种分布式架构,而经过相当长时间的发展,Hadoop在功能上也越来越成熟.不过,在这个星球上,你找不到拥有11年Hadoop经验的人.因为目前在Hadoo ...

panel中的chart-extjs如何把折线图chart放入到panel中进行显示

问题描述 extjs如何把折线图chart放入到panel中进行显示 Ext.onReady(function() { //创建每月贴现价格统计图 //通过JSON从数据库中获取数据 var char ...

如何做好SEO标题优化

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅有时候到了一个新的场合,所处时间很 ...

Python3中进行HTTP请求的4种方式

python包索引(PyPI)提供了超过10万个代码库的包,它能够帮助python程序员完成许多工作,无论是构建web应用程序还是分析数据.另外PyPI还提供了很多诸如 twilio 之类的API的辅 ...

java 操作 excel 2010

原文http://blog.csdn.net/dallas16/article/details/6954264 前段时间,需要进行excel2010数据的解析.先是找组件,jxl不支持,然后时p ...

菜鸟问各路大神

问题描述开发一个学生信息管理系统(cs模式,c#编写),需要哪些步骤? 解决方案解决方案二:软件开发的生命周期,然后按你项目的大小及人员构成,可以适当的调整周期中的某些步骤业务:提出需求产品:收集 ...

详细阐述云计算战略八项基本原则之一

Bob Deutsche上一次在Data Center Knowledge发表的文章<云计算课程>中,鉴别并定义了八个基于云计算的解决方案框架(solution-based framewo ...

升级core data 时，这个persistentStoreCoordinator代理是哪个

问题描述升级core data 时,这个persistentStoreCoordinator代理是哪个 Do you have NSMigratePersistentStoresAutomatica ...

最终幻想14出品质问题致SE年净利润大打折扣

株式会社SQUARE-ENIX宣布针对11月4日发表的财年业绩预想进行向下修正.销售额预想从1600億円减少为1300億円(-18.8%).营业利益预想从200億円减少80億円(-60%).本财年纯利 ...

vs2012打开报错

问题描述未能在系统注册表找到正确的类型库解决方案解决方案二:重装vs看看解决方案三:我看到你的问题是权限问题.你需要用admin用户运行vs.如果还没不行的话尝试修复性安装.在可以把你的安装目录 ...

快学Java SE8--Java8函数式编程（一）

目录问题解答 Comparator是函数式接口,为什么包含equals这些方法. 函数式接口,除了只能有一个抽象方法外,还可以包含Object 中覆盖的方法,也就是 equals,toString, ...

近日猪肉价格降速明显放缓

新华网北京6月7日电(记者王晓玲)据新华社全国农副产品和农资价格行情系统监测,与前一日相比(下同),6月7日,猪肉价格基本稳定:蔬菜.水产品价格以降为主:牛羊肉.食用油.水果.奶类价格微幅波动:成品粮 ...

哈哈-android imageswitcher

问题描述 android imageswitcher 请问谁有这个实现图片自动切换的实例代码?或者相关的,百度上面需要花钱下载. 解决方案一. 简单示例 src public class Andro ...

PHP 面向对象程序设计（oop）学习笔记 (四) - 异常处理类Exception_php实例

使用异常 PHP5 增加了类似其他语言的异常处理模块.在PHP代码中所产生的异常可被 throw 语句抛出并被 catch 语句捕获.需要进行异常处理的代码都必须放入到 try 代码块内,以便捕获可能 ...

DB2个人版(Linux)安装_DB2

正在看的db2教程是:DB2个人版(Linux)安装.DB2个人版(Linux)安装 cowboy(zizhao_chen@yahoo.com) the fe of swust 2003-10- ...

Android布局技巧之创建高效布局_Android

Android UI工具包提供了一些布局管理器,它们使用起来相当容易,而且,大多数的时候,你只需要使用它们最基本的特征来实现UI. 执着于基本特征的使用对于创建UI来说,往往不是最高效的.一个常见的例 ...

点击小米手机的一键清理，应用的后台服务被杀死，如何解决

问题描述点击小米手机的一键清理,应用的后台服务被杀死,如何解决点击小米手机的一键清理,应用的后台服务被杀死,无法自启,请问如何解决解决方案打开授权管理-->工具箱-->自启管理,就 ...

绿盟科技发布OpenSSL高危漏洞技术分析与防护方案 G20成员国美国、中国、德国受影响较大

近日,OpenSSL官方发布了版本更新,修复了多个OpenSSL漏洞,这次更新所修复的漏洞中,有两个危害等级较高的为CVE-2016-6304和CVE-2016-6305.绿盟科技对此漏洞进行了技术分 ...

RDS for MySQL 表上 Metadata lock 的产生和处理

RDS for MySQL 表上 Metadata lock 的产生和处理 1. Metadata lock wait 出现的场景 2. Metadata lock wait 的含义 3. 导致 Me ...

将工业未来变现 – 工业互联网的爆发前夜

如果工业互联网能够像当今的消费互联网那样得到充分应用,从现在到2030年,工业互联网将可能为中国经济带来累计3万亿美元的GDP增量. 谈及工业互联网,必然与物联网有着密切或是混淆的印象关联,当物联网以 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.024 s.