OpenAI 发布增强学习算法测试开源工具包

去年成立的非营利性人工智能研究机构OpenAI得到了包括Elon Musk在内的多个硅谷巨头的支持,因此在人工智能领域颇受瞩目(编者按:Musk是人工智能威胁论的支持者,投资OpenAI是为了随时掌握AI的发展动态)。

近日OpenAI发布了成立来的第一个产品:增强学习算法的开源测试平台Gym(Beta版本)。

Gym可以在本地运行,用于在各种实验环境中测试增强学习算法,Gym也可以作为web服务用于分享测试结果。Gym能够自动给出评估分数,同时还支持用户查看和分享这些结果。

据OpenAI研究人员在博客中介绍,开发Gym的初衷是为了加快OpenAI自身的增强学习研究。目前网络上也有一些平台可以展示和比较算法性能,例如Algorithmia,但这些都是通用代码库。OpenAI的Gym更专注于深度学习的热门领域——增强学习(RL),这也是谷歌DeepMind研究团队在AlphaGo程序中使用的技术。

但是目前此领域的深度学习技术缺乏测试基准和标准,这也是OpenAI Gym试图解决的问题。

====================================分割线================================
文章转载自 开源中国社区[http://www.oschina.net]

时间: 2024-08-01 09:22:41

OpenAI 发布增强学习算法测试开源工具包的相关文章

Intel发布开源增强学习框架Coach

本文讲的是Intel发布开源增强学习框架Coach, 今天,英特尔发布了一个新的开源增强学习框架Coach.该框架利用多核CPU处理能力,用于训练和评估增强学习Agent.Coach包含一些领先的增强学习算法的多线程实现,适用于各种游戏和机器人环境.它能够在台式计算机上高效地训练强化学习Agent,而无需任何额外的硬件. 自从2016年推出用于深层加强学习的异步方法以来,许多算法通过在许多CPU内核中并行运行多个实例,能够更快地实现更好的策略.到目前为止,这些算法包括A3C .DDPG.PPO.

OpenAI发布“宇宙”平台,用1000+训练环境赋予AI“类人智力”

当人工智能领域大牛在西班牙NIPS会议酒店吃早餐的时候,Open AI 宣布开源了其新平台"宇宙"(Universe).这家由伊隆·马斯克资助的非赢利性AI开源组织,在周一的上午搞了个大新闻,相信NIPS的餐桌上一定热闹非凡.当然,Open AI后续也在NIPS的会场展示了自己的成果. Open AI 联合创始人Greg Brockman 在Twitter上说道,"这个AI 训练架构,是我们从Open AI建立之初就在计划着的".可见Open AI对这个平台的重视.

增强学习与无人驾驶

增强学习简介 增强学习是最近几年机器学习领域的最新进展.增强学习的目的是通过和环境交互学习到如何在相应的观测中采取最优行为.行为的好坏可以通过环境给的奖励确定.不同的环境有不同的观测和奖励.例如,驾驶中环境的观测是摄像头和激光雷达采集到的周围环境的图像和点云,以及其他传感器的输出(如行驶速度.GPS定位和行驶方向).驾驶中的环境的奖励根据任务的不同,可以通过到达终点的速度.舒适度和安全性等指标确定. 增强学习和传统机器学习的最大区别是增强学习是一个闭环学习的系统,增强学习算法选取的行为会直接影响

增强学习小白?本文带你入门了解增强学习

更多深度文章,请关注:https://yq.aliyun.com/cloud 机器学习算法,特别是神经网络被认为是新的AI革命的起因. 在这篇文章中,我将介绍增强学习的概念,不过技术细节有限,只能使具有不同背景的读者能够理解该技术的本质.功能和局限性. 在本文末尾,我将提供一些实现RL的资源链接. 什么是增强学习? 从广义上讲,数据驱动算法可以分为三类:监督式.非监督式和增强学习. 前两个通常用于执行诸如图像分类.检测等任务,虽然它们的精确度是显著的,但这些任务不同于我们所期望的"智能"

(转) 深度增强学习与通用人工智能

    深度增强学习前沿算法思想 CSDN  作者: Flood Sung 2017-02-16 09:34:29 举报 阅读数:3361 作者: Flood Sung,CSDN博主,人工智能方向研究生,专注于深度学习,增强学习与机器人的研究. 责编:何永灿,欢迎人工智能领域技术投稿.约稿.给文章纠错,请发送邮件至heyc@csdn.net本文为<程序员>原创文章,未经允许不得转载,更多精彩文章请订阅2017年<程序员>​ 2016年AlphaGo计算机围棋系统战胜顶尖职业棋手李世

TensorFlow Agents日前开源,轻松在TF中构建并行强化学习算法

用于在TensorFlow中构建并行强化学习算法的高效基础架构范例TensorFlow Agents日前开源,这个项目是由谷歌的两位研究员James Davidson.Vincent Vanhoucke,以及Danijar Hafner共同研发的.关于这个项目的开源信息他们在GitHub上进行了介绍,雷锋网 AI 科技评论将内容进行编译整理. TensorFlow Agents TensorFlow Agents为强化学习提供了优化的基础架构,它将OpenAI gym接口扩展到多个并行环境,并能

干货 | 算法工程师入门第二期——穆黎森讲增强学习(二)

雷锋网(公众号:雷锋网)按:大牛讲堂算法工程师入门系列第二期-穆黎森讲增强学习(二),上一讲内容主要涉及增强学习基本概念及Deep Q Learning的相关内容,本讲除了Deep Q Learning的相关拓展内容.DQN和近期的一些进展. 传送门:干货 | 算法工程师入门第二期--穆黎森讲增强学习(一) Beyond Deep Q Learning DQN将一个强大的工具deep neural network 引入RL,解决了这中间遇到的很多新问题,收到了很好的效果.自从这篇工作以后,一方面

PaperWeekly 第二十五期 --- 增强学习在image caption任务上的应用

引言 第二十二期的PaperWeekly对Image Captioning进行了综述.今天这篇文章中,我们会介绍一些近期的工作.(如果你对Image Captioning这个任务不熟悉的话,请移步二十二期PaperWeekly 第二十二期---Image Caption任务综述) Image Captioning的模型一般是encoder-decoder的模型.模型对$p(S|I)$进行建模,$S$是描述,$I$是图片.模型的训练目标是最大化log似然:$\max_\theta\sum_i \l

【重磅】AlphaZero炼成最强通用棋类AI,DeepMind强化学习算法8小时完爆人类棋类游戏

世界最强围棋AI AlphaGo Zero带给世人的震撼并没有想象中那么久--不是因为大家都去看谁(没)跟谁吃饭了,而是DeepMind再次迅速超越了他们自己,超越了我们剩下所有人的想象. 12月5日,距离发布AlphaGo Zero论文后不到两个月,他们在arXiv上传最新论文<用通用强化学习算法自我对弈,掌握国际象棋和将棋>(Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algori