AI大事件 | Geoffrey Hinton决定抛弃反向传播,预期策略梯度算法

呜啦啦啦啦啦大家好呀,又到了本周的AI大事件时间了。过去的一周中AI圈都发生了什么?大佬们互撕了哪些问题?研究者们发布了哪些值得一读的论文?又有哪些开源的代码和数据库可以使用了?文摘菌带你盘点过去一周AI大事件!

了解过去一周AI爆点,一篇就够啦!

新闻
Geoffrey Hinton决定抛弃反向传播
来源:WWW.AXIOS.COM
链接:https://www.axios.com/ai-pioneer-advocates-starting-over-2485537027.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
现在几乎所有神经网络都会经过反向传播的训练。然而在最近的一次采访中,Hinton,深度学习之父却表示,他将“抛开一切重新开始”。要想在深度学习上向前推进,就必须发明全新的方法。

Facebook人工智能研究登陆蒙特利尔
来源:NEWSROOM.FB.COM
链接:https://newsroom.fb.com/news/2017/09/fair-montreal/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
作为Facebook的人工智能研究的一部分(FAIR),这个新的团队将由超过100名来自门洛帕克、纽约和巴黎的科学家组成,他们将努力推进人工智能领域的研究。
蒙特利尔实验室将对AI领域进行广泛的研究,但它也将特别关注强化学习和对话系统。

Sophia Genetics筹集了3000万美元帮助医生使用人工智能和基因组数据进行诊断
来源:VENTUREBEAT.COM
链接:https://venturebeat.com/2017/09/13/sophia-genetics-raises-30-million-to-help-doctors-diagnose-using-ai-and-genomic-data-analysis/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
9月13日消息,瑞士医疗数据分析公司Sophia Genetics宣布完成3000万美元D轮融资,Balderton Capital领投,Alychlo、Invoke Capital Partners、360 Capital Partners等跟投。

Sophia Genetics成立于2011年,是一家遗传信息数据分析公司,专注于通过人工智能找出患者基因突变原理,并结合专家意见提供个性化的治疗诊断方案。

文章&教程
学习其他代理想法的模型(OpenAI)
来源:BLOG.OPENAI.COM
链接:https://blog.openai.com/learning-to-model-other-minds/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一种算法,它解释了其他代理也在学习的事实,并在迭代囚徒困境中发现了类似于针锋相对的合作策略。

AI健身房
来源:LEARNINGAI.IO
链接:https://learningai.io/projects/2017/07/28/ai-gym-workout.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一个易于理解的近端策略优化( Proximal Policy Optimization)的介绍(PPO)并且能够很好的应对MuJoCo 和 RoboSchool 的环境。点击这里查看代码:https://github.com/pat-coady/trpo

使用强化学习达到最优化
来源:BAIR.BERKELEY.EDU
链接:http://bair.berkeley.edu/blog/2017/09/12/learning-to-optimize-with-rl/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
机器学习的算法仍然是人工设计的。这就引出了一个自然的问题:我们可以学习这些算法吗?

项目&数据
使用TensorBoard API完成自定义可视化
来源:RESEARCH.GOOGLEBLOG.COM
链接:https://research.googleblog.com/2017/09/build-your-own-machine-learning.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
为了让学习者能够使用新的和有用的可视化进行创作,谷歌公布了一组API,允许开发人员添加自定义的可视化插件到TensorBoard。

膨胀残留网络(Dilated Residual Network)的实现
来源:GITHUB.COM
链接:https://github.com/fyu/drn?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
基于膨胀卷积的多元内容集成和膨胀残留网络的官方PyTorch实现。

对TensorFlow数据集和估计机制(Estimators)的介绍
来源:DEVELOPERS.GOOGLEBLOG.COM
链接:https://developers.googleblog.com/2017/09/introducing-tensorflow-datasets.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
TensorFlow 1.3介绍了两个重要的特点:数据集和估计机制。这篇文章显示了他们如何适应TensorFlow架构。

数据集 | 一万本最受欢迎的书:一万本书,六百万次阅读
来源:GITHUB.COM
链接:https://github.com/zygmuntz/goodbooks-10k?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
该数据集包含了goodreads.com上一万本最受欢迎的书,其中最受欢迎的被阅读了六百万次。

爆款论文
针对工程师的机器学习简介
来源:ARXIV.ORG
链接:https://arxiv.org/abs/1709.02840?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一个200页的“简短”的介绍。这项工作旨在介绍机器学习中的关键概念、算法和理论框架,包括监督和无监督学习、统计学习理论、概率图形模型和近似推理。

把所有东西都嵌入进去!
来源:ARXIV.ORG
链接:https://arxiv.org/abs/1709.03856?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
一个通用的神经嵌入模型,可以解决各种各样的问题:标签型任务,如文本分类;排序型任务,如信息检索、网络搜索、基于协同过滤和基于内容的推荐;多关系图的嵌入,并能够实现单词、句子或文档级的嵌入。在每种情况下,模型都是通过嵌入由离散特征组成的实体来实现的,并将对它们进行比较——学习依赖于任务的相似性。

预期策略梯度算法
来源:ARXIV.ORG
链接:https://arxiv.org/abs/1706.05374?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI
预期策略梯度算法(EPG:Expected policy gradients)使强化学习中的随机策略梯度算法(SPG: stochastic policy gradients )和确定性策略梯度算法(DPG: deterministic policy gradients )达成了一致。这一算法的灵感来自于预期的SARSA算法,EPG在估计梯度的时候整合了整个操作,而不是仅仅依赖于采样轨迹。

时间: 2024-08-02 02:25:33

AI大事件 | Geoffrey Hinton决定抛弃反向传播,预期策略梯度算法的相关文章

AI大事件 | OpenAI员工离职创立机器人新公司,spaCy v2.0.0发布

呜啦啦啦啦啦大家好呀,又到了本周的AI大事件时间了.过去的一周中AI圈都发生了什么?大佬们互撕了哪些问题?研究者们发布了哪些值得一读的论文?又有哪些开源的代码和数据库可以使用了?文摘菌带你盘点过去一周AI大事件! 新闻 Waymo的无人驾驶汽车已奔驰在亚利桑那州凤凰城的大路上 来源:WWW.RECODE.NET 链接:https://www.recode.net/2017/11/7/16614780/alphabet-driverless-cars-phoenix-arizona Alphabe

AI大事件 | 人类理解行为数据集推出,Uber发布自家分布式深度学习框架

呜啦啦啦啦啦大家好呀,又到了本周的AI大事件时间了.过去的一周中AI圈都发生了什么?大佬们互撕了哪些问题?研究者们发布了哪些值得一读的论文?又有哪些开源的代码和数据库可以使用了?文摘菌带你盘点过去一周AI大事件! 新闻 AlphaGo Zero: 从零开始的学习 来源:DEEPMIND.COM: 链接:https://deepmind.com/blog/alphago-zero-learning-scratch/?utm_campaign=Revue%20newsletter&utm_mediu

深度学习要另起炉灶,彻底抛弃反向传播?

这是言论的主要出处: Artificial intelligence pioneer says we need to start over(http://t.cn/RpR0Q18) 以及 Fei-Fei Li 在 Twitter 上的评论: Echo Geoff's sentiment no tool is eternal, even backprop or deeplearning. V. important to continue basic research.(http://t.cn/Rp

AI大事件 | 高校AI科学家流失严重,关于整个地球的数据集登录AWS

新闻 大学正在失去他们最好的人工智能科学家 来源:WWW.THEGUARDIAN.COM 链接: https://www.theguardian.com/science/2017/nov/01/cant-compete-universities-losing-best-ai-scientists?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI 一些公司正

AI超大事件丨从研究到应用,这是一份2017年AI领域的最全面总结

2017年已经结束了,还有什么比回顾这一整年中AI的发展历程更激动人心的吗? AI大事件的作者Denny Britz梳理了2017整年的AI大事,人工智能从研究到应用领域的回顾,都在这篇AI超大事件里了. 强化学习在很多游戏上达到了超人表现 今年AI领域最成功的故事可能就是AlphaGo了(Nature论文),AlphaGo是一个强化学习代理,击败了世界上最好的国际象棋棋手. AlphaGo的第一个版本使用来自人类专家的训练数据进行引导,并通过自我对弈和蒙特卡洛树搜索进一步提升.不久之后,Alp

【干货】AI 实践者需要掌握的10大深度学习方法:反向传播、迁移学习、梯度下降……

过去10年,人们对机器学习的兴趣激增.几乎每天,你都可以在各种各样的计算机科学课程.行业会议.华尔街日报等等看到有关机器学习的讨论.在所有关于机器学习的讨论中,许多人把机器学习能做的事情和他们希望机器学习做的事情混为一谈.从根本上讲,机器学习是使用算法从原始数据中提取信息,并在某种类型的模型中表示这些信息.我们使用这个模型来推断还没有建模的其他数据. 神经网络是机器学习的一种模型,它们至少有50年历史了.神经网络的基本单元是节点(node),基本上是受哺乳动物大脑中的生物神经元启发.神经元之间的

Geoffrey Hinton,让加拿大成为AI创新之地的助推者

计算机科学家和人工智能方面的领头专家Geoffrey Everest Hinton 已经成功帮助多伦多大学成为一个创新中心. 在剑桥大学读本科的时候,Geoffrey Everest Hinton一直对人类大脑有着很多的思考. 他想要更好地了解人类大脑究竟是如何工作的,然而令人沮丧的是,从生理学和心理学.再到物理和化学,没有一个学科领域能给出一个真正的答案.所以他决定自己建立一个电脑模型来模仿大脑的思维过程.  "人们都以为我疯了,"现年69岁的 Hinton 博士说,他既是谷歌的研究

深度学习鼻祖Geoffrey Hinton帮你入门带你飞

本文联合编译:Blake.高斐 雷锋网注:Geoffrey Everest Hinton(杰弗里·埃弗里斯特·辛顿 )是一位英国出生的计算机学家和心理学家,以其在神经网络方面的贡献闻名.辛顿是反向传播算法和对比散度算法的发明人之一,也是深度学习的积极推动者,目前任职于多伦多大学与Google.作为人工智能领域的三位奠基人之一,早在30年前,辛顿就已经在深度学习领域留下了自己的烙印.然而,直到计算机的性能达到深度学习的要求,辛顿才开始在学术界以外得到自己应得的广泛认可,本文是他对于深度学习介绍的演

神经网络之父 Geoffrey Hinton:深度学习的下一个飞跃是什么?

Geoffrey Hinton,图源网络 雷锋网按: Geoffrey Hinton 被尊称为"神经网络之父",他将神经网络带入到研究与应用的热潮,将"深度学习"从边缘课题变成了谷歌等互联网巨头仰赖的核心技术,并将 HintonBack Propagation(反向传播)算法应用到神经网络与深度学习,还提出了"Dark Knowledge"概念. Geoffrey Hinton 曾获得爱丁堡大学人工智能的博士学位,并且为多伦多大学的特聘教授.在