炼数成金 商业智能强化学习
订阅

强化学习

DeepMind为明年的AAAI,准备了一份各种DQN的混血
DeepMind为明年的AAAI,准备了一份各种DQN的混血
DeepMind公开了一篇最近投递到AAAI 2018的新论文,这篇论文的主角,依然是这家公司四年前就开始研究的DQN,配角,依然是雅达利(Atari)游戏。DQN,全名Deep Q-Network(深度Q网络),是DeepMind在2013年NIPS Deep L ...
TensorFlow Agents日前开源,在TensorFlow中构建强化学习算法
TensorFlow Agents日前开源,在TensorFlow中构建强化学习算法
用于在TensorFlow中构建并行强化学习算法的高效基础架构范例TensorFlow Agents日前开源,这个项目是由谷歌的两位研究员James Davidson、Vincent Vanhoucke,以及Danijar Hafner共同研发的。TensorFlow Agents为强化 ...
全新强化学习算法详解,看贝叶斯神经网络如何进行策略搜索
全新强化学习算法详解,看贝叶斯神经网络如何进行策略搜索
首先,在这里,介绍一下我们最近在ICLR(International Conference on Learning Representations)上发表的论文《利用贝叶斯神经网络进行随机动力系统中的学习与策略搜索》(ICLR 2017)。点击此处查看论文代码和视 ...
智能体要找不着北了,UCL汪军团队提出环境设计的新方法
智能体要找不着北了,UCL汪军团队提出环境设计的新方法
能够达到期望的环境是需要设计的,但是很难分析性地用标准设计方法处理这类复杂的对象与环境交互问题,对整个解空间进行穷举演算的计算成本又太高。环境设计任务:智能体与环境交互,智能体是相对固定的,环境学习一 ...
强化学习族谱
强化学习族谱
强化学习是一类算法, 是让计算机实现从一开始什么都不懂, 脑袋里没有一点想法, 通过不断地尝试, 从错误中学习, 最后找到规律, 学会了达到目的的方法. 这就是一个完整的强化学习过程.
阿里巴巴为什么要选择星际争霸作为AI算法研究环境?
阿里巴巴为什么要选择星际争霸作为AI算法研究环境?
首先可能大家有疑问,为什么选择《星际争霸》这个游戏来做我们 AI 研究的一个平台。我们这个认知计算实验室目前是挂靠在搜索事业部下面,我们团队的成员基本都是做搜索、广告、推荐、算法这样的背景,之前我们主要做 ...
英特尔通过预测变量实现策略性强化学习,夺冠 Doom 游戏竞赛
英特尔通过预测变量实现策略性强化学习,夺冠 Doom 游戏竞赛
来自英特尔实验室(Intel Labs)的两名研究员Alexey Dosovitskiy和Vladlen Koltum提出了一种在沉浸式环境中实现感觉运动控制(Sensorimotor control)的方法。据悉,该方法有效地综合利用了高维度的感官流(high-dim ...
从强化学习基本概念到Q学习的实现,打造自己的迷宫智能体
从强化学习基本概念到Q学习的实现,打造自己的迷宫智能体
强化学习其实也是机器学习的一个分支,但是它与我们常见监督学习和无监督学习又不太一样。强化学习旨在选择最优决策,它讲究在一系列的情景之下,通过多步恰当的决策来达到一个目标,是一种序列多步决策的问题。该学 ...
OpenAI详解进化策略方法:可替代强化学习
OpenAI详解进化策略方法:可替代强化学习
进化策略(ES:evolution strategy)是一种已存在了数十年的优化技术,其在现代强化学习基准(如 Atari/MuJoCo)上的表现可以比肩标准的强化学习技术,同时还能克服强化学习的许多不便。特别的几点包括:进化策略的 ...
增强学习的解释——学习基于长期回报的行为
增强学习的解释——学习基于长期回报的行为
一个机器人向前迈了一大步然后跌倒了。下一次它就往前走一小步并可以保持平衡了。机器人就像这样尝试了很多次,最终它成功学会了正确的步伐大小并能够稳定地行走了。我们看到的上述例子被称为增强学习。它将一个机器 ...
田渊栋总结:强化学习跳过“认识世界”,直指“改变世界”
田渊栋总结:强化学习跳过“认识世界”,直指“改变世界”
2016年是波澜壮阔的一年。这一年人工智能领域最抢眼的莫过于AlphaGo与李世石的五番棋对决。这一战,极大地扭转了大众对人工智能的认知,注定会载入史册。我有幸参与了历史。先是开了DarkForest这个项目,在计算机围 ...
专访谷歌Jeff Dean:强化学习适合的任务与产品化应用
专访谷歌Jeff Dean:强化学习适合的任务与产品化应用
最近在接受 Fortune 杂志采访时,Google 联合创始人兼领导人之一 Jeff Dean 谈到了最前沿的人工智能的研究、其中的挑战和人工智能在产品当中的应用。下次你在 Google 搜索引擎中输入问题或者使用谷歌地图服务以获取 ...
深度学习漫游指南:强化学习概览
深度学习漫游指南:强化学习概览
还记得你是如何学习骑自行车的吗?一般都有一个大人在你旁边或你后面帮助你,并鼓励你骑出你自行车生涯的第一步,在你绊倒或摔倒的时候还会帮助你再次尝试。解释儿童学习骑自行车的方式是很困难的,而即使很好的解释 ...
强化学习的复兴
强化学习的复兴
最近几个月,DeepMind 每次宣布在玩游戏的计算机上取得惊人的成果时总会获得人们的关注。起先,这家谷歌旗下在伦敦的人工智能研究中心宣称世界上有了一个能自学玩上世纪八十年代以来从 Pong 和 Breakout 到 Pac-Man ...
谷歌深度学习大神带你认识强化学习
谷歌深度学习大神带你认识强化学习
强化学习(Reinforcement learning)灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。这个方法具有普适性,因此在其他许多领 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

      GMT+8, 2017-10-15 08:57 , Processed in 0.104449 second(s), 16 queries .