尖端人工智能:Python 中的深度强化学习

使用进化策略、A2C 和 DDPG 将深度学习应用于人工智能和强化学习

讲师:Lazy Programmer Inc.

口袋资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将学到什么

  • 了解 A2C 算法的前沿实现(OpenAI 基线)
  • 理解并实施人工智能的进化策略(ES)
  • 理解并实施 DDPG(深度确定性策略梯度)

本课程包括:

  • 8.5小时点播视频
  • 通过手机和电视访问
  • 结业证书

要求

  • 了解 MDP(马尔可夫决策过程)和强化学习的基础知识
  • 看到我的前两门强化学习课程很有帮助
  • 了解如何在 Tensorflow 中构建卷积神经网络

描述

欢迎来到尖端人工智能!

从技术上讲,这是我的深度学习系列的《Python 深度学习》第 11 部分,也是我的第三门强化学习课程。

深度强化学习实际上是两个主题的结合:强化学习深度学习(神经网络)

虽然这两种技术已经存在相当长一段时间了,但直到最近深度学习以及强化学习才真正起飞。

深度学习的成熟推动了强化学习的进步,强化学习自 20 世纪 80 年代以来就已经存在,尽管它的某些方面(例如贝尔曼方程)已经存在了更长时间。

最近,这些进步让我们展示了强化学习的强大力量。

我们已经看到AlphaZero如何通过自我对弈就能掌握围棋游戏。

就在几年前,最初的 AlphaGo 已经击败了围棋世界冠军。

我们已经看到现实世界的机器人学习如何行走,甚至在被踢倒后恢复,尽管仅使用模拟进行训练。

模拟很好,因为它不需要昂贵的实际硬件。如果你的特工摔倒了,也不会造成真正的伤害。

我们已经看到现实世界中的机器人学会了手的灵活性,这是一个不小的壮举。

走路是一回事,但这涉及粗略的动作。手的灵活性是复杂的——你有很多自由度,并且涉及的许多力量都非常微妙。

想象一下用你的脚做一些你通常用手做的事情,你会立即明白为什么这会很困难。

最后但并非最不重要的一点是——视频游戏。

即使仅考虑过去几个月,我们也看到了一些惊人的发展。AI 现在正在CS:GODota 2中击败职业玩家。

那么这门课程与前两门课程有何不同?

既然我们知道深度学习可以与强化学习配合使用,那么问题就变成了:我们如何改进这些算法?

本课程将向您展示几种不同的方法:包括强大的A2C(Advantage Actor-Critic)算法、DDPG(深度确定性策略梯度)算法和进化策略

进化策略是强化学习的一种新的尝试,它抛弃了所有旧的理论,转而采用一种更“黑匣子”的方法,其灵感来自于生物进化。

这门新课程的另一个优点是我们可以看到各种各样的环境。

首先,我们将了解经典的Atari环境。这些很重要,因为它们表明强化学习代理可以仅根据图像进行学习。

其次,我们要看看MuJoCo,它是一个物理模拟器。这是构建能够在现实世界中导航并理解物理的机器人的第一步——我们首先必须证明它可以与模拟物理一起工作。

最后,我们来看看几年前大家最喜欢的手机游戏《Flappy Bird》 。

感谢您的阅读,我们课堂上见!

“如果你不能实施它,你就没有理解它”

  • 或者正如伟大的物理学家理查德·费曼所说:“我无法创造的东西,我就不理解”。
  • 我的课程是唯一您将学习如何从头开始实现机器学习算法的课程
  • 其他课程将教您如何将数据插入到库中,但您真的需要 3 行代码的帮助吗?
  • 对 10 个数据集执行相同的操作后,您意识到自己没有学到 10 件事。你学到了 1 件事,只是重复了同样的 3 行代码 10 次……

建议的先决条件:

  • 结石
  • 可能性
  • 面向对象编程
  • Python 编码:if/else、循环、列表、字典、集合
  • Numpy 编码:矩阵和向量运算
  • 线性回归
  • 梯度下降
  • 了解如何在 TensorFlow 中构建卷积神经网络 (CNN)
  • 马尔可夫决策过程 (MDP)

我应该按什么顺序学习您的课程?:

  • 查看讲座“机器学习和 AI 先决条件路线图”(可在我的任何课程的常见问题解答中找到,包括免费的 Numpy 课程)

独特的功能

  • 每行代码都有详细解释 – 如果您不同意,请随时给我发电子邮件
  • 不像其他课程那样浪费时间在键盘上“打字”——说实话,没有人能真正从头开始在短短 20 分钟内编写出值得学习的代码
  • 不害怕大学水平的数学 – 获取其他课程遗漏的算法的重要细节

本课程适合谁:

  • 想要将强化学习应用到工作和项目中的学生和专业人士
  • 任何想要学习尖端人工智能和强化学习算法的人

发表回复

后才能评论

  • 每一个课程页面,都有演示地址选项,点击链接可以跳转到课程发布网站查看详细课程列表。
  • 绝大部分课程都有试看内容,可以先点击试看,再决定是否购买。
  • 本站课程均存储在阿里云盘或百度网盘中,由于阿里云盘对分享的文件类型有限制,所以课程资料和字幕会存储到蓝奏云盘中。
  • 阿里云盘和蓝奏云盘都是不限速下载的,你既可以选择在阿里云盘中在线学习,也可以选择下载到本地学习。
  • 课程下载到本地可以挂载中英文双字幕,请点击查看Potplayer挂载中英文双字幕教程
  • 本站所有课程,均提供mp4格式视频文件,中英文双字幕,配套资料齐全,不加密。
  • 每一个课程右侧下载面板中,都会有清晰度标识,大部分都是1080P或者720P,还有少数是超高清的。
  • 本站课程购买之后,均可以免费更新,所有课程,皆配有中文字幕。
  • 请注意,课程的中文字幕是根据英文字幕用谷歌翻译生成的,本非人工翻译。谷歌翻译准确度尚可,学习观看,没有问题。
  • 由于数字资源具有可复制性,一旦购买,不接受退款要求,请在购买之前,认真了解课程内容,确定是否需要。
  • 当然,如果有特殊情况,可以查看网站底部联系方式,联系站长说明问题,我会为你妥善处理。
  • 赞助本站VIP会员,可以免费下载所有课程,详情请查看VIP介绍