Udemy课程下载 Advanced Reinforcement Learning in Python: from DQN to SAC

【Udemy中英字幕】Advanced Reinforcement Learning in Python: from DQN to SAC

数据科学 2 年前 3 639 19.9

Python 中的高级强化学习：从 DQN 到 SAC

使用深度强化学习和 PyTorch 构建人工智能 (AI) 代理：DDPG、TD3、SAC、NAF、HER

讲师：Escape Velocity Labs

口袋资源独家Udemy付费课程，独家中英文字幕，配套资料齐全！
用不到1/10的价格，即可享受同样的高品质课程，且可以完全拥有，随时随地都可以任意观看和分享。

你将会学到的

掌握一些最先进的强化学习算法。
了解如何创建可以在复杂环境中行动以实现其目标的 AI。
使用 Python 最流行的工具（PyTorch Lightning、OpenAI gym、Brax、Optuna）从头开始创建高级强化学习代理
了解如何执行超参数调整（为我们的 AI 学习选择最佳实验条件）
从根本上了解每种算法的学习过程。
调试和扩展所提供的算法。
从研究论文中理解和实施新算法。

课程内容

14 个章节 • 115 个讲座 • 总时长 8 小时 5 分钟展开所有章节

介绍5 个讲座 • 8 分钟

复习：马尔可夫决策过程 (MDP)11 个讲座 • 32 分钟

复习：Q-Learning5 个讲座 • 11 分钟

复习：神经网络简介7 个讲座 • 34 分钟

复习：深度 Q 学习4 个讲座 • 9 分钟

PyTorch 闪电15 个讲座 • 1 小时 20 分钟

使用 Optuna 进行超参数调整6 个讲座 • 25 分钟

连续动作空间的深度 Q 学习（归一化优势函数）19 个讲座 • 1 小时 17 分钟

复习：策略梯度方法5 个讲座 • 20 分钟

深度确定性策略梯度 (DDPG)13 个讲座 • 1 小时 9 分钟

还有 4 个章节

要求

熟悉 Python 编程
完成我们的课程“强化学习初学者到掌握”或熟悉强化学习的基础知识（或观看本课程中包含的练级部分）。
了解基本统计数据（均值、方差、正态分布）

说明

这是 Udemy 上最完整的高级强化学习课程。在其中，你将学习使用 PyTorch 和 PyTorch 闪电在 Python 中实现一些最强大的深度强化学习算法。你将从头开始实施根据经验解决控制任务的自适应算法。你将学习将这些技术与神经网络和深度学习方法相结合，以创建能够解决决策任务的自适应人工智能代理。

本课程将向你介绍强化学习技术的最新技术。它还将为你准备本系列的下一个课程，我们将在其中探索在其他类型的任务中表现出色的其他高级方法。

该课程的重点是培养实践技能。因此，在学习了每个方法家族最重要的概念之后，我们将从头开始在 jupyter notebook 中实现它们的一种或多种算法。

调平模块：

– 复习：马尔可夫决策过程 (MDP)。

– 复习：Q-Learning。

– 复习：神经网络简介。

– 复习：深度 Q 学习。

– 复习：策略梯度方法

高级强化学习：

– PyTorch 闪电。

– 使用 Optuna 进行超参数调整。

– 连续动作空间的深度 Q 学习（归一化优势函数 – NAF）。

– 深度确定性策略梯度 (DDPG)。

– 双延迟 DDPG (TD3)。

– 软演员-评论家 (SAC)。

– 事后经验回放 (HER)。

此课程面向哪些人：

想要在机器学习领域找到工作的开发人员。
寻求扩展知识广度的数据科学家/分析师和机器学习从业者。
机器人专业的学生和研究人员。
工科学生和研究人员。

声明：口袋资源网（koudaizy.com）提供的所有课程、素材等资源全部来源于互联网，赞助VIP仅用于对口袋资源服务器带宽及网站运营等费用支出做支持，从本站下载资源，说明你已同意本条款。

【Udemy中英字幕】Advanced Reinforcement Learning in Python: from DQN to SAC

Python 中的高级强化学习：从 DQN 到 SAC

你将会学到的