强化学习从初学者到精通 – Python 中的 AI
使用深度强化学习和 PyTorch 构建人工智能 (AI) 代理:A2C、REINFORCE、DQN 等。
讲师:Escape Velocity Labs
口袋资源独家Mosh付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
你将学到什么
- 了解强化学习范例及其最适合解决的任务。
- 了解使用强化学习解决认知任务的过程
- 了解使用强化学习解决任务的不同方法并选择最合适的方法
- 完全从头开始实施强化学习算法
- 从根本上理解每个算法的学习过程
- 调试和扩展所提出的算法
- 从研究论文中理解并实现新算法
要求
- 轻松使用 Python 进行编程
- 了解基本的线性代数和微积分(矩阵、向量、行列式、导数等)
- 了解基本统计学和概率论(均值、方差、正态分布等)
描述
这是 Udemy 上最完整的强化学习课程。在其中,您将学习强化学习的基础知识,强化学习是现代人工智能的三大范式之一。您将从头开始实施自适应算法,根据经验解决控制任务。您还将学习将这些算法与深度学习技术和神经网络相结合,从而产生称为深度强化学习的分支。
本课程将为您提供理解新算法所需的基础。它还将为您准备本系列的下一课程,在这些课程中,我们将更深入地研究强化学习的不同分支,并研究一些现有的更高级的算法。
该课程的重点是培养实践技能。因此,在学习了每个方法系列中最重要的概念之后,我们将从头开始在 Jupyter Notebook 中实现它们的一个或多个算法。
本课程分为三个部分,涵盖以下主题:
第 1 部分(表格方法):
– 马尔可夫决策过程
– 动态规划
– 蒙特卡罗方法
– 时差法(SARSA、Q-Learning)
– N步引导
第 2 部分(连续状态空间):
– 状态聚合
– 瓷砖编码
第 3 部分(深度强化学习):
– 深SARSA
– 深度 Q 学习
– 加强
– Advantage Actor-Critic / A2C(优势 Actor-Critic / A2C 方法)
本课程适合谁:
- 想在机器学习领域找到工作的开发人员
- 寻求扩展知识广度的数据科学家/分析师和机器学习从业者。
- 寻求提高实际编码技能的研究人员/学者。
声明:口袋资源网(koudaizy.com)提供的所有课程、素材等资源全部来源于互联网,赞助VIP仅用于对口袋资源服务器带宽及网站运营等费用支出做支持,从本站下载资源,说明你已同意本条款。