强化学习从初学者到精通 – Python 中的 AI

使用深度强化学习和 PyTorch 构建人工智能 (AI) 代理:A2C、REINFORCE、DQN 等。

讲师:Escape Velocity Labs

口袋资源独家Mosh付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将学到什么

  • 了解强化学习范例及其最适合解决的任务。
  • 了解使用强化学习解决认知任务的过程
  • 了解使用强化学习解决任务的不同方法并选择最合适的方法
  • 完全从头开始实施强化学习算法
  • 从根本上理解每个算法的学习过程
  • 调试和扩展所提出的算法
  • 从研究论文中理解并实现新算法

要求

  • 轻松使用 Python 进行编程
  • 了解基本的线性代数和微积分(矩阵、向量、行列式、导数等)
  • 了解基本统计学和概率论(均值、方差、正态分布等)

描述

这是 Udemy 上最完整的强化学习课程。在其中,您将学习强化学习的基础知识,强化学习是现代人工智能的三大范式之一。您将从头开始实施自适应算法,根据经验解决控制任务。您还将学习将这些算法与深度学习技术和神经网络相结合,从而产生称为深度强化学习的分支。

本课程将为您提供理解新算法所需的基础。它还将为您准备本系列的下一课程,在这些课程中,我们将更深入地研究强化学习的不同分支,并研究一些现有的更高级的算法。

该课程的重点是培养实践技能。因此,在学习了每个方法系列中最重要的概念之后,我们将从头开始在 Jupyter Notebook 中实现它们的一个或多个算法。

本课程分为三个部分,涵盖以下主题:

第 1 部分(表格方法):

– 马尔可夫决策过程

– 动态规划

– 蒙特卡罗方法

– 时差法(SARSA、Q-Learning)

– N步引导

第 2 部分(连续状态空间):

– 状态聚合

– 瓷砖编码

第 3 部分(深度强化学习):

– 深SARSA

– 深度 Q 学习

– 加强

– Advantage Actor-Critic / A2C(优势 Actor-Critic / A2C 方法)

本课程适合谁:

  • 想在机器学习领域找到工作的开发人员
  • 寻求扩展知识广度的数据科学家/分析师和机器学习从业者。
  • 寻求提高实际编码技能的研究人员/学者。

发表回复

后才能评论

  • 每一个课程页面,都有演示地址选项,点击链接可以跳转到课程发布网站查看详细课程列表。
  • 绝大部分课程都有试看内容,可以先点击试看,再决定是否购买。
  • 本站课程均存储在阿里云盘或百度网盘中,由于阿里云盘对分享的文件类型有限制,所以课程资料和字幕会存储到蓝奏云盘中。
  • 阿里云盘和蓝奏云盘都是不限速下载的,你既可以选择在阿里云盘中在线学习,也可以选择下载到本地学习。
  • 课程下载到本地可以挂载中英文双字幕,请点击查看Potplayer挂载中英文双字幕教程
  • 本站所有课程,均提供mp4格式视频文件,中英文双字幕,配套资料齐全,不加密。
  • 每一个课程右侧下载面板中,都会有清晰度标识,大部分都是1080P或者720P,还有少数是超高清的。
  • 本站课程购买之后,均可以免费更新,所有课程,皆配有中文字幕。
  • 请注意,课程的中文字幕是根据英文字幕用谷歌翻译生成的,本非人工翻译。谷歌翻译准确度尚可,学习观看,没有问题。
  • 由于数字资源具有可复制性,一旦购买,不接受退款要求,请在购买之前,认真了解课程内容,确定是否需要。
  • 当然,如果有特殊情况,可以查看网站底部联系方式,联系站长说明问题,我会为你妥善处理。
  • 赞助本站VIP会员,可以免费下载所有课程,详情请查看VIP介绍