使用 R 进行强化学习:算法-代理-环境

了解如何利用算法进行基于奖励的学习,作为 R 强化学习的一部分。

讲师:Packt Publishing

口袋资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将学到什么

  • 理解并实现 R 中的“网格世界”问题
  • 利用马尔可夫决策过程和贝尔曼方程
  • 了解强化学习中的关键术语
  • 深入研究时差学习,这是一种结合了蒙特卡罗方法和动态规划的算法
  • 利用 RL 技术将您的机器学习技能提升到新的水平
  • 学习策略评估和迭代的 R 示例
  • 实现基于模型和无模型 RL 的典型应用
  • 了解策略评估和迭代
  • 通过 R 中的贪婪选择示例掌握 Q-Learning
  • 通过 R 中的示例掌握模拟退火变化折扣因子

要求

  • 需要对机器学习概念有基本的了解。

描述

强化学习已成为机器学习和人工智能领域最热门的研究领域之一。您可以通过几个步骤创建一个智能代理:让它半随机地探索给定不同条件和状态的动作的不同选择,然后跟踪与给定状态或动作的每个选择相关的奖励或惩罚。本课程描述并比较了构成强化学习算法的基于模型和无模型的学习算法的范围。

这门综合性的三合一课程采用分步实用的方法来掌握 R 强化学习的基础知识并构建您自己的智能系统。首先,您将学习如何使用 R 编程语言实施强化学习技术。您还将学习强化学习中的概念和关键算法。进一步,您将深入了解时域差分学习,这是一种结合了蒙特卡罗方法和动态规划的算法。最后,您将实现基于模型和无模型 RL 的典型应用程序。

在本课程结束时,您将掌握 R 强化学习的基础知识并构建您自己的智能系统。

内容和概述

该培训计划包括 3 个经过精心挑选的完整课程,旨在为您提供最全面的培训。

第一门课程“ R 强化学习技术”涵盖了 R 强化学习技术。本课程将向您简要介绍强化学习;它将帮助您导航“网格世界”,使用流行的 MDPToolbox 包计算可能的成功结果。该视频将向您展示刺激 – 行动 – 奖励算法在强化学习中的工作原理。在本课程结束时,您将对强化学习的概念有基本的了解,您将编写您的第一个强化学习程序,并掌握强化学习环境的编程。

第二门课程,实用强化学习 – 代理和环境,涵盖强化学习中的概念和关键算法。在本课程中,您将学习如何在 RL 中编写核心算法,并了解 R 和 Python 中的算法。本视频课程将帮助您快速入门,使用 R 和 Python 代码进行值迭代、策略梯度、Q 学习、时域差分学习、马尔可夫决策过程和贝尔曼方程,为建模决策提供了一个框架,其中结果部分是随机的,部分是由决策者控制的。在视频课程结束时,您将了解 RL 的主要概念和关键算法。

第三门课程,探索 R 中基于奖励的学习算法,涵盖基于模型和无模型的 R 强化学习算法。本课程首先描述无模型和基于模型的强化学习方法的差异。它讨论了无模型和基于模型的方法的特点、优点和缺点以及典型示例。我们研究基于模型的强化学习方法。我们讨论状态价值和状态行动价值函数、基于模型的迭代策略评估和改进、移动棋子的 MDP R 示例、折扣因子、伽玛如何“工作”以及说明折扣因子和伽玛如何“工作”的 R 示例。相对奖励影响政策。接下来,我们学习无模型的强化学习方法。这包括蒙特卡罗方法、Q-Learning 方法、更多关于改变学习率和动作随机性以及 SARSA 方法的 Q-Learning 解释和 R 示例。最后,我们通过研究无模型模拟退火和更多 Q-Learning 算法来总结。主要目的是学习如何创建高效、以目标为导向的业务策略,以及如何评估和优化这些策略,主要使用 R 中的 MDP 工具箱包。最后,视频展示了如何使用模拟退火方法。

在本课程结束时,您将掌握 R 强化学习的基础知识并构建您自己的智能系统。

关于作者

  • 1993 年至 2010 年间, Geoffrey Hubona 博士在美国东部三所主要州立大学担任全职终身教授、终身教授、助理教授和副教授。在这些职位上,他向本科生、硕士和博士教授了数十门各种统计、商业信息系统和计算机科学课程。学生。Hubona 博士获得博士学位。佛罗里达州坦帕市南佛罗里达大学 (USF) 工商管理(信息系统和计算机科学)学士学位(1993 年);经济学硕士学位(1990 年),同样来自南佛罗里达大学;弗吉尼亚州费尔法克斯乔治梅森大学金融 MBA(1979 年);并获得弗吉尼亚州夏洛茨维尔弗吉尼亚大学心理学学士学位(1972 年)。
  • 劳伦·华盛顿目前是 AI 驱动型初创公司 smartQED 的首席数据科学家和机器学习开发人员。Lauren 曾担任 Topix 的数据科学家、Google 的支付风险策略师(Google Wallet/Android Pay)、Nielsen 的统计分析师以及芝加哥大学国家民意研究中心的大数据实习生。劳伦还热衷于教授机器学习。她目前作为感恩数据科学训练营导师和 Packt Publishing 技术视频审阅者回馈数据科学界。她还获得了旧金山大会颁发的数据科学证书(2016 年)、哥伦比亚大学社会科学定量方法(应用统计方法)硕士学位(2012 年)以及斯佩尔曼学院经济学学士学位(2010 年)。劳伦是硅谷人工智能领域的领导者,

本课程适合谁:

  • 刚刚接触强化学习并希望以实用的方式学习构建自学习智能代理的基础知识的数据科学家和人工智能程序员。

发表回复

后才能评论

  • 每一个课程页面,都有演示地址选项,点击链接可以跳转到课程发布网站查看详细课程列表。
  • 绝大部分课程都有试看内容,可以先点击试看,再决定是否购买。
  • 本站课程均存储在阿里云盘或百度网盘中,由于阿里云盘对分享的文件类型有限制,所以课程资料和字幕会存储到蓝奏云盘中。
  • 阿里云盘和蓝奏云盘都是不限速下载的,你既可以选择在阿里云盘中在线学习,也可以选择下载到本地学习。
  • 课程下载到本地可以挂载中英文双字幕,请点击查看Potplayer挂载中英文双字幕教程
  • 本站所有课程,均提供mp4格式视频文件,中英文双字幕,配套资料齐全,不加密。
  • 每一个课程右侧下载面板中,都会有清晰度标识,大部分都是1080P或者720P,还有少数是超高清的。
  • 本站课程购买之后,均可以免费更新,所有课程,皆配有中文字幕。
  • 请注意,课程的中文字幕是根据英文字幕用谷歌翻译生成的,本非人工翻译。谷歌翻译准确度尚可,学习观看,没有问题。
  • 由于数字资源具有可复制性,一旦购买,不接受退款要求,请在购买之前,认真了解课程内容,确定是否需要。
  • 当然,如果有特殊情况,可以查看网站底部联系方式,联系站长说明问题,我会为你妥善处理。
  • 赞助本站VIP会员,可以免费下载所有课程,详情请查看VIP介绍