Python 强化学习、深度 Q 学习和 TRFL
利用强化学习技术的力量,使用 Python 开发智能系统
讲师:Packt Publishing
口袋资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
你将学到什么
- 从基础开始实施最先进的强化学习算法
- 探索强化学习的各种技术,例如 MDP、Q Learning 等
- 深入研究时差学习,这是一种结合了蒙特卡罗方法和动态规划的算法
- 使用 Deep Q-Learning 创建虚拟自动驾驶汽车应用程序
- 使用 TensorFlow 和 OpenAI 健身房教授强化学习模型玩游戏
- 使用 TRFL 和 TensorFlow 构建项目,并将必要的 RL 构建块集成到现有代码中
- 发现 RL 算法的改进,例如带有 TRFL 块的 DQN 和 DDPG,例如高级目标网络更新、双 Q 学习和分布式 Q 学习
- 修改 RL 代理以包含多步奖励技术,例如 TD lambda
- 使用 TD Learning、Q Learning 和 SARSA 等经典 RL 方法创建基于 TRFL 的 RL 代理
要求
- 需要具备 Python 基础知识。
描述
强化学习 (RL) 可让您在业务环境中开发智能、快速和自学习的系统。它是训练学习代理并解决人工智能中的各种问题的有效方法——从游戏、自动驾驶汽车和机器人到企业应用程序,范围从数据中心节能(冷却数据中心)到智能仓储解决方案。
本课程涵盖通过将深度神经网络架构与强化学习相结合,在深度强化学习方面取得的主要进展和成功。您将了解强化学习的概念、其优点以及它为何如此受欢迎。本课程还讨论马尔可夫决策过程 (MDP)、蒙特卡洛树搜索、动态规划(例如策略和值迭代)、时间差异学习(例如 Q-learning 和 SARSA)。您将学习使用 TensorFlow 和 Keras 构建卷积神经网络模型。您还将在 OpenAI Gym 的帮助下学习人工智能在游戏环境中的使用。
在本课程结束时,您将探索强化学习,并获得使用真实数据和人工智能 (AI) 构建智能系统的实践经验。
认识您的专家:
我们拥有以下受人尊敬的作者的最佳作品,以确保您的学习之旅顺利:
●劳伦·华盛顿目前是 AI 驱动型初创公司 smartQED 的首席数据科学家和机器学习开发人员。Lauren 曾担任 Topix 的数据科学家、Google 的支付风险策略师(Google Wallet/Android Pay)、Nielsen 的统计分析师以及芝加哥大学国家民意研究中心的大数据实习生。劳伦还热衷于教授机器学习。她目前作为 Thinkful 数据科学训练营导师和 Packt Publishing 技术视频审阅者回馈数据科学界。她还获得了旧金山大会颁发的数据科学证书(2016 年)、哥伦比亚大学社会科学定量方法(应用统计方法)硕士学位(2012 年)以及斯佩尔曼学院经济学学士学位(2010 年)。劳伦是硅谷人工智能领域的领导者,
● Kaiser Hamid Rabbi是一位数据科学家,对人工智能、机器学习和数据科学充满热情。在过去的四年里,他全身心投入学习大数据科学技术,如Python、机器学习、深度学习、人工智能、强化学习、数据挖掘、数据分析、推荐系统等。Kaiser 对 Lygometry(我们知道我们不知道的事情!)也有着巨大的兴趣,并且总是尝试根据他的项目经验尽可能地理解领域知识。
● Colibri Digital 是一家技术咨询公司,由 James Cross 和 Ingrid Funie 于 2015 年创立。该公司致力于帮助客户驾驭快速变化且复杂的新兴技术世界,在大数据、数据科学、机器学习和云计算等领域拥有深厚的专业知识。在过去的几年里,他们与一些世界上最大和最负盛名的公司合作,包括一家一级投资银行、一家领先的管理咨询集团以及世界上最受欢迎的软饮料公司之一,帮助他们每个人更好地发展理解其数据,并以更智能的方式处理它。该公司的座右铭是:数据 -> 智能 -> 行动。
● Jim DiLorenzo是一名自由程序员和强化学习爱好者。他毕业于哥伦比亚大学,正在攻读计算机科学硕士学位。他在自己的 RL 实验以及将科学论文转化为代码时使用了 TRFL。
本课程适合谁:
- 本课程专为人工智能工程师、机器学习工程师、有抱负的强化学习和数据科学专业人士而设计,他们热衷于使用 Python 将他们的技能扩展到强化学习。