使用 Python 掌握强化学习和深度强化学习
精通强化学习:深度 Q 学习、SARSA 以及赛车、交易项目的实际应用
讲师:AI Sciences
口袋资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
你将学到什么
- ● 强化&深度强化学习的介绍和重要性
- ● 使用Python进行实用解释和实时编码
- ● 深度强化学习应用
- ● 使用Python 进行Q-Learning
- ● 使用Python的SARSA
- ● 使用Python 的随机解决方案
- ● Deep RL 的超参数
- ● MDP
- ● 使用Python 的迷你项目(Frozen Lake)
- ● 开放AI健身房
- ● 深度学习简介
- ● 深度学习基础知识
- ● 使用 Pytorch 的迷你项目 (CIFAR)
- ● DQN 基础知识
- ● 使用Python从Scratch项目开始Cart-Pole
- ● 稳定基线3
- ● 使用稳定基线 3 从头开始的 Cart-Pole 项目
- ● 使用Stable Baseline 3的赛车游戏项目
- ● 使用稳定基线3的交易机器人项目
- ● 面试准备
要求
- ● 具备Python 知识。
- ● 对编程有基本的了解。
- ● 愿意学习和实践。
描述
强化学习 (RL) 是机器学习的一个子集。在强化学习训练方法中,期望的行为得到奖励,不期望的行为受到惩罚。一般来说,强化学习代理可以理解和解释其环境、采取行动,并通过反复试验进行学习。
深度强化学习(Deep RL)也是机器学习的一个子领域。在深度强化学习中,智能机器和软件经过训练可以从自己的行为中学习,就像人类从经验中学习一样。也就是说,深度强化学习将强化学习技术与深度学习 (DL) 策略相结合。
深度强化学习有能力解决过去机器无法解决的复杂问题。因此,深度强化学习在机器人、医学、金融、游戏、智能电网等各个领域的潜在应用是巨大的。
人工神经网络 (ANN) 快速处理非结构化信息并像人脑一样学习的非凡能力现在才开始被利用。我们还处于初步阶段,无法看到结合了强化学习和人工神经网络力量的技术的全部影响。这项最新技术有可能彻底改变商业和科学的各个领域。
这门课程有何不同?
在这个详细的边做边学课程中,每一个新的理论解释都伴随着实际的实施。本课程为您提供理论与实践之间的适当平衡。课程中包含六个项目以简化您的学习。重点是向初学者教授强化学习和深度强化学习。因此,我们尽力简化事情。
“强化和深度强化学习完整指南”课程反映了最需要的职场技能。所有理论概念的解释清晰简洁。讲师特别强调复杂的理论概念,让您更容易理解它们。视频演示的节奏不快也不慢。它非常适合学习。您将了解所有基本的强化学习和深度强化学习概念和方法。课程是:
• 简单易学。
• 不言自明。
• 非常详细。
• 实用的实时编码。
• 涵盖该领域的最新知识。
由于本课程是所有基本概念的详尽汇编,因此您将有动力学习 RL 和深度 RL。你的学习进步会很快。你所经历的肯定比你所学到的要多得多。在每个新概念结束时,都会分配一个复习任务,例如家庭作业/活动/测验。还提供了这些任务的解决方案。这是为了评估和促进您的学习。整个过程与你已经学过的概念和方法紧密相连。这些活动大部分都是基于编码的,因为目标是让您为实际实施做好准备。
除了高质量的视频内容之外,您还可以在本课程中获得易于理解的课程材料、评估问题、深入的副主题注释和内容丰富的讲义。如果您对课程有任何疑问,欢迎联系我们友好的团队,我们保证会及时回复您。
课程教程细分为145+高清短视频。在每个视频中,您都会学到一些新的、有趣的东西。此外,您还将学习 RL 和 Deep RL 的关键概念和方法,以及一些实际的实现。课程视频的总时长超过14小时。
为什么要学习强化学习和深度强化学习?
强化学习和深度强化学习是人工智能领域最热门的研究主题。
强化学习 (RL)是机器学习的一个子集,涉及智能代理在环境中需要采取的行动以最大化奖励。强化学习是除监督学习和无监督学习之外的三种基本机器学习范式之一。
让我们看看下一个热点研究课题。
深度强化学习 (Deep RL)是机器学习的一个子集,融合了强化学习 (RL) 和深度学习 (DL)。深度强化学习将深度学习集成到解决方案中,允许代理根据非结构化输入数据做出决策,而无需人工干预。深度强化学习算法可以接受大量输入(例如,视频游戏中渲染到用户屏幕上的每个像素)并确定要执行的最佳操作以优化目标(例如,获得最高游戏分数)。
深度强化学习已用于各种应用,包括但不限于视频游戏、石油和天然气、自然语言处理、计算机视觉、零售、教育、交通和医疗保健。
课程内容:
综合课程包括以下主题:
一、简介
A。动机
我。什么是强化学习?
二.它与其他机器学习框架有何不同?
三.强化学习的历史
四.为什么要强化学习?
v.现实世界的例子
六.强化学习的范围
七.强化学习的局限性
八.练习与思考
b.强化学习术语以及案例研究和现实世界的例子
我。代理人
二.环境
三.行动
四.状态
五、过渡
六.报酬
七.测验/解决方案
八.政策
九.规划
X。练习与思考
2. 实践基本概念
A。朴素/随机解决方案
我。游戏介绍
二.游戏规则
三.设置
四.使用Python实现
b.基于强化学习的解决方案
我。 Q表简介
二.州试运行
三.强化学习的工作原理
四.使用 Python 实现基于 RL 的解决方案
五、方案比较
六.结论
3. 不同类型的强化学习解决方案
A。超参数和概念
一、 Epsilon简介
二.如何更新 epsilon
三.测验/解决方案
四.伽玛、折扣因子
五、测验/解决方案
六. Alpha,学习率
七.测验/解决方案
八. Alpha 的注意事项
九. Q学习方程
X.集数的最优值
十一.何时停止训练
b.马尔可夫决策过程
我。主体-环境交互
二.目标
三.退货
四.剧集数
v.价值函数
六.政策优化
七.价值函数的优化
八.近似值
九.练习与思考
C。 Q-学习
我。 QL 简介
二.方程解释
三.使用Python实现
四.离策略学习
d.非典
我。非典简介
二.状态、行动、奖励、状态、行动
三.方程解释
四.使用Python实现
v.政策学习
e. Q-Learning 与 SARSA
我。方程的差异
二.实施差异
三.优点和缺点
四.何时使用 SARSA
v.何时使用 Q Learning
六.测验/解决方案
4. 使用上述概念的迷你项目(冰冻湖)
A。健身房简介
b.健身房环境
C。冰湖游戏介绍
d.规则
e.使用Python实现
F。代理商评价
G。结论
5.深度学习/神经网络
A。深度学习框架
我。 Pytorch 简介
二.为什么选择 Pytorch?
三.安装
四.张量
v.自动微分
六. Pytorch实践
b. DNN 的架构
我。为什么是深度神经网络?
二. DNN 简介
三.感知器
四.建筑学
v.前馈
六.测验/解决方案
七.激活函数
八.损失函数
九.梯度下降
X。权重初始化
xi.测验/解决方案
十二.学习率
十三.批量归一化
十四.优化
十五.辍学
十六.提前停止
C。使用 Python 实现 CIFAR 的 DNN
6.深度强化学习/深度Q网络(DQN)
A。前往 DQN
我。深度 Q 网络简介
二.需要 DQN
三.基本概念
四. DQN 与 DNN 有何关系
v.重放记忆
六. Epsilon 贪婪策略
七.测验/解决方案
八.政策网络
九.目标网络
X。权重共享/目标更新
xi.超参数
b.实施 DQN
我。 DQN 项目 – 使用 Pytorch 的购物车和杆
二.移动平均线
三.可视化代理
四.绩效评估
7. 赛车项目
A。游戏介绍
b.使用 DQN 实现
八、交易项目
A。稳定的基线
b.使用 DQN 的交易机器人
9. 面试准备
成功完成本课程将使您能够:
● 将强化和深度强化学习的概念和实际应用与现实世界的问题联系起来
● 申请强化和深度强化学习相关职位
● 作为自由职业者从事与强化和深度强化学习相关的工作
● 从头开始实施任何需要强化和深度强化学习知识的项目
● 扩展或改进任何其他项目的实施以提高绩效
● 了解强化和深度强化学习的理论和实践
谁应该参加该课程:
- 对强化和深度强化学习一无所知的初学者
- 想要开发智能解决方案的人
- 喜欢在使用 Python 实现之前先学习理论概念的人
- 想要学习 PySpark 及其在实际项目中的实施的人
- 机器学习或深度学习爱好者
- 任何对人工智能感兴趣的人
你将学到什么:
- 强化学习 (RL) 和深度强化学习 (Deep RL) 的基本概念和方法
- 强化学习和深度强化学习的理论知识和实际应用
- 六个项目可强化您的学习并将其应用到现实场景中
- RL和Deep RL领域的最新知识和进展
为什么选择这门课程:
- 每个理论解释后都有详细的边做边学的方法和实际实施
- 理论与实践的平衡
- 对复杂理论概念的清晰简洁的解释
- 用于评估和促进学习的测验、作业和活动
- 细分为超过 145 个高清短视频,时长超过 14 小时
- 综合课程材料、副主题笔记和内容丰富的讲义
- 友好的团队支持任何与课程相关的问题
关键词列表:
- 强化学习
- 深度强化学习
- 人工神经网络
- 机器学习
- pySpark
- 智能代理
- 实际实施
- 实际应用
- 项目
- 实践学习
- 理论概念
- Python编程
- 人工智能
- Epsilon 贪婪策略
- 超参数
- 深度 Q 网络 (DQN)
- 车和杆
准备好掌握强化和深度强化学习了吗?立即报名,潜入激动人心的人工智能世界!
本课程适合谁:
- ● 对强化和深度强化学习一无所知的初学者。
- ● 想要开发智能解决方案的人。
- ● 喜欢先学习理论概念,然后再使用Python 实现它们的人。