Python 中的集成机器学习:随机森林、AdaBoost
集成方法:Python 数据科学的提升、装袋、Boostrap 和统计机器学习
讲师:Lazy Programmer Team
口袋资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
你会学到什么
- 理解并推导偏差-方差分解
- 了解bootstrap方法及其在bagging中的应用
- 理解为什么装袋可以提高分类和回归性能
- 理解和实施随机森林
- 理解和实施 AdaBoost
要求
- 微积分(导数)
- Numpy、Matplotlib、Sci-Kit 学习
- K 最近邻、决策树
- 概率与统计(本科生水平)
- 线性回归、逻辑回归
描述
近年来,我们看到了 AI或 人工智能和 机器学习的复兴。
机器学习带来了一些惊人的成果,比如能够与人类专家一样分析医学图像和预测疾病。
谷歌的 AlphaGo 程序能够使用深度强化学习在围棋策略游戏中击败世界冠军。
机器学习甚至被用于为自动驾驶汽车编程,这将永远改变汽车行业。想象一个车祸大大减少的世界,只需消除人为错误的因素。
谷歌著名地宣布他们现在“机器学习第一”,NVIDIA 和亚马逊等公司 也纷纷效仿,这将在未来几年推动创新。
机器学习被嵌入到各种不同的产品中,并被用于许多行业,如金融、在线广告、医药和机器人技术。
它是一个广泛适用的工具,无论您身处哪个行业,它都会使您受益,一旦您做得好,它还会开辟大量的职业机会。
机器学习也引发了一些哲学问题。我们是在建造一台会思考的机器吗?有意识是什么意思?计算机有一天会接管世界吗?
这门课程是关于集成方法的。
我们已经学习了一些经典的机器学习模型,例如k 最近邻 和决策树。我们研究了它们的局限性和缺点。
但是,如果我们可以结合这些模型来消除这些限制并产生更强大的分类器或回归器呢?
在本课程中,您将学习如何结合决策树和逻辑回归等模型来构建模型,这些模型可以达到比构成它们的基础模型更高的精度。
特别是,我们将详细研究随机森林和AdaBoost算法。
为了激发我们的讨论,我们将了解统计学习中的一个重要主题,即偏差-方差权衡。然后,我们将研究bootstrap技术和bagging作为同时减少偏差和方差的方法。
我们将进行大量实验,并在真实数据集上使用这些算法,以便您亲眼目睹它们的强大之处。
由于近来深度学习如此流行,我们将研究随机森林、AdaBoost 和深度学习神经网络之间一些有趣的共性。
本课程的所有材料都是免费的。您可以在Windows、Linux 或 Mac 上使用简单命令 下载并安装 Python、Numpy 和 Scipy。
本课程着重于“如何构建和理解”,而不仅仅是“如何使用”。阅读一些文档后,任何人都可以在 15 分钟内学会使用 API。这不是关于“记住事实”,而是关于 通过实验“亲眼所见”。它将教您如何可视化模型内部发生的情况。如果您想要的 不仅仅是粗略地了解机器学习模型,那么本课程适合您。
“如果你不能执行它,你就不会理解它”
- 或者正如伟大的物理学家理查德·费曼所说:“我无法创造的东西,我不明白”。
- 我的课程是您将学习如何从头开始实施机器学习算法的唯一课程
- 其他课程会教您如何将数据插入库,但您真的需要 3 行代码的帮助吗?
- 在对 10 个数据集做了同样的事情之后,你意识到你没有学到 10 个东西。你学到了 1 件事,并且只是将相同的 3 行代码重复了 10 次……
建议先决条件:
- 微积分(导数)
- 可能性
- 面向对象编程
- Python 编码:if/else、循环、列表、字典、集合
- Numpy 编码:矩阵和向量运算
- 简单的机器学习模型,如线性回归和决策树
我应该按什么顺序上你们的课程?:
- 查看讲座“机器学习和 AI 先决条件路线图”(可在我的任何课程的常见问题解答中找到,包括免费的 Numpy 课程)
独特的功能
- 每行代码都有详细解释 – 如果您不同意,请随时给我发电子邮件
- 不会像其他课程那样浪费时间在键盘上“打字”——老实说,没有人能在短短 20 分钟内从头开始真正编写出值得学习的代码
- 不惧怕大学水平的数学——了解其他课程遗漏的有关算法的重要细节
本课程适合谁:
- 了解赢得机器学习竞赛(Netflix 奖、Kaggle)的模型类型
- 学习机器学习的学生
- 希望将数据科学和机器学习应用到工作中的专业人士
- 希望应用数据科学和机器学习来优化业务的企业家
- 想要更多地了解数据科学和机器学习的计算机科学专业的学生
- 了解一些基本的机器学习模型但想知道当今最强大的模型(随机森林、AdaBoost 和其他集成方法)是如何构建的