Python 中的数据科学:分类建模
学习 Python 进行数据科学与应用 监督机器学习,并通过有趣的实践项目构建分类模型
讲师:Maven Analytics
口袋资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
你将学到什么
- 掌握 Python 中监督机器学习和分类建模的基础
- 对模型特征和目标执行探索性数据分析
- 应用特征工程技术并将数据分为训练集、测试集和验证集
- 使用 scikit-learn 构建和解释 k 最近邻模型和逻辑回归模型
- 使用混淆矩阵等工具和准确度、精确度、召回率和 F1 等指标评估模型性能
- 学习对不平衡数据进行建模的技术,包括阈值调整、采样方法和调整类别权重
- 构建、调整和评估用于分类的决策树模型,包括随机森林和梯度增强机等高级集成模型
要求
- 我们强烈建议在此之前参加我们的数据准备、EDA 和回归课程
- Jupyter Notebooks(免费下载,我们将逐步完成安装)
- 建议熟悉基本的 Python 和 Pandas,但不是必需的
描述
这是一门基于项目的实践课程,旨在帮助您掌握 Python 分类建模的基础知识。
我们将首先回顾数据科学工作流程,讨论分类算法的主要目标和类型,并深入研究我们将在整个课程中使用的分类建模步骤。
您将学习执行探索性数据分析,利用缩放、虚拟变量和分箱等特征工程技术,并通过将数据拆分为训练、测试和验证数据集来准备建模数据。
从那里,我们将拟合 K 最近邻和逻辑回归模型,并使用混淆矩阵等工具和准确度、精确度和召回率等指标来构建解释其系数并评估其性能的直觉。我们还将介绍对不平衡数据进行建模的技术,包括阈值调整、过采样和 SMOTE 等采样方法,以及调整模型成本函数中的类权重。
在整个课程中,您将扮演Maven National Bank风险管理部门的数据科学家的角色。利用您在整个课程中学到的技能,您将使用 Python 探索他们的数据并构建分类模型,以根据客户的资料准确确定哪些客户具有高、中和低信用风险。
最后但并非最不重要的一点是,您将学习构建和评估用于分类的决策树模型。您将使用 Python 拟合、可视化和微调这些模型,然后将您的知识应用于更高级的集成模型,例如随机森林和梯度增强机。
课程大纲:
- 数据科学简介
- 介绍数据科学和机器学习领域,回顾基本技能,并介绍数据科学工作流程的每个阶段
- 分类101
- 回顾分类的基础知识,包括关键术语、分类建模的类型和目标以及建模工作流程
- 建模前数据准备和 EDA
- 回顾执行建模所需的数据准备和 EDA 步骤,包括探索目标、特征及其关系的关键技术
- K-最近邻
- 了解 k 最近邻 (KNN) 算法如何对数据点进行分类并练习在 Python 中构建 KNN 模型
- 逻辑回归
- 介绍逻辑回归,学习模型背后的数学,并练习拟合它们并调整正则化强度
- 分类指标
- 了解如何以及何时使用几个重要指标来评估分类模型,例如精度、召回率、F1 分数和 ROC-AUC
- 数据不平衡
- 了解对不平衡数据进行建模的挑战并学习在这些场景中提高模型性能的策略
- 决策树
- 构建和评估决策树模型和算法,用于寻找数据中最能区分类别的分割
- 整体模型
- 熟悉集成模型的基础知识,然后深入研究随机森林和梯度增强机等特定模型
__________
准备好潜入了吗?立即加入并立即终身访问 以下内容:
- 9.5小时的高质量视频
- 18 份家庭作业
- 9 个测验
- 2个项目
- Python 中的数据科学:分类电子书(250 多页)
- 可下载的项目文件和解决方案
- 专家支持和问答论坛
- 30 天 Udemy 满意保证
如果您是一位有抱负的数据科学家,希望了解 Python 分类建模的世界,那么这门课程就是适合您的。
快乐学习!
-Chris Bruehl (数据科学专家兼首席 Python 讲师,Maven Analytics)
本课程适合谁:
- 想要学习如何在 Python 中构建和应用监督学习模型的数据科学家
- 希望了解分类建模或过渡到数据科学角色的分析师或 BI 专家
- 任何有兴趣学习世界上最流行的开源编程语言之一的人