Master Airflow:从初学者到项目推进
Apache Airflow 综合指南:从初学者到专家学习工作流管理
讲师:Sourabh Sahu
口袋资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
你将学到什么
- 学习编排和工作流程管理
- 如何创建数据管道
- 云集成和数据迁移
- 具有真实用例的端到端数据管道
要求
- Python基础知识
描述
Apache Airflow是一个开源平台,用于复杂数据管道的工作流自动化、调度和编排。随着数据量和复杂性不断增长,对高效且可扩展的数据处理和管理的需求至关重要。在这个综合课程中,您将学习如何掌握 Apache Airflow,从基础知识开始,逐步发展到高级概念。
该课程专为数据工程师、数据科学家、Python 开发人员、软件工程师以及任何有兴趣学习如何自动化和管理数据工作流程的人而设计。
您将学习如何使用 Apache Airflow 构建和管理数据管道、计划和触发任务、监控工作流程和排除故障,以及与各种数据源和服务集成。
该课程将涵盖以下主题:
- Apache Airflow 和工作流管理简介
- Docker 和 Docker 命令简介
- Apache Airflow的安装和配置
- 使用 Apache Airflow 构建和管理工作流程
- 在 Apache Airflow 中调度和触发任务
- Apache Airflow 中的运算符
- 从 Web API 或 HTTP 获取数据
- Apache Airflow 中的文件传感器
- 与 Azure 或 AWS 连接
- 使用 AWS S3 存储桶和 Azure Blob 存储来存储和检索数据
- 创建自定义操作员和传感器
- 处理依赖关系和任务重试
- 监控和故障排除工作流程
- 与数据源和服务集成
- 使用 Celery Executors 扩展和优化 Apache Airflow 以进行大规模数据处理
- 使用 Fernet 密钥保护 Dags 连接
在整个课程中,您将进行实践练习和项目来应用您所学到的概念。在课程结束时,您将对 Apache Airflow 以及构建和管理复杂数据工作流的技能有深入的了解。
本课程适合谁:
- 数据工程师
- 对数据工程感兴趣的 Python 开发人员
- 数据科学家
- 开发运营工程师
- MLOps 工程师
- 软件开发商
声明:口袋资源网(koudaizy.com)提供的所有课程、素材等资源全部来源于互联网,赞助VIP仅用于对口袋资源服务器带宽及网站运营等费用支出做支持,从本站下载资源,说明你已同意本条款。