Apache Spark 3 – 适合初学者的 Python Spark 编程
使用 PySpark 进行数据工程
讲师:Prashant Kumar Pandey
口袋资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
你将学到什么
- Apache Spark 基础和 Spark 架构
- Spark 中的数据工程和数据处理
- 使用数据源和接收器
- 使用数据框和 Spark SQL
- 使用 PyCharm IDE 进行 Spark 开发和调试
- 单元测试、管理应用程序日志和集群部署
要求
- 使用Python编程语言的编程知识
- 具有 8 GB RAM 的最新 64 位 Windows/Mac/Linux 计算机
描述
本课程不需要任何 Apache Spark 或 Hadoop 的先验知识。我们非常仔细地解释了 Spark 架构和基本概念,以帮助您加快速度并掌握本课程的内容。
关于课程
我正在为初学者创建Apache Spark 3 – Spark Spark 编程 Python课程,以帮助您了解 Spark 编程并应用这些知识来构建数据工程解决方案。本课程以示例为主导,并遵循类似工作会议的方法。我们将采用实时编码方法并解释所有需要的概念。
谁应该学习本课程?
我为愿意使用 Apache Spark 开发数据工程管道和应用程序的软件工程师设计了本课程。我还为负责设计和构建组织以数据为中心的基础设施的数据架构师和数据工程师创建这门课程。另一类人是不直接参与 Spark 实施的经理和架构师。尽管如此,他们仍然与在底层实施 Apache Spark 的人员合作。
课程中使用的 Spark 版本
本课程使用 Apache Spark 3.x。我已在Apache Spark 3.0.0开源发行版上测试了本课程中使用的所有源代码和示例。
本课程适合谁:
- 愿意使用 Apache Spark 设计和开发大数据工程项目的软件工程师和架构师
- 渴望使用 Apache Spark 成长和学习数据工程的程序员和开发人员
声明:口袋资源网(koudaizy.com)提供的所有课程、素材等资源全部来源于互联网,赞助VIP仅用于对口袋资源服务器带宽及网站运营等费用支出做支持,从本站下载资源,说明你已同意本条款。