阿帕奇光束| 构建大数据管道的实践课程

使用任何语言的 Apache Beam 构建大数据管道,并通过 Spark、Flink、GCP(Google Cloud Dataflow)运行它。

讲师:J Garg – Real Time Learning

口袋资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将学到什么

  • 学习 Apache Beam – 一种便携式编程模型,其管道可以部署在 Spark、Flink、GCP(Google Cloud Dataflow)等上。
  • 通过动手示例了解 Apache Beam 每个组件的工作原理。
  • 了解 Apache Beam 基础知识,包括其架构、编程模型、Pcollections、管道等。
  • 多个 PTransforms 用于读取、转换和写入处理后的数据。
  • 窗口、触发器、水印、后期元素、类型提示等高级概念。
  • 从 Apache Beam 管道将数据加载到 Google BigQuery Tables。
  • 使用 Apache Beam 构建实时业务的大数据处理管道。
  • 讲座中使用的数据集和 Beam 代码可在资源选项卡中找到。

要求

  • 分布式数据处理架构的基础知识。
  • Python 基础知识。

描述

Apache Beam 是适用于批处理和流数据用例的统一且可移植的编程模型。

早些时候,我们只能在各自的集群上运行 Spark、Flink 和 Cloud Dataflow 作业。但现在 Apache Beam 提出了一种可移植的编程模型,我们可以在其中构建与语言无关的大数据管道并使用任何大数据引擎(Apache Spark、Flink 或在 Google Cloud Platform 中使用其 Cloud Dataflow 和更多大数据引擎)运行它。

Apache Beam 是构建大数据处理管道的未来,并且由于其可移植性而将被大众公司接受。许多大公司甚至开始在其生产服务器中部署 Beam 管道。

课程包括什么?

  • 从零开始到实时实施的完整 Apache Beam 概念的解释。
  • 每个 Apache Beam 概念都通过适当的 实践示例进行了解释。
  • 甚至包括那些概念,网上任何地方的解释都不是很清楚。
  • 类型提示、编码和解码、水印、窗口、触发器等等。
  • 使用 Apache Beam 编程模型构建 2 个实时大数据案例研究。
  • 通过 Dataflow 将处理后的数据从 Apache Beam 管道加载到 Google Cloud BigQuery Tables。
  • 为了方便起见,课程中附有讲座中使用的代码和数据集。

本课程适合谁:

  • 想要从头开始学习 Apache Beam 到其实时项目实施的学生。
  • 想要构建统一和便携式大数据处理管道的数据工程师。
  • 想要学习大数据处理的未来编程模型的开发人员。

发表回复

后才能评论

  • 每一个课程页面,都有演示地址选项,点击链接可以跳转到课程发布网站查看详细课程列表。
  • 绝大部分课程都有试看内容,可以先点击试看,再决定是否购买。
  • 本站课程均存储在阿里云盘或百度网盘中,由于阿里云盘对分享的文件类型有限制,所以课程资料和字幕会存储到蓝奏云盘中。
  • 阿里云盘和蓝奏云盘都是不限速下载的,你既可以选择在阿里云盘中在线学习,也可以选择下载到本地学习。
  • 课程下载到本地可以挂载中英文双字幕,请点击查看Potplayer挂载中英文双字幕教程
  • 本站所有课程,均提供mp4格式视频文件,中英文双字幕,配套资料齐全,不加密。
  • 每一个课程右侧下载面板中,都会有清晰度标识,大部分都是1080P或者720P,还有少数是超高清的。
  • 本站课程购买之后,均可以免费更新,所有课程,皆配有中文字幕。
  • 请注意,课程的中文字幕是根据英文字幕用谷歌翻译生成的,本非人工翻译。谷歌翻译准确度尚可,学习观看,没有问题。
  • 由于数字资源具有可复制性,一旦购买,不接受退款要求,请在购买之前,认真了解课程内容,确定是否需要。
  • 当然,如果有特殊情况,可以查看网站底部联系方式,联系站长说明问题,我会为你妥善处理。
  • 赞助本站VIP会员,可以免费下载所有课程,详情请查看VIP介绍