独家Udemy付费课程,中英文字幕,课程资料包齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

面向 Java 开发人员的 Apache Spark

使用 RDD、DataFrame、SparkSQL 和机器学习处理大数据 – 并使用 Kafka 进行实时流式传输!

你将会学到的

  • 使用函数式 Java 定义复杂的数据处理作业
  • 了解 RDD 和 DataFrame API 之间的区别
  • 使用 SQL 样式语法生成针对大数据集的报告
  • 将机器学习算法与大数据和 SparkML 结合使用
  • 将 Spark 连接到 Apache Kafka 以处理大数据流
  • 了解如何使用结构化流式处理与 Kafka 构建管道

要求

  • 本课程需要 Java 8。Spark 当前不支持 Java9+,你需要 Java 8 来实现函数式 Lambda 语法
  • 假定以前有 Java 知识,但解释了基础知识之上的任何内容
  • 以前的一些 SQL 将对课程的一部分有用,但如果你之前从未使用过它,这将是一个很好的初次体验

说明

开始使用令人惊叹的 Apache Spark 并行计算框架 – 本课程专为 Java 开发人员设计。

如果你是数据科学的新手,并且想了解如何并行处理海量数据集,那么 Spark 的 Java API 是一种快速入门的好方法。

你需要了解在Spark CoreSparkSQL 和DataFrames中执行的主要操作所需的所有基础知识,并附有易于理解的示例。你将能够跟随所有示例,并在你自己的本地开发计算机上运行它们。

课程中包含一个涵盖SparkML的模块,这是 Spark 的一个令人兴奋的补充,它允许你将机器学习模型应用于你的大数据!不需要数学经验!

最后,还有一个完整的 3 小时模块,涵盖Spark Streaming,你将在其中获得将 Spark 与Apache Kafka集成以处理实时大数据流的实践经验。我们同时使用DStream结构化流API。

或者,如果你有 AWS 账户,你将了解如何将你的工作部署到实时 EMR(Elastic Map Reduce)硬件集群。如果你不熟悉 AWS,你可以跳过此视频,但它仍然值得观看,而不是跟随编码。

你将深入了解 Spark 的内部结构,并了解它如何优化你的执行计划。我们将比较RDD 与 SparkSQL 的性能,你将了解可以为实时项目节省大量资金的主要性能缺陷。

在整个课程中,你将获得 Java Lambda 的一些很好的实践——如果你是新手,这是学习函数式 Java 的好方法。

此课程面向哪些人:

  • 任何已经了解 Java 并想探索 Apache Spark 的人
  • 任何想要快速入门的数据科学新手,无需学习 Python、Scala 或 R

发表回复

后才能评论

  • 每一个课程页面,都有演示地址选项,点击链接可以跳转到课程发布网站查看详细课程列表。
  • 绝大部分课程都有试看内容,可以先点击试看,再决定是否购买。
  • 本站课程均存储在阿里云盘或百度网盘中,由于阿里云盘对分享的文件类型有限制,所以课程资料和字幕会存储到蓝奏云盘中。
  • 阿里云盘和蓝奏云盘都是不限速下载的,你既可以选择在阿里云盘中在线学习,也可以选择下载到本地学习。
  • 课程下载到本地可以挂载中英文双字幕,请点击查看Potplayer挂载中英文双字幕教程
  • 本站所有课程,均提供mp4格式视频文件,中英文双字幕,配套资料齐全,不加密。
  • 每一个课程右侧下载面板中,都会有清晰度标识,大部分都是1080P或者720P,还有少数是超高清的。
  • 本站课程购买之后,均可以免费更新,所有课程,皆配有中文字幕。
  • 请注意,课程的中文字幕是根据英文字幕用谷歌翻译生成的,本非人工翻译。谷歌翻译准确度尚可,学习观看,没有问题。
  • 由于数字资源具有可复制性,一旦购买,不接受退款要求,请在购买之前,认真了解课程内容,确定是否需要。
  • 当然,如果有特殊情况,可以查看网站底部联系方式,联系站长说明问题,我会为你妥善处理。
  • 赞助本站VIP会员,可以免费下载所有课程,详情请查看VIP介绍