Google Cloud 认证专业数据工程师

理论、实践和 252 个问题、答案和解释。所有实践均采用一键复制粘贴方式。 PDF下载

讲师:Deepak Dubey

口袋资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将学到什么

  • 设计数据处理系统
  • 构建和运行数据处理系统
  • 机器学习模型的可操作性
  • 确保解决方案质量
  • 设计数据管道
  • 设计数据处理解决方案
  • 迁移数据仓库和数据处理
  • 构建和运行存储系统
  • 建设和运营管道
  • 构建和运行处理基础设施
  • 利用预构建的 ML 模型作为服务
  • 部署 ML 管道
  • 机器学习模型的测量、监控和故障排除
  • 安全性和合规性设计
  • 确保可扩展性和效率
  • 确保可靠性和保真度
  • 确保灵活性和便携性

要求

  • 本课程将涵盖您通过 Google Cloud 认证专业数据工程师所需的一切

描述

设计数据处理系统

选择适当的存储技术。考虑因素包括:

● 将存储系统映射到业务需求

● 数据建模

● 涉及延迟、吞吐量、事务的权衡

● 分布式系统

● 架构设计

设计数据管道。考虑因素包括:

● 数据发布和可视化(例如BigQuery)

● 批处理和流数据(例如Dataflow、Dataproc、Apache Beam、Apache Spark 和Hadoop 生态系统、Pub/Sub、Apache Kafka)

● 在线(交互式)预测与批量预测

● 作业自动化和编排(例如,Cloud Composer)

设计数据处理解决方案。考虑因素包括:

● 基础设施的选择

● 系统可用性和容错能力

● 分布式系统的使用

● 容量规划

● 混合云和边缘计算

● 架构选项(例如,消息代理、消息队列、中间件、面向服务的架构、无服务器功能)

● 至少一次、有序、恰好一次等事件处理

迁移数据仓库和数据处理。考虑因素包括:

● 了解当前状态以及如何将设计迁移到未来状态

● 从本地迁移到云(数据传输服务、传输设备、云网络)

● 验证迁移

构建和运行数据处理系统

构建和运行存储系统。考虑因素包括:

● 有效使用托管服务(Cloud Bigtable、Cloud Spanner、Cloud SQL、BigQuery、Cloud Storage、Datastore、Memorystore)

● 存储成本和性能

● 数据的生命周期管理

建设和运营管道。考虑因素包括:

● 数据清洗

● 批量和流式传输

● 转型

● 数据采集与导入

● 与新数据源集成

建设和运行处理基础设施。考虑因素包括:

● 配置资源

● 监控管道

● 调整管道

● 测试和质量控制

机器学习模型的可操作性

利用预构建的 ML 模型作为服务。考虑因素包括:

● ML API(例如视觉API、语音API)

● 自定义ML API(例如AutoML Vision、Auto ML 文本)

● 对话体验(例如Dialogflow)

部署机器学习管道。考虑因素包括:

● 摄取适当的数据

● 机器学习模型的再训练(AI Platform Prediction and Training、BigQuery ML、Kubeflow、Spark ML)

● 持续评估

选择适当的培训和服务基础设施。考虑因素包括:

● 分布式与单机

● 边缘计算的使用

● 硬件加速器(例如GPU、TPU)

测量、监控机器学习模型并排除故障。考虑因素包括:

● 机器学习术语(例如特征、标签、模型、回归、分类、推荐、监督和无监督学习、评估指标)

● 机器学习模型依赖性的影响

● 常见的错误来源(例如,对数据的假设)

确保解决方案质量

为安全性和合规性而设计。考虑因素包括:

● 身份和访问管理(例如,Cloud IAM)

● 数据安全(加密、密钥管理)

● 确保隐私(例如,数据丢失防护 API)

● 法律合规性(例如,健康保险流通与责任法案 (HIPAA)、儿童在线隐私保护法案 (COPPA)、FedRAMP、通用数据保护条例 (GDPR))

确保可扩展性和效率。考虑因素包括:

● 构建和运行测试套件

● 管道监控(例如云监控)

● 评估、故障排除和改进数据表示和数据处理基础设施

● 调整资源大小和自动扩展资源

确保可靠性和保真度。考虑因素包括:

● 执行数据准备和质量控制(例如Dataprep)

● 验证和监控

● 规划、执行和压力测试数据恢复(容错、重新运行失败的作业、执行回顾性重新分析)

● 在 ACID、幂等、最终一致要求之间进行选择

确保灵活性和便携性。考虑因素包括:

● 映射当前和未来的业务需求

● 针对数据和应用程序可移植性进行设计(例如,多云、数据驻留要求)

● 数据暂存、编目和发现

本课程适合谁:

  • 初学者
  • 中间的
  • 先进的

发表回复

后才能评论

  • 每一个课程页面,都有演示地址选项,点击链接可以跳转到课程发布网站查看详细课程列表。
  • 绝大部分课程都有试看内容,可以先点击试看,再决定是否购买。
  • 本站课程均存储在阿里云盘或百度网盘中,由于阿里云盘对分享的文件类型有限制,所以课程资料和字幕会存储到蓝奏云盘中。
  • 阿里云盘和蓝奏云盘都是不限速下载的,你既可以选择在阿里云盘中在线学习,也可以选择下载到本地学习。
  • 课程下载到本地可以挂载中英文双字幕,请点击查看Potplayer挂载中英文双字幕教程
  • 本站所有课程,均提供mp4格式视频文件,中英文双字幕,配套资料齐全,不加密。
  • 每一个课程右侧下载面板中,都会有清晰度标识,大部分都是1080P或者720P,还有少数是超高清的。
  • 本站课程购买之后,均可以免费更新,所有课程,皆配有中文字幕。
  • 请注意,课程的中文字幕是根据英文字幕用谷歌翻译生成的,本非人工翻译。谷歌翻译准确度尚可,学习观看,没有问题。
  • 由于数字资源具有可复制性,一旦购买,不接受退款要求,请在购买之前,认真了解课程内容,确定是否需要。
  • 当然,如果有特殊情况,可以查看网站底部联系方式,联系站长说明问题,我会为你妥善处理。
  • 赞助本站VIP会员,可以免费下载所有课程,详情请查看VIP介绍