计算机视觉中的变形金刚 – 英文版

计算机视觉中的变形金刚 – 英文版

讲师:Coursat.ai Dr. Ahmad ElSallab

口袋资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你会学到什么

  • 什么是变压器网络?
  • 图像分类、语义分割、对象检测和视频处理等 CV 应用程序的最先进架构
  • ViT、DETR、SWIN 等 SoTA 架构在 Huggingface 视觉转换器中的实际应用
  • 注意力机制作为一般的深度学习思想
  • 归纳偏差和 DL 模型在建模假设方面的前景
  • Transformers 在 NLP 和机器翻译中的应用
  • 计算机视觉中的变形金刚
  • 计算机视觉中不同类型的注意力

要求

  • 实用机器学习课程
  • 实用计算机视觉课程(ConvNets)
  • NLP课程简介

描述

Transformer Networks 是当今深度学习的新趋势。自 2017 年以来,Transformer 模型席卷了 NLP 的世界。从那时起,它们成为几乎所有 NLP 任务中的主流模型。CV 中的变形金刚仍然落后,但自 2020 年以来它们开始接管。

我们将从介绍注意力和变压器网络开始。由于转换器首先在 NLP 中引入,因此首先使用一些 NLP 示例更容易描述它们。从那里,我们将了解这种架构的优缺点。此外,我们将讨论无监督或半监督预训练对 transformer 架构的重要性,简要讨论大规模语言模型 (LLM),如 BERT 和 GPT。

这将为在 CV 中引入变压器铺平道路。在这里,我们将尝试将注意力的想法扩展到图像的二维空间域中。我们将讨论如何在编码器-解码器元架构中使用自注意力来泛化卷积。我们将看到这种通用架构在图像中如何与在文本和 NLP 中几乎相同,这使得 transformers 成为通用函数逼近器。我们将讨论通道和空间注意力、局部注意力与全局注意力等主题。

在接下来的三个模块中,我们将讨论解决 CV 中大问题的具体网络:分类、对象检测和分割。我们将讨论来自 Google 的 Vision Transformer (ViT)、来自 Microsoft 的 Shifter Window Transformer (SWIN)、来自 Facebook research 的 Detection Transformer (DETR)、Segmentation Transformer (SETR) 等等。然后我们将讨论 Transformers 在视频处理中的应用,通过时空 Transformers 应用于移动物体检测,以及多任务学习设置。

最后,我们将展示如何使用流水线接口使用著名的 Huggingface 库在实践中轻松应用这些预训练架构。

本课程适合谁:

  • 中级到高级 CV 工程师
  • 中级到高级 CV 研究人员

发表回复

后才能评论

  • 每一个课程页面,都有演示地址选项,点击链接可以跳转到课程发布网站查看详细课程列表。
  • 绝大部分课程都有试看内容,可以先点击试看,再决定是否购买。
  • 本站课程均存储在阿里云盘或百度网盘中,由于阿里云盘对分享的文件类型有限制,所以课程资料和字幕会存储到蓝奏云盘中。
  • 阿里云盘和蓝奏云盘都是不限速下载的,你既可以选择在阿里云盘中在线学习,也可以选择下载到本地学习。
  • 课程下载到本地可以挂载中英文双字幕,请点击查看Potplayer挂载中英文双字幕教程
  • 本站所有课程,均提供mp4格式视频文件,中英文双字幕,配套资料齐全,不加密。
  • 每一个课程右侧下载面板中,都会有清晰度标识,大部分都是1080P或者720P,还有少数是超高清的。
  • 本站课程购买之后,均可以免费更新,所有课程,皆配有中文字幕。
  • 请注意,课程的中文字幕是根据英文字幕用谷歌翻译生成的,本非人工翻译。谷歌翻译准确度尚可,学习观看,没有问题。
  • 由于数字资源具有可复制性,一旦购买,不接受退款要求,请在购买之前,认真了解课程内容,确定是否需要。
  • 当然,如果有特殊情况,可以查看网站底部联系方式,联系站长说明问题,我会为你妥善处理。
  • 赞助本站VIP会员,可以免费下载所有课程,详情请查看VIP介绍