数据科学:用于自然语言处理的变形器

BERT、GPT、深度学习、机器学习和 NLP 与拥抱脸、Python 中的注意力、Tensorflow、PyTorch 和 Keras

讲师:Lazy Programmer Team

口袋资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将会学到的

  • 只需几行代码即可将转换器应用于实际任务
  • 通过迁移学习在你自己的数据集上微调转换器
  • 情感分析、垃圾邮件检测、文本分类
  • NER(命名实体识别),词性标注
  • 为 SEO 构建你自己的文章微调器
  • 生成可信的类人文本
  • 神经机器翻译和文本摘要
  • 问答(例如 SQuAD)
  • 零样本分类
  • 了解变压器背后的自我关注和深入理论
  • 从头开始实施变压器
  • 将转换器与 TensorFlow 和 PyTorch 一起使用
  • 了解 BERT、GPT、GPT-2 和 GPT-3 以及应用它们的位置
  • 了解编码器、解码器和 seq2seq 架构
  • 掌握拥抱脸 Python 库

要求

  • 安装 Python,它是免费的!
  • 初级和中级内容:良好的 Python 编程技能
  • 专家级内容:对 CNN 和 RNN 有很好的理解,以及在 PyTorch 或 Tensorflow 中编码的能力

说明

大家好!

欢迎来到数据科学:自然语言处理的变形金刚。

自从变形金刚出现以来,深度学习就不一样了。

  • 机器学习能够生成与人类创建的文本基本无法区分的文本
  • 我们在许多 NLP 任务(例如机器翻译、问答、蕴涵、命名实体识别等)中达到了新的最先进性能
  • 我们创建了多模式(文本和图像)模型,仅使用文本提示即可生成令人惊叹的艺术
  • 我们已经解决了分子生物学中一个长期存在的问题,即“蛋白质结构预测”

在本课程中,你将学习应用变形金刚的非常实用的技能,如果你愿意,还将学习变形金刚和注意力如何工作的详细理论。

这与大多数其他资源不同,后者仅涵盖前者。

课程分为3个主要部分:

  1. 使用变形金刚
  2. 微调变压器
  3. 变形金刚深入

第 1 部分:使用变压器

在本节中,你将学习如何使用为你训练的转换器。这需要花费数百万美元才能完成,所以这不是你想自己尝试的事情!

我们将看到这些预建模型如何用于广泛的任务,包括:

  • 文本分类(例如垃圾邮件检测、情绪分析、文档分类)
  • 命名实体识别
  • 文本摘要
  • 机器翻译
  • 问答
  • 生成(可信的)文本
  • 蒙面语言建模(文章旋转)
  • 零样本分类

这已经很实用了。

如果你需要在工作场所或为你的客户对文档进行情感分析、文档分类、实体识别、翻译、摘要等 – 你已经拥有触手可及的最强大的最先进模型代码行。

最令人惊奇的应用之一是“零样本分类”,你将观察到预训练模型可以对你的文档进行分类,即使根本没有任何训练。

第 2 部分:微调变压器

在本节中,你将学习如何在你自己的自定义数据集上提高转换器的性能。通过使用“迁移学习”,你可以利用已经投入的数百万美元的培训,使 Transformer 能够很好地工作。

你会发现你可以用相对较少的工作(和很少的成本)微调变压器。

我们将介绍如何针对现实世界中最实际的任务微调转换器,例如文本分类(情感分析、垃圾邮件检测)、实体识别和机器翻译。

第 3 部分:深入了解变形金刚

在本节中,你将了解变压器的实际工作原理。前面的部分很好,但有点太漂亮了。对于只想完成工作的人来说,图书馆是可以的,但如果你想做任何新的或有趣的事情,它们就不起作用。

让我们明确一点:这是非常实用的。

你可能会问,这有多实用?

好吧,这就是大钱的地方。

那些对这些模式有深刻理解,并且能够做到以前没有人做过的事情的人,能够获得更高的薪水和有声望的头衔。机器学习是一个竞争激烈的领域,深入了解事物的运作方式可能是你脱颖而出所需的优势。

我们还将研究如何从头开始实现转换器。

正如伟大的理查德·费曼曾经说过的那样,“我不能创造的东西,我不明白”。

建议的先决条件:

  • 体面的 Python 编码技能
  • 使用 CNN 和 RNN 进行深度学习有用但不是必需的
  • 使用 Seq2Seq 模型进行深度学习有用但不是必需的
  • 对于深入部分:了解 CNNs、RNNs 和 seq2seq 背后的理论非常有用

期待更新:

  • 更多微调应用
  • 更深入的概念讲座
  • 从头开始实施的变形金刚

感谢你的阅读,希望很快能见到你!

此课程面向哪些人:

  • 任何想要掌握自然语言处理 (NLP) 的人
  • 任何热爱深度学习并想了解最强大的神经网络(变压器)的人
  • 任何想要超越 Udemy 上典型的仅限初学者的课程的人

发表回复

后才能评论

  • 每一个课程页面,都有演示地址选项,点击链接可以跳转到课程发布网站查看详细课程列表。
  • 绝大部分课程都有试看内容,可以先点击试看,再决定是否购买。
  • 本站课程均存储在阿里云盘或百度网盘中,由于阿里云盘对分享的文件类型有限制,所以课程资料和字幕会存储到蓝奏云盘中。
  • 阿里云盘和蓝奏云盘都是不限速下载的,你既可以选择在阿里云盘中在线学习,也可以选择下载到本地学习。
  • 课程下载到本地可以挂载中英文双字幕,请点击查看Potplayer挂载中英文双字幕教程
  • 本站所有课程,均提供mp4格式视频文件,中英文双字幕,配套资料齐全,不加密。
  • 每一个课程右侧下载面板中,都会有清晰度标识,大部分都是1080P或者720P,还有少数是超高清的。
  • 本站课程购买之后,均可以免费更新,所有课程,皆配有中文字幕。
  • 请注意,课程的中文字幕是根据英文字幕用谷歌翻译生成的,本非人工翻译。谷歌翻译准确度尚可,学习观看,没有问题。
  • 由于数字资源具有可复制性,一旦购买,不接受退款要求,请在购买之前,认真了解课程内容,确定是否需要。
  • 当然,如果有特殊情况,可以查看网站底部联系方式,联系站长说明问题,我会为你妥善处理。
  • 赞助本站VIP会员,可以免费下载所有课程,详情请查看VIP介绍