Python 中的光学字符识别 (OCR)

OpenCV、Tesseract、EasyOCR 和 EAST 应用于图像和视频!使用深度学习从头开始创建您自己的 OCR!

讲师:Jones Granatyr

口袋资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将学到什么

  • 使用 Tesseract、EAST 和 EasyOCR 工具进行图像和视频中的文本识别
  • 了解受控环境和自然环境中 OCR 之间的差异
  • 应用图像预处理技术来提高图像质量,例如:阈值处理、反演、调整大小、形态操作和降噪
  • 使用EAST架构和EasyOCR库在自然场景中获得更好的性能
  • 使用深度学习和卷积神经网络从头开始训练 OCR
  • 自然语言处理技术在OCR(词云和命名实体识别)提取文本中的应用
  • 车牌读取

要求

  • 编程逻辑
  • Python编程基础

描述

计算机视觉领域内有光学字符识别 (OCR) 的子领域,旨在将图像转换为文本。OCR 可以描述为将包含打字、手写或打印文本的图像转换为机器可以理解的字符。可以将扫描或拍照的文档转换为可以在任何工具(例如 Microsoft Word)中编辑的文本。一个常见的应用是自动表格读取,您可以在其中发送信用卡或驾驶执照的照片,系统可以读取您的所有数据,而无需手动输入。自动驾驶汽车可以使用OCR读取交通标志,停车场可以通过读取汽车牌照来保证通行!

为了带您进入这个领域,在本课程中您将在实践中学习如何使用 OCR 库来识别图像和视频中的文本,所有代码均使用 Python 编程语言逐步实现!我们将使用 Google Colab,因此您不必担心在计算机上安装库,因为一切都将使用 Google 的 GPU 在线开发!您还将学习如何使用深度学习和卷积神经网络从头开始构建自己的 OCR!您可以在下面查看课程的主要主题:

  • 使用 Tesseract、EasyOCR 和 EAST 识别图像和视频中的文本
  • 使用正则表达式搜索图像中的特定术语
  • 提高图像质量的技术,例如:阈值处理、颜色反转、灰度、调整大小、噪声去除、形态操作和透视变换
  • EAST架构和EasyOCR库可在自然场景中提供更好的性能
  • 使用 TensorFlow 和现代深度学习技术(例如卷积神经网络)从头开始训练 OCR
  • 自然语言处理技术在OCR(词云和命名实体识别)提取文本中的应用
  • 车牌读取

这些只是一些主要主题!在课程结束时,您将了解使用 OCR 创建自己的文本识别项目所需的一切!

本课程适合谁:

  • 任何对 OCR(光学字符识别)感兴趣的人
  • 正在学习人工智能、数字图像处理或计算机视觉相关学科的本科生
  • 想要增加计算机视觉知识的数据科学家
  • 有兴趣开发专业光学字符识别解决方案的专业人士
  • 有兴趣创建自己的自定义 OCR 的人

发表回复

后才能评论

  • 每一个课程页面,都有演示地址选项,点击链接可以跳转到课程发布网站查看详细课程列表。
  • 绝大部分课程都有试看内容,可以先点击试看,再决定是否购买。
  • 本站课程均存储在阿里云盘或百度网盘中,由于阿里云盘对分享的文件类型有限制,所以课程资料和字幕会存储到蓝奏云盘中。
  • 阿里云盘和蓝奏云盘都是不限速下载的,你既可以选择在阿里云盘中在线学习,也可以选择下载到本地学习。
  • 课程下载到本地可以挂载中英文双字幕,请点击查看Potplayer挂载中英文双字幕教程
  • 本站所有课程,均提供mp4格式视频文件,中英文双字幕,配套资料齐全,不加密。
  • 每一个课程右侧下载面板中,都会有清晰度标识,大部分都是1080P或者720P,还有少数是超高清的。
  • 本站课程购买之后,均可以免费更新,所有课程,皆配有中文字幕。
  • 请注意,课程的中文字幕是根据英文字幕用谷歌翻译生成的,本非人工翻译。谷歌翻译准确度尚可,学习观看,没有问题。
  • 由于数字资源具有可复制性,一旦购买,不接受退款要求,请在购买之前,认真了解课程内容,确定是否需要。
  • 当然,如果有特殊情况,可以查看网站底部联系方式,联系站长说明问题,我会为你妥善处理。
  • 赞助本站VIP会员,可以免费下载所有课程,详情请查看VIP介绍