Python 中的光学字符识别 (OCR)
OpenCV、Tesseract、EasyOCR 和 EAST 应用于图像和视频!使用深度学习从头开始创建您自己的 OCR!
讲师:Jones Granatyr
口袋资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
你将学到什么
- 使用 Tesseract、EAST 和 EasyOCR 工具进行图像和视频中的文本识别
- 了解受控环境和自然环境中 OCR 之间的差异
- 应用图像预处理技术来提高图像质量,例如:阈值处理、反演、调整大小、形态操作和降噪
- 使用EAST架构和EasyOCR库在自然场景中获得更好的性能
- 使用深度学习和卷积神经网络从头开始训练 OCR
- 自然语言处理技术在OCR(词云和命名实体识别)提取文本中的应用
- 车牌读取
要求
- 编程逻辑
- Python编程基础
描述
计算机视觉领域内有光学字符识别 (OCR) 的子领域,旨在将图像转换为文本。OCR 可以描述为将包含打字、手写或打印文本的图像转换为机器可以理解的字符。可以将扫描或拍照的文档转换为可以在任何工具(例如 Microsoft Word)中编辑的文本。一个常见的应用是自动表格读取,您可以在其中发送信用卡或驾驶执照的照片,系统可以读取您的所有数据,而无需手动输入。自动驾驶汽车可以使用OCR读取交通标志,停车场可以通过读取汽车牌照来保证通行!
为了带您进入这个领域,在本课程中您将在实践中学习如何使用 OCR 库来识别图像和视频中的文本,所有代码均使用 Python 编程语言逐步实现!我们将使用 Google Colab,因此您不必担心在计算机上安装库,因为一切都将使用 Google 的 GPU 在线开发!您还将学习如何使用深度学习和卷积神经网络从头开始构建自己的 OCR!您可以在下面查看课程的主要主题:
- 使用 Tesseract、EasyOCR 和 EAST 识别图像和视频中的文本
- 使用正则表达式搜索图像中的特定术语
- 提高图像质量的技术,例如:阈值处理、颜色反转、灰度、调整大小、噪声去除、形态操作和透视变换
- EAST架构和EasyOCR库可在自然场景中提供更好的性能
- 使用 TensorFlow 和现代深度学习技术(例如卷积神经网络)从头开始训练 OCR
- 自然语言处理技术在OCR(词云和命名实体识别)提取文本中的应用
- 车牌读取
这些只是一些主要主题!在课程结束时,您将了解使用 OCR 创建自己的文本识别项目所需的一切!
本课程适合谁:
- 任何对 OCR(光学字符识别)感兴趣的人
- 正在学习人工智能、数字图像处理或计算机视觉相关学科的本科生
- 想要增加计算机视觉知识的数据科学家
- 有兴趣开发专业光学字符识别解决方案的专业人士
- 有兴趣创建自己的自定义 OCR 的人
声明:口袋资源网(koudaizy.com)提供的所有课程、素材等资源全部来源于互联网,赞助VIP仅用于对口袋资源服务器带宽及网站运营等费用支出做支持,从本站下载资源,说明你已同意本条款。