Windows安装用于OCR的Tesseract及使用命令行参数进行OCR

news/2024/9/20 12:34:22

Windows安装用于OCR的Tesseract及使用命令行参数进行OCR

    • 1. 效果图
    • 2. Tesseract 安装及验证
    • 参考

这篇博客将介绍如何安装和使用光学字符识别(OCR Optical Character Recognition)的Tesseract库,并使用命令行对图像中的字符进行识别;**除非图像被清晰地分割,否则 Tesseract 会产生很差的结果。**在“嘈杂”输入图像的情况下,需要通过训练自定义机器学习模型来识别特定用例中的字符来获得更高的准确性。

OCR(Optical Character Recognition)光学字符识别是将键入、手写或打印文本自动转换为机器编码文本的过程,然后可以通过字符串变量访问和操作这些文本。

Tesseract最初由Hewlett-Packard在20世纪80年代开发,在2005年开源。后来在2006年,谷歌采用了该项目,并从那时起一直是赞助商。

  • Tesseract软件适用于多种自然语言,从英语到现在支持100多种书面语言,并有代码,因此可以轻松地在其他语言上进行训练。
  • Tesseract 最适合构建文档处理管道,其中扫描图像、预处理,然后需要应用光学字符识别。
  • Tesseract 最适合具有高分辨率输入的情况,其中前景文本与背景清晰地分割开来。

1. 效果图

OCR 命令行识别效果图如下:

可以看到仅英文字符(红色划线和紫色圆圈标识区),仅数字(蓝色箭头标识区)都被成功识别;
在这里插入图片描述
Tesseract局限性例子,如信用卡上的数字识别效果如下:
并没有正确识别到;
在这里插入图片描述

2. Tesseract 安装及验证

1. 安装Tesseract

  • MacOS

brew install tesseract

  • ubuntu

sudo apt-get install tesseract-ocr

  • windows

官方安装文档见:https://github.com/UB-Mannheim/tesseract/wiki

tesseract-ocr-w32-setup-v5.0.0-alpha.20210811.exe (32 bit) 下载
tesseract-ocr-w64-setup-v5.0.0-alpha.20210811.exe (64 bit) 下载

2. 验证是否已安装Tesseract

tesseract -v
安装成功可以看到屏幕上的Tesseract版本,以及Tesseract与兼容的图像文件格式库列表。

在这里插入图片描述
3. 测试Tesseract OCR

使用Tesseract时,建议:

  • 使用尽可能高的分辨率和DPI作为输入图像。
  • 应用阈值从背景分割文本。
  • 确保前景与背景尽可能清晰地分割(即,没有像素化或角色变形)。
  • 对输入图像应用文本倾斜校正,以确保文本正确对齐。

不预处理可能会导致不正确的OCR结果。

参考

  • https://www.pyimagesearch.com/2017/07/03/installing-tesseract-for-ocr/
  • https://github.com/tesseract-ocr

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pgtn.cn/news/17771.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

卷积神经网络基础:(8)递归神经网络RNN

1、RNN网络由来 RNN:Recurrent Neural Network。递归神经网络只是在传统神经网络上进行一个改进而已。 正常流程是:输入---->隐层---->输出 (数据来了经过隐层最终得到输出就完事了) 当我们在使用递归神经网络的时候一些限制,现在我拿…

Matplotlib绘制象限图——支持中文、箭头、自定义轴线交点

Matplotlib绘制象限图——支持中文、箭头、自定义轴线交点 1. 效果图2. 原理2.1 绘制象限图步骤2.1 添加文字到图表3. 源码参考这篇博客将介绍如何使用matplotlib绘制象限图,写这篇博客源于博友的提问。 首先pyechart貌似不支持绘制象限图。pyecharts支持的象形柱图demo与想要…

Facebook 与 Google 正在主导在线身份验证市场

OpenID 公司 JanRain 的一项研究发现,用户在第三方网站进行身份验证时,最喜欢使用 Google 和 Facebook 的身份验证服务。Facebook 的验证服务 在媒体, 零售,技术等领域略微领先,而 JanRain 的17万份客户数据显示&#…

PyTorch框架:(1)基本处理操作

目录 1、PyTorch框架介绍 2、安装Pytorch 2.1、CPU版本的安装命令: 2.2、GPU版本的安装命令: 2.2.1、安装CUDA 3、基本使用方法 4、Pytorch中的自动求导机制 4.1、例子: ​ 4.2、做一个线性回归试试水 4.2.1、CPU训练版本 4.2.1、GPU…

使用KMeanCluster对多个区域进行聚类,并结合Matplotlib绘制中心点、最大最小距离点

使用KMeanCluster对多个区域进行聚类,并结合Matplotlib绘制中心点、最大最小距离点1. 效果图2. 源码2.1 原始数据——xq.txt2.2 源码参考这篇博客将演示如何使用KMeansCluster对多个区域进行聚类,并结合Matplotlib绘制中心点、最大最小区域的点。 写这篇…

PyTorch框架:(2)使用PyTorch框架构建神经网络模型---气温预测

目录 第一步:数据导入 第二步:将时间转换成标准格式(比如datatime格式) 第三步: 展示数据:(画了4个子图) 第四步:做独热编码 第五步:指定输入与输出 第六步:对数据做一…

使用Python,OpenCV进行Tesseract-OCR绑定及识别

使用Python,OpenCV进行Tesseract-OCR绑定及识别1. 效果图2. 安装TesseractPython“绑定”及识别3. 源码参考上一篇博客介绍了Windows上Tesseract-OCR的安装,并使用命令行参数进行了OCR数字和字母的识别。这一篇将介绍如何使用Python应用Tesseract-OCR绑定…

PyTorch框架:(3)使用PyTorch框架构构建神经网络分类任务

目录 0、背景 1、分类任务介绍: 2、网络架构 3、手写网络 3.1、读取数据集 3.2、查看数据集 3.3将x和y转换成tensor的格式 3.4、定义model 0、背景 其实分类和回归本质上没有太大区别,只是说最终得到的结果是不同的,以及使用的损失函数…