tesseract-ocr使用与字库训练（tesseract ocr）

zazugpt 2024-08-22 04:39:03 编程文章 16 ℃ 0 评论

原创春风春风视觉 4月21日

1. tesseract介绍

tesseract-ocr是一款开源的字符识别软件。

注：在V4.1.1版本以上支持LSTM。

2. tesseract使用

命令行

tesseract --oem 1 3.png result --psm 7 -l eng

python使用

import cv2            #opencv包
import pytesseract    # 导入识别包
img = cv2.imread("3.png")
lang = "eng+chi_sim"     #设置语言
texts = pytesseract.image_to_string(image=img, lang=lang)
print("result is :", texts)

参数说明：

使用前必须下载语言包
多种语言混合在一起字库之间使用+连接
psm参数为选项参数，选择合适的参数可提高识别率
oem 为引擎模式，tesseract有四种模式可供选择
image_to_string为转为字符串，实际存在多种可供选择。如

测试图像：

测试结果：

3. 影响tesseract识别率的因素

影响识别率的主要因素是图像质量，使用中对图像进行必要的预处理，如灰度拉伸、阈值化、滤波等可以大大提高处理效果。

提高识别率除了使用上述方式外，tesseract还支持字库训练，通过训练自己的数据集生成自己的字库也可大大提高识别率。

上图中最右侧噪点图像无法识别，在使用中值滤波后可以准确识别。

4. tesseract使用时间

使用tesseract检测多个目标会存在时间过长的问题，可以尝试使用多线程方式。

网站首页 > 编程文章正文

tesseract-ocr使用与字库训练（tesseract ocr）

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

网站首页 > 编程文章 正文

tesseract-ocr使用与字库训练（tesseract ocr）

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎 你 发表评论:

网站首页 > 编程文章正文

取消回复欢迎你发表评论: