程序员开发实例大全宝库

网站首页 > 编程文章 正文

tesseract-ocr使用与字库训练(tesseract ocr)

zazugpt 2024-08-22 04:39:03 编程文章 16 ℃ 0 评论

原创 春风 春风视觉 4月21日

1. tesseract介绍

tesseract-ocr是一款开源的字符识别软件。

注:在V4.1.1版本以上支持LSTM。

2. tesseract使用

命令行

tesseract --oem 1 3.png result --psm 7 -l eng

python使用

import cv2            #opencv包
import pytesseract    # 导入识别包
img = cv2.imread("3.png")
lang = "eng+chi_sim"     #设置语言
texts = pytesseract.image_to_string(image=img, lang=lang)
print("result is :", texts)

参数说明:

  • 使用前必须下载语言包
  • 多种语言混合在一起字库之间使用+连接
  • psm参数为选项参数,选择合适的参数可提高识别率
  • oem 为引擎模式,tesseract有四种模式可供选择
  • image_to_string为转为字符串,实际存在多种可供选择。如

测试图像:

测试结果:

3. 影响tesseract识别率的因素

影响识别率的主要因素是图像质量,使用中对图像进行必要的预处理,如灰度拉伸、阈值化、滤波等可以大大提高处理效果。

提高识别率除了使用上述方式外,tesseract还支持字库训练,通过训练自己的数据集生成自己的字库也可大大提高识别率。

上图中最右侧噪点图像无法识别,在使用中值滤波后可以准确识别。

4. tesseract使用时间

使用tesseract检测多个目标会存在时间过长的问题,可以尝试使用多线程方式。


本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表