原创 春风 春风视觉 4月21日
1. tesseract介绍
tesseract-ocr是一款开源的字符识别软件。
注:在V4.1.1版本以上支持LSTM。
2. tesseract使用
命令行
tesseract --oem 1 3.png result --psm 7 -l eng
python使用
import cv2 #opencv包
import pytesseract # 导入识别包
img = cv2.imread("3.png")
lang = "eng+chi_sim" #设置语言
texts = pytesseract.image_to_string(image=img, lang=lang)
print("result is :", texts)
参数说明:
- 使用前必须下载语言包
- 多种语言混合在一起字库之间使用+连接
- psm参数为选项参数,选择合适的参数可提高识别率
- oem 为引擎模式,tesseract有四种模式可供选择
- image_to_string为转为字符串,实际存在多种可供选择。如
测试图像:
测试结果:
3. 影响tesseract识别率的因素
影响识别率的主要因素是图像质量,使用中对图像进行必要的预处理,如灰度拉伸、阈值化、滤波等可以大大提高处理效果。
提高识别率除了使用上述方式外,tesseract还支持字库训练,通过训练自己的数据集生成自己的字库也可大大提高识别率。
上图中最右侧噪点图像无法识别,在使用中值滤波后可以准确识别。
4. tesseract使用时间
使用tesseract检测多个目标会存在时间过长的问题,可以尝试使用多线程方式。
本文暂时没有评论,来添加一个吧(●'◡'●)