有的图片是FLIP_LEFT_RIGHT后的图片导致无法正确的ocr,是否有自动识别出是否左右翻转的模型呢? #14962
Replies: 2 comments
-
这个暂时没有,不过你的需求很有趣,后续可以考虑支持 |
Beta Was this translation helpful? Give feedback.
-
目前,PaddleOCR 中默认已经支持对图片角度的自动分类(use_angle_cls=True 时会启用方向分类器),可以识别出旋转角度(如正向、180 度倒向等),但方向分类器cls模块并不能识别左右镜像(即 FLIP_LEFT_RIGHT)的情况。 左右镜像后,文字的方向仍是“水平”,不会改变角度,因此无法通过当前 PaddleOCR 的方向分类器自动检测并矫正。 关于你提出的“是否有自动识别是否左右翻转”的模型,目前 PaddleOCR 社区中没有提供专门用于识别“图片是否被左右镜像”的模块。但你可以考虑以下几种思路实现此功能:
综上,如果你需要稳定可靠的检测方式,推荐首选方案是构建一个轻量的镜像图分类器,事先将输入图判断是否为镜像,再决定是否进行镜像处理。 相关讨论在社区中暂未发现直接支持此功能的现成模块,欢迎在 GitHub Issues 中提交 feature request,便于后续版本加入支持。 如果你后续希望构建自定义分类器,可参考 PaddleClas 项目:https://github.com/PaddlePaddle/PaddleClas。这个项目适合做如“是否为镜像图”这类二分类任务。 如有更多个性化需求,也欢迎继续深入讨论。 Response generated by 🤖 feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
🔎 Search before asking
🐛 Bug (问题描述)
有的图片是FLIP_LEFT_RIGHT后的图片导致无法正确的ocr,是否有自动识别出是否左右翻转的模型呢?

比如下面这个图
识别结果是:
🏃♂️ Environment (运行环境)
操作系统 win10
paddleocr 2.8.1
python 3.10.6
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
import logging
import os
from paddleocr import PaddleOCR
logging.disable(logging.DEBUG)
ocr_model_path = "paddle_ocr"
ocr_model = PaddleOCR(
rec_model_dir=os.path.join(ocr_model_path, 'PP-OCRv4_mobile_rec_infer'),
cls_model_dir=os.path.join(ocr_model_path, 'ch_ppocr_mobile_v4.0_cls_infer'),
use_angle_cls=True,
use_gpu=True,
lang='ch',
det_db_box_thresh=0.6,
det_db_score_mode='slow'
)
print(ocr_model.ocr(r"D:\pythonproject\drugcheckv3algorithmpy\test\output_text20(1).jpg"))
Beta Was this translation helpful? Give feedback.
All reactions