识别图片时,"傈僳"二字无法识别出来,在https://aistudio.baidu.com/community/app/91660/webUI 也无法识别出 #14601

PikachuGits · 2025-01-27T08:33:07Z

PikachuGits
Jan 27, 2025

🔎 Search before asking

I have searched the PaddleOCR Docs and found no similar bug report.
I have searched the PaddleOCR Issues and found no similar bug report.
I have searched the PaddleOCR Discussions and found no similar bug report.

🐛 Bug (问题描述)

识别图片时,"傈僳"二字无法识别出来,在https://aistudio.baidu.com/community/app/91660/webUI 也无法识别出
这是随意截取的含有傈僳的图片

这是识别结果

, 因为才开始接触PaddleOCR , 不清楚应该怎么处理这类的问题, 希望能提供一下解决方案

🏃‍♂️ Environment (运行环境)

mac 环境, python 3.9

🌰 Minimal Reproducible Example (最小可复现问题的Demo)

from PIL import Image, ImageEnhance, ImageFilter
from paddleocr import PaddleOCR
import cv2
import numpy as np
import json
import os

初始化 OCR 引擎

ocr = PaddleOCR(use_angle_cls=True)

img_path = "Snipaste_2025-01-27_16-12-27.png"
try:
# 打开图像
image = Image.open(img_path).convert("RGB")
# 增强对比度
enhancer = ImageEnhance.Contrast(image)
image = enhancer.enhance(1.5) # 可以根据实际情况调整增强系数
# 锐化图像
image = image.filter(ImageFilter.SHARPEN)
# 将 PIL 图像转换为 OpenCV 格式
image_cv = np.array(image)
# 转换为灰度图
gray_image = cv2.cvtColor(image_cv, cv2.COLOR_BGR2GRAY)
# 降噪处理，使用中值滤波
denoised_image = cv2.medianBlur(gray_image, 3)
# 高斯模糊处理
blurred_image = cv2.GaussianBlur(denoised_image, (5, 5), 0)
# 二值化处理
_, binary_image = cv2.threshold(gray_image, 150, 255, cv2.THRESH_BINARY)
# 进行 OCR 识别
results = ocr.ocr(binary_image, cls=True)
# 提取文本行
text_lines = [line[1][0] for line in results[0] if line[1][0].strip()]
print(json.dumps(text_lines, ensure_ascii=False))
if results:
for line in results[0]:
text = line[1][0]
confidence = line[1][1]
print(f"识别文本: {text}, 置信度: {confidence:.2f}")
else:
print("未识别到任何文本信息。")

except FileNotFoundError:
print(f"未找到图像文件: {img_path}")
except Exception as e:
print(f"发生错误: {e}")

GreatV · 2025-01-27T11:59:16Z

GreatV
Jan 27, 2025
Maintainer

根据描述的问题，“傈僳”二字无法被 PaddleOCR 识别，可能的原因包括模型的训练数据不足、字典文件缺失或者图片预处理不够优化。以下是解决此问题的详细步骤：

1. 确认 PaddleOCR 模型和字典的支持范围

PaddleOCR 使用的识别模型依赖于字典文件（ppocr_keys_v1.txt 或 ppocr_keys_v2.txt）来识别字符。如果字典中不包含“傈僳”二字，模型将无法识别这些字符。

检查字典文件内容：

下载 PaddleOCR 的字典文件：
- ppocr_keys_v1.txt
- ppocr_keys_v2.txt
打开字典文件，搜索“傈”和“僳”，确认这两个字是否包含在字典中。如果缺失，需要自定义字典（见第 4 步）。

2. 优化图片的预处理

OCR 识别的准确性可能受图片质量的影响。以下是一些图片处理的优化建议：

调整对比度：使用 ImageEnhance.Contrast，增强对比度，提升字符清晰度。
降噪：使用中值滤波（cv2.medianBlur）去除噪点。
二值化：通过 cv2.threshold 手动调整二值化阈值（如将 150 改为 127 或其他值）。
去除模糊：尝试调整锐化参数或避免过度模糊处理。

你的代码中已包含大部分预处理步骤，但可以逐步调整每一步的参数以获得最佳效果。

3. 升级或切换语言模型

PaddleOCR 提供了多种语言支持，中文模型是默认支持的，但可能需要使用最新版本的模型以确保包含更多字符。

下载最新的中文模型：

确保安装的是最新版本的 PaddleOCR 并使用最新的中文模型（ch_ppocr_server_v2.0 或更高版本）。可以通过以下代码加载最新模型：

from paddleocr import PaddleOCR

# 使用最新中文模型
ocr = PaddleOCR(lang='ch', use_gpu=False, det=True, rec=True)

4. 自定义字典和模型

如果字典中确实缺少“傈僳”，则需要自定义字典和重新训练模型：

创建自定义字典：
- 在字典文件末尾添加“傈”和“僳”。
- 保存为 my_custom_keys.txt。

修改加载代码：
在加载 OCR 时指定自定义字典文件：

ocr = PaddleOCR(rec_char_dict_path="./my_custom_keys.txt", lang='ch', use_gpu=False)

重新训练识别模型：
如果仅添加字典无法解决问题，可以使用 PaddleOCR 提供的自定义训练流程重新训练模型。需要准备包含“傈僳”二字的训练数据集。

5. 验证和测试

在完成上述步骤后，重新运行代码并验证是否能够识别“傈僳”。如果仍有问题，可以通过以下方式进一步调试：

检查识别置信度（confidence）值，分析是否是由于字符形态或者字形相似造成误判。
如果置信度低但能够识别部分字符，可以尝试优化模型或增加训练数据。

6. 其他可能问题

依赖问题：

根据附带的环境描述，可能需要确保 PaddleOCR 及其依赖库正确安装：

pip install paddleocr paddlepaddle

如果使用 GPU，还需安装 GPU 版本的 PaddlePaddle：

pip install paddlepaddle-gpu

字符完整性问题：

如果图片中字符部分被遮挡或模糊，可能会导致无法识别。可以尝试使用更清晰的图片验证问题。

总结

优先检查字典文件，确保包含“傈僳”二字。
优化图片预处理步骤，提升图片质量。
升级 PaddleOCR 模型，或根据需要自定义字典和训练模型。

如果以上方法仍无法解决问题，可以在 PaddleOCR 的 GitHub 讨论区提交问题，详细描述遇到的情况，并附上图片和代码，社区成员可能会提供更多帮助。

Response generated by feifei-bot | chatgpt-4o-latest

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

识别图片时,"傈僳"二字无法识别出来,在https://aistudio.baidu.com/community/app/91660/webUI 也无法识别出 #14601

Uh oh!

{{title}}

Uh oh!

Replies: 1 comment

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

识别图片时,"傈僳"二字无法识别出来,在https://aistudio.baidu.com/community/app/91660/webUI 也无法识别出 #14601

Uh oh!

PikachuGits Jan 27, 2025

🔎 Search before asking

🐛 Bug (问题描述)

🏃‍♂️ Environment (运行环境)

🌰 Minimal Reproducible Example (最小可复现问题的Demo)

初始化 OCR 引擎

Replies: 1 comment

Uh oh!

GreatV Jan 27, 2025 Maintainer

1. 确认 PaddleOCR 模型和字典的支持范围

检查字典文件内容：

2. 优化图片的预处理

3. 升级或切换语言模型

下载最新的中文模型：

4. 自定义字典和模型

5. 验证和测试

6. 其他可能问题

依赖问题：

字符完整性问题：

总结

PikachuGits
Jan 27, 2025

GreatV
Jan 27, 2025
Maintainer