“觞”字识别不出来 #15063

paddleocr --lang ch_doc --image_dir 435873680-608ba20c-3eb5-48fa-b996-7b7e108494ab.jpg
[2025/04/23 04:45:51] ppocr INFO: for usage help, please use `paddleocr --help`
[2025/04/23 04:45:51] ppocr DEBUG: Namespace(help='==SUPPRESS==', use_gpu=True, use_xpu=False, use_npu=False, use_mlu=False, use_gcu=False, ir_optim=True, use_tensorrt=False, min_subgraph_size=15, precision='fp32', gpu_mem=500, gpu_id=0, image_dir='435873680-608ba20c-3eb5-48fa-b996-7b7e108494ab.jpg', page_num=0, det_algorithm='DB', det_model_dir='/home/greatx/.paddleocr/whl/det/ch/ch_PP-OCRv4_det_infer', det_limit_side_len=960, det_limit_type='max', det_box_type='quad', det_db_thresh=0.3, det_db_box_thresh=0.6, det_db_unclip_ratio=1.5, max_batch_size=10, use_dilation=False, det_db_score_mode='fast', det_east_score_thresh=0.8, det_east_cover_thresh=0.1, det_east_nms_thresh=0.2, det_sast_score_thresh=0.5, det_sast_nms_thresh=0.2, det_pse_thresh=0, det_pse_box_thresh=0.85, det_pse_min_area=16, det_pse_scale=1, scales=[8, 16, 32], alpha=1.0, beta=1.0, fourier_degree=5, rec_algorithm='SVTR_LCNet', rec_model_dir='/home/greatx/.paddleocr/whl/rec/ch_doc/PP-OCRv4_server_rec_doc_infer', rec_image_inverse=True, rec_image_shape='3, 48, 320', rec_batch_num=6, max_text_length=25, rec_char_dict_path='/home/greatx/repos/PaddleOCR/ppocr/utils/dict/ppocrv4_doc_dict.txt', use_space_char=True, vis_font_path='./doc/fonts/simfang.ttf', drop_score=0.5, e2e_algorithm='PGNet', e2e_model_dir=None, e2e_limit_side_len=768, e2e_limit_type='max', e2e_pgnet_score_thresh=0.5, e2e_char_dict_path='./ppocr/utils/ic15_dict.txt', e2e_pgnet_valid_set='totaltext', e2e_pgnet_mode='fast', use_angle_cls=False, cls_model_dir='/home/greatx/.paddleocr/whl/cls/ch_ppocr_mobile_v2.0_cls_infer', cls_image_shape='3, 48, 192', label_list=['0', '180'], cls_batch_num=6, cls_thresh=0.9, enable_mkldnn=False, cpu_threads=10, use_pdserving=False, warmup=False, sr_model_dir=None, sr_image_shape='3, 32, 128', sr_batch_num=1, draw_img_save_dir='./inference_results', save_crop_res=False, crop_res_save_dir='./output', use_mp=False, total_process_num=1, process_id=0, benchmark=False, save_log_path='./log_output/', show_log=True, use_onnx=False, onnx_providers=False, onnx_sess_options=False, return_word_box=False, output='./output', table_max_len=488, table_algorithm='TableAttn', table_model_dir=None, merge_no_span_structure=True, table_char_dict_path=None, formula_algorithm='LaTeXOCR', formula_model_dir=None, formula_char_dict_path=None, formula_batch_num=1, layout_model_dir=None, layout_dict_path=None, layout_score_threshold=0.5, layout_nms_threshold=0.5, kie_algorithm='LayoutXLM', ser_model_dir=None, re_model_dir=None, use_visual_backbone=True, ser_dict_path='../train_data/XFUND/class_list_xfun.txt', ocr_order_method=None, mode='structure', image_orientation=False, layout=True, table=True, formula=False, ocr=True, recovery=False, recovery_to_markdown=False, use_pdf2docx_api=False, invert=False, binarize=False, alphacolor=(255, 255, 255), lang='ch_doc', det=True, rec=True, type='ocr', savefile=False, ocr_version='PP-OCRv4', structure_version='PP-StructureV2')
[2025/04/23 04:45:51] ppocr WARNING: The first GPU is used for inference by default, GPU ID: 0
[2025/04/23 04:45:51] ppocr WARNING: The first GPU is used for inference by default, GPU ID: 0
[2025/04/23 04:45:52] ppocr INFO: **********435873680-608ba20c-3eb5-48fa-b996-7b7e108494ab.jpg**********
[2025/04/23 04:45:52] ppocr DEBUG: dt_boxes num : 1, elapsed : 0.4374732971191406
[2025/04/23 04:45:52] ppocr DEBUG: rec_res num  : 1, elapsed : 0.16639328002929688
[2025/04/23 04:45:52] ppocr INFO: [[[97.0, 184.0], [490.0, 184.0], [490.0, 256.0], [97.0, 256.0]], ('持觞劝侯赢', 0.9502732157707214)]

0 replies

GreatV · 2025-04-23T11:04:20Z

GreatV
Apr 23, 2025
Maintainer

您好，针对“觞”字无法被PaddleOCR（包括PP-OCRv4和在线Demo）识别出来的问题，根据您的描述和已提供的相关信息，这通常由以下两个原因导致：

1. 字典覆盖范围有限
PaddleOCR的识别模型依赖于内置的字符字典（如ppocr_keys_v1.txt），里面包括了它能直接识别的汉字。如“觞”这种日常使用不多的生僻字，往往并未收录在默认字典里。模型即使检测到，也无法输出该字的正确识别结果，只能给出相近或者错乱的输出（如“持劝侯嬴”）。

2. 训练数据未覆盖生僻字
PaddleOCR的模型训练主要针对常用汉字，对于生僻字或低频字支持有限。即使加入生僻字到字典，由于模型可能没有针对这些字训练，识别效果通常也不佳。

解决思路

自定义字典
- 检查rec_char_dict_path指向的字典文件，确认是否包含“觞”字；如未包含，可添加进去（如在字典最后添加“觞”）。
微调或重新训练识别模型
- 单纯修改字典不会让模型马上识别这些新字。要让模型识别“觞”，需要在包含此字的图片样本基础上，对识别模型（rec）进行微调或重新训练。
- 官方自定义模型训练文档可供参考。
模型更新后部署
- 微调后，导出模型重新部署，无论是本地还是边缘设备（如rknn）。

小结

综上，无法识别“觞”字主因是模型字典和训练样本限制。请按上述建议添加字典条目并微调模型。如只添加字典且不训练，模型通常无法正确输出新加汉字。
如需具体自定义训练流程指引，欢迎补充说明！

Response generated by 🤖 feifei-bot | gpt-4.1

⚠️ This is an AI-generated response. Please verify any critical information.

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

“觞”字识别不出来 #15063

Uh oh!

{{title}}

Uh oh!

Replies: 4 comments

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

“觞”字识别不出来 #15063

Uh oh!

renshujiajia Apr 22, 2025

🔎 Search before asking

🐛 Bug (问题描述)

🏃‍♂️ Environment (运行环境)

🌰 Minimal Reproducible Example (最小可复现问题的Demo)

Replies: 4 comments

Uh oh!

jingsongliujing Apr 22, 2025 Collaborator

Uh oh!

raoyutian Apr 23, 2025

Uh oh!

GreatV Apr 23, 2025 Maintainer

Uh oh!

GreatV Apr 23, 2025 Maintainer

解决思路

相关参考

小结

renshujiajia
Apr 22, 2025

jingsongliujing
Apr 22, 2025
Collaborator

raoyutian
Apr 23, 2025

GreatV
Apr 23, 2025
Maintainer

GreatV
Apr 23, 2025
Maintainer