Replies: 2 comments
-
目前paddleocr默认模型对脚标样式的文本效果比较差,建议用相关垂直领域的数据进行微调 |
Beta Was this translation helpful? Give feedback.
-
你提到“Pb²⁺ / H₂O / μg/m³”这类化学公式、带上标/下标/特殊符号的文本识别率为0,的确是当前 OCR 系统在科学类文本处理中的常见难点。基于你提供的信息和相关 Issue(如 https://github.com/PaddlePaddle/PaddleOCR/issues/14275),以下是原因分析与改进建议: 问题原因分析:
解决建议: 方式一:尝试开启 LaTeX OCR 模块(推荐)
方式二:自定义字符集 + 微调识别模型
方式三:提高检测精度、辅助预处理
参考资料:
总结: 你遇到的主要症结在于当前模型及字符集设计不覆盖公式类表达的符号,建议:
如需帮助搭建 LaTeXOCR 环境,可提供更具体步骤。 Response generated by 🤖 feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
🔎 Search before asking
🐛 Bug (问题描述)
Pb²⁺ / H₂O / μg/m³请问这种为什么识别率为0?有什么办法解决吗?挺头大的
🏃♂️ Environment (运行环境)
请求帮助,win,cpu
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
请求帮助
Beta Was this translation helpful? Give feedback.
All reactions