表格内容识别准确率很差,请问如何改进优化? #14970
Replies: 1 comment
-
您遇到的问题,即表格内容识别错误、单元格错位、合并单元格处理失败,是当前使用 PPStructure 时较常见的挑战,特别是在处理结构稍复杂的表格图像时。以下是对识别准确率低的原因分析以及建议的优化措施,涵盖模型选择、图像预处理、参数调整等多个方面: 一、问题原因分析 从您提供的示例图和识别结果看,主要问题包括:
二、优化建议 以下是针对您情况的系统性改进建议:
三、总结推荐配置范例 鉴于您识别表格包含合并单元格、中文字符,建议如下代码配置参考: table_engine = PPStructure(
layout_model_dir="lp://TableBank",
table_model_dir="ch_ppstructure_mobile_v2.0_SLANet_infer",
merge_para=0.4,
ocr=True
) 并辅以以下图像预处理示例: # 图像读取与增强预处理
img = cv2.imread(img_path)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
_, binary = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU) 四、相关讨论 PaddleOCR 官方已在 Github 提出类似问题并讨论优化建议,您可以参考讨论:#14122 五、最终建议
欢迎继续补充更多表格示例,以便进一步分析与优化。 Response generated by 🤖 feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
使用PPstrcture对表格图片进行识别,发现识别的正确率很差,以下是我的代码和尝试的各项参数配置(包括已经注释掉的都试过):
例子1 的原始图片:

例子1 PPstrcture识别表格的html打印结果:
例子1 PPstrcture识别表格的html的图像效果:

可以看到,识别的表格有错误。例如表格第一列第一行的合并单元格数据是’CTNS‘,而识别的表格中将第一列第三行的单元格数据与上面第一列第一行的合并单元格的’CTNS‘合并在一起了,导致了表格数据错行。同样的单元格数据错位在识别表格的其他位置也有出息。最终导致识别的表格数据混乱。进一步发送给譬如deepseek这样的大模型去解析统计数据就会出现计算错误。
例子2 的原始图片:

例子2 PPstrcture识别表格的html打印结果:
例子2 PPstrcture识别表格的html的图像效果:

可以看到,识别的表格明显有错误,好几个单元格数据发生错行了。表格中文也是乱码
PPstrcture是否能够识别处理稍微复杂一点的表格图像数据?这个库介绍里不是说专门针对表格识别优化设计的吗?为什么识别简单的表格都识别不正确,特别是表格中存在单元格合并的情况。通过改进优化模型参数能够识别正确吗?请问上面的识别准确率低的问题原因是什么?如何解决这些问题,优化改进?
Beta Was this translation helpful? Give feedback.
All reactions