-
这张图是版面分析后的图,在分析的时候是否可以直接将每个框里的文本保存下来呢?另外右侧出来英文字母有识别错的,这块是否包含文本识别呢? |
Beta Was this translation helpful? Give feedback.
Replies: 7 comments
-
PP-Structure 会对非 table 的区域进行OCR识别。可以看到上面的可视化也是如此。 表格的部分会单独保存成excel,如果希望端到端的输出预测结果,可以使用recover的功能,转到Word上查看结果,添加参数: |
Beta Was this translation helpful? Give feedback.
-
感谢回复 尝试过 会缺内容,出现少行和排本的问题 是有pdf格式(单列or多列)的限制吗?还是当前的精度确实会出现这样的情况呀? |
Beta Was this translation helpful? Give feedback.
-
当前版面的效果有限,确实在恢复的时候还不能做到完全正确 |
Beta Was this translation helpful? Give feedback.
-
好的明白了 感谢 |
Beta Was this translation helpful? Give feedback.
-
可以直接使用pdf文件进行 版面识别吗? |
Beta Was this translation helpful? Give feedback.
-
请问pp Structure可以做到将论文中的的文字表格切出来吗?在利用其他的工具单独表格,图像保存为图片? |
Beta Was this translation helpful? Give feedback.
-
明白了,我直接用的pp ocr,其实pp Structure有这个区分功能。 |
Beta Was this translation helpful? Give feedback.
PP-Structure 会对非 table 的区域进行OCR识别。可以看到上面的可视化也是如此。
表格的部分会单独保存成excel,如果希望端到端的输出预测结果,可以使用recover的功能,转到Word上查看结果,添加参数:
--recovery=true --use_pdf2docx_api=true