ppstructure版面识别，可以将识别出来的各个框内的文本保存下来吗？ #12677

gggdroa · 2024-03-04T06:19:24Z

gggdroa
Mar 4, 2024

这张图是版面分析后的图，在分析的时候是否可以直接将每个框里的文本保存下来呢？另外右侧出来英文字母有识别错的，这块是否包含文本识别呢？

Answered by tink2123

Mar 5, 2024

PP-Structure 会对非 table 的区域进行OCR识别。可以看到上面的可视化也是如此。

表格的部分会单独保存成excel，如果希望端到端的输出预测结果，可以使用recover的功能，转到Word上查看结果，添加参数：
--recovery=true --use_pdf2docx_api=true

View full answer

tink2123 · 2024-03-05T03:22:55Z

tink2123
Mar 5, 2024
Collaborator

PP-Structure 会对非 table 的区域进行OCR识别。可以看到上面的可视化也是如此。

表格的部分会单独保存成excel，如果希望端到端的输出预测结果，可以使用recover的功能，转到Word上查看结果，添加参数：
--recovery=true --use_pdf2docx_api=true

0 replies

gggdroa · 2024-03-05T09:49:50Z

gggdroa
Mar 5, 2024
Author

PP-Structure 会对非 table 的区域进行OCR识别。可以看到上面的可视化也是如此。

表格的部分会单独保存成excel，如果希望端到端的输出预测结果，可以使用recover的功能，转到Word上查看结果，添加参数： --recovery=true --use_pdf2docx_api=true

感谢回复尝试过会缺内容，出现少行和排本的问题是有pdf格式(单列or多列)的限制吗？还是当前的精度确实会出现这样的情况呀？

0 replies

tink2123 · 2024-03-05T11:45:47Z

tink2123
Mar 5, 2024
Collaborator

当前版面的效果有限，确实在恢复的时候还不能做到完全正确

0 replies

gggdroa · 2024-03-06T01:35:03Z

gggdroa
Mar 6, 2024
Author

当前版面的效果有限，确实在恢复的时候还不能做到完全正确

好的明白了感谢

0 replies

gggdroa · 2024-03-29T06:12:54Z

gggdroa
Mar 29, 2024
Author

当前版面的效果有限，确实在恢复的时候还不能做到完全正确

可以直接使用pdf文件进行版面识别吗？
想提取出来眉头和眉脚

0 replies

CapitaineNemo · 2024-04-07T03:48:41Z

CapitaineNemo
Apr 7, 2024

当前版面的效果有限，确实在恢复的时候还不能做到完全正确

可以直接使用pdf文件进行版面识别吗？想提取出来眉头和眉脚

请问pp Structure可以做到将论文中的的文字表格切出来吗？在利用其他的工具单独表格，图像保存为图片？

0 replies

CapitaineNemo · 2024-04-07T04:16:01Z

CapitaineNemo
Apr 7, 2024

当前版面的效果有限，确实在恢复的时候还不能做到完全正确

可以直接使用pdf文件进行版面识别吗？想提取出来眉头和眉脚

请问pp Structure可以做到将论文中的的文字表格切出来吗？在利用其他的工具单独表格，图像保存为图片？

明白了，我直接用的pp ocr，其实pp Structure有这个区分功能。

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

ppstructure版面识别，可以将识别出来的各个框内的文本保存下来吗？ #12677

Uh oh!

{{title}}

Uh oh!

Replies: 7 comments

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

ppstructure版面识别，可以将识别出来的各个框内的文本保存下来吗？ #12677

Uh oh!

gggdroa Mar 4, 2024

Replies: 7 comments

Uh oh!

tink2123 Mar 5, 2024 Collaborator

Uh oh!

gggdroa Mar 5, 2024 Author

Uh oh!

tink2123 Mar 5, 2024 Collaborator

Uh oh!

gggdroa Mar 6, 2024 Author

Uh oh!

gggdroa Mar 29, 2024 Author

Uh oh!

CapitaineNemo Apr 7, 2024

Uh oh!

CapitaineNemo Apr 7, 2024

gggdroa
Mar 4, 2024

tink2123
Mar 5, 2024
Collaborator

gggdroa
Mar 5, 2024
Author

tink2123
Mar 5, 2024
Collaborator

gggdroa
Mar 6, 2024
Author

gggdroa
Mar 29, 2024
Author

CapitaineNemo
Apr 7, 2024

CapitaineNemo
Apr 7, 2024