从几种不同的票据中抽取关系。
#15713
Replies: 1 comment 11 replies
-
您好,paddleocr2.0 版本的KIE 训练可以参考这个文档 https://github.com/PaddlePaddle/PaddleOCR/blob/main/docs/version2.x/ppocr/model_train/kie.md 和 这个discussion https://github.com/PaddlePaddle/PaddleOCR/discussions/15532#discussioncomment-13419367, 在paddle3.0 后原有的信息抽取被[PP-ChatOcrv4])(https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/pipeline_usage/PP-ChatOCRv4.html) 这种大小模型范式替代了,也可以试一下这种方案,比传统的KIE方案精度要更高。感觉只有5种票据的话应该不需要每一种都训练一个模型,KIE模型完全可以拟合。 |
Beta Was this translation helpful? Give feedback.
11 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
您好,我这边需求是,大概有5种票据,都是扫描件比较规范,想从中抽取特定信息,比如 姓名,单号 等等。
是不是应该用基于图像的ser+re来做?请问如何训练?我找不到训练教程呢。
另,这5种票据没有分类,会混合输入,是不是做个基于关键词的票据分类就行,比如先走一遍ocr,按识别出的关键词调用对应训练好的5种模型之一?
Beta Was this translation helpful? Give feedback.
All reactions