关键信息提取是使用SER+RE还是UIE? #15067
Unanswered
Kyo1234567
asked this question in
Q&A
Replies: 1 comment
-
针对您的场景——即一批版式不固定、字段名称也不固定的海外英文发票和提货单,需要提取关键信息——选择SER+RE(结构化实体识别+关系抽取)和UIE(通用信息抽取)方案,需要结合两者的特点来分析哪种更适合。 1. SER+RE 所适用的场景SER+RE适合字段结构较为固定、或至少字段问题与答案成对固定、版式也相对规整的表单场景。其常见流程是:
但从您描述的情况来看:
结合相关讨论,SER+RE在这种“字段只有answer, 没有question”,或者版式复杂、字段表达不规范的情况下,性能容易大幅下降,开发和维护成本较高,不容易泛化。 2. UIE(通用信息抽取)所适用的场景UIE(Universal Information Extraction)是一种面向不定格式、不定字段、多语言、多类型信息场景设计的端到端信息抽取模型,核心特点包括:
3. 总结与建议
相关讨论参考
总结:您的实际应用场景,应该优先选择UIE通用信息抽取方法来实现关键信息提取,能大幅提升开发效率和抽取准确率。 Response generated by 🤖 feifei-bot | gpt-4.1 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
现有一批海外英文发票和提货单,需要提取关键信息 但是 这些单据都是版式不固定,字段名称也不固定 请问这种场景SER+RE 和UIE哪个能满足要求
Beta Was this translation helpful? Give feedback.
All reactions