@@ -44,7 +44,7 @@ PaddleNLP提供**开箱即用**的产业级NLP预置任务能力,无需训练
44
44
| [ 代码生成] ( #代码生成 ) | ` Taskflow("code_generation") ` | ✅ | ✅ | ✅ | | | 代码生成大模型 |
45
45
| [ 文图生成] ( #文图生成 ) | ` Taskflow("text_to_image") ` | ✅ | ✅ | ✅ | | | 文图生成大模型 |
46
46
| [ 文本摘要] ( #文本摘要 ) | ` Taskflow("text_summarization") ` | ✅ | ✅ | ✅ | ✅ | | 文本摘要大模型 |
47
- | [ 文档智能] ( #文档智能 ) | ` Taskflow("document_intelligence") ` | ✅ | ✅ | ✅ | ✅ | | 基于跨模态通用文档预训练模型ERNIE-LayoutX |
47
+ | [ 文档智能] ( #文档智能 ) | ` Taskflow("document_intelligence") ` | ✅ | ✅ | ✅ | ✅ | | 以多语言跨模态布局增强文档预训练模型ERNIE-Layout为核心底座 |
48
48
| [ 问题生成] ( #问题生成 ) | ` Taskflow("question_generation") ` | ✅ | ✅ | ✅ | ✅ | | 问题生成大模型 |
49
49
50
50
## QuickStart
@@ -1549,7 +1549,7 @@ from paddlenlp import Taskflow
1549
1549
</div ></details >
1550
1550
1551
1551
### 文档智能
1552
- <details ><summary >&emsp ; 基于跨模态通用文档预训练模型ERNIE-LayoutX </summary ><div >
1552
+ <details ><summary >&emsp ; 以多语言跨模态布局增强文档预训练模型ERNIE-Layout为核心底座 </summary ><div >
1553
1553
1554
1554
#### 输入格式
1555
1555
@@ -1573,7 +1573,7 @@ from paddlenlp import Taskflow
1573
1573
- 支持本地图片路径输入
1574
1574
1575
1575
<div align =" center " >
1576
- <img src=https://bj.bcebos .com/paddlenlp/taskflow/document_intelligence/images/resume .png height=800 hspace='20'/>
1576
+ <img src=https://user-images.githubusercontent .com/40840292/194748579-f9e8aa86-7f65-4827-bfae-824c037228b3 .png height=800 hspace='20'/>
1577
1577
</div >
1578
1578
1579
1579
@@ -1582,19 +1582,19 @@ from paddlenlp import Taskflow
1582
1582
>> > from paddlenlp import Taskflow
1583
1583
1584
1584
>> > docprompt = Taskflow(" document_intelligence" )
1585
- >> > docprompt([{" doc" : " ./resume.png" , " prompt" : [" 五百丁本次想要担任的是什么职位?" , " 五百丁是在哪里上的大学?" , " 大学学的是什么专业?" ]}])
1585
+ >> > pprint( docprompt([{" doc" : " ./resume.png" , " prompt" : [" 五百丁本次想要担任的是什么职位?" , " 五百丁是在哪里上的大学?" , " 大学学的是什么专业?" ]}]) )
1586
1586
[{' prompt' : ' 五百丁本次想要担任的是什么职位?' ,
1587
- ' result' : [{' end' : 183 , ' prob' : 1.0 , ' start' : 180 , ' value' : ' 客户经理' }]},
1588
- {' prompt' : ' 五百丁是在哪里上的大学?' ,
1589
- ' result' : [{' end' : 38 , ' prob' : 1.0 , ' start' : 32 , ' value' : ' 广州五百丁学院' }]},
1590
- {' prompt' : ' 大学学的是什么专业?' ,
1591
- ' result' : [{' end' : 45 , ' prob' : 0.74 , ' start' : 39 , ' value' : ' 金融学(本科)' }]}]
1587
+ ' result' : [{' end' : 7 , ' prob' : 1.0 , ' start' : 4 , ' value' : ' 客户经理' }]},
1588
+ {' prompt' : ' 五百丁是在哪里上的大学?' ,
1589
+ ' result' : [{' end' : 37 , ' prob' : 1.0 , ' start' : 31 , ' value' : ' 广州五百丁学院' }]},
1590
+ {' prompt' : ' 大学学的是什么专业?' ,
1591
+ ' result' : [{' end' : 44 , ' prob' : 0.82 , ' start' : 38 , ' value' : ' 金融学(本科)' }]}]
1592
1592
```
1593
1593
1594
1594
- http图片链接输入
1595
1595
1596
1596
<div align =" center " >
1597
- <img src=https://bj.bcebos .com/paddlenlp/taskflow/document_intelligence/images/invoice .jpg height=400 hspace='10'/>
1597
+ <img src=https://user-images.githubusercontent .com/40840292/194748592-e20b2a5f-d36b-46fb-8057-86755d188af0 .jpg height=400 hspace='10'/>
1598
1598
</div >
1599
1599
1600
1600
@@ -1603,13 +1603,13 @@ from paddlenlp import Taskflow
1603
1603
>> > from paddlenlp import Taskflow
1604
1604
1605
1605
>> > docprompt = Taskflow(" document_intelligence" )
1606
- >> > docprompt([{" doc" : " https://bj.bcebos.com/paddlenlp/taskflow/document_intelligence/images/invoice.jpg" , " prompt" : [" 发票号码是多少?" , " 校验码是多少?" ]}])
1606
+ >> > pprint( docprompt([{" doc" : " https://bj.bcebos.com/paddlenlp/taskflow/document_intelligence/images/invoice.jpg" , " prompt" : [" 发票号码是多少?" , " 校验码是多少?" ]}]) )
1607
1607
[{' prompt' : ' 发票号码是多少?' ,
1608
- ' result' : [{' end' : 10 , ' prob' : 0.96 , ' start' : 7 , ' value' : ' No44527206' }]},
1609
- {' prompt' : ' 校验码是多少?' ,
1610
- ' result' : [{' end' : 271 ,
1608
+ ' result' : [{' end' : 2 , ' prob' : 0.74 , ' start' : 2 , ' value' : ' No44527206' }]},
1609
+ {' prompt' : ' 校验码是多少?' ,
1610
+ ' result' : [{' end' : 233 ,
1611
1611
' prob' : 1.0 ,
1612
- ' start' : 263 ,
1612
+ ' start' : 231 ,
1613
1613
' value' : ' 01107 555427109891646' }]}]
1614
1614
```
1615
1615
0 commit comments