@@ -50,6 +50,35 @@ pip install --upgrade paddlenlp
50
50
51
51
## 易用的文本领域API
52
52
53
+ ### Taskflow:开箱即用的工业级NLP能力
54
+
55
+ Taskflow旨在提供开箱即用的NLP预置任务能力,覆盖自然语言理解与自然语言生成两大场景,在中文场景上提供** 工业级的效果** 与** 极致的预测性能** 。
56
+
57
+ ``` python
58
+ from paddlenlp import Taskflow
59
+
60
+ # 中文分词
61
+ seg = Taskflow(" word_segmentation" )
62
+ seg(" 第十四届全运会在西安举办" )
63
+ >> > [' 第十四届' , ' 全运会' , ' 在' , ' 西安' , ' 举办' ]
64
+
65
+ # 词性标注
66
+ tag = Taskflow(" pos_tagging" )
67
+ tag(" 第十四届全运会在西安举办" )
68
+ >> > [(' 第十四届' , ' m' ), (' 全运会' , ' nz' ), (' 在' , ' p' ), (' 西安' , ' LOC' ), (' 举办' , ' v' )]
69
+
70
+ # 命名实体识别
71
+ ner = Taskflow(" ner" )
72
+ ner(" 《孤女》是2010年九州出版社出版的小说,作者是余兼羽" )
73
+ >>> [{'text': '《孤女》是2010年九州出版社出版的小说,作者是余兼羽', 'items': [{'item': '《', 'offset': 0, 'wordtag_label': 'w', 'length': 1}, {'item': '孤女', 'offset': 1, 'wordtag_label': '作品类_实体', 'length': 2}, {'item': '》', 'offset': 3, 'wordtag_label': 'w', 'length': 1}, {'item': '是', 'offset': 4, 'wordtag_label': '肯定词', 'length': 1}, {'item': '2010年', 'offset': 5, 'wordtag_label': '时间类', 'length': 5}, {'item': '九州出版社', 'offset': 10, 'wordtag_label': '组织机构类', 'length': 5}, {'item': '出版', 'offset': 15, 'wordtag_label': '场景事件', 'length': 2}, {'item': '的', 'offset': 17, 'wordtag_label': '助词', 'length': 1}, {'item': '小说', 'offset': 18, 'wordtag_label': '作品类_概念', 'length': 2}, {'item': ',', 'offset': 20, 'wordtag_label': 'w', 'length': 1}, {'item': '作者', 'offset': 21, 'wordtag_label': '人物类_概念', 'length': 2}, {'item': '是', 'offset': 23, 'wordtag_label': '肯定词', 'length': 1}, {'item': '余兼羽', 'offset': 24, 'wordtag_label': '人物类_实体', 'length': 3}]}]
74
+
75
+ # 句法分析
76
+ ddp = Taskflow(" dependency_parsing" )
77
+ ddp(" 百度是一家高科技公司" )
78
+ >> > [{' word' : [' 百度' , ' 是' , ' 一家' , ' 高科技' , ' 公司' ], ' head' : [' 2' , ' 0' , ' 5' , ' 5' , ' 2' ], ' deprel' : [' SBV' , ' HED' , ' ATT' , ' ATT' , ' VOB' ]}]
79
+ ```
80
+ 更多使用方法请参考[ Taskflow文档] ( ./docs/model_zoo/taskflow.md )
81
+
53
82
### Transformer API: 强大的预训练模型生态底座
54
83
55
84
覆盖** 15** 个网络结构和** 67** 个预训练模型参数,既包括百度自研的预训练模型如ERNIE系列, PLATO, SKEP等,也涵盖业界主流的中文预训练模型。也欢迎开发者贡献更多预训练模型!🤗
@@ -243,47 +272,7 @@ PaddleNLP提供了多粒度、多场景的NLP应用示例,面向动态图模
243
272
| [ P-Tuning] ( ./examples/few_shot/p-tuning/ ) | 基于[ GPT Understands, Too] ( https://arxiv.org/pdf/2103.10385.pdf ) 论文策略实现, 首次提出连续可学习的模板参数,在全参数空间对模板进行连续优化,大幅提升模型稳定性和模型效果。|
244
273
| [ EFL] ( ./examples/few_shot/efl/ ) | 基于[ Entailment as Few-Shot Learner] ( https://arxiv.org/abs/2104.14690 ) 论文策略实现,将下游目标任务转换为蕴含任务降低模型预测空间,显著提升模型效果。|
245
274
246
- ## Taskflow 一键预测
247
-
248
- Taskflow是功能强大的自然语言处理库,旨在提供开箱即用的NLP预置任务,覆盖自然语言理解与自然语言生成两大核心应用,在中文场景上提供工业级的效果与极致的预测性能。
249
275
250
- ### 调用示例
251
-
252
- ``` python
253
- from paddlenlp import Taskflow
254
-
255
- # 中文分词
256
- seg = Taskflow(" word_segmentation" )
257
- seg(" 第十四届全运会在西安举办" )
258
- >> > [' 第十四届' , ' 全运会' , ' 在' , ' 西安' , ' 举办' ]
259
-
260
- # 词性标注
261
- pos_tagging = Taskflow(" pos_tagging" )
262
- pos_tagging(" 第十四届全运会在西安举办" )
263
- >> > [(' 第十四届' , ' m' ), (' 全运会' , ' nz' ), (' 在' , ' p' ), (' 西安' , ' LOC' ), (' 举办' , ' v' )]
264
-
265
- # 命名实体识别
266
- ner = Taskflow(" ner" )
267
- ner(" 《孤女》是2010年九州出版社出版的小说,作者是余兼羽" )
268
- >>> [{'text': '《孤女》是2010年九州出版社出版的小说,作者是余兼羽', 'items': [{'item': '《', 'offset': 0, 'wordtag_label': 'w', 'length': 1}, {'item': '孤女', 'offset': 1, 'wordtag_label': '作品类_实体', 'length': 2}, {'item': '》', 'offset': 3, 'wordtag_label': 'w', 'length': 1}, {'item': '是', 'offset': 4, 'wordtag_label': '肯定词', 'length': 1}, {'item': '2010年', 'offset': 5, 'wordtag_label': '时间类', 'length': 5}, {'item': '九州出版社', 'offset': 10, 'wordtag_label': '组织机构类', 'length': 5}, {'item': '出版', 'offset': 15, 'wordtag_label': '场景事件', 'length': 2}, {'item': '的', 'offset': 17, 'wordtag_label': '助词', 'length': 1}, {'item': '小说', 'offset': 18, 'wordtag_label': '作品类_概念', 'length': 2}, {'item': ',', 'offset': 20, 'wordtag_label': 'w', 'length': 1}, {'item': '作者', 'offset': 21, 'wordtag_label': '人物类_概念', 'length': 2}, {'item': '是', 'offset': 23, 'wordtag_label': '肯定词', 'length': 1}, {'item': '余兼羽', 'offset': 24, 'wordtag_label': '人物类_实体', 'length': 3}]}]
269
-
270
- # 句法分析
271
- ddp = Taskflow(" dependency_parsing" )
272
- ddp(" 百度是一家高科技公司" )
273
- >> > [{' word' : [' 百度' , ' 是' , ' 一家' , ' 高科技' , ' 公司' ], ' head' : [' 2' , ' 0' , ' 5' , ' 5' , ' 2' ], ' deprel' : [' SBV' , ' HED' , ' ATT' , ' ATT' , ' VOB' ]}]
274
- ```
275
- 更多使用方法请参考[ Taskflow文档] ( ./docs/model_zoo/taskflow.md )
276
-
277
- ### 任务清单
278
-
279
- | 自然语言理解任务 | 自然语言生成任务 |
280
- | :------------ | ---- |
281
- | 中文分词 | 生成式问答 |
282
- | 词性标注 | 智能写诗 |
283
- | 命名实体识别 | |
284
- | 文本纠错 | |
285
- | 句法分析 | |
286
- | 情感分类 | |
287
276
288
277
## 交互式Notebook教程
289
278
0 commit comments