@@ -83,9 +83,9 @@ seg(["第十四届全运会在西安举办", "三亚是一个美丽的城市"])
83
83
84
84
#### 自定义词典
85
85
86
- 用户可以通过装载自定义词典来定制化分词结果。
86
+ 用户可以通过装载自定义词典来定制化分词结果。词典文件每一行表示一个自定义item,可以由一个单词或者多个单词组成。
87
87
88
- 词典文件` custom_seg .txt` 示例:
88
+ 词典文件` user_dict .txt` 示例:
89
89
90
90
``` text
91
91
平原上的火焰
@@ -103,15 +103,15 @@ seg(["第十四届全运会在西安举办", "三亚是一个美丽的城市"])
103
103
``` python
104
104
from paddlenlp import Taskflow
105
105
106
- my_seg = Taskflow(" word_segmentation" , custom_vocab = " custom_seg .txt" )
106
+ my_seg = Taskflow(" word_segmentation" , user_dict = " user_dict .txt" )
107
107
my_seg(" 平原上的火焰计划于年末上映" )
108
108
>> > [' 平原上的火焰' , ' 计划' , ' 于' , ' 年' , ' 末' , ' 上映' ]
109
109
```
110
110
111
111
#### 可配置参数说明
112
112
113
113
* ` batch_size ` :批处理大小,请结合机器情况进行调整,默认为1。
114
- * ` custom_vocab ` :用户自定义词典文件,默认为None。
114
+ * ` user_dict ` :用户自定义词典文件,默认为None。
115
115
116
116
### 词性标注
117
117
@@ -140,9 +140,9 @@ tag(["第十四届全运会在西安举办", "三亚是一个美丽的城市"])
140
140
141
141
#### 自定义词典
142
142
143
- 用户可以通过装载自定义词典来定制化分词和词性标注结果。
143
+ 用户可以通过装载自定义词典来定制化分词和词性标注结果。词典文件每一行表示一个自定义item,可以由一个单词或者多个单词组成,单词后面可以添加自定义标签,格式为 ` item/tag ` ,如果不添加自定义标签,则使用模型默认标签。
144
144
145
- 词典文件` custom_pos .txt` 示例:
145
+ 词典文件` user_dict .txt` 示例:
146
146
147
147
``` text
148
148
赛里木湖/LAKE
@@ -162,15 +162,15 @@ tag(["第十四届全运会在西安举办", "三亚是一个美丽的城市"])
162
162
``` python
163
163
from paddlenlp import Taskflow
164
164
165
- my_pos = Taskflow(" pos_tagging" , custom_vocab = " custom_pos .txt" )
165
+ my_pos = Taskflow(" pos_tagging" , user_dict = " user_dict .txt" )
166
166
my_pos(" 赛里木湖是新疆海拔最高的高山湖泊" )
167
167
>> > [(' 赛里木湖' , ' LAKE' ), (' 是' , ' v' ), (' 新疆' , ' LOC' ), (' 海拔最高' , ' n' ), (' 的' , ' u' ), (' 高' , ' a' ), (' 山' , ' n' ), (' 湖' , ' n' ), (' 泊' , ' n' )]
168
168
```
169
169
170
170
#### 可配置参数说明
171
171
172
172
* ` batch_size ` :批处理大小,请结合机器情况进行调整,默认值为1。
173
- * ` custom_vocab ` :用户自定义词典文件,默认为None。
173
+ * ` user_dict ` :用户自定义词典文件,默认为None。
174
174
175
175
### 命名实体识别
176
176
@@ -187,9 +187,9 @@ ner(["热梅茶是一道以梅子为主要原料制作的茶饮", "《孤女》
187
187
188
188
#### 自定义词典
189
189
190
- 用户可以通过装载自定义词典来定制化分词和词性标注结果。
190
+ 用户可以通过装载自定义词典来定制化分词和词性标注结果。词典文件每一行表示一个自定义item,可以由一个单词或者多个单词组成,单词后面可以添加自定义标签,格式为 ` item/tag ` ,如果不添加自定义标签,则使用模型默认标签。
191
191
192
- 词典文件` custom_ner .txt` 示例:
192
+ 词典文件` user_dict .txt` 示例:
193
193
194
194
``` text
195
195
长津湖/电影类_实体
@@ -209,7 +209,7 @@ ner(["热梅茶是一道以梅子为主要原料制作的茶饮", "《孤女》
209
209
``` python
210
210
from paddlenlp import Taskflow
211
211
212
- my_ner = Taskflow(" ner" , custom_vocab = " custom_ner .txt" )
212
+ my_ner = Taskflow(" ner" , user_dict = " user_dict .txt" )
213
213
my_ner(" 《长津湖》收尾,北美是最大海外票仓" )
214
214
>> > [(' 《' , ' w' ), (' 长津湖' , ' 电影类_实体' ), (' 》' , ' w' ), (' 收' , ' 词汇用语' ), (' 尾' , ' 术语类' ), (' ,' , ' w' ), (' 北美' , ' 世界地区类' ), (' 是' , ' 肯定词' ), (' 最' , ' 修饰词' ), (' 大' , ' 修饰词' ), (' 海外票仓' , ' 场所类' )]
215
215
```
@@ -229,7 +229,7 @@ my_ner = Taskflow("ner", params_path="/path/to/your/params", tag_path="/path/to/
229
229
#### 可配置参数说明
230
230
231
231
* ` batch_size ` :批处理大小,请结合机器情况进行调整,默认为1。
232
- * ` custom_vocab ` :用户自定义词典文件,默认为None。
232
+ * ` user_dict ` :用户自定义词典文件,默认为None。
233
233
* ` params_path ` :模型参数文件路径,默认为None。
234
234
* ` tag_path ` :标签文件路径,默认为None。
235
235
0 commit comments