Skip to content

Commit 61413bf

Browse files
committed
readme change
1 parent d757171 commit 61413bf

File tree

2 files changed

+11
-5
lines changed

2 files changed

+11
-5
lines changed

models/rank/naml/README.md

Lines changed: 10 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -95,10 +95,16 @@ python3 -u ../../../tools/infer.py -m config.yaml
9595

9696
## 效果复现
9797
为了方便使用者能够快速的跑通每一个模型,我们在每个模型下都提供了样例数据。
98-
同时,我们处理好了一份中等规模的microsoft news dataset的数据,可以从https://paddlerec.bj.bcebos.com/datasets/MIND/bigdata.zip下载,
99-
之后解压到 ../../../datasets/MIND目录,也可以直接运行../../../datasets/MIND目录下的run.sh生成训练,测试数据
100-
101-
运行方式
98+
同时,我们提供了全量数据生成的脚本,将会自动下载microsoft news dataset全量数据集并转换为模型能接受的
99+
输入格式,执行方法如下:
100+
PaddleRec/datasets/MIND/data
101+
执行 sh run.sh
102+
脚本运行完成后,打开dict/yaml_info.txt,将其中的词向量大小,类目大小,子类目大小信息copy到config_bigdata.yaml
103+
里,替换最后3行的超参数
104+
category_size
105+
sub_category_size
106+
word_dict_size
107+
完成后运行:
102108
```
103109
python3 -u ../../../tools/trainer.py -m config_bigdata.yaml
104110
```

models/rank/naml/config_bigdata.yaml

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -41,7 +41,7 @@ hyper_parameters:
4141
browse_size: 30
4242
neg_condidate_sample_size: 4
4343
word_dimension: 60
44+
category_dimension: 32
4445
category_size: 19
4546
sub_category_size: 294
46-
category_dimension: 32
4747
word_dict_size: 31440

0 commit comments

Comments
 (0)