File tree Expand file tree Collapse file tree 2 files changed +11
-5
lines changed Expand file tree Collapse file tree 2 files changed +11
-5
lines changed Original file line number Diff line number Diff line change @@ -95,10 +95,16 @@ python3 -u ../../../tools/infer.py -m config.yaml
9595
9696## 效果复现
9797为了方便使用者能够快速的跑通每一个模型,我们在每个模型下都提供了样例数据。
98- 同时,我们处理好了一份中等规模的microsoft news dataset的数据,可以从https://paddlerec.bj.bcebos.com/datasets/MIND/bigdata.zip下载,
99- 之后解压到 ../../../datasets/MIND目录,也可以直接运行../../../datasets/MIND目录下的run.sh生成训练,测试数据
100-
101- 运行方式
98+ 同时,我们提供了全量数据生成的脚本,将会自动下载microsoft news dataset全量数据集并转换为模型能接受的
99+ 输入格式,执行方法如下:
100+ PaddleRec/datasets/MIND/data
101+ 执行 sh run.sh
102+ 脚本运行完成后,打开dict/yaml_info.txt,将其中的词向量大小,类目大小,子类目大小信息copy到config_bigdata.yaml
103+ 里,替换最后3行的超参数
104+ category_size
105+ sub_category_size
106+ word_dict_size
107+ 完成后运行:
102108```
103109python3 -u ../../../tools/trainer.py -m config_bigdata.yaml
104110```
Original file line number Diff line number Diff line change @@ -41,7 +41,7 @@ hyper_parameters:
4141 browse_size : 30
4242 neg_condidate_sample_size : 4
4343 word_dimension : 60
44+ category_dimension : 32
4445 category_size : 19
4546 sub_category_size : 294
46- category_dimension : 32
4747 word_dict_size : 31440
You can’t perform that action at this time.
0 commit comments