Merge prepare.benchmark.sh and prepare.sh (#1938)

FrostML · smallv0221 · web-flow · commit f9fab9430cfe · 2022-04-13T12:15:56.000+08:00
* merge prepare benchmark

* update

* delete export BENCHMARK_ROOT

* rename ips tp ips_total, ips_per_cars to ips

* pre-commit issue

Co-authored-by: smallv0221 &lt;33639025+smallv0221@users.noreply.github.com&gt;
diff --git a/examples/language_model/gpt-3/dygraph/run_pretrain.py b/examples/language_model/gpt-3/dygraph/run_pretrain.py
@@ -394,7 +394,7 @@ def do_train(args):
                     avg_reader_cost = train_reader_cost / args.logging_freq
 
                     logger.info(
-                        "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f step/s, ips: %.0f tokens/s, ips_per_card: %.0f tokens/s, learning rate: %.5e"
+                        "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f step/s, ips_total: %.0f tokens/s, ips: %.0f tokens/s, learning rate: %.5e"
                         % (global_step, epoch, step, avg_loss, avg_reader_cost,
                            1. / speed, speed, speed * default_global_tokens_num,
                            speed * default_global_tokens_num / nranks,
diff --git a/examples/language_model/gpt-3/static/run_pretrain_static.py b/examples/language_model/gpt-3/static/run_pretrain_static.py
@@ -435,7 +435,7 @@ def do_train(args):
                         train_reader_cost + train_run_cost)
                     avg_reader_cost = train_reader_cost / args.logging_freq
                     logger.info(
-                        "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f steps/s, ips: %.0f tokens/s, ips_per_card: %.0f tokens/s, learning rate: %.5e"
+                        "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f steps/s, ips_total: %.0f tokens/s, ips: %.0f tokens/s, learning rate: %.5e"
                         % (global_step, epoch, step, loss_return[0],
                            avg_reader_cost, 1. / speed, speed,
                            speed * args.global_batch_size * args.max_seq_len,
diff --git a/examples/language_model/gpt/run_pretrain.py b/examples/language_model/gpt/run_pretrain.py
@@ -263,7 +263,7 @@ def do_train(args):
                         train_reader_cost + train_run_cost)
                     avg_reader_cost = train_reader_cost / args.logging_freq
                     logger.info(
-                        "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f step/s, ips: %.0f tokens/s, ips_per_card: %.0f tokens/s, learning rate: %.5e"
+                        "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f step/s, ips_total: %.0f tokens/s, ips: %.0f tokens/s, learning rate: %.5e"
                         %
                         (global_step, epoch, step, loss_numpy, avg_reader_cost,
                          1. / speed, speed, speed * default_global_tokens_num,
diff --git a/examples/language_model/gpt/run_pretrain_static.py b/examples/language_model/gpt/run_pretrain_static.py
@@ -430,7 +430,7 @@ def do_train(args):
                     avg_reader_cost = train_reader_cost / args.logging_freq
 
                     logger.info(
-                        "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f steps/s, ips: %.0f tokens/s, ips_per_card: %.0f tokens/s, learning rate: %.5e"
+                        "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f steps/s, ips_total: %.0f tokens/s, ips: %.0f tokens/s, learning rate: %.5e"
                         % (global_step, epoch, step, loss_return[0],
                            avg_reader_cost, 1. / speed, speed,
                            speed * args.global_batch_size * args.max_seq_len,
diff --git a/tests/benchmark/run_benchmark.sh b/tests/benchmark/run_benchmark.sh
@@ -30,7 +30,7 @@ function _set_params(){
 
     log_with_profiler=$log_file
     profiler_path=$log_profile
-    keyword="ips_per_card:" 
+    keyword="ips:" 
     keyword_loss="loss:"
     skip_steps=20
     model_mode=-1
diff --git a/tests/test_tipc/benchmark_train.sh b/tests/test_tipc/benchmark_train.sh
@@ -93,7 +93,6 @@ lines=(${dataline})
 model_name=$(func_parser_value "${lines[1]}")
 
 if [[ ${model_name} =~ gpt* ]]; then
-    export BENCHMARK_ROOT=/workspace
     run_env=$BENCHMARK_ROOT/run_env
     export PATH=$run_env:${PATH}
 fi
diff --git a/tests/test_tipc/prepare.benchmark.sh b/tests/test_tipc/prepare.benchmark.sh
diff --git a/tests/test_tipc/prepare.sh b/tests/test_tipc/prepare.sh
@@ -34,16 +34,16 @@ if [ ${MODE} = "lite_train_lite_infer" ];then
 
         # The whole procedure of lite_train_infer should be less than 15min.
         # Hence, set maximum output length is 16. 
-        # sed -i "s/^max_out_len.*/max_out_len: 16/g" configs/transformer.base.yaml
-        # sed -i "s/^max_out_len.*/max_out_len: 16/g" configs/transformer.big.yaml
+        sed -i "s/^max_out_len.*/max_out_len: 16/g" configs/transformer.base.yaml
+        sed -i "s/^max_out_len.*/max_out_len: 16/g" configs/transformer.big.yaml
 
-        # sed -i "s/^random_seed:.*/random_seed: 128/g" configs/transformer.base.yaml
-        # sed -i "s/^shuffle_batch:.*/shuffle_batch: False/g" configs/transformer.base.yaml
-        # sed -i "s/^shuffle:.*/shuffle: False/g" configs/transformer.base.yaml
+        sed -i "s/^random_seed:.*/random_seed: 128/g" configs/transformer.base.yaml
+        sed -i "s/^shuffle_batch:.*/shuffle_batch: False/g" configs/transformer.base.yaml
+        sed -i "s/^shuffle:.*/shuffle: False/g" configs/transformer.base.yaml
 
-        # sed -i "s/^random_seed:.*/random_seed: 128/g" configs/transformer.big.yaml
-        # sed -i "s/^shuffle_batch:.*/shuffle_batch: False/g" configs/transformer.big.yaml
-        # sed -i "s/^shuffle:.*/shuffle: False/g" configs/transformer.big.yaml
+        sed -i "s/^random_seed:.*/random_seed: 128/g" configs/transformer.big.yaml
+        sed -i "s/^shuffle_batch:.*/shuffle_batch: False/g" configs/transformer.big.yaml
+        sed -i "s/^shuffle:.*/shuffle: False/g" configs/transformer.big.yaml
 
         # Data set prepared. 
         if [ ! -f WMT14.en-de.partial.tar.gz ]; then
@@ -94,16 +94,16 @@ elif [ ${MODE} = "whole_train_whole_infer" ];then
 
     if [[ ${model_name} =~ transformer* ]]; then
         cd ../examples/machine_translation/transformer/
-        # sed -i "s/^max_out_len.*/max_out_len: 256/g" configs/transformer.base.yaml
-        # sed -i "s/^max_out_len.*/max_out_len: 1024/g" configs/transformer.big.yaml
+        sed -i "s/^max_out_len.*/max_out_len: 256/g" configs/transformer.base.yaml
+        sed -i "s/^max_out_len.*/max_out_len: 1024/g" configs/transformer.big.yaml
 
-        # sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.base.yaml
-        # sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.base.yaml
-        # sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.base.yaml
+        sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.base.yaml
+        sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.base.yaml
+        sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.base.yaml
 
-        # sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.big.yaml
-        # sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.big.yaml
-        # sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.big.yaml
+        sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.big.yaml
+        sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.big.yaml
+        sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.big.yaml
 
         # Whole data set prepared. 
         if [ ! -f WMT14.en-de.tar.gz ]; then
@@ -154,16 +154,16 @@ elif [ ${MODE} = "lite_train_whole_infer" ];then
 
     if [[ ${model_name} =~ transformer* ]]; then
         cd ../examples/machine_translation/transformer/
-        # sed -i "s/^max_out_len.*/max_out_len: 256/g" configs/transformer.base.yaml
-        # sed -i "s/^max_out_len.*/max_out_len: 1024/g" configs/transformer.big.yaml
+        sed -i "s/^max_out_len.*/max_out_len: 256/g" configs/transformer.base.yaml
+        sed -i "s/^max_out_len.*/max_out_len: 1024/g" configs/transformer.big.yaml
 
-        # sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.base.yaml
-        # sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.base.yaml
-        # sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.base.yaml
+        sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.base.yaml
+        sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.base.yaml
+        sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.base.yaml
 
-        # sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.big.yaml
-        # sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.big.yaml
-        # sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.big.yaml
+        sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.big.yaml
+        sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.big.yaml
+        sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.big.yaml
 
         # Trained transformer base model checkpoint. 
         # For infer. 
@@ -230,16 +230,16 @@ elif [ ${MODE} = "whole_infer" ];then
 
     if [[ ${model_name} =~ transformer* ]]; then
         cd ../examples/machine_translation/transformer/
-        # sed -i "s/^max_out_len.*/max_out_len: 256/g" configs/transformer.base.yaml
-        # sed -i "s/^max_out_len.*/max_out_len: 1024/g" configs/transformer.big.yaml
+        sed -i "s/^max_out_len.*/max_out_len: 256/g" configs/transformer.base.yaml
+        sed -i "s/^max_out_len.*/max_out_len: 1024/g" configs/transformer.big.yaml
 
-        # sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.base.yaml
-        # sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.base.yaml
-        # sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.base.yaml
+        sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.base.yaml
+        sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.base.yaml
+        sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.base.yaml
 
-        # sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.big.yaml
-        # sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.big.yaml
-        # sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.big.yaml
+        sed -i "s/^random_seed:.*/random_seed: None/g" configs/transformer.big.yaml
+        sed -i "s/^shuffle_batch:.*/shuffle_batch: True/g" configs/transformer.big.yaml
+        sed -i "s/^shuffle:.*/shuffle: True/g" configs/transformer.big.yaml
 
         # Trained transformer base model checkpoint. 
         if [ ! -f transformer-base-wmt_ende_bpe.tar.gz ]; then
@@ -269,4 +269,96 @@ elif [ ${MODE} = "whole_infer" ];then
         ln -s WMT14.en-de/wmt14_ende_data_bpe/newstest2014.tok.bpe.33708.de test.de
         cd -
     fi
+elif [ ${MODE} = "benchmark_train" ];then
+    if [ ${model_name} == "bigru_crf" ]; then
+        rm -rf ./data/lexical_analysis_dataset_tiny ./data/lexical_analysis_dataset_tiny.tar.gz
+        wget -nc -P ./data/ https://bj.bcebos.com/paddlenlp/datasets/lexical_analysis_dataset_tiny.tar.gz --no-check-certificate
+        cd ./data/ && tar xfz lexical_analysis_dataset_tiny.tar.gz && cd .. 
+    fi
+
+    if [[ ${model_name} =~ bert* ]]; then
+        rm -rf ./data/wikicorpus_en_seqlen128/ wikicorpus_en_seqlen128.tar wikicorpus_en_seqlen512 hdf5_lower_case_1_seq_len_512_max_pred_80_masked_lm_prob_0.15_random_seed_12345_dupe_factor_5/ hdf5_lower_case_1_seq_len_512_max_pred_80_masked_lm_prob_0.15_random_seed_12345_dupe_factor_5.tar
+        wget -nc -P ./data/ https://bj.bcebos.com/paddlenlp/datasets/benchmark_wikicorpus_en_seqlen128.tar --no-check-certificate
+        wget -nc -P ./data/ https://bj.bcebos.com/paddlenlp/datasets/benchmark_hdf5_lower_case_1_seq_len_512_max_pred_80_masked_lm_prob_0.15_random_seed_12345_dupe_factor_5.tar --no-check-certificate
+
+        cd ./data/
+        tar -xf benchmark_wikicorpus_en_seqlen128.tar
+        tar -xf benchmark_hdf5_lower_case_1_seq_len_512_max_pred_80_masked_lm_prob_0.15_random_seed_12345_dupe_factor_5.tar
+
+        ln -s hdf5_lower_case_1_seq_len_512_max_pred_80_masked_lm_prob_0.15_random_seed_12345_dupe_factor_5/wikicorpus_en_seqlen512/ wikicorpus_en_seqlen512
+
+        cd ..
+    fi
+
+    if [[ ${model_name} =~ gpt* ]]; then
+        run_env=$BENCHMARK_ROOT/run_env
+
+        rm -rf $run_env
+        mkdir $run_env
+
+        echo `which python`
+        ln -s $(which python)m-config  $run_env/python3-config
+        ln -s $(which python)m-config  $run_env/python-config
+        ln -s $(which python) $run_env/python3
+
+        export PATH=$run_env:${PATH}
+
+        mkdir -p data && cd data
+        wget https://bj.bcebos.com/paddlenlp/models/transformers/gpt/data/gpt_en_dataset_300m_ids.npy -o .tmp
+        wget https://bj.bcebos.com/paddlenlp/models/transformers/gpt/data/gpt_en_dataset_300m_idx.npz -o .tmp
+        cd -
+    fi
+
+    if [[ ${model_name} =~ transformer* ]]; then
+        cd ../examples/machine_translation/transformer/
+
+        git checkout .
+
+        # Data set prepared. 
+        if [ ! -f WMT14.en-de.partial.tar.gz ]; then
+            wget https://bj.bcebos.com/paddlenlp/datasets/WMT14.en-de.partial.tar.gz
+            tar -zxf WMT14.en-de.partial.tar.gz
+        fi
+        # Set soft link.
+        if [ -f train.en ]; then
+            rm -f train.en
+        fi
+        if [ -f train.de ]; then
+            rm -f train.de
+        fi
+        if [ -f dev.en ]; then
+            rm -f dev.en
+        fi
+        if [ -f dev.de ]; then
+            rm -f dev.de
+        fi
+        if [ -f test.en ]; then
+            rm -f test.en
+        fi
+        if [ -f test.de ]; then
+            rm -f test.de
+        fi
+        rm -f vocab_all.bpe.33712
+        rm -f vocab_all.bpe.33708
+        # Vocab
+        cp -f WMT14.en-de.partial/wmt14_ende_data_bpe/vocab_all.bpe.33712 ./
+        cp -f WMT14.en-de.partial/wmt14_ende_data_bpe/vocab_all.bpe.33708 ./
+        # Train
+        ln -s WMT14.en-de.partial/wmt14_ende_data_bpe/train.tok.clean.bpe.en train.en
+        ln -s WMT14.en-de.partial/wmt14_ende_data_bpe/train.tok.clean.bpe.de train.de
+        # Dev
+        ln -s WMT14.en-de.partial/wmt14_ende_data_bpe/dev.tok.bpe.en dev.en
+        ln -s WMT14.en-de.partial/wmt14_ende_data_bpe/dev.tok.bpe.de dev.de
+        #Test
+        ln -s WMT14.en-de.partial/wmt14_ende_data_bpe/test.tok.bpe.en test.en
+        ln -s WMT14.en-de.partial/wmt14_ende_data_bpe/test.tok.bpe.de test.de
+        cd -
+    fi
+
+    export PYTHONPATH=$(dirname "$PWD"):$PYTHONPATH
+    python -m pip install --upgrade pip
+    python -m pip install -r ../requirements.txt -i https://mirror.baidu.com/pypi/simple
+    python -m pip install pybind11 regex sentencepiece tqdm visualdl attrdict pyyaml -i https://mirror.baidu.com/pypi/simple
+    python -m pip install -e ..
+
 fi

Original file line number	Diff line number	Diff line change
`@@ -263,7 +263,7 @@ def do_train(args):`
`263`	`263`	`train_reader_cost + train_run_cost)`
`264`	`264`	`avg_reader_cost = train_reader_cost / args.logging_freq`
`265`	`265`	`logger.info(`
`266`		`- "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f step/s, ips: %.0f tokens/s, ips_per_card: %.0f tokens/s, learning rate: %.5e"`
	`266`	`+ "global step %d, epoch: %d, batch: %d, loss: %.9f, avg_reader_cost: %.5f sec, avg_batch_cost: %.5f sec, speed: %.2f step/s, ips_total: %.0f tokens/s, ips: %.0f tokens/s, learning rate: %.5e"`
`267`	`267`	`%`
`268`	`268`	`(global_step, epoch, step, loss_numpy, avg_reader_cost,`
`269`	`269`	`1. / speed, speed, speed * default_global_tokens_num,`