wangxicoding
diff --git a/‎examples/language_model/gpt/tests/acc_dp_dygraph.sh‎ renamed to ‎tests/examples/gpt/acc_dp_dygraph.sh‎
Lines changed: 7 additions & 6 deletions b/‎examples/language_model/gpt/tests/acc_dp_dygraph.sh‎ renamed to ‎tests/examples/gpt/acc_dp_dygraph.sh‎
Lines changed: 7 additions & 6 deletions
diff --git a/‎examples/language_model/gpt/tests/acc_dp_static.sh‎ renamed to ‎tests/examples/gpt/acc_dp_static.sh‎
Lines changed: 7 additions & 7 deletions b/‎examples/language_model/gpt/tests/acc_dp_static.sh‎ renamed to ‎tests/examples/gpt/acc_dp_static.sh‎
Lines changed: 7 additions & 7 deletions
diff --git a/‎examples/language_model/gpt/tests/acc_mp_static.sh‎ renamed to ‎tests/examples/gpt/acc_mp_static.sh‎
Lines changed: 8 additions & 6 deletions b/‎examples/language_model/gpt/tests/acc_mp_static.sh‎ renamed to ‎tests/examples/gpt/acc_mp_static.sh‎
Lines changed: 8 additions & 6 deletions
diff --git a/‎examples/language_model/gpt/tests/acc_sharding_static.sh‎ renamed to ‎tests/examples/gpt/acc_sharding_static.sh‎
Lines changed: 7 additions & 7 deletions b/‎examples/language_model/gpt/tests/acc_sharding_static.sh‎ renamed to ‎tests/examples/gpt/acc_sharding_static.sh‎
Lines changed: 7 additions & 7 deletions
diff --git a/‎examples/language_model/gpt/tests/acc_single_dygraph.sh‎ renamed to ‎tests/examples/gpt/acc_single_dygraph.sh‎
Lines changed: 7 additions & 6 deletions b/‎examples/language_model/gpt/tests/acc_single_dygraph.sh‎ renamed to ‎tests/examples/gpt/acc_single_dygraph.sh‎
Lines changed: 7 additions & 6 deletions
diff --git a/‎examples/language_model/gpt/tests/acc_single_static.sh‎ renamed to ‎tests/examples/gpt/acc_single_static.sh‎
Lines changed: 7 additions & 6 deletions b/‎examples/language_model/gpt/tests/acc_single_static.sh‎ renamed to ‎tests/examples/gpt/acc_single_static.sh‎
Lines changed: 7 additions & 6 deletions
diff --git a/‎examples/language_model/gpt/tests/benchmark_mp_sharding_static.sh‎ renamed to ‎tests/examples/gpt/benchmark_mp_sharding_static.sh‎ b/‎examples/language_model/gpt/tests/benchmark_mp_sharding_static.sh‎ renamed to ‎tests/examples/gpt/benchmark_mp_sharding_static.sh‎
diff --git a/‎examples/language_model/gpt/tests/benchmark_mp_static.sh‎ renamed to ‎tests/examples/gpt/benchmark_mp_static.sh‎ b/‎examples/language_model/gpt/tests/benchmark_mp_static.sh‎ renamed to ‎tests/examples/gpt/benchmark_mp_static.sh‎
diff --git a/‎examples/language_model/gpt/tests/benchmark_sharding_static.sh‎ renamed to ‎tests/examples/gpt/benchmark_sharding_static.sh‎ b/‎examples/language_model/gpt/tests/benchmark_sharding_static.sh‎ renamed to ‎tests/examples/gpt/benchmark_sharding_static.sh‎
diff --git a/‎examples/language_model/gpt/tests/benchmark_single_static.sh‎ renamed to ‎tests/examples/gpt/benchmark_single_static.sh‎ b/‎examples/language_model/gpt/tests/benchmark_single_static.sh‎ renamed to ‎tests/examples/gpt/benchmark_single_static.sh‎
@@ -1,16 +1,17 @@
 set -x
 
 task_name="gpt-acc-dp-dygraph"
-rm -rf output/$task_name/log
+base_out="tests/output"
+rm -rf $base_out/$task_name/log
 
 unset CUDA_VISIBLE_DEVICES
-PYTHONPATH=../../../../ python -m paddle.distributed.launch \
+PYTHONPATH=../../../ python -m paddle.distributed.launch \
     --gpus "0,1" \
-    --log_dir "output/$task_name/log"  ../run_pretrain.py \
+    --log_dir "$base_out/$task_name/log"  run_pretrain.py \
     --model_type "gpt" \
-    --model_name_or_path "../ckpt/gpt2-small-en-init-checkpoint"\
-    --input_dir "../data"\
-    --output_dir "output/$task_name"\
+    --model_name_or_path "./ckpt/gpt2-small-en-init-checkpoint"\
+    --input_dir "./data"\
+    --output_dir "$base_out/$task_name"\
     --max_seq_len 1024 \
     --micro_batch_size 4\
     --max_lr 0.00015\
 
@@ -1,7 +1,6 @@
 set -x
 export PADDLE_WITH_GLOO=0
 export FLAGS_call_stack_level=2
-#export FLAGS_allocator_strategy=naive_best_fit
 export GLOG_v=-1
 unset CUDA_VISIBLE_DEVICES
 
@@ -11,15 +10,16 @@ rm -rf start_sharding*
 rm -rf main_sharding*
 
 task_name="gpt-acc-dp-static"
-rm -rf output/$task_name/log
+base_out="tests/output"
+rm -rf $base_out/$task_name/log
 
-PYTHONPATH=../../../../ python -u  -m paddle.distributed.fleet.launch \
+PYTHONPATH=../../../ python -u  -m paddle.distributed.launch \
     --gpus "0,1" \
-    --log_dir "output/$task_name/log" ../run_pretrain_static.py \
+    --log_dir "$base_out/$task_name/log" run_pretrain_static.py \
     --model_type "gpt" \
-    --model_name_or_path "../ckpt/gpt2-small-en-init-checkpoint"\
-    --input_dir "../data" \
-    --output_dir "output/$task_name" \
+    --model_name_or_path "./ckpt/gpt2-small-en-init-checkpoint"\
+    --input_dir "./data" \
+    --output_dir "$base_out/$task_name" \
     --max_seq_len 1024 \
     --micro_batch_size 4 \
     --global_batch_size 8 \
 
@@ -10,15 +10,17 @@ rm -rf start_sharding*
 rm -rf main_sharding*
 
 task_name="gpt-acc-mp-static"
-rm -rf output/$task_name/log
+base_out="tests/output"
+rm -rf $base_out/$task_name/log
 
-PYTHONPATH=../../../../ python -u  -m paddle.distributed.fleet.launch \
+
+PYTHONPATH=../../../ python -u  -m paddle.distributed.launch \
     --gpus "0,1" \
-    --log_dir "output/$task_name/log" ../run_pretrain_static.py \
+    --log_dir "$base_out/$task_name/log" run_pretrain_static.py \
     --model_type "gpt" \
-    --model_name_or_path "../ckpt/gpt2-small-en-init-checkpoint"\
-    --input_dir "../data" \
-    --output_dir "output/$task_name" \
+    --model_name_or_path "./ckpt/gpt2-small-en-init-checkpoint"\
+    --input_dir "./data" \
+    --output_dir "$base_out/$task_name" \
     --max_seq_len 1024 \
     --micro_batch_size 8 \
     --global_batch_size 8\
 
@@ -1,7 +1,6 @@
 set -x
 export PADDLE_WITH_GLOO=0
 export FLAGS_call_stack_level=2
-#export FLAGS_allocator_strategy=naive_best_fit
 export GLOG_v=-1
 unset CUDA_VISIBLE_DEVICES
 
@@ -11,15 +10,16 @@ rm -rf start_sharding*
 rm -rf main_sharding*
 
 task_name="gpt-acc-sharding-static"
-rm -rf output/$task_name/log
+base_out="tests/output"
+rm -rf $base_out/$task_name/log
 
-PYTHONPATH=../../../../ python -u  -m paddle.distributed.fleet.launch \
+PYTHONPATH=../../../ python -u  -m paddle.distributed.launch \
     --gpus "0,1" \
-    --log_dir "output/$task_name/log" ../run_pretrain_static.py \
+    --log_dir "$base_out/$task_name/log" run_pretrain_static.py \
     --model_type "gpt" \
-    --model_name_or_path "../ckpt/gpt2-small-en-init-checkpoint"\
-    --input_dir "../data" \
-    --output_dir "output/$task_name" \
+    --model_name_or_path "./ckpt/gpt2-small-en-init-checkpoint"\
+    --input_dir "./data" \
+    --output_dir "$base_out/$task_name" \
     --max_seq_len 1024 \
     --micro_batch_size 4 \
     --global_batch_size 8 \
 
@@ -1,16 +1,17 @@
 set -x
 
 task_name="gpt-acc-single-dygraph"
-rm -rf output/$task_name/log
+base_out="tests/output"
+rm -rf $base_out/$task_name/log
 
 unset CUDA_VISIBLE_DEVICES
-PYTHONPATH=../../../../ python -m paddle.distributed.launch \
+PYTHONPATH=../../../ python -m paddle.distributed.launch \
     --gpus "0" \
-    --log_dir "output/$task_name/log"  ../run_pretrain.py \
+    --log_dir "$base_out/$task_name/log"  run_pretrain.py \
     --model_type "gpt" \
-    --model_name_or_path "../ckpt/gpt2-small-en-init-checkpoint"\
-    --input_dir "../data"\
-    --output_dir "output/$task_name"\
+    --model_name_or_path "./ckpt/gpt2-small-en-init-checkpoint"\
+    --input_dir "./data"\
+    --output_dir "$base_out/$task_name"\
     --max_seq_len 1024 \
     --micro_batch_size 8\
     --max_lr 0.00015\
 
@@ -10,15 +10,16 @@ rm -rf start_sharding*
 rm -rf main_sharding*
 
 task_name="gpt-acc-single-static"
-rm -rf output/$task_name/log
+base_out="tests/output"
+rm -rf $base_out/$task_name/log
 
-PYTHONPATH=../../../../ python -u  -m paddle.distributed.fleet.launch \
+PYTHONPATH=../../../ python -u  -m paddle.distributed.launch \
     --gpus "0" \
-    --log_dir "output/$task_name/log" ../run_pretrain_static.py \
+    --log_dir "$base_out/$task_name/log" run_pretrain_static.py \
     --model_type "gpt" \
-    --model_name_or_path "../ckpt/gpt2-small-en-init-checkpoint"\
-    --input_dir "../data" \
-    --output_dir "output/$task_name" \
+    --model_name_or_path "./ckpt/gpt2-small-en-init-checkpoint"\
+    --input_dir "./data" \
+    --output_dir "$base_out/$task_name" \
     --max_seq_len 1024 \
     --micro_batch_size 8 \
     --global_batch_size 8\