EnVision-Research
diff --git a/‎accelerate_configs/01234567.yaml‎
Lines changed: 16 additions & 0 deletions b/‎accelerate_configs/01234567.yaml‎
Lines changed: 16 additions & 0 deletions
diff --git a/‎datasets/quick_validation/00.png‎
904 KB b/‎datasets/quick_validation/00.png‎
904 KB
diff --git a/‎datasets/quick_validation/01.jpg‎
80.9 KB b/‎datasets/quick_validation/01.jpg‎
80.9 KB
diff --git a/‎datasets/quick_validation/02.jpg‎
55.5 KB b/‎datasets/quick_validation/02.jpg‎
55.5 KB
diff --git a/‎datasets/quick_validation/03.jpg‎
285 KB b/‎datasets/quick_validation/03.jpg‎
285 KB
diff --git a/‎datasets/quick_validation/04.jpg‎
59 KB b/‎datasets/quick_validation/04.jpg‎
59 KB
diff --git a/‎train_lotus_d.py‎
Lines changed: 1150 additions & 0 deletions b/‎train_lotus_d.py‎
Lines changed: 1150 additions & 0 deletions
diff --git a/‎train_lotus_g.py‎
Lines changed: 1201 additions & 0 deletions b/‎train_lotus_g.py‎
Lines changed: 1201 additions & 0 deletions
diff --git a/‎train_scripts/train_lotus_d_depth.sh‎
Lines changed: 59 additions & 0 deletions b/‎train_scripts/train_lotus_d_depth.sh‎
Lines changed: 59 additions & 0 deletions
diff --git a/‎train_scripts/train_lotus_d_normal.sh‎
Lines changed: 58 additions & 0 deletions b/‎train_scripts/train_lotus_d_normal.sh‎
Lines changed: 58 additions & 0 deletions
@@ -0,0 +1,16 @@
+compute_environment: LOCAL_MACHINE
+debug: false
+distributed_type: MULTI_GPU
+downcast_bf16: 'no'
+gpu_ids: '0,1,2,3,4,5,6,7'
+machine_rank: 0
+main_training_function: main
+mixed_precision: 'no'
+num_machines: 1
+num_processes: 8
+rdzv_backend: static
+same_network: true
+tpu_env: []
+tpu_use_cluster: false
+tpu_use_sudo: false
+use_cpu: false
@@ -0,0 +1,59 @@
+# export PYTHONPATH="$(dirname "$(dirname "$0")"):$PYTHONPATH"
+
+export MODEL_NAME="stabilityai/stable-diffusion-2-base"
+
+# training dataset
+export TRAIN_DATA_DIR_HYPERSIM=$PATH_TO_HYPERSIM_DATA
+export TRAIN_DATA_DIR_VKITTI=$PATH_TO_VKITTI_DATA
+export RES_HYPERSIM=576
+export RES_VKITTI=375
+export P_HYPERSIM=0.9
+export NORMTYPE="trunc_disparity"
+
+# training configs
+export BATCH_SIZE=16
+export CUDA=01234567
+export GAS=1
+export TOTAL_BSZ=$(($BATCH_SIZE * ${#CUDA} * $GAS))
+
+# model configs
+export TIMESTEP=999
+export TASK_NAME="depth"
+
+# eval
+export BASE_TEST_DATA_DIR="datasets/eval/"
+export VALIDATION_IMAGES="datasets/quick_validation/"
+export VAL_STEP=500
+
+# output dir
+export OUTPUT_DIR="output/train-lotus-d-${TASK_NAME}-bsz${TOTAL_BSZ}/"
+
+accelerate launch --config_file=accelerate_configs/$CUDA.yaml --mixed_precision="fp16" \
+  --main_process_port="13324" \
+  train_lotus_d.py \
+  --pretrained_model_name_or_path=$MODEL_NAME \
+  --train_data_dir_hypersim=$TRAIN_DATA_DIR_HYPERSIM \
+  --resolution_hypersim=$RES_HYPERSIM \
+  --train_data_dir_vkitti=$TRAIN_DATA_DIR_VKITTI \
+  --resolution_vkitti=$RES_VKITTI \
+  --prob_hypersim=$P_HYPERSIM \
+  --mix_dataset \
+  --random_flip \
+  --norm_type=$NORMTYPE \
+  --dataloader_num_workers=0 \
+  --train_batch_size=$BATCH_SIZE \
+  --gradient_accumulation_steps=$GAS \
+  --gradient_checkpointing \
+  --max_grad_norm=1 \
+  --seed=42 \
+  --max_train_steps=20000 \
+  --learning_rate=3e-05 \
+  --lr_scheduler="constant" --lr_warmup_steps=0 \
+  --task_name=$TASK_NAME \
+  --timestep=$TIMESTEP \
+  --validation_images=$VALIDATION_IMAGES \
+  --validation_steps=$VAL_STEP \
+  --checkpointing_steps=$VAL_STEP \
+  --base_test_data_dir=$BASE_TEST_DATA_DIR \
+  --output_dir=$OUTPUT_DIR \
+  --resume_from_checkpoint="latest"
@@ -0,0 +1,58 @@
+# export PYTHONPATH="$(dirname "$(dirname "$0")"):$PYTHONPATH"
+
+export MODEL_NAME="stabilityai/stable-diffusion-2-base"
+
+# training dataset
+export TRAIN_DATA_DIR_HYPERSIM=$PATH_TO_HYPERSIM_DATA
+export TRAIN_DATA_DIR_VKITTI=$PATH_TO_VKITTI_DATA
+export RES_HYPERSIM=576
+export RES_VKITTI=375
+export P_HYPERSIM=0.9
+
+# training configs
+export BATCH_SIZE=16
+export CUDA=01234567
+export GAS=1
+export TOTAL_BSZ=$(($BATCH_SIZE * ${#CUDA} * $GAS))
+
+# model configs
+export TIMESTEP=999
+export TASK_NAME="normal"
+
+# eval
+export BASE_TEST_DATA_DIR="datasets/eval/"
+export VALIDATION_IMAGES="datasets/quick_validation/"
+export VAL_STEP=500
+
+# output dir
+export OUTPUT_DIR="output/train-lotus-d-${TASK_NAME}-bsz${TOTAL_BSZ}/"
+
+accelerate launch --config_file=accelerate_configs/$CUDA.yaml --mixed_precision="fp16" \
+  --main_process_port="13324" \
+  train_lotus_d.py \
+  --pretrained_model_name_or_path=$MODEL_NAME \
+  --train_data_dir_hypersim=$TRAIN_DATA_DIR_HYPERSIM \
+  --resolution_hypersim=$RES_HYPERSIM \
+  --train_data_dir_vkitti=$TRAIN_DATA_DIR_VKITTI \
+  --resolution_vkitti=$RES_VKITTI \
+  --prob_hypersim=$P_HYPERSIM \
+  --mix_dataset \
+  --random_flip \
+  --align_cam_normal \
+  --dataloader_num_workers=0 \
+  --train_batch_size=$BATCH_SIZE \
+  --gradient_accumulation_steps=$GAS \
+  --gradient_checkpointing \
+  --max_grad_norm=1 \
+  --seed=42 \
+  --max_train_steps=20000 \
+  --learning_rate=3e-05 \
+  --lr_scheduler="constant" --lr_warmup_steps=0 \
+  --task_name=$TASK_NAME \
+  --timestep=$TIMESTEP \
+  --validation_images=$VALIDATION_IMAGES \
+  --validation_steps=$VAL_STEP \
+  --checkpointing_steps=$VAL_STEP \
+  --base_test_data_dir=$BASE_TEST_DATA_DIR \
+  --output_dir=$OUTPUT_DIR \
+  --resume_from_checkpoint="latest"