GitGyun
diff --git a/‎.gitignore‎
Lines changed: 1 addition & 0 deletions b/‎.gitignore‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎args.py‎
Lines changed: 85 additions & 81 deletions b/‎args.py‎
Lines changed: 85 additions & 81 deletions
diff --git a/‎configs/finetune_config.yaml‎
Lines changed: 43 additions & 0 deletions b/‎configs/finetune_config.yaml‎
Lines changed: 43 additions & 0 deletions
diff --git a/‎configs/test_config.yaml‎
Lines changed: 25 additions & 0 deletions b/‎configs/test_config.yaml‎
Lines changed: 25 additions & 0 deletions
diff --git a/‎configs/train_config.yaml‎
Lines changed: 59 additions & 0 deletions b/‎configs/train_config.yaml‎
Lines changed: 59 additions & 0 deletions
@@ -3,3 +3,4 @@ experiments*
 model/pretrained_checkpoints*
 support_data.pth
 data_paths.yaml
+*ipynb*
@@ -1,5 +1,8 @@
 import argparse
 import yaml
+from easydict import EasyDict
+
+from dataset.taskonomy_constants import TASKS_GROUP_NAMES, TASKS_GROUP_TEST
 
 
 def str2bool(v):
@@ -14,109 +17,110 @@ def str2bool(v):
 # argument parser
 parser = argparse.ArgumentParser()
 
-# environment arguments
-parser.add_argument('--seed', type=int, default=0)
-parser.add_argument('--precision', '-prc', type=str, default='bf16', choices=['fp32', 'fp16', 'bf16']) 
-parser.add_argument('--strategy', '-str', type=str, default='ddp', choices=['none', 'ddp']) 
+# necessary arguments
 parser.add_argument('--debug_mode', '-debug', default=False, action='store_true')
 parser.add_argument('--continue_mode', '-cont', default=False, action='store_true')
 parser.add_argument('--skip_mode', '-skip', default=False, action='store_true')
 parser.add_argument('--no_eval', '-ne', default=False, action='store_true')
 parser.add_argument('--no_save', '-ns', default=False, action='store_true')
 parser.add_argument('--reset_mode', '-reset', default=False, action='store_true')
-parser.add_argument('--profile_mode', '-prof', default=False, action='store_true')
-parser.add_argument('--sanity_check', '-sc', default=False, action='store_true')
-
-# data arguments
-parser.add_argument('--dataset', type=str, default='taskonomy', choices=['taskonomy'])
-parser.add_argument('--task', type=str, default='', choices=['', 'all'])
-parser.add_argument('--task_fold', '-fold', type=int, default=0, choices=[0, 1, 2, 3, 4]) 
-
-parser.add_argument('--num_workers', '-nw', type=int, default=8)
-parser.add_argument('--global_batch_size', '-gbs', type=int, default=8)
-parser.add_argument('--max_channels', '-mc', type=int, default=5)
-parser.add_argument('--shot', type=int, default=4)
-parser.add_argument('--domains_per_batch', '-dpb', type=int, default=2)
-parser.add_argument('--eval_batch_size', '-ebs', type=int, default=8)
-parser.add_argument('--n_eval_batches', '-neb', type=int, default=10)
-
-parser.add_argument('--img_size', type=int, default=224, choices=[224])
-parser.add_argument('--image_augmentation', '-ia', type=str2bool, default=True)
-parser.add_argument('--unary_augmentation', '-ua', type=str2bool, default=True)
-parser.add_argument('--binary_augmentation', '-ba', type=str2bool, default=True)
-parser.add_argument('--mixed_augmentation', '-ma', type=str2bool, default=True)
-
-# model arguments
-parser.add_argument('--model', type=str, default='VTM', choices=['VTM'])
-parser.add_argument('--image_backbone', '-ib', type=str, default='beit_base_patch16_224_in22k')
-parser.add_argument('--label_backbone', '-lb', type=str, default='vit_base_patch16_224')
-parser.add_argument('--image_encoder_weights', '-iew', type=str, default='imagenet', choices=['none', 'imagenet'])
-parser.add_argument('--label_encoder_weights', '-lew', type=str, default='none', choices=['none', 'imagenet'])
-parser.add_argument('--n_attn_heads', '-nah', type=int, default=4)
-parser.add_argument('--n_attn_layers', '-nal', type=int, default=1)
-parser.add_argument('--attn_residual', '-ar', type=str2bool, default=True)
-parser.add_argument('--out_activation', '-oa', type=str, default='sigmoid', choices=['sigmoid', 'clip', 'none'])
-parser.add_argument('--drop_rate', '-dr', type=float, default=0.0)
-parser.add_argument('--drop_path_rate', '-dpr', type=float, default=0.1)
-parser.add_argument('--bitfit', '-bf', type=str2bool, default=True)
-parser.add_argument('--semseg_threshold', '-th', type=float, default=0.2)
-
-# training arguments
-parser.add_argument('--n_steps', '-nst', type=int, default=300000)
-parser.add_argument('--optimizer', '-opt', type=str, default='adam', choices=['sgd', 'adam', 'adamw', 'fadam', 'dsadam'])
-parser.add_argument('--lr', type=float, default=1e-4)
-parser.add_argument('--lr_pretrained', '-lrp', type=float, default=1e-5)
-parser.add_argument('--lr_schedule', '-lrs', type=str, default='poly', choices=['constant', 'sqroot', 'cos', 'poly'])
-parser.add_argument('--lr_warmup', '-lrw', type=int, default=5000)
-parser.add_argument('--lr_warmup_scale', '-lrws', type=float, default=0.)
-parser.add_argument('--weight_decay', '-wd', type=float, default=0.)
-parser.add_argument('--lr_decay_degree', '-ldd', type=float, default=0.9)
-parser.add_argument('--temperature', '-temp', type=float, default=-1.)
-parser.add_argument('--reg_coef', '-rgc', type=float, default=1.)
-parser.add_argument('--mask_value', '-mv', type=float, default=-1.)
-
-# logging arguments
-parser.add_argument('--log_dir', type=str, default='TRAIN')
-parser.add_argument('--save_dir', type=str, default='')
-parser.add_argument('--load_dir', type=str, default='')
+
+parser.add_argument('--stage', type=int, default=0, choices=[0, 1, 2])
+parser.add_argument('--task', type=str, default='', choices=['', 'all'] + TASKS_GROUP_NAMES)
+parser.add_argument('--task_fold', '-fold', type=int, default=None, choices=[0, 1, 2, 3, 4])
 parser.add_argument('--exp_name', type=str, default='')
+parser.add_argument('--exp_subname', type=str, default='')
 parser.add_argument('--name_postfix', '-ptf', type=str, default='')
-parser.add_argument('--log_iter', '-li', type=int, default=100)
-parser.add_argument('--val_iter', '-vi', type=int, default=10000)
-parser.add_argument('--save_iter', '-si', type=int, default=10000)
+parser.add_argument('--save_postfix', '-sptf', type=str, default='')
+parser.add_argument('--result_postfix', '-rptf', type=str, default='')
 parser.add_argument('--load_step', '-ls', type=int, default=-1)
 
-config = parser.parse_args()
+# optional arguments
+parser.add_argument('--model', type=str, default=None, choices=['VTM'])
+parser.add_argument('--seed', type=int, default=None)
+parser.add_argument('--strategy', '-str', type=str, default=None)
+parser.add_argument('--num_workers', '-nw', type=int, default=None)
+parser.add_argument('--global_batch_size', '-gbs', type=int, default=None)
+parser.add_argument('--eval_batch_size', '-ebs', type=int, default=None)
+parser.add_argument('--n_eval_batches', '-neb', type=int, default=None)
+parser.add_argument('--shot', type=int, default=None)
+parser.add_argument('--max_channels', '-mc', type=int, default=None)
+parser.add_argument('--support_idx', '-sid', type=int, default=None)
+parser.add_argument('--channel_idx', '-cid', type=int, default=None)
+parser.add_argument('--test_split', '-split', type=str, default=None)
+parser.add_argument('--semseg_threshold', '-sth', type=float, default=None)
+
+parser.add_argument('--image_augmentation', '-ia', type=str2bool, default=None)
+parser.add_argument('--unary_augmentation', '-ua', type=str2bool, default=None)
+parser.add_argument('--binary_augmentation', '-ba', type=str2bool, default=None)
+parser.add_argument('--mixed_augmentation', '-ma', type=str2bool, default=None)
+parser.add_argument('--image_backbone', '-ib', type=str, default=None)
+parser.add_argument('--label_backbone', '-lb', type=str, default=None)
+parser.add_argument('--n_attn_heads', '-nah', type=int, default=None)
+
+parser.add_argument('--n_steps', '-nst', type=int, default=None)
+parser.add_argument('--optimizer', '-opt', type=str, default=None, choices=['sgd', 'adam', 'adamw'])
+parser.add_argument('--lr', type=float, default=None)
+parser.add_argument('--lr_pretrained', '-lrp', type=float, default=None)
+parser.add_argument('--lr_schedule', '-lrs', type=str, default=None, choices=['constant', 'sqroot', 'cos', 'poly'])
+parser.add_argument('--early_stopping_patience', '-esp', type=int, default=None)
+
+parser.add_argument('--log_dir', type=str, default=None)
+parser.add_argument('--save_dir', type=str, default=None)
+parser.add_argument('--load_dir', type=str, default=None)
+parser.add_argument('--val_iter', '-viter', type=int, default=None)
+parser.add_argument('--save_iter', '-siter', type=int, default=None)
+
+args = parser.parse_args()
 
 
+# load config file
+if args.stage == 0:
+    config_path = 'configs/train_config.yaml'
+elif args.stage == 1:
+    config_path = 'configs/finetune_config.yaml'
+elif args.stage == 2:
+    config_path = 'configs/test_config.yaml'
+
+with open(config_path, 'r') as f:
+    config = yaml.safe_load(f)
+    config = EasyDict(config)
+
+# copy parsed arguments
+for key in args.__dir__():
+    if key[:2] != '__' and getattr(args, key) is not None:
+        setattr(config, key, getattr(args, key))
+
 # retrieve data root
 with open('data_paths.yaml', 'r') as f:
     path_dict = yaml.safe_load(f)
     config.root_dir = path_dict[config.dataset]
-if config.save_dir == '':
-    config.save_dir = config.log_dir
-if config.load_dir == '':
-    config.load_dir = config.log_dir
 
 # for debugging
 if config.debug_mode:
     config.n_steps = 10
     config.log_iter = 1
     config.val_iter = 5
     config.save_iter = 5
-    config.n_eval_batches = 4
+    if config.stage == 2:
+        config.n_eval_batches = 2
     config.log_dir += '_debugging'
-    config.save_dir += '_debugging'
-    config.load_dir += '_debugging'
-    
+    if config.stage == 0:
+        config.load_dir += '_debugging'
+    if config.stage <= 1:
+        config.save_dir += '_debugging'
 
-# model-specific hyper-parameters
-config.n_levels = 4
-    
-# adjust backbone names
-if config.image_backbone in ['beit_base', 'beit_large']:
-    config.image_backbone += '_patch16_224_in22k'
-if config.image_backbone in ['vit_tiny', 'vit_small', 'vit_base', 'vit_large']:
-    config.image_backbone += '_patch16_224'
-if config.label_backbone in ['vit_tiny', 'vit_small', 'vit_base', 'vit_large']:
-    config.label_backbone += '_patch16_224'
+# create experiment name
+if config.exp_name == '':
+    if config.stage == 0:
+        if config.task == '':
+            config.exp_name = f'{config.model}_fold:{config.task_fold}{config.name_postfix}'
+        else:
+            config.exp_name = f'{config.model}_task:{config.task}{config.name_postfix}'
+    else:
+        fold_dict = {}
+        for fold in TASKS_GROUP_TEST:
+            for task in TASKS_GROUP_TEST[fold]:
+                fold_dict[task] = fold
+        task_fold = fold_dict[config.task]
+        config.exp_name = f'{config.model}_fold:{task_fold}{config.name_postfix}'
@@ -0,0 +1,43 @@
+# environment settings
+seed: 0
+precision: bf16
+strategy: ddp
+
+# data arguments
+dataset: taskonomy
+num_workers: 4
+global_batch_size: 1
+shot: 10
+eval_batch_size: 5
+n_eval_batches: 2
+img_size: 224
+support_idx: 0
+channel_idx: -1
+
+# model arguments
+model: VTM
+semseg_threshold: 0.2
+attn_dropout: 0.5
+
+# training arguments
+n_steps: 20000
+n_schedule_steps: 20000
+optimizer: adam
+lr: 0.005
+lr_schedule: constant 
+lr_warmup: 0
+lr_warmup_scale: 0.
+schedule_from: 0
+weight_decay: 0.
+lr_decay_degree: 0.9
+mask_value: -1.
+early_stopping_patience: 5
+
+# logging arguments
+log_dir: FINETUNE
+save_dir: FINETUNE
+load_dir: TRAIN
+log_iter: 100
+val_iter: 100
+save_iter: 100
+load_step: 0
@@ -0,0 +1,25 @@
+# environment settings
+seed: 0
+precision: bf16
+strategy: ddp
+
+# data arguments
+dataset: taskonomy
+test_split: muleshoe
+num_workers: 4
+shot: 10
+eval_batch_size: 8
+n_eval_batches: -1
+img_size: 224
+support_idx: 0
+channel_idx: -1
+
+# model arguments
+model: VTM
+semseg_threshold: 0.2
+
+# logging arguments
+log_dir: TEST
+save_dir: FINETUNE
+load_dir: TRAIN
+load_step: 0
@@ -0,0 +1,59 @@
+# environment settings
+seed: 0
+precision: bf16
+strategy: ddp
+
+# data arguments
+dataset: taskonomy
+task_fold: 0
+num_workers: 4
+global_batch_size: 8
+max_channels: 5
+shot: 4
+n_buildings: -1
+domains_per_batch: 2
+eval_batch_size: 8
+n_eval_batches: 10
+img_size: 224
+image_augmentation: True
+unary_augmentation: True
+binary_augmentation: True
+mixed_augmentation: True
+channel_idx: -1
+
+# model arguments
+model: VTM
+image_backbone: beit_base_patch16_224_in22k
+label_backbone: vit_base_patch16_224
+image_encoder_weights: imagenet
+drop_rate: 0.
+drop_path_rate: 0.1
+attn_drop_rate: 0.
+n_attn_heads: 4
+semseg_threshold: 0.2
+channel_idx: -1
+n_levels: 4
+bitfit: True
+
+# training arguments
+n_steps: 300000
+optimizer: adam
+lr: 0.0001
+lr_pretrained: 0.00001
+lr_schedule: poly
+lr_warmup: 5000
+lr_warmup_scale: 0.
+schedule_from: 0
+weight_decay: 0.
+lr_decay_degree: 0.9
+mask_value: -1.
+early_stopping_patience: -1
+
+# logging arguments
+log_dir: TRAIN
+save_dir: TRAIN
+load_dir: TRAIN
+log_iter: 100
+val_iter: 20000
+save_iter: 20000
+load_step: -1