NUS-HPC-AI-Lab
diff --git a/‎configs/Demo_Hard_Label.yaml‎
Lines changed: 23 additions & 21 deletions b/‎configs/Demo_Hard_Label.yaml‎
Lines changed: 23 additions & 21 deletions
diff --git a/‎configs/Demo_Soft_Label.yaml‎
Lines changed: 27 additions & 27 deletions b/‎configs/Demo_Soft_Label.yaml‎
Lines changed: 27 additions & 27 deletions
diff --git a/‎dd_ranking/config/user_config.py‎
Lines changed: 22 additions & 1 deletion b/‎dd_ranking/config/user_config.py‎
Lines changed: 22 additions & 1 deletion
diff --git a/‎dd_ranking/metrics/__init__.py‎
Lines changed: 3 additions & 3 deletions b/‎dd_ranking/metrics/__init__.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎dd_ranking/metrics/dd_ranking_unified.py‎ ‎dd_ranking/metrics/general.py‎dd_ranking/metrics/dd_ranking_unified.py renamed to dd_ranking/metrics/general.py
Lines changed: 60 additions & 28 deletions b/‎dd_ranking/metrics/dd_ranking_unified.py‎ ‎dd_ranking/metrics/general.py‎dd_ranking/metrics/dd_ranking_unified.py renamed to dd_ranking/metrics/general.py
Lines changed: 60 additions & 28 deletions
@@ -1,34 +1,36 @@
 
 # real data
-dataset: "CIFAR10"
-real_data_path: "./dataset/"
-custom_val_trans: None
+dataset: CIFAR10
+real_data_path: ./dataset/
+custom_val_trans: null
 
 # synthetic data
 ipc: 10
-im_size: (32, 32)
+im_size: [32, 32]
 
 # agent model
-model_name: "ConvNet-3"
-use_torchvision: False
+model_name: ConvNet-3
+use_torchvision: false
 
 # data augmentation
 data_aug_func: "dsa"
-aug_params: {
-  "prob_flip": 0.5, 
-  "ratio_rotate": 15.0, 
-  "saturation": 2.0, 
-  "brightness": 1.0, 
-  "contrast": 0.5, 
-  "ratio_scale": 1.2, 
-  "ratio_crop_pad": 0.125, 
-  "ratio_cutout": 0.5
-}
-use_zca: False
+aug_params:
+  prob_flip: 0.5
+  ratio_rotate: 15.0
+  saturation: 2.0
+  brightness: 1.0
+  contrast: 0.5
+  ratio_scale: 1.2
+  ratio_crop_pad: 0.125
+  ratio_cutout: 0.5
+use_zca: false
+
+custom_train_trans: null
+custom_val_trans: null
 
 # training specifics
-optimizer: "sgd"
-lr_scheduler: "step"
+optimizer: sgd
+lr_scheduler: step
 weight_decay: 0.0005
 momentum: 0.9
 num_eval: 5
@@ -37,7 +39,7 @@ syn_batch_size: 128
 real_batch_size: 256
 default_lr: 0.01
 num_workers: 4
-device: "cuda"
+device: cuda
 
 # save path
-save_path: "./results/my_method_hard_label_scores.csv"
+save_path: ./results/my_method_hard_label_scores.csv
@@ -1,49 +1,49 @@
 # real data
-dataset: "CIFAR10"
-real_data_path: "./dataset/"
-custom_val_trans: None
+dataset: CIFAR10
+real_data_path: ./dataset/
+custom_val_trans: null
 
 # synthetic data
 ipc: 10
-im_size: (32, 32)
+im_size: [32, 32]
 
 # agent model
-model_name: "ConvNet-3"
-stu_use_torchvision: False
-tea_use_torchvision: False
-teacher_dir: "./teacher_models"
+model_name: ConvNet-3
+stu_use_torchvision: false
+tea_use_torchvision: false
+teacher_dir: ./teacher_models
 
-# data augmentation
-data_aug_func: "dsa"
-aug_params: {
-    "prob_flip": 0.5,
-    "ratio_rotate": 15.0,
-    "saturation": 2.0,
-    "brightness": 1.0,
-    "contrast": 0.5,
-    "ratio_scale": 1.2,
-    "ratio_crop_pad": 0.125,
-    "ratio_cutout": 0.5
-}
-use_zca: True
+# syntheticdata augmentation
+data_aug_func: dsa
+aug_params:
+    prob_flip: 0.5
+    ratio_rotate: 15.0
+    saturation: 2.0
+    brightness: 1.0
+    contrast: 0.5
+    ratio_scale: 1.2
+    ratio_crop_pad: 0.125
+    ratio_cutout: 0.5
+use_zca: true
+custom_train_trans: null
 
 # soft label settings
-soft_label_mode: "S"
-soft_label_criterion: "sce"
+soft_label_mode: S
+soft_label_criterion: sce
 temperature: 1.0
 
 # training specifics
-optimizer: "sgd"
-lr_scheduler: "step"
+optimizer: sgd
+lr_scheduler: step
 weight_decay: 0.0005
 momentum: 0.9
 num_eval: 5
 num_epochs: 1000
 default_lr: 0.01
 num_workers: 4
-device: "cuda"
+device: cuda
 syn_batch_size: 128
 real_batch_size: 256
 
 # save path
-save_path: "./results/my_method_soft_label_scores.csv"
+save_path: ./my_method_soft_label_scores.csv
@@ -1,7 +1,7 @@
 import yaml
 import json
 from typing import Dict, Any
-
+from torchvision import transforms
 
 class Config:
     """Configuration object to manage individual configurations."""
@@ -21,9 +21,30 @@ def from_file(cls, filepath: str):
         else:
             raise ValueError("Unsupported file format. Use YAML or JSON.")
         return cls(config)
+    
+    def load_transforms_from_yaml(self, values):
+        if values is None:
+            return None
+        transform_list = [] 
+        for transform in values:
+            name = transform["name"]
+            args = transform.get("args", [])
+            if isinstance(args, dict):
+                transform_list.append(getattr(transforms, name)(**args))
+            else:
+                transform_list.append(getattr(transforms, name)(*args))
+        
+        return transforms.Compose(transform_list)
 
     def get(self, key: str, default: Any = None):
         """Get a value from the config."""
+        if key == "custom_train_trans":
+            return self.load_transforms_from_yaml(self.config["custom_train_trans"])
+        elif key == "custom_val_trans":
+            return self.load_transforms_from_yaml(self.config["custom_val_trans"])
+        elif key == "im_size":
+            return tuple(self.config.get("im_size", default))
+        
         return self.config.get(key, default)
 
     def update(self, overrides: Dict[str, Any]):
 
@@ -1,3 +1,3 @@
-from .dd_ranking_unified import Unified_Evaluator
-from .dd_ranking_obj import Soft_Label_Objective_Metrics, Hard_Label_Objective_Metrics
-from .dd_ranking_aug import Augmentation_Metrics, DSA_Augmentation_Metrics, ZCA_Whitening_Augmentation_Metrics, Mixup_Augmentation_Metrics, Cutmix_Augmentation_Metrics
+from .general import Unified_Evaluator
+from .soft_label import Soft_Label_Evaluator
+from .hard_label import Hard_Label_Evaluator
@@ -9,11 +9,8 @@
 from tqdm import tqdm
 from torch.utils.data import DataLoader
 from torch.nn import CrossEntropyLoss
-from torch.optim import SGD
-from torch.optim.lr_scheduler import CosineAnnealingLR, StepLR
 from torchvision import transforms, datasets
-from dd_ranking.utils import build_model, get_pretrained_model_path
-from dd_ranking.utils import TensorDataset, get_random_images, get_dataset
+from dd_ranking.utils import build_model, get_pretrained_model_path, get_dataset, TensorDataset
 from dd_ranking.utils import set_seed, get_optimizer, get_lr_scheduler
 from dd_ranking.utils import train_one_epoch, validate
 from dd_ranking.loss import SoftCrossEntropyLoss, KLDivergenceLoss
@@ -39,12 +36,17 @@ def __init__(self,
         num_eval: int=5,
         im_size: tuple=(32, 32), 
         num_epochs: int=300,
-        batch_size: int=256,
+        real_batch_size: int=256,
+        syn_batch_size: int=256,
         weight_decay: float=0.0005,
         momentum: float=0.9,
         use_zca: bool=False,
         temperature: float=1.0,
-        use_torchvision: bool=False,
+        stu_use_torchvision: bool=False,
+        tea_use_torchvision: bool=False,
+        teacher_dir: str='./teacher_models',
+        custom_train_trans: transforms.Compose=None,
+        custom_val_trans: transforms.Compose=None,
         num_workers: int=4,
         save_path: str=None,
         device: str="cuda"
@@ -78,20 +80,30 @@ def __init__(self,
             num_eval = self.config.get('num_eval', 5)
             im_size = self.config.get('im_size', (32, 32))
             num_epochs = self.config.get('num_epochs', 300)
-            batch_size = self.config.get('batch_size', 256)
+            real_batch_size = self.config.get('real_batch_size', 256)
+            syn_batch_size = self.config.get('syn_batch_size', 256)
             default_lr = self.config.get('default_lr', 0.01)
             save_path = self.config.get('save_path', None)
             num_workers = self.config.get('num_workers', 4)
-            use_torchvision = self.config.get('use_torchvision', False)
+            stu_use_torchvision = self.config.get('stu_use_torchvision', False)
+            tea_use_torchvision = self.config.get('tea_use_torchvision', False)
+            custom_train_trans = self.config.get('custom_train_trans', None)
+            custom_val_trans = self.config.get('custom_val_trans', None)
             device = self.config.get('device', 'cuda')
 
-        channel, im_size, num_classes, dst_train, dst_test, class_map, class_map_inv = get_dataset(dataset, real_data_path, im_size, use_zca)
+        channel, im_size, num_classes, dst_train, dst_test, class_map, class_map_inv = get_dataset(dataset, 
+                                                                                                   real_data_path, 
+                                                                                                   im_size,
+                                                                                                   custom_val_trans,
+                                                                                                   use_zca)
         self.num_classes = num_classes
         self.im_size = im_size
-        self.test_loader = DataLoader(dst_test, batch_size=batch_size, num_workers=num_workers, shuffle=False)
+        self.real_test_loader = DataLoader(dst_test, batch_size=real_batch_size, num_workers=num_workers, shuffle=False)
 
         self.ipc = ipc
         self.model_name = model_name
+        self.stu_use_torchvision = stu_use_torchvision
+        self.custom_train_trans = custom_train_trans
         self.use_soft_label = use_soft_label
         if use_soft_label:
             assert soft_label_mode is not None, "soft_label_mode must be provided if use_soft_label is True"
@@ -107,7 +119,7 @@ def __init__(self,
 
         self.num_eval = num_eval
         self.num_epochs = num_epochs
-        self.batch_size = batch_size
+        self.syn_batch_size = syn_batch_size
         self.device = device
 
         if not save_path:
@@ -117,7 +129,7 @@ def __init__(self,
         self.save_path = save_path
 
         if not use_torchvision:
-            pretrained_model_path = get_pretrained_model_path(model_name, dataset, ipc)
+            pretrained_model_path = get_pretrained_model_path(teacher_dir, model_name, dataset, ipc)
         else:
             pretrained_model_path = None
 
@@ -128,15 +140,14 @@ def __init__(self,
             pretrained=True, 
             device=self.device, 
             model_path=pretrained_model_path,
-            use_torchvision=use_torchvision
+            use_torchvision=tea_use_torchvision
         )
         self.teacher_model.eval()
 
         if data_aug_func is None:
             self.aug_func = None
         elif data_aug_func == 'dsa':
             self.aug_func = DSA_Augmentation(aug_params)
-            self.num_epochs = 1000
         elif data_aug_func == 'mixup':
             self.aug_func = Mixup_Augmentation(aug_params)  
         elif data_aug_func == 'cutmix':
@@ -145,7 +156,7 @@ def __init__(self,
             raise ValueError(f"Invalid data augmentation function: {data_aug_func}")
 
     def generate_soft_labels(self, images):
-        batches = torch.split(images, self.batch_size)
+        batches = torch.split(images, self.syn_batch_size)
         soft_labels = []
         with torch.no_grad():
             for image_batch in batches:
@@ -164,12 +175,13 @@ def hyper_param_search(self, loader):
                 model_name=self.model_name, 
                 num_classes=self.num_classes, 
                 im_size=self.im_size, 
-                pretrained=False, 
+                pretrained=False,
+                use_torchvision=self.stu_use_torchvision,
                 device=self.device
             )
             acc = self.compute_metrics_helper(
                 model=model, 
-                loader=loader, 
+                loader=loader,
                 lr=lr
             )
             if acc > best_acc:
@@ -180,13 +192,13 @@ def hyper_param_search(self, loader):
     def get_loss_fn(self):
         if self.use_soft_label:
             if self.soft_label_criterion == 'kl':
-                return KLDivergenceLoss(temperature=self.temperature)
+                return KLDivergenceLoss(temperature=self.temperature).to(self.device)
             elif self.soft_label_criterion == 'sce':
-                return SoftCrossEntropyLoss()
-            else:
+                return SoftCrossEntropyLoss(temperature=self.temperature).to(self.device)
+            else:   
                 raise ValueError(f"Invalid soft label criterion: {self.soft_label_criterion}")
         else:
-            return nn.CrossEntropyLoss()
+            return CrossEntropyLoss().to(self.device)
 
     def compute_metrics_helper(self, model, loader, lr):
         loss_fn = self.get_loss_fn()
@@ -195,7 +207,7 @@ def compute_metrics_helper(self, model, loader, lr):
         scheduler = get_lr_scheduler(optimizer, self.lr_scheduler, self.num_epochs)
 
         best_acc = 0
-        for epoch in range(self.num_epochs):
+        for epoch in tqdm(range(self.num_epochs), total=self.num_epochs, desc="Training"):
             train_one_epoch(
                 model=model, 
                 loader=loader, 
@@ -218,9 +230,28 @@ def compute_metrics_helper(self, model, loader, lr):
                 best_acc = acc
         return best_acc
 
-    def compute_metrics(self, images, labels, syn_lr=None):
-        syn_dataset = TensorDataset(images, labels)
-        syn_loader = DataLoader(syn_dataset, batch_size=self.batch_size, shuffle=True, num_workers=4)
+    def compute_metrics(self, image_tensor: Tensor=None, image_path: str=None, labels: Tensor=None, syn_lr=None):
+        if image_tensor is None and image_path is None:
+            raise ValueError("Either image_tensor or image_path must be provided")
+        
+        if self.use_soft_label and self.soft_label_mode == 'S' and labels is None:
+            raise ValueError("labels must be provided if soft_label_mode is 'S'")
+        
+        if image_tensor is None:
+            syn_dataset = datasets.ImageFolder(root=image_path, transform=self.custom_train_trans)
+            if labels is not None:
+                syn_dataset.samples = [(path, labels[idx]) for idx, (path, _) in enumerate(syn_dataset.samples)]
+                syn_dataset.targets = labels
+        else:
+            if labels is not None:
+                syn_dataset = TensorDataset(image_tensor, labels, transform=self.custom_train_trans)
+            else:
+                # use hard labels if labels are not provided
+                default_labels = torch.tensor(np.array([np.ones(self.ipc) * i for i in range(self.num_classes)]), 
+                                              dtype=torch.long, requires_grad=False).view(-1)
+                syn_dataset = TensorDataset(image_tensor, default_labels, transform=self.custom_train_trans)
+
+        syn_loader = DataLoader(syn_dataset, batch_size=self.syn_batch_size, shuffle=True, num_workers=4)
 
         accs = []
         lrs = []
@@ -232,12 +263,13 @@ def compute_metrics(self, images, labels, syn_lr=None):
                     model_name=self.model_name, 
                     num_classes=self.num_classes,
                     im_size=self.im_size, 
-                    pretrained=False, 
+                    pretrained=False,
+                    use_torchvision=self.stu_use_torchvision,
                     device=self.device
                 )
                 syn_data_acc = self.compute_metrics_helper(
-                    model=model, 
-                    loader=syn_loader, 
+                    model=model,
+                    loader=syn_loader,
                     lr=syn_lr
                 )
                 del model