updates

Programmer-RD-AI · Programmer-RD-AI · commit 79af8c979bca · 2023-07-27T20:12:54.000+05:30
diff --git a/ML/__init__.py b/ML/__init__.py
@@ -27,7 +27,9 @@
 from sklearn.metrics import *
 from torch.hub import *
 import torchtext.functional as F
+import warnings
 
+warnings.filterwarnings("ignore")
 print(torch.__version__, torchvision.__version__, torchtext.__version__)
 os.environ["CUDA_LAUNCH_BLOCKING"] = "1"
 # os.environ["WANDB_SILENT"] = "true"
diff --git a/ML/dataset/main_loaders.py b/ML/dataset/main_loaders.py
@@ -29,7 +29,7 @@ def __init__(
         self.batch_size = batch_size
         self.get_batches()
 
-    def get_batches(self):
+    def get_batches(self) -> None:
         X = self.X_train if self.train else self.X_test
         y = self.y_train if self.train else self.y_test
         X_batches = []
diff --git a/ML/dataset/valid_loaders.py b/ML/dataset/valid_loaders.py
@@ -5,7 +5,10 @@
 class Valid_Loader(Loader):
     def __init__(self, *args) -> None:
         super().__init__(*args)
+        self.data["id"].dropna(inplace=True)
         self.X = self.data["text"].to_numpy()
+        self.ids = self.data["id"].to_numpy()
+        print(len(self.X), len(self.ids))
 
     def __getitem__(self, index) -> np.array:
-        return self.transform(self.X[index])
+        return (self.ids[index], [self.transform(self.X[index])])
diff --git a/ML/helper_functions/__init__.py b/ML/helper_functions/__init__.py
@@ -1,4 +1,4 @@
 from ML.helper_functions.load_data import *
 from ML.helper_functions.test import *
 from ML.helper_functions.train import *
-from ML.helper_functions.transformer import *
+from ML.helper_functions.transformations.transformer import *
diff --git a/ML/helper_functions/alert.py b/ML/helper_functions/alert.py
@@ -0,0 +1,6 @@
+from ML import *
+
+
+class Alert:
+    def __init__(self) -> None:
+        pass
diff --git a/ML/helper_functions/clearcache.py b/ML/helper_functions/clearcache.py
@@ -2,8 +2,8 @@
 
 
 class ClearCache:
-    def __enter__(self):
+    def __enter__(self) -> None:
         torch.cuda.empty_cache()
 
-    def __exit__(self, *args):
+    def __exit__(self, *args) -> None:
         torch.cuda.empty_cache()
diff --git a/ML/helper_functions/load_data.py b/ML/helper_functions/load_data.py
@@ -49,7 +49,7 @@ def ld(self) -> Tuple[DataLoader, DataLoader, DataLoader]:
             num_workers=round(os.cpu_count() / 2),
         )
         self.valid_data_loader = DataLoader(
-            self.dataset_valid(self.valid_path, None),
+            self.dataset_valid(self.valid_path, self.main_transform),
             batch_size=None,
             shuffle=False,
             num_workers=round(os.cpu_count() / 2),
diff --git a/ML/helper_functions/test.py b/ML/helper_functions/test.py
@@ -16,7 +16,7 @@ def __init__(
         self.model = model
         self.name = name
 
-    def test(self):
+    def test(self) -> Dict:
         a_tot = 0
         p_tot = 0
         r_tot = 0
@@ -29,7 +29,7 @@ def test(self):
                 X = F.to_tensor(X, padding_value=1).to("cuda")
                 y = torch.tensor(y).to("cuda")
                 preds = torch.argmax(torch.softmax(self.model(X), dim=1), dim=1)
-                loss = self.criteria(preds, y.view(-1, 1).squeeze(1))
+                loss = self.criterion(preds.float(), y.view(-1, 1).squeeze(1).float())
                 results = classification_report(
                     preds.cpu(), y.view(-1, 1).squeeze(1).cpu(), output_dict=True
                 )
@@ -43,10 +43,25 @@ def test(self):
                 f1_tot += f1score
                 l_tot += loss.item()
                 n += 1
+        print(loss.item(), l_tot, l_tot / n)
         return {
             f"{self.name} precision": p_tot / n,
             f"{self.name} recall": r_tot / n,
             f"{self.name} f1-score": f1_tot / n,
             f"{self.name} accuracy": a_tot / n,
             f"{self.name} loss": l_tot / n,
         }
+
+    def make_predictions(self, run_name: str, epoch: int) -> pd.DataFrame:
+        ids = []
+        target = []
+        for i, X in enumerate(self.valid_dataloader):
+            X = F.to_tensor(X, padding_value=1).to("cuda")
+            pred = torch.argmax(torch.softmax(self.model(X), dim=1), dim=1).squeeze().cpu().item()
+            ids.append(i)
+            target.append(pred)
+        if run_name not in os.listdir("./ML/predictions/"):
+            os.mkdir(f"./ML/predictions/{run_name}")
+        df = pd.DataFrame({"id": ids, "target": target})
+        df.to_csv(f"./ML/predictions/{run_name}/{epoch}.csv", index=False)
+        return df
diff --git a/ML/helper_functions/train.py b/ML/helper_functions/train.py
@@ -26,12 +26,12 @@ def __init__(
         self.optimizer = optimizer
         self.lr_schedular = lr_schedular
 
-    def train(self, run_name):
+    def train(self, run_name: str) -> None:
         print(torchinfo.summary(self.model))
         wandb.init(project=PROJECT_NAME, name=run_name, config=self.config)
         wandb.watch(self.model, log="all")
         iterator = tqdm(range(self.epochs))
-        for _ in iterator:
+        for epoch in iterator:
             torch.cuda.empty_cache()
             for i, (X, y) in enumerate(self.train_dataloader):
                 y = y[0]
@@ -61,6 +61,13 @@ def train(self, run_name):
                     "Train",
                 ).test()
             )
+            Test(
+                self.train_dataloader,
+                self.valid_dataloader,
+                self.criterion,
+                self.model,
+                "Train",
+            ).make_predictions(run_name, epoch)
             iterator.set_description(f"Testing Done")
             self.model.train()
         wandb.save()
diff --git a/ML/helper_functions/transformations/__init__.py b/ML/helper_functions/transformations/__init__.py
@@ -0,0 +1,2 @@
+from ML.helper_functions.transformations.randomize import *
+from ML.helper_functions.transformations.transformer import *
diff --git a/ML/helper_functions/transformations/randomize.py b/ML/helper_functions/transformations/randomize.py
@@ -0,0 +1,21 @@
+from ML import *
+
+
+class Randomize(Module):
+    def __init__(self, p: float = 0.5) -> None:
+        self.p = 0.5 if p > 1 else p
+
+    def __call__(
+        self,
+        X: torch.tensor,
+    ) -> torch.tensor:
+        """it will randamize the order of a given tensor / list, this will make it harder for the model to understand inturn hopefully understand as for the
+
+        Keyword arguments:
+        argument -- description
+        Return: return_description
+        """
+        if torch.rand(1).item() < self.p:
+            np.random.shuffle(X)
+            return X
+        return X
diff --git a/ML/helper_functions/transformations/transformer.py b/ML/helper_functions/transformations/transformer.py
@@ -1,4 +1,5 @@
 from ML import *
+from ML.helper_functions.transformations.randomize import *
 
 
 class Transformer:
@@ -13,6 +14,7 @@ def __init__(
         tokenizer: torchtext.transforms = SentencePieceTokenizer,
         vocab_transform: torchtext.transforms = VocabTransform,
         truncate: torchtext.transforms = Truncate,
+        randomize: bool = True,
     ) -> None:
         self.padding_idx = padding_idx
         self.beg_idx = beg_idx
@@ -23,16 +25,18 @@ def __init__(
         self.tokenizer = tokenizer
         self.vocab_transform = vocab_transform
         self.truncate = truncate
+        self.randomize = randomize
 
     def transform(self) -> torchtext.transforms.Sequential:
         t = torchtext.transforms.Sequential(
             self.tokenizer(self.spm_model_path),
             self.vocab_transform(load_state_dict_from_url(self.vocab_path)),
             self.truncate(self.max_seq_len),
+            Randomize() if self.randomize else Randomize(0),
             AddToken(self.beg_idx, begin=True),
             AddToken(self.end_idx, begin=False),
         )
         return t
 
-    def model_transform(self, model):
+    def model_transform(self, model) -> torchtext.transforms:
         return model.transforms()
diff --git a/ML/modelling/tt.py b/ML/modelling/tt.py
@@ -7,13 +7,32 @@ def __init__(
         num_classes: int = 2,
         input_dim: int = 768,
         classifier_head: torchtext.models = RobertaClassificationHead,
-        model: torchtext.models = ROBERTA_BASE_ENCODER,
+        model: torchtext.models = XLMR_BASE_ENCODER,
     ) -> None:
+        """The initialization of the Transfer Learning Model
+
+        Keyword arguments:
+        num_classes -- the number of classes to be outputted
+        input_dim -- the input dimension for the Encoder
+        classifier_head -- the head of the Encoder model
+        model -- the encoder model it self
+        Return: None
+        """
         super().__init__()
         self.num_classes = num_classes
         self.input_dim = input_dim
         self.classifier_head = classifier_head(num_classes, input_dim)
         self.model = model.get_model(head=self.classifier_head).to(device)
 
-    def forward(self, X):
+    def freeze(self):
+        pass
+
+    def forward(self, X) -> torch.tensor:
+        """the forward function where the input / X data is inputed and the logits are outputed
+
+        Keyword arguments:
+        X -- the input data
+        Return: the logits of the each input_data in the shape of ((num_classes),len(X))
+        """
+
         return self.model(X)
diff --git a/run.py b/run.py
@@ -27,4 +27,4 @@
 }
 Train(
     model, 10, config, train_data_loader, test_data_loader, valid_data_loader, criterion, optimizer
-).train("baseline")
+).train("wit_randomize")
diff --git a/test.py b/test.py
@@ -0,0 +1,5 @@
+from torchvision import transforms
+
+import torch
+
+print(torch.rand(1).item())

Original file line number	Diff line number	Diff line change
`@@ -49,7 +49,7 @@ def ld(self) -> Tuple[DataLoader, DataLoader, DataLoader]:`
`49`	`49`	`num_workers=round(os.cpu_count() / 2),`
`50`	`50`	`)`
`51`	`51`	`self.valid_data_loader = DataLoader(`
`52`		`- self.dataset_valid(self.valid_path, None),`
	`52`	`+ self.dataset_valid(self.valid_path, self.main_transform),`
`53`	`53`	`batch_size=None,`
`54`	`54`	`shuffle=False,`
`55`	`55`	`num_workers=round(os.cpu_count() / 2),`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,2 @@`
	`1`	`+from ML.helper_functions.transformations.randomize import *`
	`2`	`+from ML.helper_functions.transformations.transformer import *`