Minor nits

vrdn-23 · vrdn-23 · commit 5b0f345ef51b · 2022-08-11T15:11:03.000-07:00
diff --git a/mindmeld/models/taggers/pytorch_crf.py b/mindmeld/models/taggers/pytorch_crf.py
@@ -23,6 +23,8 @@
 
 logger = logging.getLogger(__name__)
 
+TEST_BATCH_SIZE = 512
+
 
 class TaggerDataset(Dataset):
     """PyTorch Dataset class used to handle tagger inputs, labels and mask"""
@@ -301,7 +303,6 @@ def load_best_weights_path(self, path):
         Args:
             path (str): Path to save the best model weights.
         """
-        # self.best_model_save_path = os.path.abspath(path)
         if os.path.exists(path):
             self.load_state_dict(torch.load(path))
         else:
@@ -500,8 +501,8 @@ def get_dataloader(self, X, y, is_train):
         """
         tensor_inputs, input_seq_lens, tensor_labels = self._encoder.get_tensor_data(X, y, fit=is_train)
         tensor_dataset = TaggerDataset(tensor_inputs, input_seq_lens, tensor_labels)
-        torch_dataloader = DataLoader(tensor_dataset, batch_size=self.batch_size if is_train else 512, shuffle=is_train,
-                                      collate_fn=collate_tensors_and_masks)
+        torch_dataloader = DataLoader(tensor_dataset, batch_size=self.batch_size if is_train else TEST_BATCH_SIZE,
+                                      shuffle=is_train, collate_fn=collate_tensors_and_masks)
         return torch_dataloader
 
     def fit(self, X, y):
@@ -534,7 +535,7 @@ def fit(self, X, y):
         if self.optimizer == "sgd":
             self.optim = optim.SGD(self.parameters(), lr=0.01, momentum=0.9, nesterov=True, weight_decay=1e-5)
         if self.optimizer == "adam":
-            self.optim = optim.Adam(self.parameters(), weight_decay=1e-5)
+            self.optim = optim.Adam(self.parameters(), lr=0.001, weight_decay=1e-5)
 
         self.training_loop(train_dataloader, dev_dataloader)
         self.load_state_dict(torch.load(self.tmp_save_path))