changed default train config

harsha-simhadri · harsha-simhadri · commit ef6275858782 · 2019-08-27T16:04:54.000+05:30
diff --git a/examples/pytorch/FastCells/train_classifier.py b/examples/pytorch/FastCells/train_classifier.py
@@ -106,7 +106,7 @@ def configure_optimizer(self, options):
                                     step_sizes=oo.step_sizes)
         elif options.optimizer == "SGD":
             optimizer = optim.SGD(self.parameters(), lr=initial_rate, weight_decay=oo.weight_decay,
-                                  momentum=oo.momentum, dampening=oo.dampening)
+                                  momentum=oo.momentum, dampening=oo.dampening, nesterov=oo.nesterov)
         return optimizer
 
     def configure_lr(self, options, optimizer, ticks, total_iterations):
@@ -478,7 +478,8 @@ def train(config, evaluate_only=False, outdir=".", detail=False, azureml=False):
             model.cuda()  # move the processing to GPU
 
         start = time.time()
-        log = model.fit(training_data, validation_data, config.training, config.model.sparsify, device, detail, run)
+        log = model.fit(training_data, validation_data, config.training,
+                       config.model.sparsify, device, detail, run)
         end = time.time()
 
         passed, total, rate = model.evaluate(training_data, batch_size, device)
diff --git a/examples/pytorch/FastCells/training_config.py b/examples/pytorch/FastCells/training_config.py
@@ -48,6 +48,7 @@ def __init__(self):
         self.etas = (0.5, 1.2)  # Rprop
         self.dampening = 0  # SGD
         self.step_sizes = (1e-06, 50)  # Rprop
+        self.nesterov = True # SGD
 
 
 class TrainingOptions:
@@ -60,7 +61,7 @@ def __init__(self):
         self.lr_gamma = 1
         self.lr_step_size = 1
         self.batch_size = 128
-        self.optimizer = "Adam"
+        self.optimizer = "SGD"
         self.optimizer_options = OptimizerOptions()
         self.use_gpu = False
         self.rolling = False