update for calculating loss

tyui592 · tyui592 · commit e51f155eecb6 · 2019-11-28T00:44:23.000+09:00
diff --git a/train.py b/train.py
@@ -1,47 +1,78 @@
+import time
 import torch
 
-from network import AvatarNet
-from utils import ImageFolder, get_transformer, imsave
-from loss import LossCalculator
+from network import AvatarNet, Encoder
+from utils import ImageFolder, imsave, lastest_arverage_value
 
 def network_train(args):
     # set device
-    device = torch.device("cuda" if args.cuda_device_no >= 0 else "cpu")
-
-    # save arguments
-    torch.save(args, args.save_path+"arguments.pth")
+    device = torch.device('cuda' if args.gpu_no >= 0 else 'cpu')
 
     # get network
-    network = AvatarNet(args.layers)
-    network = network.to(device)
+    network = AvatarNet(args.layers).to(device)
 
     # get data set
-    data_set = ImageFolder(args.train_data_path, get_transformer(args.imsize, args.cropsize))
+    data_set = ImageFolder(args.content_dir, args.imsize, args.cropsize, args.cencrop)
 
     # get loss calculator
-    loss_calculator = LossCalculator(device, args.layers, args.feature_weight, args.reconstruction_weight, args.tv_weight)
+    loss_network = Encoder(args.layers).to(device)
+    mse_loss = torch.nn.MSELoss(reduction='mean').to(device)
+    loss_seq = {'total':[], 'image':[], 'feature':[], 'tv':[]}
 
     # get optimizer
-    optimizer = torch.optim.Adam(network.decoders.parameters(), lr=args.lr)
+    for param in network.encoder.parameters():
+        param.requires_grad = False
+    optimizer = torch.optim.Adam(network.decoder.parameters(), lr=args.lr)
 
     # training
     for iteration in range(args.max_iter):
         data_loader = torch.utils.data.DataLoader(data_set, batch_size=args.batch_size, shuffle=True)
-        image = next(iter(data_loader)).to(device)
+        input_image = next(iter(data_loader)).to(device)
+
+        output_image = network(input_image, [input_image], train=True)
+
+        # calculate losses
+        total_loss = 0
+        ## image reconstruction loss
+        image_loss = mse_loss(output_image, input_image)
+        loss_seq['image'].append(image_loss.item())
+        total_loss += image_loss
 
-        output = network(image, image, train_flag=True)
+        ## feature reconstruction loss
+        input_features = loss_network(input_image)
+        output_features = loss_network(output_image) 
+        feature_loss = 0
+        for output_feature, input_feature in zip(output_features, input_features):
+            feature_loss += mse_loss(output_feature, input_feature)
+        loss_seq['feature'].append(feature_loss.item())
+        total_loss += feature_loss * args.feature_weight
 
-        total_loss = loss_calculator.calc_total_loss(output, image)
+        ## total variation loss
+        tv_loss = calc_tv_loss(output_image)
+        loss_seq['tv'].append(tv_loss.item())
+        total_loss += tv_loss * args.tv_weight
+
+        loss_seq['total'].append(total_loss.item())
 
         optimizer.zero_grad()
         total_loss.backward()
         optimizer.step()
 
         # print loss log and save network, loss log and output images
         if (iteration + 1) % args.check_iter == 0:
-            loss_calculator.print_loss_seq()
-            torch.save(network.state_dict(), args.save_path+"network.pth")
-            torch.save(loss_calculator.loss_seq, args.save_path+"loss_seq.pth")
-            imsave(output, args.save_path+"training_image.png")
+            imsave(torch.cat([input_image, output_image], dim=0), args.save_path+"training_image.png")
+            print("%s: Iteration: [%d/%d]\tImage Loss: %2.4f\tFeature Loss: %2.4f\tTV Loss: %2.4f\tTotal: %2.4f"%(time.ctime(),iteration+1, 
+                args.max_iter, lastest_arverage_value(loss_seq['image']), lastest_arverage_value(loss_seq['feature']), 
+                lastest_arverage_value(loss_seq['tv']), lastest_arverage_value(loss_seq['total'])))
+            torch.save({'iteration': iteration+1,
+                'state_dict': network.state_dict(),
+                'loss_seq': loss_seq},
+                args.save_path+'check_point.pth')
 
     return network
+
+def calc_tv_loss(x):
+    tv_loss = torch.mean(torch.abs(x[:, :, :, :-1] - x[:, :, :, 1:])) 
+    tv_loss += torch.mean(torch.abs(x[:, :, :-1, :] - x[:, :, 1:, :]))
+    return tv_loss
+