Pull jik876#25 Solve imbalanced gpu memory at multi-gpu distributed training

shivahr · shivahr · commit 95b50d7b0713 · 2022-01-14T10:40:37.000+05:30
diff --git a/train.py b/train.py
@@ -27,6 +27,7 @@ def train(rank, a, h):
                            world_size=h.dist_config['world_size'] * h.num_gpus, rank=rank)
 
     torch.cuda.manual_seed(h.seed)
+    torch.cuda.set_device(rank)
     device = torch.device('cuda:{:d}'.format(rank))
 
     generator = Generator(h).to(device)