Changed MelGen to only deal with numpy

Rick-McCoy · Rick-McCoy · commit a929bbcee43c · 2019-10-14T21:41:24.000+09:00
diff --git a/datasets/wavloader.py b/datasets/wavloader.py
@@ -39,9 +39,9 @@ def __init__(self, hp, args, train):
         random.seed(123)
         random.shuffle(self.file_list)
         if train:
-            self.file_list = self.file_list[:int(0.95*len(self.file_list))]
+            self.file_list = self.file_list[:int(0.95 * len(self.file_list))]
         else:
-            self.file_list = self.file_list[int(0.95*len(self.file_list)):]
+            self.file_list = self.file_list[int(0.95 * len(self.file_list)):]
 
         self.wavlen = int(hp.audio.sr * hp.audio.duration)
         self.tier = self.args.tier
diff --git a/utils/audio.py b/utils/audio.py
@@ -1,6 +1,5 @@
 # based on https://github.com/keithito/tacotron/blob/master/util/audio.py
 
-import torch
 import librosa
 import numpy as np
 
@@ -18,7 +17,6 @@ def get_normalized_mel(self, x):
             win_length=self.hp.audio.win_length,
             n_mels=self.hp.audio.n_mels
         )
-        x = torch.from_numpy(x)
         x = self.pre_spec(x)
         return x
 
@@ -29,13 +27,13 @@ def post_spec(self, x):
         return self.db_to_amp(self.denormalize(x) + self.hp.audio.ref_level_db)
 
     def amp_to_db(self, x):
-        return 20.0 * torch.log10(torch.max(x, torch.tensor(1e-6)))
+        return 20.0 * np.log10(np.maximum(x, 1e-6))
 
     def normalize(self, x):
-        return torch.clamp(x / -self.hp.audio.min_level_db, -1.0, 0.0) + 1.0
+        return np.clip(x / -self.hp.audio.min_level_db, -1.0, 0.0) + 1.0
 
     def db_to_amp(self, x):
-        return torch.pow(10.0, 0.05*x)
+        return np.power(10.0, 0.05 * x)
 
     def denormalize(self, x):
-        return (torch.clamp(x, 0.0, 1.0) - 1.0) * -self.hp.audio.min_level_db
+        return (np.clip(x, 0.0, 1.0) - 1.0) * -self.hp.audio.min_level_db
diff --git a/utils/train.py b/utils/train.py
@@ -79,7 +79,6 @@ def train(args, pt_dir, chkpt_path, trainloader, testloader, writer, logger, hp,
         optimizer.zero_grad()
         loss_sum = 0
         for epoch in itertools.count(init_epoch+1):
-            trainloader.tier = args.tier
             loader = tqdm(trainloader, desc='Train data loader')
             for source, target in loader:
                 mu, std, pi = model(source.cuda())