feat: add noisy autoencoder option

flavioschneider · flavioschneider · commit c5ac20481512 · 2022-09-28T21:36:01.000+02:00
diff --git a/audio_diffusion_pytorch/modules.py b/audio_diffusion_pytorch/modules.py
@@ -1118,11 +1118,13 @@ def __init__(
         multipliers: Sequence[int],
         factors: Sequence[int],
         num_blocks: Sequence[int],
+        use_noisy: bool = False,
         bottleneck: Optional[Bottleneck] = None,
     ):
         super().__init__()
         num_layers = len(multipliers) - 1
         self.bottleneck = bottleneck
+        self.use_noisy = use_noisy
 
         assert len(factors) >= num_layers and len(num_blocks) >= num_layers
 
@@ -1150,7 +1152,7 @@ def __init__(
         self.upsamples = nn.ModuleList(
             [
                 UpsampleBlock1d(
-                    in_channels=channels * multipliers[i + 1],
+                    in_channels=channels * multipliers[i + 1] * (use_noisy + 1),
                     out_channels=channels * multipliers[i],
                     factor=factors[i],
                     num_groups=resnet_groups,
@@ -1183,6 +1185,8 @@ def encode(
 
     def decode(self, x: Tensor) -> Tensor:
         for upsample in self.upsamples:
+            if self.use_noisy:
+                x = torch.cat([x, torch.randn_like(x)], dim=1)
             x = upsample(x)
         return self.to_out(x)
 
diff --git a/setup.py b/setup.py
@@ -3,7 +3,7 @@
 setup(
     name="audio-diffusion-pytorch",
     packages=find_packages(exclude=[]),
-    version="0.0.50",
+    version="0.0.51",
     license="MIT",
     description="Audio Diffusion - PyTorch",
     long_description_content_type="text/markdown",