feat: context channels in model1d

flavioschneider · flavioschneider · commit 425e55975082 · 2022-08-26T23:09:37.000+02:00
diff --git a/audio_diffusion_pytorch/model.py b/audio_diffusion_pytorch/model.py
@@ -40,6 +40,7 @@ def __init__(
         diffusion_sigma_data: int,
         diffusion_dynamic_threshold: float,
         out_channels: Optional[int] = None,
+        context_channels: Optional[Sequence[int]] = None,
         use_autoencoder: bool = False,
         autoencoder: Optional[AutoEncoder1d] = None,
         autoencoder_scale: float = 1.0,
@@ -72,6 +73,7 @@ def __init__(
             use_skip_scale=use_skip_scale,
             use_attention_bottleneck=use_attention_bottleneck,
             out_channels=out_channels,
+            context_channels=context_channels,
         )
 
         self.diffusion = Diffusion(
@@ -81,21 +83,26 @@ def __init__(
             dynamic_threshold=diffusion_dynamic_threshold,
         )
 
-    def forward(self, x: Tensor) -> Tensor:
+    def forward(self, x: Tensor, **kwargs) -> Tensor:
         if self.use_autoencoder:
             x = self.autoencoder_scale * self.autoencoder.encode(x)  # type: ignore
-        return self.diffusion(x)
+        return self.diffusion(x, **kwargs)
 
     def sample(
-        self, noise: Tensor, num_steps: int, sigma_schedule: Schedule, sampler: Sampler
+        self,
+        noise: Tensor,
+        num_steps: int,
+        sigma_schedule: Schedule,
+        sampler: Sampler,
+        **kwargs
     ) -> Tensor:
         diffusion_sampler = DiffusionSampler(
             diffusion=self.diffusion,
             sampler=sampler,
             sigma_schedule=sigma_schedule,
             num_steps=num_steps,
         )
-        x = diffusion_sampler(noise)
+        x = diffusion_sampler(noise, **kwargs)
 
         if self.use_autoencoder:
             x = (1.0 / self.autoencoder_scale) * self.autoencoder.decode(x)
diff --git a/setup.py b/setup.py
@@ -3,7 +3,7 @@
 setup(
     name="audio-diffusion-pytorch",
     packages=find_packages(exclude=[]),
-    version="0.0.16",
+    version="0.0.17",
     license="MIT",
     description="Audio Diffusion - PyTorch",
     long_description_content_type="text/markdown",