move prompt embeds, pooled embeds outside

linoytsaban · linoytsaban · commit 5257b468fd73 · 2025-04-14T14:44:44.000+03:00
diff --git a/examples/dreambooth/train_dreambooth_lora_hidream.py b/examples/dreambooth/train_dreambooth_lora_hidream.py
@@ -1591,7 +1591,9 @@ def get_sigmas(timesteps, n_dim=4, dtype=torch.float32):
                 # encode batch prompts when custom prompts are provided for each image -
                 if train_dataset.custom_instance_prompts:
                     prompt_embeds, pooled_prompt_embeds = compute_text_embeddings(prompts, text_encoders, tokenizers)
-
+                else:
+                    prompt_embeds = prompt_embeds.repeat(len(prompts), 1, 1)
+                    pooled_prompt_embeds = pooled_prompt_embeds.repeat(len(prompts), 1)
                 # Convert images to latent space
                 if args.cache_latents:
                     model_input = latents_cache[step].sample()
@@ -1646,12 +1648,8 @@ def get_sigmas(timesteps, n_dim=4, dtype=torch.float32):
                 # Predict the noise residual
                 model_pred = transformer(
                     hidden_states=noisy_model_input,
-                    encoder_hidden_states=prompt_embeds.repeat(len(prompts), 1, 1)
-                    if not train_dataset.custom_instance_prompts
-                    else prompt_embeds,
-                    pooled_embeds=pooled_prompt_embeds.repeat(len(prompts), 1)
-                    if not train_dataset.custom_instance_prompts
-                    else pooled_prompt_embeds,
+                    encoder_hidden_states=prompt_embeds,
+                    pooled_embeds=pooled_prompt_embeds,
                     timestep=timesteps,
                     img_sizes=img_sizes,
                     img_ids=img_ids,