kubernetes-sigs
diff --git a/‎site-src/guides/serve-multiple-genai-models.md‎
Lines changed: 0 additions & 1 deletion b/‎site-src/guides/serve-multiple-genai-models.md‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎site-src/images/inference-overview.svg‎
Lines changed: 1 addition & 1 deletion b/‎site-src/images/inference-overview.svg‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎site-src/images/serve-LoRA-adapters.png‎
-371 KB b/‎site-src/images/serve-LoRA-adapters.png‎
-371 KB
diff --git a/‎site-src/images/serve-mul-gen-AI-models.png‎
-403 KB b/‎site-src/images/serve-mul-gen-AI-models.png‎
-403 KB
@@ -12,7 +12,6 @@ The following diagram illustrates how an Inference Gateway routes requests to di
 The model name is extracted by [Body-Based routing](https://github.com/kubernetes-sigs/gateway-api-inference-extension/blob/main/pkg/bbr/README.md) (BBR)
  from the request body to the header. The header is then matched to dispatch
  requests to different `InferencePool` (and their EPPs) instances.
-![Serving multiple generative AI models](../images/serve-mul-gen-AI-models.png)
 
 ### Deploy Body-Based Routing