kubernetes-sigs · k8s-ci-robot · Sep 15, 2025 · Sep 15, 2025
diff --git a/site-src/guides/serve-multiple-genai-models.md b/site-src/guides/serve-multiple-genai-models.md
@@ -12,7 +12,6 @@ The following diagram illustrates how an Inference Gateway routes requests to di
 The model name is extracted by [Body-Based routing](https://github.com/kubernetes-sigs/gateway-api-inference-extension/blob/main/pkg/bbr/README.md) (BBR)
  from the request body to the header. The header is then matched to dispatch
  requests to different `InferencePool` (and their EPPs) instances.
-![Serving multiple generative AI models](../images/serve-mul-gen-AI-models.png)
 
 ### Deploy Body-Based Routing
 

diff --git a/site-src/images/inference-overview.svg b/site-src/images/inference-overview.svg
diff --git a/site-src/images/serve-LoRA-adapters.png b/site-src/images/serve-LoRA-adapters.png
diff --git a/site-src/images/serve-mul-gen-AI-models.png b/site-src/images/serve-mul-gen-AI-models.png