Remove accidentally committed test report files

szedan-rh · szedan-rh · commit d5dae34d2b9d · 2025-11-25T08:39:37.000+02:00
Signed-off-by: Senan Zedan &lt;szedan@redhat.com&gt;
diff --git a/deploy/kubernetes/routing-strategies/aigw-resources/base-model.yaml b/deploy/kubernetes/routing-strategies/aigw-resources/base-model.yaml
@@ -0,0 +1,89 @@
+apiVersion: apps/v1
+kind: Deployment
+metadata:
+  name: vllm-llama3-8b-instruct
+  namespace: default
+spec:
+  replicas: 1
+  selector:
+    matchLabels:
+      app: vllm-llama3-8b-instruct
+  template:
+    metadata:
+      labels:
+        app: vllm-llama3-8b-instruct
+    spec:
+      containers:
+      - name: vllm-sim
+        image: ghcr.io/llm-d/llm-d-inference-sim:v0.5.0
+        imagePullPolicy: IfNotPresent
+        args:
+        - --model
+        - base-model
+        - --port
+        - '8000'
+        - --max-loras
+        - '6'
+        - --lora-modules
+        - '{"name": "math-expert"}'
+        - '{"name": "science-expert"}'
+        - '{"name": "social-expert"}'
+        - '{"name": "humanities-expert"}'
+        - '{"name": "law-expert"}'
+        - '{"name": "general-expert"}'
+        env:
+        - name: POD_NAME
+          valueFrom:
+            fieldRef:
+              fieldPath: metadata.name
+        - name: NAMESPACE
+          valueFrom:
+            fieldRef:
+              fieldPath: metadata.namespace
+        ports:
+        - containerPort: 8000
+          name: http
+          protocol: TCP
+        resources:
+          requests:
+            cpu: 10m
+---
+apiVersion: v1
+kind: Service
+metadata:
+  name: vllm-llama3-8b-instruct
+  namespace: default
+  labels:
+    app: vllm-llama3-8b-instruct
+spec:
+  type: ClusterIP
+  ports:
+  - port: 8000
+    targetPort: 8000
+    protocol: TCP
+  selector:
+    app: vllm-llama3-8b-instruct
+---
+apiVersion: aigateway.envoyproxy.io/v1alpha1
+kind: AIServiceBackend
+metadata:
+  name: vllm-llama3-8b-instruct
+  namespace: default
+spec:
+  schema:
+    name: OpenAI
+  backendRef:
+    name: vllm-llama3-8b-instruct
+    kind: Backend
+    group: gateway.envoyproxy.io
+---
+apiVersion: gateway.envoyproxy.io/v1alpha1
+kind: Backend
+metadata:
+  name: vllm-llama3-8b-instruct
+  namespace: default
+spec:
+  endpoints:
+  - fqdn:
+      hostname: vllm-llama3-8b-instruct.default.svc.cluster.local
+      port: 8000
diff --git a/deploy/kubernetes/routing-strategies/aigw-resources/gwapi-resources.yaml b/deploy/kubernetes/routing-strategies/aigw-resources/gwapi-resources.yaml
@@ -0,0 +1,188 @@
+apiVersion: gateway.networking.k8s.io/v1
+kind: GatewayClass
+metadata:
+  name: semantic-router
+spec:
+  controllerName: gateway.envoyproxy.io/gatewayclass-controller
+---
+apiVersion: gateway.envoyproxy.io/v1alpha1
+kind: EnvoyProxy
+metadata:
+  name: semantic-router
+  namespace: default
+spec:
+  provider:
+    type: Kubernetes
+    kubernetes:
+      envoyDeployment:
+        replicas: 1
+        container:
+          resources: {}
+  logging:
+    level:
+      default: trace
+---
+apiVersion: gateway.networking.k8s.io/v1
+kind: Gateway
+metadata:
+  name: semantic-router
+  namespace: default
+spec:
+  gatewayClassName: semantic-router
+  listeners:
+  - name: http
+    protocol: HTTP
+    port: 80
+  infrastructure:
+    parametersRef:
+      group: gateway.envoyproxy.io
+      kind: EnvoyProxy
+      name: semantic-router
+---
+# By default, Envoy Gateway sets the buffer limit to 32kiB which is not sufficient for AI workloads.
+# This ClientTrafficPolicy sets the buffer limit to 50MiB as an example.
+apiVersion: gateway.envoyproxy.io/v1alpha1
+kind: ClientTrafficPolicy
+metadata:
+  name: semantic-router
+  namespace: default
+spec:
+  targetRefs:
+  - group: gateway.networking.k8s.io
+    kind: Gateway
+    name: semantic-router
+  connection:
+    bufferLimit: 50Mi
+---
+apiVersion: aigateway.envoyproxy.io/v1alpha1
+kind: AIGatewayRoute
+metadata:
+  name: semantic-router
+  namespace: default
+spec:
+  parentRefs:
+  - name: semantic-router
+    kind: Gateway
+    group: gateway.networking.k8s.io
+  rules:
+  - matches:
+    - headers:
+      - type: Exact
+        name: x-ai-eg-model
+        value: math-expert
+    backendRefs:
+    - name: vllm-llama3-8b-instruct
+    timeouts:
+      request: 60s
+      backendRequest: 60s
+  - matches:
+    - headers:
+      - type: Exact
+        name: x-ai-eg-model
+        value: science-expert
+    backendRefs:
+    - name: vllm-llama3-8b-instruct
+    timeouts:
+      request: 60s
+      backendRequest: 60s
+  - matches:
+    - headers:
+      - type: Exact
+        name: x-ai-eg-model
+        value: social-expert
+    backendRefs:
+    - name: vllm-llama3-8b-instruct
+    timeouts:
+      request: 60s
+      backendRequest: 60s
+  - matches:
+    - headers:
+      - type: Exact
+        name: x-ai-eg-model
+        value: humanities-expert
+    backendRefs:
+    - name: vllm-llama3-8b-instruct
+    timeouts:
+      request: 60s
+      backendRequest: 60s
+  - matches:
+    - headers:
+      - type: Exact
+        name: x-ai-eg-model
+        value: law-expert
+    backendRefs:
+    - name: vllm-llama3-8b-instruct
+    timeouts:
+      request: 60s
+      backendRequest: 60s
+  - matches:
+    - headers:
+      - type: Exact
+        name: x-ai-eg-model
+        value: general-expert
+    backendRefs:
+    - name: vllm-llama3-8b-instruct
+    timeouts:
+      request: 60s
+      backendRequest: 60s
+  - backendRefs:
+    - name: vllm-llama3-8b-instruct
+    timeouts:
+      request: 60s
+      backendRequest: 60s
+---
+apiVersion: gateway.envoyproxy.io/v1alpha1
+kind: EnvoyPatchPolicy
+metadata:
+  name: ai-gateway-prepost-extproc-patch-policy
+  namespace: default
+spec:
+  jsonPatches:
+  - name: default/semantic-router/http
+    operation:
+      op: add
+      path: /default_filter_chain/filters/0/typed_config/http_filters/0
+      value:
+        name: semantic-router-extproc
+        typedConfig:
+          '@type': type.googleapis.com/envoy.extensions.filters.http.ext_proc.v3.ExternalProcessor
+          allow_mode_override: true
+          grpcService:
+            envoyGrpc:
+              authority: semantic-router.vllm-semantic-router-system:50051
+              clusterName: semantic-router
+            timeout: 60s
+          message_timeout: 60s
+          processing_mode:
+            request_body_mode: BUFFERED
+            request_header_mode: SEND
+            request_trailer_mode: SKIP
+            response_body_mode: BUFFERED
+            response_header_mode: SEND
+            response_trailer_mode: SKIP
+    type: type.googleapis.com/envoy.config.listener.v3.Listener
+  - name: semantic-router
+    operation:
+      op: add
+      path: ''
+      value:
+        connect_timeout: 60s
+        http2_protocol_options: {}
+        lb_policy: ROUND_ROBIN
+        load_assignment:
+          cluster_name: semantic-router
+          endpoints:
+          - lb_endpoints:
+            - endpoint:
+                address:
+                  socket_address:
+                    address: semantic-router.vllm-semantic-router-system.svc.cluster.local
+                    port_value: 50051
+        name: semantic-router
+        type: STRICT_DNS
+    type: type.googleapis.com/envoy.config.cluster.v3.Cluster
+  targetRef:
+    group: gateway.networking.k8s.io
+    kind: Gateway
+    name: semantic-router
+  type: JSONPatch
diff --git a/e2e/profiles/ai-gateway/profile.go b/e2e/profiles/ai-gateway/profile.go
@@ -124,7 +124,6 @@ func (p *Profile) GetTestCases() []string {
 		"plugin-chain-execution",      // Plugin ordering and blocking
 		"rule-condition-logic",        // AND/OR operators
 		"decision-fallback-behavior",  // Fallback to default
-		"keyword-routing",             // Keyword-based decisions
 		"plugin-config-variations",    // Plugin configuration testing
 
 		// Load tests
diff --git a/e2e/profiles/aibrix/profile.go b/e2e/profiles/aibrix/profile.go
@@ -184,7 +184,6 @@ func (p *Profile) GetTestCases() []string {
 		"plugin-chain-execution",      // Plugin ordering and blocking
 		"rule-condition-logic",        // AND/OR operators
 		"decision-fallback-behavior",  // Fallback to default
-		"keyword-routing",             // Keyword-based decisions
 		"plugin-config-variations",    // Plugin configuration testing
 
 		// Load tests
diff --git a/e2e/profiles/dynamic-config/profile.go b/e2e/profiles/dynamic-config/profile.go
@@ -121,7 +121,6 @@ func (p *Profile) GetTestCases() []string {
 		"plugin-chain-execution",      // Plugin ordering and blocking
 		"rule-condition-logic",        // AND/OR operators
 		"decision-fallback-behavior",  // Fallback to default
-		"keyword-routing",             // Keyword-based decisions
 		"plugin-config-variations",    // Plugin configuration testing
 
 		// Load tests
diff --git a/e2e/profiles/routing-strategies/profile.go b/e2e/profiles/routing-strategies/profile.go
@@ -202,12 +202,12 @@ func (p *Profile) deployEnvoyAIGateway(ctx context.Context, deployer *helm.Deplo
 
 func (p *Profile) deployGatewayResources(ctx context.Context, opts *framework.SetupOptions) error {
 	// Apply base model
-	if err := p.kubectlApply(ctx, opts.KubeConfig, "deploy/kubernetes/ai-gateway/aigw-resources/base-model.yaml"); err != nil {
+	if err := p.kubectlApply(ctx, opts.KubeConfig, "deploy/kubernetes/routing-strategies/aigw-resources/base-model.yaml"); err != nil {
 		return fmt.Errorf("failed to apply base model: %w", err)
 	}
 
 	// Apply gateway API resources
-	if err := p.kubectlApply(ctx, opts.KubeConfig, "deploy/kubernetes/ai-gateway/aigw-resources/gwapi-resources.yaml"); err != nil {
+	if err := p.kubectlApply(ctx, opts.KubeConfig, "deploy/kubernetes/routing-strategies/aigw-resources/gwapi-resources.yaml"); err != nil {
 		return fmt.Errorf("failed to apply gateway API resources: %w", err)
 	}
 
@@ -295,8 +295,8 @@ func (p *Profile) verifyEnvironment(ctx context.Context, opts *framework.SetupOp
 
 func (p *Profile) cleanupGatewayResources(ctx context.Context, opts *framework.TeardownOptions) error {
 	// Delete in reverse order
-	p.kubectlDelete(ctx, opts.KubeConfig, "deploy/kubernetes/ai-gateway/aigw-resources/gwapi-resources.yaml")
-	p.kubectlDelete(ctx, opts.KubeConfig, "deploy/kubernetes/ai-gateway/aigw-resources/base-model.yaml")
+	p.kubectlDelete(ctx, opts.KubeConfig, "deploy/kubernetes/routing-strategies/aigw-resources/gwapi-resources.yaml")
+	p.kubectlDelete(ctx, opts.KubeConfig, "deploy/kubernetes/routing-strategies/aigw-resources/base-model.yaml")
 	return nil
 }
 
diff --git a/test-report.json b/test-report.json
diff --git a/test-report.md b/test-report.md