@@ -146,7 +146,7 @@ spec:
146
146
fieldPath : status.podIP
147
147
---
148
148
# --- Primary InferencePool Definition ---
149
- apiVersion : inference.networking.x- k8s.io/v1alpha2
149
+ apiVersion : inference.networking.k8s.io/v1
150
150
kind : InferencePool
151
151
metadata :
152
152
name : primary-inference-pool
@@ -196,8 +196,8 @@ spec:
196
196
terminationGracePeriodSeconds : 130
197
197
containers :
198
198
- name : epp
199
- image : registry.k8s.io/ gateway-api-inference-extension/epp:v0.1.0
200
- imagePullPolicy : IfNotPresent
199
+ image : us-central1-docker.pkg.dev/k8s-staging-images/ gateway-api-inference-extension/epp:main
200
+ imagePullPolicy : Always
201
201
args :
202
202
- --pool-name
203
203
- " primary-inference-pool"
@@ -239,7 +239,7 @@ spec:
239
239
name : plugins-config
240
240
---
241
241
# --- Secondary InferencePool Definition ---
242
- apiVersion : inference.networking.x- k8s.io/v1alpha2
242
+ apiVersion : inference.networking.k8s.io/v1
243
243
kind : InferencePool
244
244
metadata :
245
245
name : secondary-inference-pool
@@ -290,8 +290,8 @@ spec:
290
290
terminationGracePeriodSeconds : 130
291
291
containers :
292
292
- name : epp
293
- image : registry.k8s.io/ gateway-api-inference-extension/epp:v0.1.0
294
- imagePullPolicy : IfNotPresent
293
+ image : us-central1-docker.pkg.dev/k8s-staging-images/ gateway-api-inference-extension/epp:main
294
+ imagePullPolicy : Always
295
295
args :
296
296
- --pool-name
297
297
- " secondary-inference-pool"
@@ -363,6 +363,9 @@ rules:
363
363
- apiGroups : ["inference.networking.x-k8s.io"]
364
364
resources : ["inferencemodels", "inferencepools"]
365
365
verbs : ["get", "list", "watch"]
366
+ - apiGroups : ["inference.networking.k8s.io"]
367
+ resources : ["inferencepools"]
368
+ verbs : ["get", "list", "watch"]
366
369
- apiGroups : [""]
367
370
resources : ["pods"]
368
371
verbs : ["get", "list", "watch"]
@@ -379,4 +382,4 @@ subjects:
379
382
roleRef :
380
383
kind : Role
381
384
name : inference-model-reader
382
- apiGroup : rbac.authorization.k8s.io
385
+ apiGroup : rbac.authorization.k8s.io
0 commit comments