docker
diff --git a/‎README.md‎
Lines changed: 8 additions & 0 deletions b/‎README.md‎
Lines changed: 8 additions & 0 deletions
diff --git a/‎charts/docker-model-runner/CONTRIBUTING.md‎
Lines changed: 18 additions & 0 deletions b/‎charts/docker-model-runner/CONTRIBUTING.md‎
Lines changed: 18 additions & 0 deletions
diff --git a/‎charts/docker-model-runner/Chart.yaml‎
Lines changed: 6 additions & 0 deletions b/‎charts/docker-model-runner/Chart.yaml‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎charts/docker-model-runner/Makefile‎
Lines changed: 54 additions & 0 deletions b/‎charts/docker-model-runner/Makefile‎
Lines changed: 54 additions & 0 deletions
diff --git a/‎charts/docker-model-runner/README.md‎
Lines changed: 175 additions & 0 deletions b/‎charts/docker-model-runner/README.md‎
Lines changed: 175 additions & 0 deletions
diff --git a/‎charts/docker-model-runner/static/docker-model-runner-desktop.yaml‎
Lines changed: 114 additions & 0 deletions b/‎charts/docker-model-runner/static/docker-model-runner-desktop.yaml‎
Lines changed: 114 additions & 0 deletions
@@ -144,3 +144,11 @@ curl http://localhost:8080/metrics
 - **Monitoring integration**: Add the endpoint to your Prometheus configuration
 
 Check [METRICS.md](./METRICS.md) for more details.
+
+##  Kubernetes
+
+Experimental support for running in Kubernetes is available
+in the form of [a Helm chart and static YAML](charts/docker-model-runner/README).
+
+If you are interested in a specific Kubernetes use-case, please start a
+discussion on the issue tracker.
@@ -0,0 +1,18 @@
+# Contributing
+
+
+## Using the Makefile
+
+```bash
+# Render to plain Kubernetes YAML
+make render
+
+# Install the chart
+make install
+
+# Upgrade the chart
+make upgrade
+
+# Uninstall the chart
+make uninstall
+```
@@ -0,0 +1,6 @@
+apiVersion: v2
+name: docker-model-runner
+description: A Helm chart for Docker Model Runner
+type: application
+version: 0.1.0
+appVersion: "latest"
@@ -0,0 +1,54 @@
+.PHONY: render clean install upgrade uninstall template lint package help
+
+CHART_NAME := docker-model-runner
+RELEASE_NAME := docker-model-runner
+NAMESPACE := default
+
+render:
+	@echo "Rendering Helm chart to plain Kubernetes YAML..."
+	mkdir -p static
+	helm template $(RELEASE_NAME) . --namespace $(NAMESPACE) > static/docker-model-runner.yaml
+	helm template $(RELEASE_NAME) . --namespace $(NAMESPACE) --set "nodePort.enabled=true" > static/docker-model-runner-desktop.yaml
+	helm template $(RELEASE_NAME) . --namespace $(NAMESPACE) --set "modelInit.enabled=true" --set "modelInit.models[0]=ai/smollm2:latest" > static/docker-model-runner-smollm2.yaml
+	helm template $(RELEASE_NAME) . --namespace $(NAMESPACE) --set "storage.storageClass=gp2" > static/docker-model-runner-eks.yaml
+	@echo "Rendered YAML saved to static"
+
+clean:
+	@echo "Cleaning up rendered files..."
+	rm -fR static
+
+install:
+	@echo "Installing Helm chart..."
+	helm install $(RELEASE_NAME) . --namespace $(NAMESPACE) --create-namespace
+
+upgrade:
+	@echo "Upgrading Helm chart..."
+	helm upgrade $(RELEASE_NAME) . --namespace $(NAMESPACE)
+
+uninstall:
+	@echo "Uninstalling Helm chart..."
+	helm uninstall $(RELEASE_NAME) --namespace $(NAMESPACE)
+
+template:
+	@echo "Templating Helm chart..."
+	helm template $(RELEASE_NAME) . --namespace $(NAMESPACE)
+
+lint:
+	@echo "Linting Helm chart..."
+	helm lint .
+
+package:
+	@echo "Packaging Helm chart..."
+	helm package .
+
+help:
+	@echo "Available targets:"
+	@echo "  render    - Render Helm chart to plain Kubernetes YAML (saves to rendered.yaml)"
+	@echo "  template  - Template Helm chart (output to stdout)"
+	@echo "  lint      - Lint Helm chart"
+	@echo "  package   - Package Helm chart"
+	@echo "  install   - Install Helm chart"
+	@echo "  upgrade   - Upgrade Helm chart"
+	@echo "  uninstall - Uninstall Helm chart"
+	@echo "  clean     - Clean up rendered files"
+	@echo "  help      - Show this help message"
@@ -0,0 +1,175 @@
+# Docker Model Runner Kubernetes Support
+
+Manifests for deploying Docker Model Runner on Kubernetes with ephemeral storage, GPU support, and model pre-pulling capabilities.
+
+## Quickstart
+
+### On Docker Desktop
+
+```
+kubectl apply -f static/docker-model-runner-desktop.yaml
+kubectl wait --for=condition=Available deployment/docker-model-runner --timeout=5m
+MODEL_RUNNER_HOST=http://localhost:31245 docker model run ai/smollm2:latest
+```
+
+### On any Kubernetes Cluster
+
+```
+kubectl apply -f static/docker-model-runner.yaml
+kubectl wait --for=condition=Available deployment/docker-model-runner --timeout=5m
+kubectl port-forward deployment/docker-model-runner 31245:12434
+```
+
+Then:
+
+```
+MODEL_RUNNER_HOST=http://localhost:31245 docker model run ai/smollm2:latest
+```
+
+## Helm Configuration
+
+### Basic Configuration
+
+Key configuration options in `values.yaml`:
+
+```yaml
+# Storage configuration
+storage:
+  size: 100Gi
+  storageClass: ""  # Set this to the storage class of your cloud provider.
+
+# Model pre-pull configuration
+modelInit:
+  enabled: false
+  models:
+    - "ai/smollm2:latest"
+
+# GPU configuration
+gpu:
+  enabled: false
+  vendor: nvidia  # or amd
+  count: 1
+
+# NodePort configuration
+nodePort:
+  enabled: false
+  port: 31245
+```
+
+### GPU Scheduling
+
+To enable GPU scheduling:
+
+```yaml
+gpu:
+  enabled: true
+  vendor: nvidia  # or amd
+  count: 1
+```
+
+This will add the appropriate resource requests/limits:
+- NVIDIA: `nvidia.com/gpu`
+- AMD: `amd.com/gpu`
+
+### Model Pre-pulling
+
+Configure models to pre-pull during pod initialization:
+
+```yaml
+modelInit:
+  enabled: true
+  models:
+    - "ai/smollm2:latest"
+    - "ai/llama3.2:latest"
+    - "ai/mistral:latest"
+```
+
+## Usage
+
+### Testing the Installation
+
+Once installed, set up a port-forward to access the service:
+
+```bash
+kubectl port-forward service/docker-model-runner-nodeport 31245:80
+```
+
+Then test the model runner:
+
+```bash
+MODEL_RUNNER_HOST=http://localhost:31245 docker model run ai/smollm2:latest
+```
+
+### Using with Open WebUI
+
+To use Docker Model Runner with Open WebUI, install the Open WebUI Helm chart:
+
+```bash
+# Add the Open WebUI Helm repository
+helm repo add open-webui https://helm.openwebui.com/
+helm repo update
+
+# Install Open WebUI with auth diabled
+# See the open-webui Helm chart for
+# connecting to your auth provider.
+helm upgrade --install --wait open-webui open-webui/open-webui \
+  --set ollama.enabled=false \
+  --set pipelines.enabled=false \
+  --set extraEnvVars[0].name="WEBUI_AUTH" \
+  --set-string extraEnvVars[0].value=false \
+  --set openaiBaseApiUrl="http://docker-model-runner/engines/v1"
+```
+
+Access Open WebUI:
+
+```bash
+kubectl port-forward service/open-webui 8080:80
+```
+
+Then visit http://localhost:8080 in your browser.
+
+## Values Reference
+
+| Parameter | Description | Default |
+|-----------|-------------|---------|
+| `replicaCount` | Number of replicas | `1` |
+| `image.repository` | Docker Model Runner image repository | `docker/model-runner` |
+| `image.tag` | Docker Model Runner image tag | `latest` |
+| `image.pullPolicy` | Image pull policy | `IfNotPresent` |
+| `storage.size` | Ephemeral volume size | `100Gi` |
+| `storage.storageClass` | Storage class for ephemeral volume | `""` |
+| `modelInit.enabled` | Enable model pre-pulling | `false` |
+| `modelInit.models` | List of models to pre-pull | `["ai/smollm2:latest"]` |
+| `gpu.enabled` | Enable GPU support | `false` |
+| `gpu.vendor` | GPU vendor (nvidia or amd) | `nvidia` |
+| `gpu.count` | Number of GPUs to request | `1` |
+| `nodePort.enabled` | Enable NodePort service | `false` |
+| `nodePort.port` | NodePort port number | `31245` |
+
+## Troubleshooting
+
+### Pod Fails to Start
+
+Check the pod logs:
+
+```bash
+kubectl logs -f deployment/docker-model-runner
+```
+
+### Model Pre-pull Issues
+
+Check the init container logs:
+
+```bash
+kubectl logs -f deployment/docker-model-runner -c model-init
+```
+
+### GPU Not Available
+
+Your cluster must use [a GPU scheduling plugin](https://kubernetes.io/docs/tasks/manage-gpus/scheduling-gpus/).
+
+Ensure your cluster has GPU support and the appropriate device plugin installed:
+
+- For NVIDIA GPUs: Install the [NVIDIA device plugin](https://github.com/NVIDIA/k8s-device-plugin)
+- For AMD GPUs: Install the [AMD device plugin](https://github.com/ROCm/k8s-device-plugin#deployment)
+
@@ -0,0 +1,114 @@
+---
+# Source: docker-model-runner/templates/service.yaml
+apiVersion: v1
+kind: Service
+metadata:
+  name: docker-model-runner
+  labels:
+    helm.sh/chart: docker-model-runner-0.1.0
+    app.kubernetes.io/name: docker-model-runner
+    app.kubernetes.io/instance: docker-model-runner
+    app.kubernetes.io/version: "latest"
+    app.kubernetes.io/managed-by: Helm
+spec:
+  type: ClusterIP
+  ports:
+  - port: 80
+    targetPort: 12434
+    protocol: TCP
+    name: http
+  selector:
+    app.kubernetes.io/name: docker-model-runner
+    app.kubernetes.io/instance: docker-model-runner
+---
+# Source: docker-model-runner/templates/service.yaml
+apiVersion: v1
+kind: Service
+metadata:
+  name: docker-model-runner-nodeport
+  labels:
+    helm.sh/chart: docker-model-runner-0.1.0
+    app.kubernetes.io/name: docker-model-runner
+    app.kubernetes.io/instance: docker-model-runner
+    app.kubernetes.io/version: "latest"
+    app.kubernetes.io/managed-by: Helm
+spec:
+  type: NodePort
+  ports:
+  - port: 80
+    targetPort: 12434
+    nodePort: 31245
+    protocol: TCP
+    name: http
+  selector:
+    app.kubernetes.io/name: docker-model-runner
+    app.kubernetes.io/instance: docker-model-runner
+---
+# Source: docker-model-runner/templates/deployment.yaml
+apiVersion: apps/v1
+kind: Deployment
+metadata:
+  name: docker-model-runner
+  labels:
+    helm.sh/chart: docker-model-runner-0.1.0
+    app.kubernetes.io/name: docker-model-runner
+    app.kubernetes.io/instance: docker-model-runner
+    app.kubernetes.io/version: "latest"
+    app.kubernetes.io/managed-by: Helm
+spec:
+  replicas: 1
+  selector:
+    matchLabels:
+      app.kubernetes.io/name: docker-model-runner
+      app.kubernetes.io/instance: docker-model-runner
+  template:
+    metadata:
+      labels:
+        app.kubernetes.io/name: docker-model-runner
+        app.kubernetes.io/instance: docker-model-runner
+    spec:
+      initContainers:
+      - name: changeowner
+        image: busybox
+        command: ["sh", "-c", "chmod a+rwx /models"]
+        volumeMounts:
+        - name: model-storage
+          mountPath: /models
+
+      containers:
+      - name: model-runner
+        image: "docker/model-runner:latest"
+        imagePullPolicy: IfNotPresent
+        ports:
+        - containerPort: 12434
+        env:
+        - name: DMR_ORIGINS
+          value: "http://localhost:31245,http://localhost:12434"
+        volumeMounts:
+        - name: model-storage
+          mountPath: /models
+        securityContext:
+          allowPrivilegeEscalation: false
+        readinessProbe:
+          httpGet:
+            path: /engines/status
+            port: 12434
+          initialDelaySeconds: 5
+          periodSeconds: 10
+          failureThreshold: 3
+        livenessProbe:
+          httpGet:
+            path: /engines/status
+            port: 12434
+          initialDelaySeconds: 15
+          periodSeconds: 20
+          failureThreshold: 3
+      volumes:
+      - name: model-storage
+        ephemeral:
+          volumeClaimTemplate:
+            spec:
+              accessModes: [ "ReadWriteOnce" ]
+              resources:
+                requests:
+                  storage: 100Gi