Enable GPU if available in Makefile

ericcurtin · ericcurtin · commit eefca6e751f8 · 2025-09-24T22:48:02.000+01:00
Also some podman-compatibility fixes, trying to compare why GPU
access works in podman and not docker and vice versa for debugging
reasons.

Signed-off-by: Eric Curtin &lt;eric.curtin@docker.com&gt;
diff --git a/Dockerfile b/Dockerfile
@@ -3,10 +3,11 @@
 ARG GO_VERSION=1.24.2
 ARG LLAMA_SERVER_VERSION=latest
 ARG LLAMA_SERVER_VARIANT=cpu
+ARG TARGETARCH=${BUILDARCH}
 ARG LLAMA_BINARY_PATH=/com.docker.llama-server.native.linux.${LLAMA_SERVER_VARIANT}.${TARGETARCH}
 ARG BASE_IMAGE=ubuntu:24.04
 
-FROM golang:${GO_VERSION}-bookworm AS builder
+FROM docker.io/library/golang:${GO_VERSION}-bookworm AS builder
 
 # Install git for go mod download if needed
 RUN apt-get update && apt-get install -y --no-install-recommends git && rm -rf /var/lib/apt/lists/*
@@ -33,7 +34,7 @@ RUN --mount=type=cache,target=/go/pkg/mod \
 FROM docker/docker-model-backend-llamacpp:${LLAMA_SERVER_VERSION}-${LLAMA_SERVER_VARIANT} AS llama-server
 
 # --- Final image ---
-FROM ${BASE_IMAGE} AS final
+FROM docker.io/${BASE_IMAGE} AS final
 
 ARG LLAMA_SERVER_VARIANT
 
diff --git a/Makefile b/Makefile
@@ -7,6 +7,7 @@ BASE_IMAGE := ubuntu:24.04
 DOCKER_IMAGE := docker/model-runner:latest
 PORT := 8080
 MODELS_PATH := $(shell pwd)/models-store
+GPU_DEVICE_FLAG := $(shell if [ -d /dev/dri ]; then echo "--device /dev/dri"; fi)
 LLAMA_ARGS ?=
 
 # Main targets
@@ -61,6 +62,8 @@ docker-run: docker-build
 		-e DMR_ORIGINS="$(DMR_ORIGINS)" \
 		-e DO_NOT_TRACK=${DO_NOT_TRACK} \
 		-e DEBUG=${DEBUG} \
+		--gpus all \
+		$(GPU_DEVICE_FLAG) \
 		$(DOCKER_IMAGE)
 
 # Show help