CLIP-DLUT/podman_deploy.sh at master · m0cal/CLIP-DLUT · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
#!/bin/bash

# Exit on error
set -e

POD_NAME="clip-dlut-pod"
IMAGE_NAME="clip-dlut-app"
REDIS_CONTAINER="clip-dlut-redis"
BACKEND_CONTAINER="clip-dlut-backend"
WORKER_CONTAINER="clip-dlut-worker"

echo "=== CLIP-DLUT Podman Deployment ==="

# 1. Check/Generate NVIDIA CDI config
if ! podman run --rm --device nvidia.com/gpu=all docker.io/library/ubuntu nvidia-smi > /dev/null 2>&1; then
    echo "Checking NVIDIA CDI configuration..."
    if command -v nvidia-ctk &> /dev/null; then
        echo "Generating CDI specification at /etc/cdi/nvidia.yaml..."
        sudo nvidia-ctk cdi generate --output=/etc/cdi/nvidia.yaml
        echo "CDI generated. Verifying..."
    else
        echo "WARNING: nvidia-ctk not found. GPU access might fail if not configured."
    fi
fi

# 2. Build Image
echo "Building application image..."
podman build -t $IMAGE_NAME .

# 3. Create Pod
# We expose port 8000. In a pod, all containers share localhost.
if podman pod exists $POD_NAME; then
    echo "Pod $POD_NAME exists. Stopping and removing old containers..."
    podman pod stop $POD_NAME
    podman pod rm $POD_NAME
fi

echo "Creating Pod $POD_NAME..."
podman pod create --name $POD_NAME -p 8000:8000

# 4. Start Redis
echo "Starting Redis..."
podman run -d --pod $POD_NAME \
    --name $REDIS_CONTAINER \
    docker.io/library/redis:alpine

# 5. Start Backend
# Note: Since they are in the same pod, they communicate via localhost.
# The internal config defaults to localhost:6379, so no env overrides needed for BROKER/BACKEND URLs.
echo "Starting Backend..."
podman run -d --pod $POD_NAME \
    --name $BACKEND_CONTAINER \
    -v $(pwd)/storage:/app/storage \
    -v $(pwd)/backend:/app/backend \
    -v $(pwd)/model:/app/model \
    $IMAGE_NAME \
    uvicorn backend.main:app --host 0.0.0.0 --port 8000

# 6. Start Worker with GPU
echo "Starting Worker (with GPU)..."
# Using --device nvidia.com/gpu=all (CDI syntax)
podman run -d --pod $POD_NAME \
    --device nvidia.com/gpu=all \
    --name $WORKER_CONTAINER \
    -v $(pwd)/storage:/app/storage \
    -v $(pwd)/backend:/app/backend \
    -v $(pwd)/model:/app/model \
    $IMAGE_NAME \
    celery -A backend.core.celery_app worker --loglevel=info --concurrency=1 --pool=solo

echo "=== Deployment Complete ==="
echo "Access the API at: http://localhost:8000/docs"
echo "View logs: podman logs -f $WORKER_CONTAINER"