jroth1111
diff --git a/‎.compose.dynamic.rendered.yml‎
Lines changed: 101 additions & 0 deletions b/‎.compose.dynamic.rendered.yml‎
Lines changed: 101 additions & 0 deletions
diff --git a/‎.compose.dynamic.yml‎
Lines changed: 92 additions & 0 deletions b/‎.compose.dynamic.yml‎
Lines changed: 92 additions & 0 deletions
diff --git a/‎.compose.rendered.yml‎
Lines changed: 99 additions & 0 deletions b/‎.compose.rendered.yml‎
Lines changed: 99 additions & 0 deletions
diff --git a/‎.env.example‎
Lines changed: 14 additions & 0 deletions b/‎.env.example‎
Lines changed: 14 additions & 0 deletions
diff --git a/‎.gitignore‎
Lines changed: 4 additions & 0 deletions b/‎.gitignore‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎LICENSE‎
Lines changed: 21 additions & 0 deletions b/‎LICENSE‎
Lines changed: 21 additions & 0 deletions
@@ -0,0 +1,101 @@
+name: litellm-coolify-deployment-pack
+services:
+  litellm_glm5_pool:
+    entrypoint:
+      - /bin/sh
+      - -lc
+      - |
+        set -eu
+        cat > /app/config.yaml <<'CONFIG'
+        model_list:
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_1
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_2
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_3
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_4
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_5
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_6
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_7
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_8
+        router_settings:
+          routing_strategy: simple-shuffle
+          allowed_fails: 1
+          cooldown_time: 60
+        litellm_settings:
+          master_key: os.environ/LITELLM_MASTER_KEY
+          drop_params: true
+        general_settings:
+          disable_master_key_return: true
+        CONFIG
+        exec docker/prod_entrypoint.sh --config /app/config.yaml --host 0.0.0.0 --port 4000
+    environment:
+      LITELLM_MASTER_KEY: replace-with-random-master-key
+      NVIDIA_API_BASE: https://integrate.api.nvidia.com/v1
+      NVIDIA_API_KEY_POOL_1: replace-me
+      NVIDIA_API_KEY_POOL_2: replace-me
+      NVIDIA_API_KEY_POOL_3: replace-me
+      NVIDIA_API_KEY_POOL_4: replace-me
+      NVIDIA_API_KEY_POOL_5: replace-me
+      NVIDIA_API_KEY_POOL_6: replace-me
+      NVIDIA_API_KEY_POOL_7: replace-me
+      NVIDIA_API_KEY_POOL_8: replace-me
+      SSL_CERT_FILE: /etc/ssl/certs/ca-certificates.crt
+    healthcheck:
+      test:
+        - CMD-SHELL
+        - python3 -c "import sys,urllib.request;sys.exit(0 if urllib.request.urlopen('http://127.0.0.1:4000/health/liveliness', timeout=5).status == 200 else 1)"
+      timeout: 6s
+      interval: 10s
+      retries: 12
+      start_period: 20s
+    image: ghcr.io/berriai/litellm@sha256:d6580beba82a69e4cfb6598c300b7c524d9ea6f67592226fdec7f6a9aba34eb2
+    networks:
+      default: null
+    ports:
+      - mode: ingress
+        target: 4000
+        published: "4000"
+        protocol: tcp
+    restart: unless-stopped
+networks:
+  default:
+    name: litellm-coolify-deployment-pack_default
@@ -0,0 +1,92 @@
+services:
+  litellm_glm5_pool:
+    image: "ghcr.io/berriai/litellm@sha256:d6580beba82a69e4cfb6598c300b7c524d9ea6f67592226fdec7f6a9aba34eb2"
+    restart: unless-stopped
+    ports:
+      - "${HOST_PORT:-4000}:4000"
+    environment:
+      LITELLM_MASTER_KEY: "${LITELLM_MASTER_KEY}"
+      NVIDIA_API_BASE: "${NVIDIA_API_BASE}"
+      NVIDIA_API_KEY_POOL_1: "${NVIDIA_API_KEY_POOL_1}"
+      NVIDIA_API_KEY_POOL_2: "${NVIDIA_API_KEY_POOL_2}"
+      NVIDIA_API_KEY_POOL_3: "${NVIDIA_API_KEY_POOL_3}"
+      NVIDIA_API_KEY_POOL_4: "${NVIDIA_API_KEY_POOL_4}"
+      NVIDIA_API_KEY_POOL_5: "${NVIDIA_API_KEY_POOL_5}"
+      NVIDIA_API_KEY_POOL_6: "${NVIDIA_API_KEY_POOL_6}"
+      NVIDIA_API_KEY_POOL_7: "${NVIDIA_API_KEY_POOL_7}"
+      NVIDIA_API_KEY_POOL_8: "${NVIDIA_API_KEY_POOL_8}"
+      SSL_CERT_FILE: "${SSL_CERT_FILE:-/etc/ssl/certs/ca-certificates.crt}"
+    entrypoint:
+      - /bin/sh
+      - -lc
+      - |
+        set -eu
+        cat > /app/config.yaml <<'CONFIG'
+        model_list:
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_1
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_2
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_3
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_4
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_5
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_6
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_7
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_8
+        router_settings:
+          routing_strategy: simple-shuffle
+          allowed_fails: 1
+          cooldown_time: 60
+        litellm_settings:
+          master_key: os.environ/LITELLM_MASTER_KEY
+          drop_params: true
+        general_settings:
+          disable_master_key_return: true
+        CONFIG
+        exec docker/prod_entrypoint.sh --config /app/config.yaml --host 0.0.0.0 --port 4000
+    healthcheck:
+      test:
+        - CMD-SHELL
+        - "python3 -c \"import sys,urllib.request;sys.exit(0 if urllib.request.urlopen('http://127.0.0.1:4000/health/liveliness', timeout=5).status == 200 else 1)\""
+      interval: 10s
+      timeout: 6s
+      retries: 12
+      start_period: 20s
@@ -0,0 +1,99 @@
+name: litellm-coolify-deployment-pack
+services:
+  litellm_glm5_pool:
+    entrypoint:
+      - /bin/sh
+      - -lc
+      - |
+        set -eu
+        cat > /app/config.yaml <<'CONFIG'
+        model_list:
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_1
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_2
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_3
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_4
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_5
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_6
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_7
+          - model_name: glm-5-nvidia
+            litellm_params:
+              model: z-ai/glm5
+              custom_llm_provider: openai
+              api_base: os.environ/NVIDIA_API_BASE
+              api_key: os.environ/NVIDIA_API_KEY_POOL_8
+        router_settings:
+          routing_strategy: simple-shuffle
+          allowed_fails: 1
+          cooldown_time: 60
+        litellm_settings:
+          master_key: os.environ/LITELLM_MASTER_KEY
+          drop_params: true
+        CONFIG
+        exec docker/prod_entrypoint.sh --config /app/config.yaml --host 0.0.0.0 --port 4000
+    environment:
+      LITELLM_MASTER_KEY: replace-with-random-master-key
+      NVIDIA_API_BASE: https://integrate.api.nvidia.com/v1
+      NVIDIA_API_KEY_POOL_1: replace-me
+      NVIDIA_API_KEY_POOL_2: replace-me
+      NVIDIA_API_KEY_POOL_3: replace-me
+      NVIDIA_API_KEY_POOL_4: replace-me
+      NVIDIA_API_KEY_POOL_5: replace-me
+      NVIDIA_API_KEY_POOL_6: replace-me
+      NVIDIA_API_KEY_POOL_7: replace-me
+      NVIDIA_API_KEY_POOL_8: replace-me
+      SSL_CERT_FILE: /etc/ssl/certs/ca-certificates.crt
+    healthcheck:
+      test:
+        - CMD-SHELL
+        - python3 -c "import sys,urllib.request;sys.exit(0 if urllib.request.urlopen('http://127.0.0.1:4000/health/liveliness', timeout=5).status == 200 else 1)"
+      timeout: 6s
+      interval: 10s
+      retries: 12
+      start_period: 20s
+    image: ghcr.io/berriai/litellm@sha256:d6580beba82a69e4cfb6598c300b7c524d9ea6f67592226fdec7f6a9aba34eb2
+    networks:
+      default: null
+    ports:
+      - mode: ingress
+        target: 4000
+        published: "4000"
+        protocol: tcp
+    restart: unless-stopped
+networks:
+  default:
+    name: litellm-coolify-deployment-pack_default
@@ -0,0 +1,14 @@
+# Change HOST_PORT when deploying a second LiteLLM instance on the same server.
+HOST_PORT=4000
+LITELLM_MASTER_KEY=replace-with-random-master-key
+NVIDIA_API_BASE=https://integrate.api.nvidia.com/v1
+# Add or remove NVIDIA_API_KEY_POOL_N lines as needed.
+NVIDIA_API_KEY_POOL_1=replace-me
+NVIDIA_API_KEY_POOL_2=replace-me
+NVIDIA_API_KEY_POOL_3=replace-me
+NVIDIA_API_KEY_POOL_4=replace-me
+NVIDIA_API_KEY_POOL_5=replace-me
+NVIDIA_API_KEY_POOL_6=replace-me
+NVIDIA_API_KEY_POOL_7=replace-me
+NVIDIA_API_KEY_POOL_8=replace-me
+SSL_CERT_FILE=/etc/ssl/certs/ca-certificates.crt
@@ -0,0 +1,4 @@
+.env
+.env.*
+!.env.example
+.DS_Store
@@ -0,0 +1,21 @@
+MIT License
+
+Copyright (c) 2026 Jacob Rothfield
+
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.
-Original file line number
+Diff line change
@@ @@ -0,0 +1,4 @@ @@
 +.env
 +.env.*
 +!.env.example
 +.DS_Store