readme : update llama-server commands with fim presets (#34)

danbev · web-flow · commit 3126abfeb5df · 2025-02-20T09:24:30.000+02:00
diff --git a/README.md b/README.md
@@ -54,28 +54,19 @@ Here are recommended settings, depending on the amount of VRAM that you have:
 - More than 16GB VRAM:
 
   ```bash
-  llama-server \
-      -hf ggml-org/Qwen2.5-Coder-7B-Q8_0-GGUF \
-      --port 8012 -ngl 99 -fa -ub 1024 -b 1024 \
-      --ctx-size 0 --cache-reuse 256
+  llama-server --fim-qwen-7b-default
   ```
 
 - Less than 16GB VRAM:
 
   ```bash
-  llama-server \
-      -hf ggml-org/Qwen2.5-Coder-3B-Q8_0-GGUF \
-      --port 8012 -ngl 99 -fa -ub 1024 -b 1024 \
-      --ctx-size 0 --cache-reuse 256
+  llama-server --fim-qwen-3b-default
   ```
 
 - Less than 8GB VRAM:
 
   ```bash
-  llama-server \
-      -hf ggml-org/Qwen2.5-Coder-1.5B-Q8_0-GGUF \
-      --port 8012 -ngl 99 -fa -ub 1024 -b 1024 \
-      --ctx-size 0 --cache-reuse 256
+  llama-server --fim-qwen-1.5b-default
   ```
 
 <details>