readme : minor simplifications of the server commands

ggerganov · web-flow · commit a0dd85c7054c · 2025-01-27T09:46:10.000+02:00
diff --git a/README.md b/README.md
@@ -102,7 +102,7 @@ Here are recommended settings, depending on the amount of VRAM that you have:
   ```bash
   llama-server \
       -hf ggml-org/Qwen2.5-Coder-7B-Q8_0-GGUF \
-      --port 8012 -ngl 99 -fa -ub 1024 -b 1024 -dt 0.1 \
+      --port 8012 -ngl 99 -fa -ub 1024 -b 1024 \
       --ctx-size 0 --cache-reuse 256
   ```
 
@@ -111,7 +111,7 @@ Here are recommended settings, depending on the amount of VRAM that you have:
   ```bash
   llama-server \
       -hf ggml-org/Qwen2.5-Coder-3B-Q8_0-GGUF \
-      --port 8012 -ngl 99 -fa -ub 1024 -b 1024 -dt 0.1 \
+      --port 8012 -ngl 99 -fa -ub 1024 -b 1024 \
       --ctx-size 0 --cache-reuse 256
   ```
 
@@ -120,7 +120,7 @@ Here are recommended settings, depending on the amount of VRAM that you have:
   ```bash
   llama-server \
       -hf ggml-org/Qwen2.5-Coder-1.5B-Q8_0-GGUF \
-      --port 8012 -ngl 99 -fa -ub 1024 -b 1024 -dt 0.1 \
+      --port 8012 -ngl 99 -fa -ub 1024 -b 1024 \
       --ctx-size 0 --cache-reuse 256
   ```