ollama: enable flash attention and k/v cache quantization

Omoeba · Omoeba · commit f8e735b643da · 2025-05-24T02:57:53.000-07:00
diff --git a/Formula/o/ollama.rb b/Formula/o/ollama.rb
@@ -50,6 +50,8 @@ def install
     working_dir var
     log_path var/"log/ollama.log"
     error_log_path var/"log/ollama.log"
+    environment_variables OLLAMA_FLASH_ATTENTION: "1",
+                          OLLAMA_KV_CACHE_TYPE:   "q8_0"
   end
 
   test do