disable clip fa for now

LostRuins · LostRuins · commit d68f4a5ae51e · 2025-11-27T10:20:38.000+08:00
diff --git a/gpttype_adapter.cpp b/gpttype_adapter.cpp
@@ -2470,7 +2470,7 @@ ModelLoadResult gpttype_load_model(const load_model_inputs inputs, FileFormat in
             }
             clip_context_params ctx_clip_params {
                 /* use_gpu           */ true,
-                /* flash_attn_type   */ (kcpp_data->flash_attn?CLIP_FLASH_ATTN_TYPE_ENABLED:CLIP_FLASH_ATTN_TYPE_DISABLED),
+                /* flash_attn_type   */ CLIP_FLASH_ATTN_TYPE_DISABLED, //kcpp: disabled in 1.102.2 as some headsizes break on turing
                 /* image_min_tokens  */ -1,
                 /* image_max_tokens  */ -1,
             };
diff --git a/koboldcpp.py b/koboldcpp.py
@@ -66,7 +66,7 @@
 extra_images_max = 4 # for kontext/qwen img
 
 # global vars
-KcppVersion = "1.102.1"
+KcppVersion = "1.102.2"
 showdebug = True
 kcpp_instance = None #global running instance
 global_memory = {"tunnel_url": "", "restart_target":"", "input_to_exit":False, "load_complete":False, "restart_override_config_target":""}

Original file line number	Diff line number	Diff line change
`@@ -2470,7 +2470,7 @@ ModelLoadResult gpttype_load_model(const load_model_inputs inputs, FileFormat in`
`2470`	`2470`	`}`
`2471`	`2471`	`clip_context_params ctx_clip_params {`
`2472`	`2472`	`/* use_gpu */ true,`
`2473`		`- /* flash_attn_type */ (kcpp_data->flash_attn?CLIP_FLASH_ATTN_TYPE_ENABLED:CLIP_FLASH_ATTN_TYPE_DISABLED),`
	`2473`	`+ /* flash_attn_type */ CLIP_FLASH_ATTN_TYPE_DISABLED, //kcpp: disabled in 1.102.2 as some headsizes break on turing`
`2474`	`2474`	`/* image_min_tokens */ -1,`
`2475`	`2475`	`/* image_max_tokens */ -1,`
`2476`	`2476`	`};`