llama : expose layer device type via C API

okaris · okaris · commit 79242d8ddc39 · 2025-09-06T07:08:35.000Z
diff --git a/include/llama.h b/include/llama.h
@@ -481,6 +481,7 @@ extern "C" {
     LLAMA_API int32_t llama_model_n_ctx_train(const struct llama_model * model);
     LLAMA_API int32_t llama_model_n_embd     (const struct llama_model * model);
     LLAMA_API int32_t llama_model_n_layer    (const struct llama_model * model);
+    LLAMA_API int32_t llama_model_dev_layer  (const struct llama_model * model, int32_t il);
     LLAMA_API int32_t llama_model_n_head     (const struct llama_model * model);
     LLAMA_API int32_t llama_model_n_head_kv  (const struct llama_model * model);
     LLAMA_API int32_t llama_model_n_swa      (const struct llama_model * model);
diff --git a/src/llama-model.cpp b/src/llama-model.cpp
@@ -19192,6 +19192,11 @@ int32_t llama_model_n_layer(const llama_model * model) {
     return model->hparams.n_layer;
 }
 
+int32_t llama_model_dev_layer(const llama_model * model, int32_t il) {
+    ggml_backend_dev_t dev = model->dev_layer(il);
+    return static_cast<int32_t>(ggml_backend_dev_type(dev));
+}
+
 int32_t llama_model_n_head(const llama_model * model) {
     return model->hparams.n_head();
 }

Original file line number	Diff line number	Diff line change
`@@ -19192,6 +19192,11 @@ int32_t llama_model_n_layer(const llama_model * model) {`
`19192`	`19192`	`return model->hparams.n_layer;`
`19193`	`19193`	`}`
`19194`	`19194`
	`19195`	`+int32_t llama_model_dev_layer(const llama_model * model, int32_t il) {`
	`19196`	`+ ggml_backend_dev_t dev = model->dev_layer(il);`
	`19197`	`+ return static_cast<int32_t>(ggml_backend_dev_type(dev));`
	`19198`	`+}`
	`19199`	`+`
`19195`	`19200`	`int32_t llama_model_n_head(const llama_model * model) {`
`19196`	`19201`	`return model->hparams.n_head();`
`19197`	`19202`	`}`