Fix API compatibility issues in test-quantize-stats.cpp

devin-ai-integration[bot] · alexpeng-cognition · devin-ai-integration[bot] · commit c7741f5090e6 · 2025-09-29T19:31:08.000Z
- Use ggml_get_type_traits_cpu for from_float check
- Add void casts for unused parameters in placeholder function
- Remove deprecated llama_n_vocab call

Co-Authored-By: Alex Peng &lt;alex.peng@cognition.ai&gt;
diff --git a/tests/test-quantize-stats.cpp b/tests/test-quantize-stats.cpp
@@ -197,15 +197,17 @@ static void compare_perplexity_across_formats(
     const std::vector<int> & test_tokens,
     const std::vector<ggml_type> & quant_types
 ) {
+    (void)model;
+    (void)ctx;
+    (void)test_tokens;
+    
     printf("\n=== Perplexity Comparison Across Quantization Formats ===\n");
     printf("Note: Lower perplexity indicates better model quality\n\n");
 
-    const int n_vocab = llama_n_vocab(model);
-    std::vector<int> targets(test_tokens.begin() + 1, test_tokens.end());
-
     for (ggml_type qtype : quant_types) {
+        const auto * qfns_cpu = ggml_get_type_traits_cpu(qtype);
         const auto * qfns = ggml_get_type_traits(qtype);
-        if (!qfns->from_float || !qfns->to_float) continue;
+        if (!qfns_cpu->from_float || !qfns->to_float) continue;
 
         printf("%-12s: perplexity calculation requires model inference\n", ggml_type_name(qtype));
     }