add common_grammar_trigger.{to_json,from_json}

ochafik · ochafik · commit 1317a35fddfa · 2025-03-05T01:55:02.000Z
diff --git a/common/common.cpp b/common/common.cpp
@@ -10,7 +10,6 @@
 // Change JSON_ASSERT from assert() to GGML_ASSERT:
 #define JSON_ASSERT GGML_ASSERT
 #include "json.hpp"
-#include "json-schema-to-grammar.h"
 #include "llama.h"
 
 #include <algorithm>
@@ -2031,3 +2030,25 @@ common_control_vector_data common_control_vector_load(const std::vector<common_c
     return result;
 }
 
+template <>
+json common_grammar_trigger::to_json() const {
+    json out {
+        {"type", (int) type},
+        {"value", value},
+    };
+    if (type == COMMON_GRAMMAR_TRIGGER_TYPE_TOKEN) {
+        out["token"] = (int) token;
+    }
+    return out;
+}
+
+template <>
+common_grammar_trigger common_grammar_trigger::from_json(const json & in) {
+    common_grammar_trigger out;
+    out.type = (common_grammar_trigger_type) in.at("type").get<int>();
+    out.value = in.at("value").get<std::string>();
+    if (out.type == COMMON_GRAMMAR_TRIGGER_TYPE_TOKEN) {
+        out.token = (llama_token) in.at("token").get<int>();
+    }
+    return out;
+}
diff --git a/common/common.h b/common/common.h
@@ -8,7 +8,6 @@
 #include <string>
 #include <vector>
 #include <sstream>
-#include <variant>
 
 #ifdef _WIN32
 #define DIRECTORY_SEPARATOR '\\'
@@ -122,6 +121,12 @@ struct common_grammar_trigger {
     common_grammar_trigger_type type;
     std::string value;
     llama_token token = LLAMA_TOKEN_NULL;
+
+    template <class T>
+    T to_json() const;
+    
+    template <class T>
+    static common_grammar_trigger from_json(const T & in);
 };
 
 // sampling parameters
@@ -172,7 +177,7 @@ struct common_params_sampling {
 
     std::string                         grammar; // optional BNF-like grammar to constrain sampling
     bool                                grammar_lazy = false;
-    std::vector<common_grammar_trigger> grammar_triggers;  // optional trigger words to trigger lazy grammar
+    std::vector<common_grammar_trigger> grammar_triggers; // optional triggers (for lazy grammars)
     std::set<llama_token>               preserved_tokens;
 
     std::vector<llama_logit_bias> logit_bias; // logit biases to apply
diff --git a/examples/server/server.cpp b/examples/server/server.cpp
@@ -133,20 +133,7 @@ struct slot_params {
 
         auto grammar_triggers = json::array();
         for (const auto & trigger : sampling.grammar_triggers) {
-            switch (trigger.type) {
-                case COMMON_GRAMMAR_TRIGGER_TYPE_WORD:
-                    grammar_triggers.push_back({{"word", trigger.value}});
-                    break;
-                case COMMON_GRAMMAR_TRIGGER_TYPE_PATTERN:
-                    grammar_triggers.push_back({{"pattern", trigger.value}});
-                    break;
-                case COMMON_GRAMMAR_TRIGGER_TYPE_PATTERN_START:
-                    grammar_triggers.push_back({{"pattern_start", trigger.value}});
-                    break;
-                case COMMON_GRAMMAR_TRIGGER_TYPE_TOKEN:
-                    grammar_triggers.push_back({{"token", trigger.token}});
-                    break;
-            }
+            grammar_triggers.push_back(trigger.to_json<json>());
         }
 
         return json {
@@ -385,44 +372,31 @@ struct server_task {
             const auto grammar_triggers = data.find("grammar_triggers");
             if (grammar_triggers != data.end()) {
                 for (const auto & t : *grammar_triggers) {
-                    auto type = static_cast<common_grammar_trigger_type>(t.at("type"));
-                    switch (type) {
-                        case COMMON_GRAMMAR_TRIGGER_TYPE_WORD:
-                        {
-                            const std::string & word = t.at("value");
-                            auto ids = common_tokenize(vocab, word, /* add_special= */ false, /* parse_special= */ true);
-                            if (ids.size() == 1) {
-                                auto token = ids[0];
-                                if (std::find(params.sampling.preserved_tokens.begin(), params.sampling.preserved_tokens.end(), (llama_token) token) == params.sampling.preserved_tokens.end()) {
-                                    throw std::runtime_error("Grammar trigger word should be marked as preserved token: " + word);
-                                }
-                                SRV_DBG("Grammar trigger token: %d (`%s`)\n", token, word.c_str());
-                                common_grammar_trigger trigger;
-                                trigger.type = COMMON_GRAMMAR_TRIGGER_TYPE_TOKEN;
-                                trigger.value = token;
-                                params.sampling.grammar_triggers.push_back(trigger);
-                            } else {
-                                SRV_DBG("Grammar trigger word: `%s`\n", word.c_str());
-                                params.sampling.grammar_triggers.push_back({COMMON_GRAMMAR_TRIGGER_TYPE_WORD, word});
+                    auto ct = common_grammar_trigger::from_json(t);
+                    if (ct.type == COMMON_GRAMMAR_TRIGGER_TYPE_WORD) {
+                        const auto & word = ct.value;
+                        auto ids = common_tokenize(vocab, word, /* add_special= */ false, /* parse_special= */ true);
+                        if (ids.size() == 1) {
+                            auto token = ids[0];
+                            if (std::find(params.sampling.preserved_tokens.begin(), params.sampling.preserved_tokens.end(), (llama_token) token) == params.sampling.preserved_tokens.end()) {
+                                throw std::runtime_error("Grammar trigger word should be marked as preserved token: " + word);
                             }
-                            break;
-                        }
-                        case COMMON_GRAMMAR_TRIGGER_TYPE_PATTERN:
-                        case COMMON_GRAMMAR_TRIGGER_TYPE_PATTERN_START:
-                        {
-                            const std::string & pattern = t.at("value");
-                            params.sampling.grammar_triggers.push_back({type, pattern});
-                            break;
+                            SRV_DBG("Grammar trigger token: %d (`%s`)\n", token, word.c_str());
+                            common_grammar_trigger trigger;
+                            trigger.type = COMMON_GRAMMAR_TRIGGER_TYPE_TOKEN;
+                            trigger.value = (llama_token) token;
+                            params.sampling.grammar_triggers.push_back(trigger);
+                        } else {
+                            SRV_DBG("Grammar trigger word: `%s`\n", word.c_str());
+                            params.sampling.grammar_triggers.push_back({COMMON_GRAMMAR_TRIGGER_TYPE_WORD, word});
                         }
-                        case COMMON_GRAMMAR_TRIGGER_TYPE_TOKEN:
-                            throw std::runtime_error("Unespected token trigger");
-                        default:
-                            throw std::runtime_error("Unknown trigger type");
+                    } else {
+                        params.sampling.grammar_triggers.push_back(ct);
                     }
                 }
             }
             if (params.sampling.grammar_lazy) {
-                GGML_ASSERT(params.sampling.grammar_triggers.size() > 0);
+                GGML_ASSERT(!params.sampling.grammar_triggers.empty());
             }
         }
 
diff --git a/examples/server/utils.hpp b/examples/server/utils.hpp
@@ -621,10 +621,7 @@ static json oaicompat_completion_params_parse(
     llama_params["grammar_lazy"]     = chat_params.grammar_lazy;
     auto grammar_triggers = json::array();
     for (const auto & trigger : chat_params.grammar_triggers) {
-        grammar_triggers.push_back({
-            {"type", (int) trigger.type},
-            {"value", trigger.token},
-        });
+        grammar_triggers.push_back(trigger.to_json<json>());
     }
     llama_params["grammar_triggers"] = grammar_triggers;
     llama_params["preserved_tokens"] = chat_params.preserved_tokens;