add llama_grammar_trigger_pattern

Olivier Chafik · Olivier Chafik · commit 5d43b7264e68 · 2025-03-05T01:21:47.000Z
diff --git a/src/llama-grammar.cpp b/src/llama-grammar.cpp
@@ -1050,14 +1050,16 @@ struct llama_grammar * llama_grammar_init_impl(
     } while (true);
 
     std::vector<llama_token>    vec_trigger_tokens;
-    std::vector<std::pair<std::string, std::regex>>     vec_trigger_patterns;
+    std::vector<llama_grammar_trigger_pattern> vec_trigger_patterns;
     for (size_t i = 0; i < num_trigger_tokens; i++) {
         GGML_ASSERT(trigger_tokens != nullptr);
         vec_trigger_tokens.push_back(trigger_tokens[i]);
     }
     for (size_t i = 0; i < num_trigger_patterns; i++) {
         GGML_ASSERT(trigger_patterns != nullptr);
-        vec_trigger_patterns.emplace_back(trigger_patterns[i], trigger_patterns[i]);
+        auto & trigger = vec_trigger_patterns.back();
+        trigger.pattern = trigger_patterns[i];
+        trigger.regex = std::regex(trigger.pattern);
     }
 
     // Important: vec_rules has to be moved here, not copied, because stacks contains
@@ -1085,7 +1087,7 @@ void llama_grammar_free_impl(struct llama_grammar * grammar) {
 }
 
 struct llama_grammar * llama_grammar_clone_impl(const struct llama_grammar & grammar) {
-    llama_grammar * result = new llama_grammar {
+    auto * result = new llama_grammar {
         grammar.vocab,
         grammar.rules,
         grammar.stacks,
@@ -1172,8 +1174,8 @@ void llama_grammar_accept_impl(struct llama_grammar & grammar, llama_token token
             grammar.trigger_buffer += piece;
 
             std::smatch match;
-            for (const auto & [_, regex] : grammar.trigger_patterns) {
-                if (std::regex_match(grammar.trigger_buffer, match, regex)) {
+            for (const auto & trigger_pattern : grammar.trigger_patterns) {
+                if (std::regex_match(grammar.trigger_buffer, match, trigger_pattern.regex)) {
                     grammar.awaiting_trigger = false;
                     // get from the first match to the end of the string
                     auto constrained_str = grammar.trigger_buffer.substr(match.position(1));
diff --git a/src/llama-grammar.h b/src/llama-grammar.h
@@ -106,6 +106,11 @@ struct llama_grammar_parser {
     void print(FILE * file);
 };
 
+struct llama_grammar_trigger_pattern {
+    std::string pattern;
+    std::regex  regex;
+};
+
 struct llama_grammar {
     // note: allow null vocab for testing (not great)
     const llama_vocab * vocab;
@@ -123,7 +128,7 @@ struct llama_grammar {
     bool                     awaiting_trigger = false; // Initialized to true for lazy grammars only
     std::string              trigger_buffer;           // Output buffered by lazy grammar. Will be cleared once trigger is found.
     std::vector<llama_token> trigger_tokens;           // Tokens that trigger a lazy grammar, or tokens to force printing of (even if special).
-    std::vector<std::pair<std::string, std::regex>>
+    std::vector<llama_grammar_trigger_pattern>
                              trigger_patterns;         // Regular expressions that trigger a lazy grammar. Must be a full match of the entire generated
                                                        // string, and the grammar will be given the string from the first match group onwards.
 
diff --git a/src/llama-sampling.cpp b/src/llama-sampling.cpp
@@ -1461,8 +1461,8 @@ static void llama_sampler_grammar_reset(struct llama_sampler * smpl) {
 
     std::vector<const char *>  trigger_patterns_c;
     trigger_patterns_c.reserve(ctx->grammar->trigger_patterns.size());
-    for (auto & [pattern, _] : ctx->grammar->trigger_patterns) {
-        trigger_patterns_c.push_back(pattern.c_str());
+    for (auto & trigger_pattern : ctx->grammar->trigger_patterns) {
+        trigger_patterns_c.push_back(trigger_pattern.pattern.c_str());
     }
 
     auto * grammar_new = llama_grammar_init_impl(ctx->grammar->vocab, ctx->grammar_str.c_str(), ctx->grammar_root.c_str(),

Original file line number	Diff line number	Diff line change
`@@ -1461,8 +1461,8 @@ static void llama_sampler_grammar_reset(struct llama_sampler * smpl) {`
`1461`	`1461`
`1462`	`1462`	`std::vector<const char *> trigger_patterns_c;`
`1463`	`1463`	`trigger_patterns_c.reserve(ctx->grammar->trigger_patterns.size());`
`1464`		`- for (auto & [pattern, _] : ctx->grammar->trigger_patterns) {`
`1465`		`- trigger_patterns_c.push_back(pattern.c_str());`
	`1464`	`+ for (auto & trigger_pattern : ctx->grammar->trigger_patterns) {`
	`1465`	`+ trigger_patterns_c.push_back(trigger_pattern.pattern.c_str());`
`1466`	`1466`	`}`
`1467`	`1467`
`1468`	`1468`	`auto * grammar_new = llama_grammar_init_impl(ctx->grammar->vocab, ctx->grammar_str.c_str(), ctx->grammar_root.c_str(),`