test-model-random : fix seq_id buffer overflow

compilade · compilade · commit 7634d14d7a49 · 2025-07-08T18:23:58.000-04:00
diff --git a/tests/test-model-random.cpp b/tests/test-model-random.cpp
@@ -1077,7 +1077,6 @@ int main(int argc, char ** argv) {
     const int32_t n_shared_len = 13; // prime number, shared prompt length
     const int32_t n_seq_len = 127; // prime number
 
-    llama_batch batch = llama_batch_init(n_batch, 0, 1);
     // TODO: batch with embeddings
 
     std::vector<model_variant> model_variants;
@@ -1119,6 +1118,8 @@ int main(int argc, char ** argv) {
         // TODO: avoid re-creating reference outputs
         for (int32_t n_seq_max : { 1, 2, 5 }) {
 
+            llama_batch batch = llama_batch_init(n_batch, 0, n_seq_max);
+
             // TODO(later): context shift testing
             for (int32_t n_ctx : { n_seq_len * n_seq_max }) {
 
@@ -1195,6 +1196,7 @@ int main(int argc, char ** argv) {
                                 for (llama_seq_id seq_id = 0; seq_id < n_seq_max; ++seq_id) {
                                     seq_id_group.push_back(seq_id);
                                     seq_id_n_past[seq_id] += shared_prompt.size();
+                                    seq_ids_in_batch.insert(seq_id);
                                 };
 
                                 for (size_t i = 0; i < shared_prompt.size(); ++i) {
@@ -1272,12 +1274,12 @@ int main(int argc, char ** argv) {
                     }
                 }
             }
+
+            llama_batch_free(batch);
         }
 
         llama_model_free(model);
     }
 
-    llama_batch_free(batch);
-
     return 0;
 }

Original file line number	Diff line number	Diff line change
`@@ -1077,7 +1077,6 @@ int main(int argc, char ** argv) {`
`1077`	`1077`	`const int32_t n_shared_len = 13; // prime number, shared prompt length`
`1078`	`1078`	`const int32_t n_seq_len = 127; // prime number`
`1079`	`1079`
`1080`		`- llama_batch batch = llama_batch_init(n_batch, 0, 1);`
`1081`	`1080`	`// TODO: batch with embeddings`
`1082`	`1081`
`1083`	`1082`	`std::vector<model_variant> model_variants;`
`@@ -1119,6 +1118,8 @@ int main(int argc, char ** argv) {`
`1119`	`1118`	`// TODO: avoid re-creating reference outputs`
`1120`	`1119`	`for (int32_t n_seq_max : { 1, 2, 5 }) {`
`1121`	`1120`
	`1121`	`+ llama_batch batch = llama_batch_init(n_batch, 0, n_seq_max);`
	`1122`	`+`
`1122`	`1123`	`// TODO(later): context shift testing`
`1123`	`1124`	`for (int32_t n_ctx : { n_seq_len * n_seq_max }) {`
`1124`	`1125`
`@@ -1195,6 +1196,7 @@ int main(int argc, char ** argv) {`
`1195`	`1196`	`for (llama_seq_id seq_id = 0; seq_id < n_seq_max; ++seq_id) {`
`1196`	`1197`	`seq_id_group.push_back(seq_id);`
`1197`	`1198`	`seq_id_n_past[seq_id] += shared_prompt.size();`
	`1199`	`+ seq_ids_in_batch.insert(seq_id);`
`1198`	`1200`	`};`
`1199`	`1201`
`1200`	`1202`	`for (size_t i = 0; i < shared_prompt.size(); ++i) {`
`@@ -1272,12 +1274,12 @@ int main(int argc, char ** argv) {`
`1272`	`1274`	`}`
`1273`	`1275`	`}`
`1274`	`1276`	`}`
	`1277`	`+`
	`1278`	`+ llama_batch_free(batch);`
`1275`	`1279`	`}`
`1276`	`1280`
`1277`	`1281`	`llama_model_free(model);`
`1278`	`1282`	`}`
`1279`	`1283`
`1280`		`- llama_batch_free(batch);`
`1281`		`-`
`1282`	`1284`	`return 0;`
`1283`	`1285`	`}`