Improve ET llama runner logging and debuggability

derekxu · web-flow · commit 83a32af14344 · 2024-08-09T12:58:33.000-07:00
Differential Revision: D61002749 Pull Request resolved: #4634
diff --git a/examples/models/llama2/runner/runner.cpp b/examples/models/llama2/runner/runner.cpp
@@ -152,11 +152,15 @@ Error Runner::generate(
   ET_CHECK_MSG(num_prompt_tokens >= 1, "Expected at least 1 prompt token");
   ET_CHECK_MSG(
       num_prompt_tokens < max_seq_len_,
-      "Max seq length exceeded - please increase max seq len value in .../llama2/model.py");
+      "num_prompt_tokens %d >= max_seq_len_ %d, Max seq length exceeded - please increase max seq len value in .../llama2/model.py",
+      num_prompt_tokens,
+      max_seq_len_);
 
   ET_CHECK_MSG(
       num_prompt_tokens < seq_len,
-      "Sequence length exceeded - please increase the seq_len value passed to generate()");
+      "num_prompt_tokens %d >= seq_len %d, Sequence length exceeded - please increase the seq_len value passed to generate()",
+      num_prompt_tokens,
+      seq_len);
 
   // Prefill first
   // Here feed all tokens to the model and get the next predicted token