server : improve error reporting #13680

ggerganov · 2025-05-21T10:01:51Z

On master even when the computation fails due to lack of system resources, we send an error to the client that states "Input prompt is too big ..." which is confusing.

We now send error messages that correspond better to the error codes of llama_decode().

ggerganov · 2025-05-21T10:02:18Z

cc @erusev

server : improve error reporting

efe67fd

ggerganov requested a review from ngxson as a code owner May 21, 2025 10:01

github-actions bot added examples server labels May 21, 2025

ngxson approved these changes May 21, 2025

View reviewed changes

ggerganov merged commit 5fbfe38 into master May 21, 2025
46 checks passed

ggerganov deleted the gg/server-fix-error-msg branch May 21, 2025 16:47

infil00p pushed a commit to baseweight/llama.cpp that referenced this pull request May 22, 2025

server : improve error reporting (ggml-org#13680)

470fd3f

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

server : improve error reporting #13680

server : improve error reporting #13680

Uh oh!

ggerganov commented May 21, 2025

Uh oh!

ggerganov commented May 21, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

server : improve error reporting #13680

server : improve error reporting #13680

Uh oh!

Conversation

ggerganov commented May 21, 2025

Uh oh!

ggerganov commented May 21, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants