时长问题 #4442

CUsopp · 2026-01-30T02:44:01Z

CUsopp
Jan 30, 2026

目前推理，我们的单张图片很复杂，官网推理时间很长，本地部署　ａｐｉ：　ｐｉｐｅ３－６ｓ，ｖｌｍ　23ｓ，ｈｔｔｐ－ｃｌｉｅｎｔ　２３ｓ左右，是部署存在问题吗？

Jan 30, 2026

你的本地推理时长（pipe3: 6秒，vlm/http-client: 23秒）在处理复杂单页技术文档时是正常现象，不属于部署异常。社区和官方多次反馈，VLM（如vllm）后端在复杂图片、文本量大、表格多的情况下，单张推理2-20秒都属于正常区间，且推理时长与图片复杂度、文本量成正比，pipe3（transformers/pipeline）通常更快一些，但精度略低于VLM后端参考1 参考2。

影响推理时长的主要因素有：图片复杂度、所选后端（pipeline/vlm/http-client）、硬件配置（GPU型号与显存）、batch size、并发数、是否启用表格/公式识别等参考3。

优化建议：

确认 MinerU 及模型为最新版，并与官网一致参考4。
如不需要表格/公式识别，可通过环境变量关闭（MINERU_TABLE_ENABLE=false，MINERU_FORMULA_ENABLE=false），减少CPU负载。
pipeline 后端可通过 MINERU_MIN_BATCH_INFERENCE_SIZE 调大 batch size（如384），提升吞吐。
vllm 后端建议 max_concurrency 设为10以内，gpu_memory_utilization 设为0.7~0.8，batch_size 8-16（视显存而定）。
vllm/http-client 后端如需高吞吐，需多client并发请求，单client会串行处理，速度受限参考5。
复杂表格建议用 pipeline 或强制 OCR 模式（--method ocr），更稳定参考6。
保证 CUD…

View full answer

2026-01-30T02:49:31Z

dosubot[bot]
bot Jan 30, 2026

你的本地推理时长（pipe3: 6秒，vlm/http-client: 23秒）在处理复杂单页技术文档时是正常现象，不属于部署异常。社区和官方多次反馈，VLM（如vllm）后端在复杂图片、文本量大、表格多的情况下，单张推理2-20秒都属于正常区间，且推理时长与图片复杂度、文本量成正比，pipe3（transformers/pipeline）通常更快一些，但精度略低于VLM后端参考1 参考2。

影响推理时长的主要因素有：图片复杂度、所选后端（pipeline/vlm/http-client）、硬件配置（GPU型号与显存）、batch size、并发数、是否启用表格/公式识别等参考3。

优化建议：

确认 MinerU 及模型为最新版，并与官网一致参考4。
如不需要表格/公式识别，可通过环境变量关闭（MINERU_TABLE_ENABLE=false，MINERU_FORMULA_ENABLE=false），减少CPU负载。
pipeline 后端可通过 MINERU_MIN_BATCH_INFERENCE_SIZE 调大 batch size（如384），提升吞吐。
vllm 后端建议 max_concurrency 设为10以内，gpu_memory_utilization 设为0.7~0.8，batch_size 8-16（视显存而定）。
vllm/http-client 后端如需高吞吐，需多client并发请求，单client会串行处理，速度受限参考5。
复杂表格建议用 pipeline 或强制 OCR 模式（--method ocr），更稳定参考6。
保证 CUDA、PyTorch、vllm、flash-attn 等依赖版本兼容，推荐 Ubuntu 22.04 + CUDA 环境参考7。

如果需要进一步提速，建议补充硬件配置、具体命令参数、日志片段，便于定位瓶颈。整体来看，你的推理时长属于正常范围，无需担心部署问题。

To reply, just mention @dosu.

^{How did I do? Good | Irrelevant | Incorrect | Verbose | Hallucination | Report 🐛 | Other}

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

时长问题 #4442

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{editor}}'s edit

{{editor}}'s edit

Uh oh!

Replies: 1 comment

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

时长问题 #4442

Uh oh!

Uh oh!

CUsopp Jan 30, 2026

Replies: 1 comment

Uh oh!

dosubot[bot] bot Jan 30, 2026

CUsopp
Jan 30, 2026

dosubot[bot]
bot Jan 30, 2026