-
|
docker 的 stats 查看也是正常的,但是速度非常慢,GPU 占用也不显示 api 的状态。 我开了三个 api,同时 web 支持 vlm 和 hybrid。其它服务未开启。两个 英伟达 A10 显卡,配置还是可以的。 |
Beta Was this translation helpful? Give feedback.
Replies: 1 comment 2 replies
-
|
这个问题可能与 MinerU API 服务的内存泄漏有关。根据已知的 issue #4243,多次调用 mineru-api 会导致 GPU 显存持续增加直到 OOM,这是由于 vLLM 模型作为单例缓存的设计限制。 可能的解决方案:
重启后正常说明确实是运行过程中累积的问题,建议先尝试限制 GPU 显存使用率,或者考虑两进程模式部署。 To reply, just mention @dosu. How did I do? Good | Irrelevant | Incorrect | Verbose | Hallucination | Report 🐛 | Other |
Beta Was this translation helpful? Give feedback.
Pipeline 模式也会出现这种情况的。虽然没有使用 VLM 大模型,但 pipeline 模式内部实际上使用了多个专用模型(DocLayoutYOLO、PaddleOCR、表格检测模型等),这些模型都是通过**单例模式(Singleton)**缓存的。
根据 issue #3617 和 issue #4510 的讨论,这是一个已知问题:
torch.cuda.empty_cache()和gc.collect()也无法释放单例缓存的资源建议的临时解决方案:
MINERU_VIRTUAL_VRAM_SIZE限制 GPU 显存使用To reply, just mention @dosu.
How did I do? Good | Irrelevant | Incorrect | Verbose | Hallucination | Report 🐛 | Other