Replies: 2 comments 2 replies
-
|
你的情况是:8张卡但只有1张在用,且处理批量PDF时OOM。以下是降低显存占用 + 利用多卡的建议: 1. 利用多GPU并行处理 推荐使用 CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 OMP_NUM_THREADS=1 mineru-vllm-server \
--host 0.0.0.0 --port 30000 \
--data-parallel-size 8 \
--gpu-memory-utilization 0.4然后客户端使用 另一种方式是用 mineru-router --host 0.0.0.0 --port 8002 --local-gpus auto适合并发处理多个PDF文件的场景。 2. 降低单卡显存占用
3. 分批处理大文件 对页数较多的PDF,使用 4. 其他建议
你有8张卡,最直接的改善方式就是用方案1把所有卡都用起来,同时适当降低 To reply, just mention @dosu. How did I do? Good | Irrelevant | Incorrect | Verbose | Hallucination | Report 🐛 | Other |
Beta Was this translation helpful? Give feedback.
-
|
多卡用router起服务啊,然后任务通过client直接连接router的服务器使用 |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
我在使用docker部署的 MinerU 处理一批PDF 论文时,遇到了 CUDA out of memory (显存不足)的错误,导致任务全部失败。服务器本身有8张卡,使用mineru -p <input_path> -o <output_path>启动,只有一张卡占用,如何能够实现批量处理pdf降低显存的方法。

Beta Was this translation helpful? Give feedback.
All reactions