Replies: 2 comments
-
|
目前 MinerU 并不支持通过简单配置直接将底层识别模型切换为 PaddleOCR-VL-1.5。MinerU 只原生支持 PaddleOCR(paddleocr2torch 适配),所有 CLI/API 配置项仅影响 PaddleOCR 权重文件的选择,而无法切换底层引擎。如果 PaddleOCR-VL-1.5 的模型结构、输入输出与现有 PaddleOCR2Torch 兼容,并且能转为 PyTorch .pth 格式,可以尝试:
如果只是替换 PaddleOCR 权重且格式兼容,可以直接替换模型文件并更新配置;否则需要开发适配代码。VLM(vlm-vllm-engine)后端不支持 PaddleOCR-VL-1.5,仅支持 Transformer 架构的 VLM 模型参考。 如需进一步自定义开发,建议重点关注 To reply, just mention @dosu. How did I do? Good | Irrelevant | Incorrect | Verbose | Hallucination | Report 🐛 | Other |
Beta Was this translation helpful? Give feedback.
-
|
@myhloli 大佬,我这种有没有比较好的解决方案啊。 |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
想将百度新发布的 PaddlePaddle/PaddleOCR-VL-1.5 作为底层模型,能否在MinerU框架上,通过配置的形式简单实现?
目前是使用了 mineru-api 提供的api接口,将pdf文件作为入参,完整解析pdf,想在改动最小的情况下将模型调整为百度的。
谢谢!
Beta Was this translation helpful? Give feedback.
All reactions