求助~mineru处理账单时，单号和两行的日期会重叠，有人知道怎么处理吗？ #4621

zixing15 · 2026-03-14T07:23:30Z

zixing15
Mar 14, 2026

对于图里的这种账单，我是通过docker部署的，用python调用api解析时会把结果变成4200002971202601086622422026-01-085262 和22:10:38；我试过在py里传了这几个参数：'enable_merge_det_boxes': 'false', # 禁用检测框自动合并、 'det_db_box_thresh': '0.3', # 降低检测阈值、 'det_db_unclip_ratio': '0.9', # 增加文本框扩展比例，但是不行；后来又按照deepwiki里说的去main.py和utils_table_recover.py里修改了参数，sorted_ocr_boxes(..., threhold=0.05)、gather_ocr_list_by_row(..., threhold=0.05)、text = "
".join(ocr_rec_text)，但是还是失败了，解析不成功

但是我一开始直接在window上通过uv部署的时候图里的账单时能成功解析的，单号和日期分离很成功，就是windows上运行太慢了

有没有大佬帮忙看下该如何解决，谢谢

@zixing15 · 2026-03-14T07:30:29Z

dosubot[bot]
bot Mar 14, 2026

Hi @zixing15! I'm Dosu and I’m helping the MinerU team.

你遇到的问题根本原因是Docker部署默认使用pipeline后端，而你在Windows上通过uv部署时可能使用了VLM后端，这导致了表格识别结果的差异。

最直接的解决方案：切换到VLM后端

在Docker环境中显式指定使用VLM后端：

# 使用VLM后端
docker run --rm -v /path/to/input:/input -v /path/to/output:/output \
  opendatalab/mineru:latest \
  magic-pdf -p /input/your_bill.pdf -o /output --backend vlm-vllm-engine

# 或使用hybrid后端
magic-pdf -p /input/your_bill.pdf -o /output --backend hybrid-auto-engine

如果是通过Python API调用，需要在导入MinerU之前设置环境变量：

import os
os.environ['BACKEND'] = 'vlm-vllm-engine'  # 必须在导入前设置

from magic_pdf import parse_pdf
# 然后调用API

为什么你修改的参数没有生效？

你修改的sorted_ocr_boxes和gather_ocr_list_by_row的threshold参数仅在使用Unet表格识别模型时生效。Docker可能使用了不同的表格识别模型，所以这些修改无效。而且实际调用时代码中hardcode了threhold=0.4，可能覆盖了你的修改。

另外，VLM后端对复杂表格（账单、发票等）的识别准确度显著高于pipeline后端，调整pipeline的参数无法从根本上解决架构性限制。

其他建议：