tool/eval.py没有结果 #14373

AI-LMD · 2024-12-12T03:53:34Z

AI-LMD
Dec 12, 2024

没有结果
数据集格式为

AI-LMD · 2024-12-12T03:56:26Z

AI-LMD
Dec 12, 2024
Author

Global:
  debug: false
  use_gpu: true
  epoch_num: 500
  log_smooth_window: 20
  print_batch_step: 10
  save_model_dir: ./output/ch_PP-OCR_V3_det/
  save_epoch_step: 10
  eval_batch_step:
  - 1
  cal_metric_during_train: false
  pretrained_model: /root/paddlejob/workspace/env_run/liumingda/root/paddlejob/workspace/env_run/liumingda/paddleOCR_work/PaddleOCR-main/models/ch_PP-OCRv3_det_distill_train/best_accuracy.pdparams
  checkpoints: null
  save_inference_dir: null
  use_visualdl: false
  infer_img: doc/imgs_en/img_10.jpg
  save_res_path: ./checkpoints/det_db/predicts_db.txt
  distributed: true

Architecture:
  model_type: det
  algorithm: DB
  Transform:
  Backbone:
    name: MobileNetV3
    scale: 0.5
    model_name: large
    disable_se: True
  Neck:
    name: RSEFPN
    out_channels: 96
    shortcut: True
  Head:
    name: DBHead
    k: 50

Loss:
  name: DBLoss
  balance_loss: true
  main_loss_type: DiceLoss
  alpha: 5
  beta: 10
  ohem_ratio: 3
Optimizer:
  name: Adam
  beta1: 0.9
  beta2: 0.999
  lr:
    name: Cosine
    learning_rate: 0.001
    warmup_epoch: 2
  regularizer:
    name: L2
    factor: 5.0e-05
PostProcess:
  name: DBPostProcess
  thresh: 0.3
  box_thresh: 0.6
  max_candidates: 1000
  unclip_ratio: 1.5
Metric:
  name: DetMetric
  main_indicator: hmean
Train:
  dataset:
    name: SimpleDataSet
    data_dir: ./train_data/icdar2015/text_localization/
    label_file_list:
      - ./train_data/icdar2015/text_localization/train_icdar2015_label.txt
    ratio_list: [1.0]
    transforms:
    - DecodeImage:
        img_mode: BGR
        channel_first: false
    - DetLabelEncode: null
    - IaaAugment:
        augmenter_args:
        - type: Fliplr
          args:
            p: 0.5
        - type: Affine
          args:
            rotate:
            - -10
            - 10
        - type: Resize
          args:
            size:
            - 0.5
            - 3
    - EastRandomCropData:
        size:
        - 960
        - 960
        max_tries: 50
        keep_ratio: true
    - MakeBorderMap:
        shrink_ratio: 0.4
        thresh_min: 0.3
        thresh_max: 0.7
    - MakeShrinkMap:
        shrink_ratio: 0.4
        min_text_size: 8
    - NormalizeImage:
        scale: 1./255.
        mean:
        - 0.485
        - 0.456
        - 0.406
        std:
        - 0.229
        - 0.224
        - 0.225
        order: hwc
    - ToCHWImage: null
    - KeepKeys:
        keep_keys:
        - image
        - threshold_map
        - threshold_mask
        - shrink_map
        - shrink_mask
  loader:
    shuffle: true
    drop_last: false
    batch_size_per_card: 8
    num_workers: 4
Eval:
  dataset:
    name: SimpleDataSet
    data_dir: /root/paddlejob/workspace/env_run/liumingda/root/paddlejob/workspace/env_run/liumingda/paddleOCR_work/data/image_50000
    label_file_list:
      - /root/paddlejob/workspace/env_run/liumingda/root/paddlejob/workspace/env_run/liumingda/paddleOCR_work/data/50000_txt/text/test_copy.txt
    transforms:
    - DecodeImage:
        img_mode: BGR
        channel_first: false
    - DetLabelEncode: null
    - DetResizeForTest: null
    - NormalizeImage:
        scale: 1./255.
        mean:
        - 0.485
        - 0.456
        - 0.406
        std:
        - 0.229
        - 0.224
        - 0.225
        order: hwc
    - ToCHWImage: null
    - KeepKeys:
        keep_keys:
        - image
        - shape
        - polys
        - ignore_tags
  loader:
    shuffle: false
    drop_last: false
    batch_size_per_card: 1
    num_workers: 2

0 replies

GreatV · 2024-12-12T03:56:52Z

GreatV
Dec 12, 2024
Maintainer

根据你的问题描述，tool/eval.py 没有生成结果，以下是可能的原因和建议解决方法：

1. 数据集格式检查

从你提供的图片来看，数据集格式可能存在问题。请参考以下几点确认数据是否符合 PaddleOCR 的要求：

标注文件格式：PaddleOCR 的标注文件通常是 .txt 文件，内容格式为：
```
image_path\tlabel
```
其中，image_path 是图片的路径，label 是对应的文字标签。如果你的数据集格式与此不符，可能导致程序无法正确解析数据。
图片路径有效性：确保标注文件中列出的所有图片路径都有效，图片文件存在且可被访问。
字符集支持：如果标注文件中的字符超出了 PaddleOCR 所支持的字符集范围（如 ppocr_keys_v1.txt 中的字符），可能也会导致处理失败。

2. 检查脚本输入参数

确保运行 tool/eval.py 时，所有输入参数的设置正确。例如：

配置文件路径：检查是否正确传入了模型相关的配置文件（例如 .yml 文件）。配置文件应与训练使用的模型对应。
数据路径：运行脚本时需要明确指定数据集路径，确保路径设置正确且数据可访问。

3. 日志输出与调试

如果脚本运行没有任何结果，建议检查日志输出或手动添加调试信息：

检查是否有错误日志：
- 确保运行脚本时有日志输出，查看是否有错误提示或异常信息。如果没有日志输出，可以尝试通过添加 --use_debug=True 参数（如果脚本支持）或直接修改代码以打印调试信息。
排查代码逻辑：
- 打开 tool/eval.py 文件，检查脚本是否有数据加载、模型调用或结果写入环节的问题。
- 在关键步骤（如加载数据集、读取标注文件、模型推理等）手动添加调试打印语句，确认每一步是否正常执行。

4. 参考相关讨论

根据提供的文档，部分讨论中提到了类似的问题，例如数据集划分无反应或结果未生成。参考以下内容：

Discussion: 执行数据集划分无反应：
- 用户提到运行数据集划分脚本后未生成目标文件夹。可能的原因包括：
  - 输入数据路径错误。
  - 数据格式不符合预期。
  - 程序依赖未满足。
建议检查 gen_ocr_train_val_test.py 或 tool/eval.py 脚本的依赖项和输入数据格式。

5. 系统环境检查

根据你的问题背景，还可以检查以下系统环境是否符合 PaddleOCR 的运行需求：

PaddlePaddle 版本：确保已安装的 PaddlePaddle 版本与 PaddleOCR 的版本匹配。例如，PaddleOCR 2.6 需要 PaddlePaddle 2.6.x。
Python 版本：建议使用 Python 3.7~3.10。
依赖库安装：运行 pip list 检查是否安装了所有必要的依赖库。可以重新运行 pip install -r requirements.txt 以安装缺失的依赖。

总结

请按照以下步骤排查：

检查数据集格式是否正确。
确认脚本运行时的输入参数设置无误。
查看日志输出，添加调试信息以定位问题。
参考相关讨论，检查是否有类似问题的解决方案。
确认系统环境和依赖项符合要求。

如果仍然无法解决问题，可以在相关的 GitHub Discussion 中提供详细的运行环境和错误信息进行反馈。

Response generated by feifei-bot | chatgpt-4o-latest

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

tool/eval.py没有结果 #14373

Uh oh!

{{title}}

Uh oh!

Replies: 2 comments

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{editor}}'s edit

{{editor}}'s edit

Uh oh!

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

tool/eval.py没有结果 #14373

Uh oh!

AI-LMD Dec 12, 2024

Replies: 2 comments

Uh oh!

Uh oh!

AI-LMD Dec 12, 2024 Author

Uh oh!

GreatV Dec 12, 2024 Maintainer

1. 数据集格式检查

2. 检查脚本输入参数

3. 日志输出与调试

4. 参考相关讨论

5. 系统环境检查

总结

AI-LMD
Dec 12, 2024

AI-LMD
Dec 12, 2024
Author

GreatV
Dec 12, 2024
Maintainer