Skip to content

QWEN3.5 测试RefCOCO,需要修改prompt,否则准确率低 #1226

@xiyuwang-sudo

Description

@xiyuwang-sudo

自查清单

在提交 issue 之前,请确保您已完成以下步骤:

问题描述

QWEN3.5 测试RefCOCO,需要修改prompt,否则准确率低
原因是输出坐标没有进行归一化,导致结果对不上,准确率特别低,需要进行prompt调整输出格式,或者对结果进行修改,QWEN3也有但是没有这么多。

请简要描述您遇到的问题。

EvalScope 版本(必填)

v1.5.0

使用的工具

  • Native / 原生框架
  • Opencompass backend
  • VLMEvalKit backend
  • RAGEval backend
  • Perf / 模型推理压测工具
  • Arena / 竞技场模式

执行的代码或指令

请提供您执行的主要代码或指令。

错误日志

请粘贴完整的错误日志或控制台输出。

运行环境

  • 操作系统:
  • Python版本:

其他信息

如果有其他相关信息,请在此处提供。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions