我在videomme和mvbench上测试,分别用vllm和qwen2.5-vl,得到的结果差别很大,用vllm分数要低很多: videomme: 57.52,用vllm: 54.11 mvbench: 62.8, 用vllm: 57.725