在单个模型对多个partitioned数据集做eval的时候,模型会被重复加载 #1088
Unanswered
IcyFeather233
asked this question in
Q&A
Replies: 1 comment
-
|
oc设计上是这样的,这种方式更有利于抢占集群的资源。如果你对MTBench这种比较小的数据集想要不切分的话,我建议用这个config: https://github.com/open-compass/opencompass/blob/main/configs/datasets/subjective/multiround/mtbench_single_judge.py 他只会启动一个任务,这是因为原版的mtbench他根据题目类型划分成了三种不同温度的设定,也就是不同的子数据集需要用不同的温度来推理,所以为了和原版保持一致我们也做了这样的划分。但是实际上我们实测下来即使都设成同一温度也没有多少影响(这一点在最新的arenahard上也使用了统一的温度),比不上mtbench本身的bias,所以你可以直接用统一温度的config推理,这样就不会切分了。 By the way,arenahard数据集我们也支持完了,很快会提pr |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
例如这样的配置:
MTBench数据集被切成了三个task,运行发现每次运行一个task,都会重复加载模型,造成时间上的浪费:
但是我没完全看懂代码,找不到在哪里修改TAT 不过我觉得这个问题应该被修复掉
Beta Was this translation helpful? Give feedback.
All reactions