[bugfix] fix import issues (#5407)

hjh0119 · Jintao-Huang · commit 8a527fe41cdc · 2025-08-16T00:03:40.000+08:00
diff --git a/swift/llm/infer/infer_engine/grpo_vllm_engine.py b/swift/llm/infer/infer_engine/grpo_vllm_engine.py
@@ -8,6 +8,7 @@
 from tqdm.asyncio import tqdm_asyncio
 
 from swift.llm import InferRequest, RolloutInferRequest, Template, VllmEngine
+from swift.llm.infer.protocol import MultiModalRequestMixin
 from swift.plugin import Metric, multi_turns
 from swift.plugin.context_manager import ContextManager, context_managers
 from swift.plugin.env import Env, envs
@@ -295,13 +296,16 @@ async def _multi_turn_sampling_controller(self, infer_request: RolloutInferReque
             if should_stop:
                 result_choice.messages = messages
                 info_dict['num_turns'] = current_turn
-                for key, value in info_dict.items():
+                for key, values in info_dict.items():
                     if key in ['images', 'audios', 'videos']:
-                        value = MultiModalRequestMixin.to_base64(value)
+                        if not isinstance(values, list):
+                            values = [values]
+                        for i, value in enumerate(values):
+                            values[i] = MultiModalRequestMixin.to_base64(value)
                     if hasattr(result_choice, key):
-                        setattr(result_choice, key, value)
+                        setattr(result_choice, key, values)
                     else:
-                        result_choice.multi_turn_infos[key] = value
+                        result_choice.multi_turn_infos[key] = values
                 return result
 
             ret = self.multi_turn_scheduler.step(current_request, result_choice, current_turn)
diff --git a/swift/plugin/multi_turn.py b/swift/plugin/multi_turn.py
@@ -67,9 +67,12 @@ def step(self, infer_request: 'RolloutInferRequest', result: 'RolloutResponseCho
 
 
 class MathTipsMultiTurnScheduler(MultiTurnScheduler):
-    from .orm import MathAccuracy
-    tips_prompt = 'The answer is not correct, It seems You made a mistake, you need to recheck very carefully.'
-    acc_func = MathAccuracy()
+
+    def __init__(self, max_turns: Optional[int] = None, *args, **kwargs):
+        super().__init__(max_turns, *args, **kwargs)
+        from .orm import MathAccuracy
+        self.tips_prompt = 'The answer is not correct, It seems You made a mistake, you need to recheck very carefully.'
+        self.acc_func = MathAccuracy()
 
     def check_finished(self, infer_request: 'RolloutInferRequest', result: 'RolloutResponseChoice',
                        current_turn: int) -> bool: