[template] fix qwen3 remove '<think></think>' (#4857)

Jintao-Huang · web-flow · commit 80aa7b2b9dd4 · 2025-07-07T21:12:19.000+08:00
diff --git a/swift/llm/template/template/qwen.py b/swift/llm/template/template/qwen.py
@@ -50,9 +50,13 @@ class ThinkingTemplate(Template):
 
     def _swift_prepare_messages(self, messages):
         super()._swift_prepare_messages(messages)
-        for i, message in enumerate(messages):
-            if message['role'] == 'assistant' and isinstance(message['content'], str) and i != len(messages) - 1:
-                message['content'] = message['content'].split('</think>')[-1].strip()
+        # Only during inference or training, and only if the loss_scale is set to 'last_round',
+        # will the previous 'think' entries be deleted.
+        if not self.is_training or self.loss_scale.name == 'last_round':
+            for i, message in enumerate(messages):
+                # Delete the content before '</think>' in all assistant turns except the last round.
+                if message['role'] == 'assistant' and isinstance(message['content'], str) and i != len(messages) - 1:
+                    message['content'] = message['content'].split('</think>')[-1].strip()
 
 
 register_template(
diff --git a/swift/plugin/loss_scale/loss_scale.py b/swift/plugin/loss_scale/loss_scale.py
@@ -164,3 +164,6 @@ def get_loss_scale(self,
     'agentflan': AgentFlanLossScale,
     'alpha_umi': AlphaUmiLossScale,
 }
+
+for k, v in loss_scale_map.items():
+    v.name = k

Original file line number	Diff line number	Diff line change
`@@ -164,3 +164,6 @@ def get_loss_scale(self,`
`164`	`164`	`'agentflan': AgentFlanLossScale,`
`165`	`165`	`'alpha_umi': AlphaUmiLossScale,`
`166`	`166`	`}`
	`167`	`+`
	`168`	`+for k, v in loss_scale_map.items():`
	`169`	`+ v.name = k`