fix (#4565)

tastelikefeet · tastelikefeet · Jintao-Huang · commit 48787441a792 · 2025-06-13T10:50:52.000+08:00
Co-authored-by: tastelikefeet &lt;yuze.zyz@alibaab-inc.com&gt;
diff --git a/swift/llm/template/base.py b/swift/llm/template/base.py
@@ -370,6 +370,7 @@ def split_multi_medias(_inputs):
         positive_encoded = self._encode_truncated(positive)
         for key in positive_encoded:
             _encoded[f'positive_{key}'] = positive_encoded[key]
+            _encoded[f'negative_{key}'] = []
         labels.append(float(inputs.label) if inputs.label is not None else 1.0)
 
         rejected_len = len(inputs.rejected_response) if inputs.rejected_response else 0
@@ -381,7 +382,7 @@ def split_multi_medias(_inputs):
             split_multi_medias(negative)
             negative_encoded = self._encode_truncated(negative)
             for key in negative_encoded:
-                _encoded[f'negative{i}_{key}'] = negative_encoded[key]
+                _encoded[f'negative_{key}'].append(negative_encoded[key])
             labels.append(0.0)
 
         _encoded['labels'] = labels
@@ -1314,10 +1315,18 @@ def _embedding_data_collator(self,
         new_batch = []
         for b in batch:
             keys = [key for key in b.keys() if 'negative' in key]
-            max_neg = max([int(re.findall(r'negative(-?\d+)', key)[0]) for key in keys]) if keys else None
+            max_neg = None
+            for key in keys:
+                value_list = b[key]
+                suffix = key[len('negative_'):]
+                max_neg = len(value_list)
+                for i, value in enumerate(value_list):
+                    b[f'negative{i}_{suffix}'] = value
+                b.pop(key)
+
             indexes = ['anchor_', 'positive_']
             if max_neg is not None:
-                for i in range(0, max_neg + 1):
+                for i in range(0, max_neg):
                     indexes.append(f'negative{i}_')
             for prefix in indexes:
                 new_batch += self._fetch_inputs_startswith([b], prefix)
diff --git a/swift/trainers/sequence_parallel/ulysses.py b/swift/trainers/sequence_parallel/ulysses.py
@@ -851,6 +851,27 @@ def prepare_trainer(self, trainer):
             trainer._get_per_token_logps = MethodType(_get_per_token_logps, trainer)
             trainer.split_by_mini_batches = MethodType(split_by_mini_batches, trainer)
 
+            class DataloaderWrap:
+
+                def __init__(self, dataloader):
+                    self.dataloader = dataloader
+
+                def __getattr__(self, item):
+                    return getattr(self.dataloader, item)
+
+                def __len__(wrapped):
+                    return len(wrapped.dataloader) * self.sp_world_size
+
+                def __iter__(self):
+                    yield from self.dataloader
+
+            def get_train_dataloader(trainer):
+                dataloader = trainer.get_origin_train_dataloader()
+                return DataloaderWrap(dataloader)
+
+            trainer.get_origin_train_dataloader = trainer.get_train_dataloader
+            trainer.get_train_dataloader = MethodType(get_train_dataloader, trainer)
+
         from swift.plugin import metric
         from swift.trainers import mixin
         compute_acc_origin = metric.compute_acc