Merge branch 'main' into release/3.6

Jintao-Huang · Jintao-Huang · commit 39bfc8a4ac77 · 2025-07-08T10:48:28.000+08:00
diff --git a/swift/llm/dataset/loader.py b/swift/llm/dataset/loader.py
@@ -209,7 +209,8 @@ def _load_dataset_path(
         kwargs = {'split': 'train', 'streaming': streaming, 'num_proc': num_proc}
         if file_type == 'csv':
             kwargs['na_filter'] = False
-        dataset = hf_load_dataset(file_type, data_files=dataset_path, **kwargs)
+        with safe_ddp_context(None, True):
+            dataset = hf_load_dataset(file_type, data_files=dataset_path, **kwargs)
         if columns:
             dataset = RowPreprocessor.safe_rename_columns(dataset, columns)
         dataset = dataset_meta.preprocess_func(
@@ -315,7 +316,8 @@ def _select_subsets(subsets: List[str], dataset_meta: DatasetMeta) -> List[Subse
     @staticmethod
     def shuffle_dataset(dataset, seed: int, buffer_size: int = 1000):
         if isinstance(dataset, HfDataset):
-            return dataset.shuffle(seed=seed)
+            with safe_ddp_context(None, True):
+                return dataset.shuffle(seed=seed)
         else:
             return dataset.shuffle(seed=seed, buffer_size=buffer_size)
 
@@ -366,8 +368,9 @@ def post_process(
                 val_sample = max(int(train_len * split_dataset_ratio), 1)
                 train_sample = dataset_sample - val_sample
                 assert train_sample > 0
-                train_dataset, val_dataset = train_dataset.train_test_split(
-                    test_size=val_sample, shuffle=shuffle, seed=get_seed(random_state)).values()
+                with safe_ddp_context(None, True):
+                    train_dataset, val_dataset = train_dataset.train_test_split(
+                        test_size=val_sample, shuffle=shuffle, seed=get_seed(random_state)).values()
                 train_dataset = sample_dataset(train_dataset, train_sample, shuffle, random_state)
         return train_dataset, val_dataset
 
diff --git a/swift/ui/llm_grpo/llm_grpo.py b/swift/ui/llm_grpo/llm_grpo.py
@@ -260,7 +260,7 @@ def do_build_ui(cls, base_tab: Type['BaseUI']):
                 LLMRollout.set_lang(cls.lang)
                 LLMRollout.build_ui(LLMRollout)
                 GRPOTuner.build_ui(base_tab)
-                with gr.Accordion(elem_id='extra_params', open=True):
+                with gr.Accordion(elem_id='extra_params', open=False):
                     with gr.Tabs():
                         GrpoAdvanced.build_ui(base_tab)
                         GRPOAdvanced.build_ui(base_tab)
diff --git a/swift/ui/llm_grpo/rollout.py b/swift/ui/llm_grpo/rollout.py
@@ -201,7 +201,7 @@ class Rollout(BaseUI):
 
     @classmethod
     def do_build_ui(cls, base_tab: Type['BaseUI']):
-        with gr.Accordion(elem_id='rollout_param', open=True):
+        with gr.Accordion(elem_id='rollout_param', open=False):
             with gr.Row():
                 gr.Slider(elem_id='temperature', minimum=0.0, maximum=10, step=0.1, value=1.0)
                 gr.Slider(elem_id='top_k', minimum=1, maximum=100, step=5, value=80)
diff --git a/swift/ui/llm_rlhf/llm_rlhf.py b/swift/ui/llm_rlhf/llm_rlhf.py
@@ -272,7 +272,7 @@ def do_build_ui(cls, base_tab: Type['BaseUI']):
                 RLHFTuner.build_ui(base_tab)
                 RLHFOptimizer.build_ui(base_tab)
                 RLHF.build_ui(base_tab)
-                with gr.Accordion(elem_id='extra_params', open=True):
+                with gr.Accordion(elem_id='extra_params', open=False):
                     with gr.Tabs():
                         RLHFAdvanced.build_ui(base_tab)
                         RLHFQuantization.build_ui(base_tab)
diff --git a/swift/ui/llm_rlhf/rlhf.py b/swift/ui/llm_rlhf/rlhf.py
@@ -147,7 +147,7 @@ class RLHF(BaseUI):
 
     @classmethod
     def do_build_ui(cls, base_tab: Type['BaseUI']):
-        with gr.Accordion(elem_id='rlhf_tab', open=True):
+        with gr.Accordion(elem_id='rlhf_tab', open=False):
             with gr.Blocks():
                 with gr.Row():
                     gr.Slider(elem_id='beta', minimum=0., maximum=5.0, step=0.1, value=0.1, scale=10)
diff --git a/swift/ui/llm_train/llm_train.py b/swift/ui/llm_train/llm_train.py
@@ -281,7 +281,7 @@ def do_build_ui(cls, base_tab: Type['BaseUI']):
                 Tuner.build_ui(base_tab)
                 Optimizer.build_ui(base_tab)
                 Task.build_ui(base_tab)
-                with gr.Accordion(elem_id='extra_params', open=True):
+                with gr.Accordion(elem_id='extra_params', open=False):
                     with gr.Tabs():
                         Advanced.build_ui(base_tab)
                         Quantization.build_ui(base_tab)