* sort by priority before writing to buffer

HYLcool · HYLcool · commit 2c7fd581db93 · 2025-06-13T15:27:10.000+08:00
diff --git a/trinity/data/controllers/active_iterator.py b/trinity/data/controllers/active_iterator.py
@@ -159,8 +159,9 @@ def run(self):
                 traceback.print_exc()
                 return 7, "Tracking lineage failed."
 
-            # step 8. export the result to the output buffer
+            # step 8. sort and export the result to the output buffer
             try:
+                res_dataset.sort_by("priority", reverse=True)
                 res_dataset.write_to_buffer()
             except Exception:
                 traceback.print_exc()
@@ -246,7 +247,7 @@ def _compute_combined_score(
             difficulty = stats.get("difficulty_score", 0.5)
             score += self.priority_weights["difficulty"] * difficulty
 
-        sample["priority"] = [score]
+        sample["priority"] = score
         return sample
 
     def _compute_diversity_score(self) -> float:
@@ -258,10 +259,6 @@ def _compute_priority_scores(self, dataset: RftDataset) -> RftDataset:
         dataset.data = dataset.data.map(self._compute_combined_score)
         return dataset
 
-    def _select_top_k(self, dataset: RftDataset, k: int) -> List:
-        """Select top-k samples based on utility scores"""
-        return dataset.data.sort("priority", reverse=True).take(k).to_list()
-
     @ray.method(num_returns=1)
     def select_batch(self, dataset: RftDataset, batch_size: int) -> List[Dict[str, Any]]:
         """Select a batch of samples for training"""
@@ -273,7 +270,8 @@ def select_batch(self, dataset: RftDataset, batch_size: int) -> List[Dict[str, A
         dataset.data = dataset.data.filter(lambda s: s["priority"] >= self.min_priority_score)
 
         # Select top-k samples
-        selected_samples = self._select_top_k(dataset, batch_size)
+        dataset.sort_by("priority", reverse=True, top_k=batch_size)
+        selected_samples = dataset.data.to_list()
 
         # Update state
         self._update_state(selected_samples, dataset.data["priority"])
diff --git a/trinity/data/core/dataset.py b/trinity/data/core/dataset.py
@@ -64,6 +64,11 @@ def format(
         for formatter in formatters:
             self.data = formatter(self.data, num_proc)
 
+    def sort_by(self, key: str, reverse: bool = False, top_k: int = -1):
+        if top_k == -1:
+            top_k = len(self.data)
+        self.data = self.data.sort(key, reverse=reverse).take(top_k)
+
     def read_from_buffer(self):
         datasets = []
         for buffer in self.buffers: