fix: manage evalset and tracing file uniformly in one function

BhAem · BhAem · commit e82f8c00c91b · 2025-08-12T10:02:33.000+08:00
diff --git a/tests/test_evaluator.py b/tests/test_evaluator.py
@@ -129,7 +129,7 @@ def test_evaluator():
     with open(eval_set_file_path, "w") as f:
         json.dump(EVAL_SET_DATA, f)
 
-    base_evaluator.generate_eval_data(eval_set_file_path=eval_set_file_path)
+    base_evaluator.generate_eval_data(file_path=eval_set_file_path)
 
     assert len(base_evaluator.invocation_list) == 1
     assert len(base_evaluator.invocation_list[0].invocations) == 1
@@ -141,17 +141,15 @@ def test_evaluator():
     os.remove(eval_set_file_path)
 
 
-def test_evaluator_using_tracing():
+def test_tracing_file_to_evalset():
     base_evaluator = BaseEvaluator(agent=None, name="test_evaluator")
 
     # save data to file
-    tracing_set_file_path = "./tracing_set_for_test_evaluator.json"
-    with open(tracing_set_file_path, "w") as f:
+    tracing_file_path = "./tracing_for_test_evaluator.json"
+    with open(tracing_file_path, "w") as f:
         json.dump(TRACE_SET_DATA, f)
 
-    base_evaluator.generate_eval_data_from_tracing(
-        tracing_set_file_path=tracing_set_file_path
-    )
+    base_evaluator.generate_eval_data(file_path=tracing_file_path)
 
     assert len(base_evaluator.invocation_list) == 1
     assert len(base_evaluator.invocation_list[0].invocations) == 1
@@ -160,4 +158,4 @@ def test_evaluator_using_tracing():
         == "e-ea6bb35b-c3f0-4c5c-b127-c71c7d6d6441"
     )
 
-    os.remove(tracing_set_file_path)
+    os.remove(tracing_file_path)
diff --git a/veadk/evaluation/base_evaluator.py b/veadk/evaluation/base_evaluator.py
@@ -87,14 +87,14 @@ def load_eval_set(self, eval_set_file: str) -> EvalSet:
 
         return load_eval_set_from_file(eval_set_file)
 
-    def generate_eval_data(self, eval_set_file_path: str):
-        eval_case_data_list: list[EvalCaseData] = []
-        eval_cases = self.load_eval_set(eval_set_file_path).eval_cases
-        self.generate_invocation_data(eval_cases, eval_case_data_list)
-
-    def load_tracing_set(self, tracing_set_file_path: str) -> EvalSet:
-        with open(tracing_set_file_path, "r") as f:
-            tracing_data = json.load(f)
+    def load_eval_set_from_tracing(self, tracing_file: str) -> EvalSet:
+        try:
+            with open(tracing_file, "r") as f:
+                tracing_data = json.load(f)
+        except json.JSONDecodeError as e:
+            raise ValueError(f"Invalid JSON format in file {tracing_file}: {e}")
+        except Exception as e:
+            raise ValueError(f"Error reading file {tracing_file}: {e}")
 
         # Group spans by trace_id
         trace_groups = {}
@@ -188,14 +188,33 @@ def load_tracing_set(self, tracing_set_file_path: str) -> EvalSet:
 
         return evalset
 
-    def generate_eval_data_from_tracing(self, tracing_set_file_path: str):
+    def generate_eval_data(self, file_path: str):
+        """Generate evaluation data from a given file and assign it to the class attribute `invocation_list`."""
         eval_case_data_list: list[EvalCaseData] = []
-        eval_cases = self.load_tracing_set(tracing_set_file_path).eval_cases
-        self.generate_invocation_data(eval_cases, eval_case_data_list)
 
-    def generate_invocation_data(
-        self, eval_cases: list[EvalSet], eval_case_data_list: list[EvalCaseData]
-    ):
+        try:
+            with open(file_path, "r") as f:
+                file_content = json.load(f)
+        except json.JSONDecodeError as e:
+            raise ValueError(f"Invalid JSON format in file {file_path}: {e}")
+        except Exception as e:
+            raise ValueError(f"Error reading file {file_path}: {e}")
+
+        if isinstance(file_content, dict) and "eval_cases" in file_content:
+            eval_cases = self.load_eval_set(file_path).eval_cases
+        elif (
+            isinstance(file_content, list)
+            and len(file_content) > 0
+            and all(
+                isinstance(span, dict) and "trace_id" in span for span in file_content
+            )
+        ):
+            eval_cases = self.load_eval_set_from_tracing(file_path).eval_cases
+        else:
+            raise ValueError(
+                f"Unsupported file format in {file_path}. Please provide a valid file."
+            )
+
         for eval_case in eval_cases:
             eval_case_data = EvalCaseData(invocations=[])
             self.agent_information_list.append(