Update 2.evaluation.md

yaozheng-fang · web-flow · commit 79b5720f58bc · 2025-09-30T17:43:34.000+08:00
diff --git a/docs/content/8.observation/2.evaluation.md b/docs/content/8.observation/2.evaluation.md
@@ -154,64 +154,3 @@ evaluator = DeepevalEvaluator(
     prometheus_config=prometheus_config,
 )
 ```
-
-## 完整示例
-
-以下是使用 DeepEval 评测器的完整例子。其中定义了 [GEval](https://deepeval.com/docs/metrics-llm-evals) 指标和 [ToolCorrectnessMetric](https://deepeval.com/docs/metrics-tool-correctness) 指标，分别用于整体输出质量评估和工具调用正确率评估，并将评测结果上报至火山引擎的 VMP 平台：
-
-```python
-import asyncio
-import os
-from builtin_tools.agent import agent
-
-from deepeval.metrics import GEval, ToolCorrectnessMetric
-from deepeval.test_case import LLMTestCaseParams
-from veadk.config import getenv
-from veadk.evaluation.deepeval_evaluator import DeepevalEvaluator
-from veadk.evaluation.utils.prometheus import PrometheusPushgatewayConfig
-from veadk.prompts.prompt_evaluator import eval_principle_prompt
-
-prometheus_config = PrometheusPushgatewayConfig()
-
-# 1. Rollout, and generate eval set file
-# await agent.run(
-#     prompt,
-#     collect_runtime_data=True,
-#     eval_set_id=f"eval_demo_set_{get_current_time()}",
-# )
-# # get expect output
-# dump_path = agent._dump_path
-# assert dump_path != "", "Dump eval set file failed! Please check runtime logs."
-
-# 2. Evaluate in terms of eval set file
-evaluator = DeepevalEvaluator(
-    agent=agent,
-    judge_model_name=getenv("MODEL_JUDGE_NAME"),
-    judge_model_api_base=getenv("MODEL_JUDGE_API_BASE"),
-    judge_model_api_key=getenv("MODEL_JUDGE_API_KEY"),
-    prometheus_config=prometheus_config,
-)
-
-# 3. Define evaluation metrics
-metrics = [
-    GEval(
-        threshold=0.8,
-        name="Base Evaluation",
-        criteria=eval_principle_prompt,
-        evaluation_params=[
-            LLMTestCaseParams.INPUT,
-            LLMTestCaseParams.ACTUAL_OUTPUT,
-            LLMTestCaseParams.EXPECTED_OUTPUT,
-        ],
-    ),
-    ToolCorrectnessMetric(
-        threshold=0.5
-    ), 
-]
-
-# 4. Run evaluation
-eval_set_file_path = os.path.join(
-    os.path.dirname(__file__), "builtin_tools", "evalsetf0aef1.evalset.json"
-)
-await evaluator.eval(eval_set_file_path=eval_set_file_path, metrics=metrics)
-```