redteam bug fixes for model usage computation and auth (#43633)

slister1001 · web-flow · commit 585a3021e6b8 · 2025-10-26T00:10:56.000Z
diff --git a/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/_red_team.py b/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/_red_team.py
@@ -325,6 +325,7 @@ async def _get_attack_objectives(
         application_scenario: Optional[str] = None,
         strategy: Optional[str] = None,
         is_agent_target: Optional[bool] = None,
+        client_id: Optional[str] = None,
     ) -> List[str]:
         """Get attack objectives from the RAI client for a specific risk category or from a custom dataset.
 
@@ -407,6 +408,7 @@ async def _get_attack_objectives(
                 current_key,
                 num_objectives,
                 is_agent_target,
+                client_id,
             )
 
     async def _get_custom_attack_objectives(
@@ -469,6 +471,7 @@ async def _get_rai_attack_objectives(
         current_key: tuple,
         num_objectives: int,
         is_agent_target: Optional[bool] = None,
+        client_id: Optional[str] = None,
     ) -> List[str]:
         """Get attack objectives from the RAI service."""
         content_harm_risk = None
@@ -495,6 +498,7 @@ async def _get_rai_attack_objectives(
                     language=self.language.value,
                     scan_session_id=self.scan_session_id,
                     target=target_type_str,
+                    client_id=client_id,
                 )
             else:
                 objectives_response = await self.generated_rai_client.get_attack_objectives(
@@ -505,6 +509,7 @@ async def _get_rai_attack_objectives(
                     language=self.language.value,
                     scan_session_id=self.scan_session_id,
                     target=target_type_str,
+                    client_id=client_id,
                 )
 
             if isinstance(objectives_response, list):
@@ -539,6 +544,7 @@ async def _get_rai_attack_objectives(
                             language=self.language.value,
                             scan_session_id=self.scan_session_id,
                             target="model",
+                            client_id=client_id,
                         )
                     else:
                         objectives_response = await self.generated_rai_client.get_attack_objectives(
@@ -549,6 +555,7 @@ async def _get_rai_attack_objectives(
                             language=self.language.value,
                             scan_session_id=self.scan_session_id,
                             target="model",
+                            client_id=client_id,
                         )
 
                     if isinstance(objectives_response, list):
@@ -1022,6 +1029,8 @@ async def scan(
         self._app_insights_configuration = _app_insights_configuration
         self.taxonomy_risk_categories = taxonomy_risk_categories or {}
         is_agent_target: Optional[bool] = kwargs.get("is_agent_target", False)
+        client_id: Optional[str] = kwargs.get("client_id")
+
         with UserAgentSingleton().add_useragent_product(user_agent):
             # Initialize scan
             self._initialize_scan(scan_name, application_scenario)
@@ -1112,7 +1121,7 @@ async def scan(
 
             # Fetch attack objectives
             all_objectives = await self._fetch_all_objectives(
-                flattened_attack_strategies, application_scenario, is_agent_target
+                flattened_attack_strategies, application_scenario, is_agent_target, client_id
             )
 
             chat_target = get_chat_target(target)
@@ -1228,7 +1237,11 @@ def _initialize_tracking_dict(self, flattened_attack_strategies: List):
                 }
 
     async def _fetch_all_objectives(
-        self, flattened_attack_strategies: List, application_scenario: str, is_agent_target: bool
+        self,
+        flattened_attack_strategies: List,
+        application_scenario: str,
+        is_agent_target: bool,
+        client_id: Optional[str] = None,
     ) -> Dict:
         """Fetch all attack objectives for all strategies and risk categories."""
         log_section_header(self.logger, "Fetching attack objectives")
@@ -1242,6 +1255,7 @@ async def _fetch_all_objectives(
                 application_scenario=application_scenario,
                 strategy="baseline",
                 is_agent_target=is_agent_target,
+                client_id=client_id,
             )
             if "baseline" not in all_objectives:
                 all_objectives["baseline"] = {}
@@ -1266,6 +1280,7 @@ async def _fetch_all_objectives(
                     application_scenario=application_scenario,
                     strategy=strategy_name,
                     is_agent_target=is_agent_target,
+                    client_id=client_id,
                 )
                 all_objectives[strategy_name][risk_category.value] = objectives
 
diff --git a/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/_result_processor.py b/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/_result_processor.py
@@ -1231,7 +1231,6 @@ def _compute_per_model_usage(output_items: List[Dict[str, Any]]) -> List[Dict[st
         """
         # Track usage by model name
         model_usage: Dict[str, Dict[str, int]] = {}
-
         for item in output_items:
             if not isinstance(item, dict):
                 continue
@@ -1254,10 +1253,11 @@ def _compute_per_model_usage(output_items: List[Dict[str, Any]]) -> List[Dict[st
                         }
 
                     model_usage[model_name]["invocation_count"] += 1
-                    model_usage[model_name]["prompt_tokens"] += usage.get("prompt_tokens", 0)
-                    model_usage[model_name]["completion_tokens"] += usage.get("completion_tokens", 0)
-                    model_usage[model_name]["total_tokens"] += usage.get("total_tokens", 0)
-                    model_usage[model_name]["cached_tokens"] += usage.get("cached_tokens", 0)
+                    # Convert to int to handle cases where values come as strings
+                    model_usage[model_name]["prompt_tokens"] += int(usage.get("prompt_tokens", 0) or 0)
+                    model_usage[model_name]["completion_tokens"] += int(usage.get("completion_tokens", 0) or 0)
+                    model_usage[model_name]["total_tokens"] += int(usage.get("total_tokens", 0) or 0)
+                    model_usage[model_name]["cached_tokens"] += int(usage.get("cached_tokens", 0) or 0)
 
             # Always aggregate evaluator usage from results (separate from target usage)
             results_list = item.get("results", [])
@@ -1286,9 +1286,10 @@ def _compute_per_model_usage(output_items: List[Dict[str, Any]]) -> List[Dict[st
 
                     if prompt_tokens or completion_tokens:
                         model_usage[model_name]["invocation_count"] += 1
-                        model_usage[model_name]["prompt_tokens"] += prompt_tokens
-                        model_usage[model_name]["completion_tokens"] += completion_tokens
-                        model_usage[model_name]["total_tokens"] += prompt_tokens + completion_tokens
+                        # Convert to int to handle cases where values come as strings
+                        model_usage[model_name]["prompt_tokens"] += int(prompt_tokens or 0)
+                        model_usage[model_name]["completion_tokens"] += int(completion_tokens or 0)
+                        model_usage[model_name]["total_tokens"] += int(prompt_tokens or 0) + int(completion_tokens or 0)
 
         if not model_usage:
             return []