Add language support to red_team with SupportedLanguages enum (#42132)

Copilot · slister1001 · Copilot · web-flow · commit c1fc122f92bf · 2025-08-13T11:08:55.000-04:00
* Initial plan

* Add language support to RedTeam with SupportedLanguages enum

Co-authored-by: slister1001 &lt;103153180+slister1001@users.noreply.github.com&gt;

* Fix black formatting issues in RedTeam language support files

Co-authored-by: slister1001 &lt;103153180+slister1001@users.noreply.github.com&gt;

* test fixes and black code formatting

* Update sdk/evaluation/azure-ai-evaluation/tests/unittests/test_redteam/test_red_team_language_support.py

Co-authored-by: Copilot &lt;175728472+Copilot@users.noreply.github.com&gt;

* Update sdk/evaluation/azure-ai-evaluation/tests/unittests/test_redteam/test_red_team_language_support.py

Co-authored-by: Copilot &lt;175728472+Copilot@users.noreply.github.com&gt;

* Update test_red_team_language_support.py

* add SupportedLanguages in redteam module

* black formatting fix

---------

Co-authored-by: copilot-swe-agent[bot] &lt;198982749+Copilot@users.noreply.github.com&gt;
Co-authored-by: slister1001 &lt;103153180+slister1001@users.noreply.github.com&gt;
Co-authored-by: Sydney Lister &lt;sydneylister@microsoft.com&gt;
Co-authored-by: Copilot &lt;175728472+Copilot@users.noreply.github.com&gt;
diff --git a/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/__init__.py b/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/__init__.py
@@ -5,7 +5,7 @@
 try:
     from ._red_team import RedTeam
     from ._attack_strategy import AttackStrategy
-    from ._attack_objective_generator import RiskCategory
+    from ._attack_objective_generator import RiskCategory, SupportedLanguages
     from ._red_team_result import RedTeamResult
 except ImportError:
     raise ImportError(
@@ -18,4 +18,5 @@
     "AttackStrategy",
     "RiskCategory",
     "RedTeamResult",
+    "SupportedLanguages",
 ]
diff --git a/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/_attack_objective_generator.py b/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/_attack_objective_generator.py
@@ -24,6 +24,21 @@ class RiskCategory(str, Enum):
     XPIA = "xpia"
 
 
+@experimental
+class SupportedLanguages(Enum):
+    """Supported languages for attack objectives, using ISO standard language codes."""
+
+    Spanish = "es"
+    Italian = "it"
+    French = "fr"
+    German = "de"
+    SimplifiedChinese = "zh-cn"
+    Portuguese = "pt"
+    Japanese = "ja"
+    English = "en"
+    Korean = "ko"
+
+
 @experimental
 class _InternalRiskCategory(str, Enum):
     ECI = "eci"
diff --git a/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/_red_team.py b/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/red_team/_red_team.py
@@ -45,6 +45,7 @@
 from ._attack_strategy import AttackStrategy
 from ._attack_objective_generator import (
     RiskCategory,
+    SupportedLanguages,
     _AttackObjectiveGenerator,
 )
 
@@ -95,6 +96,8 @@ class RedTeam:
     :type application_scenario: Optional[str]
     :param custom_attack_seed_prompts: Path to a JSON file containing custom attack seed prompts (can be absolute or relative path)
     :type custom_attack_seed_prompts: Optional[str]
+    :param language: Language to use for attack objectives generation. Defaults to English.
+    :type language: SupportedLanguages
     :param output_dir: Directory to save output files (optional)
     :type output_dir: Optional[str]
     :param attack_success_thresholds: Threshold configuration for determining attack success.
@@ -113,6 +116,7 @@ def __init__(
         num_objectives: int = 10,
         application_scenario: Optional[str] = None,
         custom_attack_seed_prompts: Optional[str] = None,
+        language: SupportedLanguages = SupportedLanguages.English,
         output_dir=".",
         attack_success_thresholds: Optional[Dict[RiskCategory, int]] = None,
     ):
@@ -135,6 +139,8 @@ def __init__(
         :type application_scenario: Optional[str]
         :param custom_attack_seed_prompts: Path to a JSON file with custom attack prompts
         :type custom_attack_seed_prompts: Optional[str]
+        :param language: Language to use for attack objectives generation. Defaults to English.
+        :type language: SupportedLanguages
         :param output_dir: Directory to save evaluation outputs and logs. Defaults to current working directory.
         :type output_dir: str
         :param attack_success_thresholds: Threshold configuration for determining attack success.
@@ -147,6 +153,7 @@ def __init__(
         self.azure_ai_project = validate_azure_ai_project(azure_ai_project)
         self.credential = credential
         self.output_dir = output_dir
+        self.language = language
         self._one_dp_project = is_onedp_project(azure_ai_project)
 
         # Configure attack success thresholds
@@ -434,6 +441,7 @@ async def _get_rai_attack_objectives(
                     risk_category=other_risk,
                     application_scenario=application_scenario or "",
                     strategy="tense",
+                    language=self.language.value,
                     scan_session_id=self.scan_session_id,
                 )
             else:
@@ -442,6 +450,7 @@ async def _get_rai_attack_objectives(
                     risk_category=other_risk,
                     application_scenario=application_scenario or "",
                     strategy=None,
+                    language=self.language.value,
                     scan_session_id=self.scan_session_id,
                 )
 
diff --git a/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/simulator/_model_tools/_generated_rai_client.py b/sdk/evaluation/azure-ai-evaluation/azure/ai/evaluation/simulator/_model_tools/_generated_rai_client.py
@@ -30,7 +30,11 @@ class GeneratedRAIClient:
     :type token_manager: ~azure.ai.evaluation.simulator._model_tools._identity_manager.APITokenManager
     """
 
-    def __init__(self, azure_ai_project: Union[AzureAIProject, str], token_manager: ManagedIdentityAPITokenManager):
+    def __init__(
+        self,
+        azure_ai_project: Union[AzureAIProject, str],
+        token_manager: ManagedIdentityAPITokenManager,
+    ):
         self.azure_ai_project = azure_ai_project
         self.token_manager = token_manager
 
@@ -53,10 +57,14 @@ def __init__(self, azure_ai_project: Union[AzureAIProject, str], token_manager:
             ).rai_svc
         else:
             self._client = AIProjectClient(
-                endpoint=azure_ai_project, credential=token_manager, user_agent_policy=user_agent_policy
+                endpoint=azure_ai_project,
+                credential=token_manager,
+                user_agent_policy=user_agent_policy,
             ).red_teams
             self._evaluation_onedp_client = EvaluationServiceOneDPClient(
-                endpoint=azure_ai_project, credential=token_manager, user_agent_policy=user_agent_policy
+                endpoint=azure_ai_project,
+                credential=token_manager,
+                user_agent_policy=user_agent_policy,
             )
 
     def _get_service_discovery_url(self):
@@ -68,7 +76,10 @@ def _get_service_discovery_url(self):
         import requests
 
         bearer_token = self._fetch_or_reuse_token(self.token_manager)
-        headers = {"Authorization": f"Bearer {bearer_token}", "Content-Type": "application/json"}
+        headers = {
+            "Authorization": f"Bearer {bearer_token}",
+            "Content-Type": "application/json",
+        }
 
         response = requests.get(
             f"https://management.azure.com/subscriptions/{self.azure_ai_project['subscription_id']}/"
@@ -100,6 +111,7 @@ async def get_attack_objectives(
         risk_category: Optional[str] = None,
         application_scenario: str = None,
         strategy: Optional[str] = None,
+        language: str = "en",
         scan_session_id: Optional[str] = None,
     ) -> Dict:
         """Get attack objectives using the auto-generated operations.
@@ -112,6 +124,8 @@ async def get_attack_objectives(
         :type application_scenario: str
         :param strategy: Optional strategy to filter the attack objectives
         :type strategy: Optional[str]
+        :param language: Language code for the attack objectives (e.g., "en", "es", "fr")
+        :type language: str
         :param scan_session_id: Optional unique session ID for the scan
         :type scan_session_id: Optional[str]
         :return: The attack objectives
@@ -122,7 +136,7 @@ async def get_attack_objectives(
             response = self._client.get_attack_objectives(
                 risk_types=[risk_type],
                 risk_category=risk_category,
-                lang="en",
+                lang=language,
                 strategy=strategy,
                 headers={"x-ms-client-request-id": scan_session_id},
             )
diff --git a/sdk/evaluation/azure-ai-evaluation/tests/unittests/test_redteam/test_red_team_language_support.py b/sdk/evaluation/azure-ai-evaluation/tests/unittests/test_redteam/test_red_team_language_support.py
@@ -0,0 +1,213 @@
+import pytest
+from unittest.mock import AsyncMock, MagicMock, patch
+from azure.ai.evaluation.red_team._red_team import RedTeam, RiskCategory, SupportedLanguages
+from azure.core.credentials import TokenCredential
+
+
+@pytest.fixture
+def mock_azure_ai_project():
+    return {
+        "subscription_id": "test-subscription",
+        "resource_group_name": "test-resource-group",
+        "project_name": "test-project",
+    }
+
+
+@pytest.fixture
+def mock_credential():
+    return MagicMock(spec=TokenCredential)
+
+
+class TestRedTeamLanguageSupport:
+    """Test language support functionality in RedTeam class."""
+
+    def test_red_team_init_default_language(self, mock_azure_ai_project, mock_credential):
+        """Test that RedTeam initializes with default English language."""
+        with patch("azure.ai.evaluation.red_team._red_team.GeneratedRAIClient"), patch(
+            "azure.ai.evaluation.red_team._red_team.setup_logger"
+        ) as mock_setup_logger, patch("azure.ai.evaluation.red_team._red_team.initialize_pyrit"), patch(
+            "azure.ai.evaluation.red_team._red_team._AttackObjectiveGenerator"
+        ):
+
+            mock_logger = MagicMock()
+            mock_setup_logger.return_value = mock_logger
+
+            agent = RedTeam(
+                azure_ai_project=mock_azure_ai_project,
+                credential=mock_credential,
+                risk_categories=[RiskCategory.Violence],
+                num_objectives=5,
+            )
+
+            # Verify default language is English
+            assert agent.language == SupportedLanguages.English
+
+    def test_red_team_init_custom_language(self, mock_azure_ai_project, mock_credential):
+        """Test that RedTeam initializes with custom language."""
+        with patch("azure.ai.evaluation.red_team._red_team.GeneratedRAIClient"), patch(
+            "azure.ai.evaluation.red_team._red_team.setup_logger"
+        ) as mock_setup_logger, patch("azure.ai.evaluation.red_team._red_team.initialize_pyrit"), patch(
+            "azure.ai.evaluation.red_team._red_team._AttackObjectiveGenerator"
+        ):
+
+            mock_logger = MagicMock()
+            mock_setup_logger.return_value = mock_logger
+
+            # Test with Spanish language
+            agent = RedTeam(
+                azure_ai_project=mock_azure_ai_project,
+                credential=mock_credential,
+                risk_categories=[RiskCategory.Violence],
+                num_objectives=5,
+                language=SupportedLanguages.Spanish,
+            )
+
+            assert agent.language == SupportedLanguages.Spanish
+
+    @pytest.mark.parametrize(
+        "language",
+        [
+            SupportedLanguages.English,
+            SupportedLanguages.Spanish,
+            SupportedLanguages.French,
+            SupportedLanguages.German,
+            SupportedLanguages.Italian,
+            SupportedLanguages.Portuguese,
+            SupportedLanguages.Japanese,
+            SupportedLanguages.Korean,
+            SupportedLanguages.SimplifiedChinese,
+        ],
+    )
+    def test_red_team_init_all_supported_languages(self, mock_azure_ai_project, mock_credential, language):
+        """Test that RedTeam initializes correctly with all supported languages."""
+        with patch("azure.ai.evaluation.red_team._red_team.GeneratedRAIClient"), patch(
+            "azure.ai.evaluation.red_team._red_team.setup_logger"
+        ) as mock_setup_logger, patch("azure.ai.evaluation.red_team._red_team.initialize_pyrit"), patch(
+            "azure.ai.evaluation.red_team._red_team._AttackObjectiveGenerator"
+        ):
+
+            mock_logger = MagicMock()
+            mock_setup_logger.return_value = mock_logger
+
+            agent = RedTeam(
+                azure_ai_project=mock_azure_ai_project,
+                credential=mock_credential,
+                risk_categories=[RiskCategory.Violence],
+                num_objectives=5,
+                language=language,
+            )
+
+            assert agent.language == language
+
+    @pytest.mark.asyncio
+    async def test_get_attack_objectives_passes_language(self, mock_azure_ai_project, mock_credential):
+        """Test that _get_attack_objectives passes language parameter to generated RAI client."""
+        with patch("azure.ai.evaluation.red_team._red_team.GeneratedRAIClient") as mock_rai_client_class, patch(
+            "azure.ai.evaluation.red_team._red_team.setup_logger"
+        ) as mock_setup_logger, patch("azure.ai.evaluation.red_team._red_team.initialize_pyrit"), patch(
+            "azure.ai.evaluation.red_team._red_team._AttackObjectiveGenerator"
+        ) as mock_attack_obj_generator_class:
+
+            mock_logger = MagicMock()
+            mock_setup_logger.return_value = mock_logger
+
+            # Set up mock RAI client instance
+            mock_rai_client = MagicMock()
+            mock_rai_client.get_attack_objectives = AsyncMock(
+                return_value=[
+                    {
+                        "id": "test-id",
+                        "messages": [{"role": "user", "content": "test prompt"}],
+                        "metadata": {"target_harms": [{"risk-type": "violence"}]},
+                    }
+                ]
+            )
+            mock_rai_client_class.return_value = mock_rai_client
+
+            # Set up mock attack objective generator instance
+            mock_attack_obj_generator = MagicMock()
+            mock_attack_obj_generator.num_objectives = 5
+            mock_attack_obj_generator.custom_attack_seed_prompts = None
+            mock_attack_obj_generator.validated_prompts = False
+            mock_attack_obj_generator_class.return_value = mock_attack_obj_generator
+
+            # Create RedTeam instance with Spanish language
+            agent = RedTeam(
+                azure_ai_project=mock_azure_ai_project,
+                credential=mock_credential,
+                risk_categories=[RiskCategory.Violence],
+                num_objectives=5,
+                language=SupportedLanguages.Spanish,
+            )
+
+            agent.generated_rai_client = mock_rai_client
+            agent.scan_session_id = "test-session"
+
+            # Call _get_attack_objectives
+            await agent._get_attack_objectives(
+                risk_category=RiskCategory.Violence,
+                application_scenario="test scenario",
+                strategy="baseline",
+            )
+
+            # Verify that get_attack_objectives was called with Spanish language
+            mock_rai_client.get_attack_objectives.assert_called_once()
+            call_args = mock_rai_client.get_attack_objectives.call_args
+            assert call_args.kwargs["language"] == SupportedLanguages.Spanish.value
+
+    @pytest.mark.asyncio
+    async def test_get_attack_objectives_tense_strategy_passes_language(self, mock_azure_ai_project, mock_credential):
+        """Test that _get_attack_objectives passes language parameter for tense strategy."""
+        with patch("azure.ai.evaluation.red_team._red_team.GeneratedRAIClient") as mock_rai_client_class, patch(
+            "azure.ai.evaluation.red_team._red_team.setup_logger"
+        ) as mock_setup_logger, patch("azure.ai.evaluation.red_team._red_team.initialize_pyrit"), patch(
+            "azure.ai.evaluation.red_team._red_team._AttackObjectiveGenerator"
+        ) as mock_attack_obj_generator_class:
+
+            mock_logger = MagicMock()
+            mock_setup_logger.return_value = mock_logger
+
+            # Set up mock RAI client instance
+            mock_rai_client = MagicMock()
+            mock_rai_client.get_attack_objectives = AsyncMock(
+                return_value=[
+                    {
+                        "id": "test-id",
+                        "messages": [{"role": "user", "content": "test prompt"}],
+                        "metadata": {"target_harms": [{"risk-type": "violence"}]},
+                    }
+                ]
+            )
+            mock_rai_client_class.return_value = mock_rai_client
+
+            # Set up mock attack objective generator instance
+            mock_attack_obj_generator = MagicMock()
+            mock_attack_obj_generator.num_objectives = 5
+            mock_attack_obj_generator.custom_attack_seed_prompts = None
+            mock_attack_obj_generator.validated_prompts = False
+            mock_attack_obj_generator_class.return_value = mock_attack_obj_generator
+
+            # Create RedTeam instance with French language
+            agent = RedTeam(
+                azure_ai_project=mock_azure_ai_project,
+                credential=mock_credential,
+                risk_categories=[RiskCategory.Violence],
+                num_objectives=5,
+                language=SupportedLanguages.French,
+            )
+
+            agent.generated_rai_client = mock_rai_client
+            agent.scan_session_id = "test-session"
+
+            # Call _get_attack_objectives with tense strategy
+            await agent._get_attack_objectives(
+                risk_category=RiskCategory.Violence,
+                application_scenario="test scenario",
+                strategy="tense",
+            )
+
+            # Verify that get_attack_objectives was called with French language and tense strategy
+            mock_rai_client.get_attack_objectives.assert_called_once()
+            call_args = mock_rai_client.get_attack_objectives.call_args
+            assert call_args.kwargs["language"] == SupportedLanguages.French.value  # French language code
+            assert call_args.kwargs["strategy"] == "tense"