deeppavlov
diff --git a/‎autointent/generation/utterances/__init__.py‎
Lines changed: 1 addition & 1 deletion b/‎autointent/generation/utterances/__init__.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎autointent/generation/utterances/basic/__init__.py‎
Lines changed: 2 additions & 2 deletions b/‎autointent/generation/utterances/basic/__init__.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎autointent/generation/utterances/basic/chat_template.py‎
Lines changed: 0 additions & 229 deletions b/‎autointent/generation/utterances/basic/chat_template.py‎
Lines changed: 0 additions & 229 deletions
diff --git a/‎autointent/generation/utterances/basic/chat_templates/__init__.py‎
Lines changed: 5 additions & 0 deletions b/‎autointent/generation/utterances/basic/chat_templates/__init__.py‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎autointent/generation/utterances/basic/chat_templates/_base.py‎
Lines changed: 76 additions & 0 deletions b/‎autointent/generation/utterances/basic/chat_templates/_base.py‎
Lines changed: 76 additions & 0 deletions
@@ -1,4 +1,4 @@
-from .basic import SynthesizerChatTemplate, UtteranceGenerator
+from .basic import EnglishSynthesizerTemplate, RussianSynthesizerTemplate, UtteranceGenerator
 from .evolution import (
     AbstractEvolution,
     ConcreteEvolution,
 
@@ -1,4 +1,4 @@
-from .chat_template import SynthesizerChatTemplate
+from .chat_templates import EnglishSynthesizerTemplate, RussianSynthesizerTemplate
 from .utterance_generator import UtteranceGenerator
 
-__all__ = ["SynthesizerChatTemplate", "UtteranceGenerator"]
+__all__ = ["EnglishSynthesizerTemplate", "RussianSynthesizerTemplate", "UtteranceGenerator"]
@@ -0,0 +1,5 @@
+from ._base import BaseChatTemplate, BaseSynthesizerTemplate
+from ._synthesizer_en import EnglishSynthesizerTemplate
+from ._synthesizer_ru import RussianSynthesizerTemplate
+
+__all__ = ["BaseChatTemplate", "BaseSynthesizerTemplate", "EnglishSynthesizerTemplate", "RussianSynthesizerTemplate"]
@@ -0,0 +1,76 @@
+"""Base class for chat template for class-wise augmentation."""
+
+import random
+from abc import ABC, abstractmethod
+from copy import deepcopy
+from typing import ClassVar
+
+from autointent import Dataset
+from autointent.generation.utterances.schemas import Message, Role
+from autointent.schemas import Intent
+
+
+class BaseChatTemplate(ABC):
+    """Base class."""
+
+    @abstractmethod
+    def __call__(self, intent_data: Intent, n_examples: int) -> list[Message]:
+        """Generate examples for this intent."""
+
+
+class BaseSynthesizerTemplate(BaseChatTemplate):
+    """Base chat template for generating additional examples for a given intent."""
+
+    _MESSAGES_TEMPLATE: ClassVar[list[Message]]
+    _INTENT_NAME_LABEL: ClassVar[str]
+    _EXAMPLE_UTTERANCES_LABEL: ClassVar[str]
+    _GENERATE_INSTRUCTION: ClassVar[str]
+
+    def __init__(
+        self,
+        dataset: Dataset,
+        split: str,
+        extra_instructions: str | None = None,
+        max_sample_utterances: int | None = None,
+    ) -> None:
+        """Initialize the chat template with dataset, split, and optional instructions."""
+        if extra_instructions is None:
+            extra_instructions = ""
+
+        self._messages = deepcopy(self._MESSAGES_TEMPLATE)
+
+        if self._messages:
+            self._messages[0]["content"] = self._messages[0]["content"].format(extra_instructions=extra_instructions)
+
+        self.dataset = dataset
+        self.split = split
+        self.max_sample_utterances = max_sample_utterances
+
+    def __call__(self, intent_data: Intent, n_examples: int) -> list[Message]:
+        """Generate a list of messages to request additional examples for the given intent."""
+        in_domain_samples = self.dataset[self.split].filter(lambda sample: sample[Dataset.label_feature] is not None)
+        if self.dataset.multilabel:
+            filter_fn = lambda sample: sample[Dataset.label_feature][intent_data.id] == 1  # noqa: E731
+        else:
+            filter_fn = lambda sample: sample[Dataset.label_feature] == intent_data.id  # noqa: E731
+
+        filtered_split = in_domain_samples.filter(filter_fn)
+        sample_utterances = filtered_split[Dataset.utterance_feature]
+
+        if self.max_sample_utterances is not None and len(sample_utterances) > self.max_sample_utterances:
+            sample_utterances = random.sample(sample_utterances, k=self.max_sample_utterances)
+
+        return [
+            *self._messages,
+            self._create_final_message(intent_data, n_examples, sample_utterances),
+        ]
+
+    def _create_final_message(self, intent_data: Intent, n_examples: int, sample_utterances: list[str]) -> Message:
+        content = f"{self._INTENT_NAME_LABEL}: {intent_data.name}\n\n" f"{self._EXAMPLE_UTTERANCES_LABEL}:\n"
+
+        if sample_utterances:
+            numbered_utterances = "\n".join(f"{i+1}. {utt}" for i, utt in enumerate(sample_utterances))
+            content += numbered_utterances + "\n\n"
+
+        content += self._GENERATE_INSTRUCTION.format(n_examples=n_examples)
+        return Message(role=Role.USER, content=content)
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-from .basic import SynthesizerChatTemplate, UtteranceGenerator`
	`1`	`+from .basic import EnglishSynthesizerTemplate, RussianSynthesizerTemplate, UtteranceGenerator`
`2`	`2`	`from .evolution import (`
`3`	`3`	`AbstractEvolution,`
`4`	`4`	`ConcreteEvolution,`