liberate-org · yneshch · Jun 12, 2024 · Jun 12, 2024 · Jun 12, 2024
diff --git a/vocode/streaming/models/transcriber.py b/vocode/streaming/models/transcriber.py
@@ -64,6 +64,8 @@ class TranscriberConfig(TypedModel, type=TranscriberType.BASE.value):
     input_device_config: Optional[InputDeviceConfig] = None
     vad: bool = False
     experimental: bool = False
+    utterance_end_ms: int = None
+    deepgram_endpoint_ms: int = None
 
     @validator("min_interrupt_confidence")
     def min_interrupt_confidence_must_be_between_0_and_1(cls, v):
@@ -78,6 +80,8 @@ def from_input_device_config_experimental(
         endpointing_config: Optional[EndpointingConfig] = None,
         vad: Optional[bool] = False,
         experimental: Optional[bool] = False,
+        utterance_end_ms: Optional[float] = None,
+        deepgram_endpoint_ms: Optional[float] = None,
         **kwargs,
     ):
         return cls(
@@ -87,6 +91,8 @@ def from_input_device_config_experimental(
             endpointing_config=endpointing_config,
             vad=vad,
             experimental=experimental,
+            utterance_end_ms=utterance_end_ms,
+            deepgram_endpoint_ms=deepgram_endpoint_ms,
             input_device_config=InputDeviceConfig(
                 sampling_rate=input_device.sampling_rate,
                 audio_encoding=input_device.audio_encoding
@@ -99,6 +105,8 @@ def from_input_device_config_vad(
             cls,
             input_device: BaseInputDevice,
             endpointing_config: Optional[EndpointingConfig] = None,
+            utterance_end_ms: Optional[float] = None,
+            deepgram_endpoint_ms: Optional[float] = None,
             **kwargs,
     ):
         return cls(
@@ -107,6 +115,8 @@ def from_input_device_config_vad(
             chunk_size=input_device.chunk_size,
             endpointing_config=endpointing_config,
             vad=True,
+            utterance_end_ms=utterance_end_ms,
+            deepgram_endpoint_ms=deepgram_endpoint_ms,
             # this is used for mapping the input device to the transcriber
             input_device_config=InputDeviceConfig(
                 sampling_rate=input_device.sampling_rate,
@@ -120,13 +130,17 @@ def from_input_device(
         cls,
         input_device: BaseInputDevice,
         endpointing_config: Optional[EndpointingConfig] = None,
+        utterance_end_ms: Optional[float] = None,
+        deepgram_endpoint_ms: Optional[float] = None,
         **kwargs,
     ):
         return cls(
             sampling_rate=input_device.sampling_rate,
             audio_encoding=input_device.audio_encoding,
             chunk_size=input_device.chunk_size,
             endpointing_config=endpointing_config,
+            utterance_end_ms=utterance_end_ms,
+            deepgram_endpoint_ms=deepgram_endpoint_ms,
             **kwargs,
         )