BBC-Esq
diff --git a/‎config/constants.py‎
Lines changed: 90 additions & 205 deletions b/‎config/constants.py‎
Lines changed: 90 additions & 205 deletions
diff --git a/‎config/settings.py‎
Lines changed: 6 additions & 8 deletions b/‎config/settings.py‎
Lines changed: 6 additions & 8 deletions
diff --git a/‎core/models/manager.py‎
Lines changed: 2 additions & 2 deletions b/‎core/models/manager.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎core/monitoring/metrics_store.py‎
Lines changed: 0 additions & 21 deletions b/‎core/monitoring/metrics_store.py‎
Lines changed: 0 additions & 21 deletions
@@ -1,220 +1,105 @@
-"""Model definitions and application constants."""
+from collections import OrderedDict
+
+_MODEL_SPECS = [
+    ("Whisper large-v3 turbo",  "whisper-large-v3-turbo",  "float32", 155, 4, "3.2 GB"),
+    ("Whisper large-v3 turbo",  "whisper-large-v3-turbo",  "bfloat16", 160, 4, "3.0 GB"),
+    ("Whisper large-v3 turbo",  "whisper-large-v3-turbo",  "float16", 165, 4, "2.8 GB"),
+    ("Distil Whisper large-v3", "distil-whisper-large-v3", "float32", 160, 4, "3.0 GB"),
+    ("Distil Whisper large-v3", "distil-whisper-large-v3", "bfloat16", 160, 4, "3.0 GB"),
+    ("Distil Whisper large-v3", "distil-whisper-large-v3", "float16", 160, 4, "3.0 GB"),
+    ("Whisper large-v3",        "whisper-large-v3",        "float32", 85,  2, "5.5 GB"),
+    ("Whisper large-v3",        "whisper-large-v3",        "bfloat16", 95, 3, "3.8 GB"),
+    ("Whisper large-v3",        "whisper-large-v3",        "float16", 100, 3, "3.3 GB"),
+    ("Distil Whisper medium.en", "distil-whisper-medium.en", "float32", 160, 4, "3.0 GB"),
+    ("Distil Whisper medium.en", "distil-whisper-medium.en", "bfloat16", 160, 4, "3.0 GB"),
+    ("Distil Whisper medium.en", "distil-whisper-medium.en", "float16", 160, 4, "3.0 GB"),
+    ("Whisper medium",          "whisper-medium",          "float32", 125, 5, "2.8 GB"),
+    ("Whisper medium",          "whisper-medium",          "bfloat16", 135, 6, "2.2 GB"),
+    ("Whisper medium",          "whisper-medium",          "float16", 140, 6, "2.0 GB"),
+    ("Whisper medium.en",       "whisper-medium.en",       "float32", 130, 6, "2.5 GB"),
+    ("Whisper medium.en",       "whisper-medium.en",       "bfloat16", 140, 7, "2.0 GB"),
+    ("Whisper medium.en",       "whisper-medium.en",       "float16", 145, 7, "1.8 GB"),
+    ("Distil Whisper small.en", "distil-whisper-small.en", "float32", 160, 4, "3.0 GB"),
+    ("Distil Whisper small.en", "distil-whisper-small.en", "bfloat16", 160, 4, "3.0 GB"),
+    ("Distil Whisper small.en", "distil-whisper-small.en", "float16", 160, 4, "3.0 GB"),
+    ("Whisper small",           "whisper-small",           "float32", 175, 12, "1.8 GB"),
+    ("Whisper small",           "whisper-small",           "bfloat16", 185, 13, "1.4 GB"),
+    ("Whisper small",           "whisper-small",           "float16", 190, 13, "1.3 GB"),
+    ("Whisper small.en",        "whisper-small.en",        "float32", 180, 14, "1.5 GB"),
+    ("Whisper small.en",        "whisper-small.en",        "bfloat16", 190, 15, "1.2 GB"),
+    ("Whisper small.en",        "whisper-small.en",        "float16", 195, 15, "1.1 GB"),
+    ("Whisper base",            "whisper-base",            "float32", 225, 20, "1.1 GB"),
+    ("Whisper base",            "whisper-base",            "bfloat16", 235, 21, "0.9 GB"),
+    ("Whisper base",            "whisper-base",            "float16", 240, 21, "0.85 GB"),
+    ("Whisper base.en",         "whisper-base.en",         "float32", 230, 22, "1.0 GB"),
+    ("Whisper base.en",         "whisper-base.en",         "bfloat16", 240, 23, "0.85 GB"),
+    ("Whisper base.en",         "whisper-base.en",         "float16", 245, 23, "0.8 GB"),
+    ("Whisper tiny",            "whisper-tiny",            "float32", 275, 28, "0.75 GB"),
+    ("Whisper tiny",            "whisper-tiny",            "bfloat16", 285, 29, "0.65 GB"),
+    ("Whisper tiny",            "whisper-tiny",            "float16", 290, 29, "0.6 GB"),
+    ("Whisper tiny.en",         "whisper-tiny.en",         "float32", 280, 30, "0.7 GB"),
+    ("Whisper tiny.en",         "whisper-tiny.en",         "bfloat16", 290, 31, "0.6 GB"),
+    ("Whisper tiny.en",         "whisper-tiny.en",         "float16", 295, 31, "0.55 GB"),
+]
 
 WHISPER_MODELS = {
-    # LARGE-V3
-    'Distil Whisper large-v3 - float32': {
-        'name': 'Distil Whisper large-v3',
-        'precision': 'float32',
-        'repo_id': 'ctranslate2-4you/distil-whisper-large-v3-ct2-float32',
-        'tokens_per_second': 160,
-        'optimal_batch_size': 4,
-        'avg_vram_usage': '3.0 GB'
-    },
-    'Distil Whisper large-v3 - bfloat16': {
-        'name': 'Distil Whisper large-v3',
-        'precision': 'bfloat16',
-        'repo_id': 'ctranslate2-4you/distil-whisper-large-v3-ct2-bfloat16',
-        'tokens_per_second': 160,
-        'optimal_batch_size': 4,
-        'avg_vram_usage': '3.0 GB'
-    },
-    'Distil Whisper large-v3 - float16': {
-        'name': 'Distil Whisper large-v3',
-        'precision': 'float16',
-        'repo_id': 'ctranslate2-4you/distil-whisper-large-v3-ct2-float16',
-        'tokens_per_second': 160,
-        'optimal_batch_size': 4,
-        'avg_vram_usage': '3.0 GB'
-    },
-    'Whisper large-v3 - float32': {
-        'name': 'Whisper large-v3',
-        'precision': 'float32',
-        'repo_id': 'ctranslate2-4you/whisper-large-v3-ct2-float32',
-        'tokens_per_second': 85,
-        'optimal_batch_size': 2,
-        'avg_vram_usage': '5.5 GB'
-    },
-    'Whisper large-v3 - bfloat16': {
-        'name': 'Whisper large-v3',
-        'precision': 'bfloat16',
-        'repo_id': 'ctranslate2-4you/whisper-large-v3-ct2-bfloat16',
-        'tokens_per_second': 95,
-        'optimal_batch_size': 3,
-        'avg_vram_usage': '3.8 GB'
-    },
-    'Whisper large-v3 - float16': {
-        'name': 'Whisper large-v3',
-        'precision': 'float16',
-        'repo_id': 'ctranslate2-4you/whisper-large-v3-ct2-float16',
-        'tokens_per_second': 100,
-        'optimal_batch_size': 3,
-        'avg_vram_usage': '3.3 GB'
-    },
-    # MEDIUM.EN
-    'Distil Whisper medium.en - float32': {
-        'name': 'Distil Whisper large-v3',
-        'precision': 'float32',
-        'repo_id': 'ctranslate2-4you/distil-whisper-medium.en-ct2-float32',
-        'tokens_per_second': 160,
-        'optimal_batch_size': 4,
-        'avg_vram_usage': '3.0 GB'
-    },
-    'Distil Whisper medium.en - bfloat16': {
-        'name': 'Distil Whisper medium.en',
-        'precision': 'bfloat16',
-        'repo_id': 'ctranslate2-4you/distil-whisper-medium.en-ct2-bfloat16',
-        'tokens_per_second': 160,
-        'optimal_batch_size': 4,
-        'avg_vram_usage': '3.0 GB'
-    },
-    'Distil Whisper medium.en - float16': {
-        'name': 'Distil Whisper medium.en',
-        'precision': 'float16',
-        'repo_id': 'ctranslate2-4you/distil-whisper-medium.en-ct2-float16',
-        'tokens_per_second': 160,
-        'optimal_batch_size': 4,
-        'avg_vram_usage': '3.0 GB'
-    },
-    'Whisper medium.en - float32': {
-        'name': 'Whisper medium.en',
-        'precision': 'float32',
-        'repo_id': 'ctranslate2-4you/whisper-medium.en-ct2-float32',
-        'tokens_per_second': 130,
-        'optimal_batch_size': 6,
-        'avg_vram_usage': '2.5 GB'
-    },
-    'Whisper medium.en - bfloat16': {
-        'name': 'Whisper medium.en',
-        'precision': 'bfloat16',
-        'repo_id': 'ctranslate2-4you/whisper-medium.en-ct2-bfloat16',
-        'tokens_per_second': 140,
-        'optimal_batch_size': 7,
-        'avg_vram_usage': '2.0 GB'
-    },
-    'Whisper medium.en - float16': {
-        'name': 'Whisper medium.en',
-        'precision': 'float16',
-        'repo_id': 'ctranslate2-4you/whisper-medium.en-ct2-float16',
-        'tokens_per_second': 145,
-        'optimal_batch_size': 7,
-        'avg_vram_usage': '1.8 GB'
-    },
-    # SMALL.EN
-    'Distil Whisper small.en - float32': {
-        'name': 'Distil Whisper small.en',
-        'precision': 'float32',
-        'repo_id': 'ctranslate2-4you/distil-whisper-small.en-ct2-float32',
-        'tokens_per_second': 160,
-        'optimal_batch_size': 4,
-        'avg_vram_usage': '3.0 GB'
-    },
-    'Distil Whisper small.en - bfloat16': {
-        'name': 'Distil Whisper small.en',
-        'precision': 'bfloat16',
-        'repo_id': 'ctranslate2-4you/distil-whisper-small.en-ct2-bfloat16',
-        'tokens_per_second': 160,
-        'optimal_batch_size': 4,
-        'avg_vram_usage': '3.0 GB'
-    },
-    'Distil Whisper small.en - float16': {
-        'name': 'Distil Whisper small.en',
-        'precision': 'float16',
-        'repo_id': 'ctranslate2-4you/distil-whisper-small.en-ct2-float16',
-        'tokens_per_second': 160,
-        'optimal_batch_size': 4,
-        'avg_vram_usage': '3.0 GB'
-    },
-    'Whisper small.en - float32': {
-        'name': 'Whisper small.en',
-        'precision': 'float32',
-        'repo_id': 'ctranslate2-4you/whisper-small.en-ct2-float32',
-        'tokens_per_second': 180,
-        'optimal_batch_size': 14,
-        'avg_vram_usage': '1.5 GB'
-    },
-    'Whisper small.en - bfloat16': {
-        'name': 'Whisper small.en',
-        'precision': 'bfloat16',
-        'repo_id': 'ctranslate2-4you/whisper-small.en-ct2-bfloat16',
-        'tokens_per_second': 190,
-        'optimal_batch_size': 15,
-        'avg_vram_usage': '1.2 GB'
-    },
-    'Whisper small.en - float16': {
-        'name': 'Whisper small.en',
-        'precision': 'float16',
-        'repo_id': 'ctranslate2-4you/whisper-small.en-ct2-float16',
-        'tokens_per_second': 195,
-        'optimal_batch_size': 15,
-        'avg_vram_usage': '1.1 GB'
-    },
-    # BASE.EN
-    'Whisper base.en - float32': {
-        'name': 'Whisper base.en',
-        'precision': 'float32',
-        'repo_id': 'ctranslate2-4you/whisper-base.en-ct2-float32',
-        'tokens_per_second': 230,
-        'optimal_batch_size': 22,
-        'avg_vram_usage': '1.0 GB'
-    },
-    'Whisper base.en - bfloat16': {
-        'name': 'Whisper base.en',
-        'precision': 'bfloat16',
-        'repo_id': 'ctranslate2-4you/whisper-base.en-ct2-bfloat16',
-        'tokens_per_second': 240,
-        'optimal_batch_size': 23,
-        'avg_vram_usage': '0.85 GB'
-    },
-    'Whisper base.en - float16': {
-        'name': 'Whisper base.en',
-        'precision': 'float16',
-        'repo_id': 'ctranslate2-4you/whisper-base.en-ct2-float16',
-        'tokens_per_second': 245,
-        'optimal_batch_size': 23,
-        'avg_vram_usage': '0.8 GB'
-    },
-    # TINY.EN
-    'Whisper tiny.en - float32': {
-        'name': 'Whisper tiny.en',
-        'precision': 'float32',
-        'repo_id': 'ctranslate2-4you/whisper-tiny.en-ct2-float32',
-        'tokens_per_second': 280,
-        'optimal_batch_size': 30,
-        'avg_vram_usage': '0.7 GB'
-    },
-    'Whisper tiny.en - bfloat16': {
-        'name': 'Whisper tiny.en',
-        'precision': 'bfloat16',
-        'repo_id': 'ctranslate2-4you/whisper-tiny.en-ct2-bfloat16',
-        'tokens_per_second': 290,
-        'optimal_batch_size': 31,
-        'avg_vram_usage': '0.6 GB'
-    },
-    'Whisper tiny.en - float16': {
-        'name': 'Whisper tiny.en',
-        'precision': 'float16',
-        'repo_id': 'ctranslate2-4you/whisper-tiny.en-ct2-float16',
-        'tokens_per_second': 295,
-        'optimal_batch_size': 31,
-        'avg_vram_usage': '0.55 GB'
-    },
+    f"{name} - {prec}": {
+        'name': name,
+        'precision': prec,
+        'repo_id': f'ctranslate2-4you/{slug}-ct2-{prec}',
+        'tokens_per_second': tps,
+        'optimal_batch_size': batch,
+        'avg_vram_usage': vram,
+    }
+    for name, slug, prec, tps, batch, vram in _MODEL_SPECS
 }
 
+MODEL_NAMES = list(OrderedDict.fromkeys(name for name, *_ in _MODEL_SPECS))
+
+MODEL_PRECISIONS = {}
+for name, slug, prec, *_ in _MODEL_SPECS:
+    MODEL_PRECISIONS.setdefault(name, []).append(prec)
+
+DISTIL_MODELS = frozenset(name for name, *_ in _MODEL_SPECS if name.startswith("Distil"))
+
+WHISPER_LANGUAGES = OrderedDict([
+    ("af", "Afrikaans"), ("am", "Amharic"), ("ar", "Arabic"), ("as", "Assamese"),
+    ("az", "Azerbaijani"), ("ba", "Bashkir"), ("be", "Belarusian"), ("bg", "Bulgarian"),
+    ("bn", "Bengali"), ("bo", "Tibetan"), ("br", "Breton"), ("bs", "Bosnian"),
+    ("ca", "Catalan"), ("cs", "Czech"), ("cy", "Welsh"), ("da", "Danish"),
+    ("de", "German"), ("el", "Greek"), ("en", "English"), ("es", "Spanish"),
+    ("et", "Estonian"), ("eu", "Basque"), ("fa", "Persian"), ("fi", "Finnish"),
+    ("fo", "Faroese"), ("fr", "French"), ("gl", "Galician"), ("gu", "Gujarati"),
+    ("ha", "Hausa"), ("haw", "Hawaiian"), ("he", "Hebrew"), ("hi", "Hindi"),
+    ("hr", "Croatian"), ("ht", "Haitian Creole"), ("hu", "Hungarian"), ("hy", "Armenian"),
+    ("id", "Indonesian"), ("is", "Icelandic"), ("it", "Italian"), ("ja", "Japanese"),
+    ("jw", "Javanese"), ("ka", "Georgian"), ("kk", "Kazakh"), ("km", "Khmer"),
+    ("kn", "Kannada"), ("ko", "Korean"), ("la", "Latin"), ("lb", "Luxembourgish"),
+    ("ln", "Lingala"), ("lo", "Lao"), ("lt", "Lithuanian"), ("lv", "Latvian"),
+    ("mg", "Malagasy"), ("mi", "Maori"), ("mk", "Macedonian"), ("ml", "Malayalam"),
+    ("mn", "Mongolian"), ("mr", "Marathi"), ("ms", "Malay"), ("mt", "Maltese"),
+    ("my", "Myanmar"), ("ne", "Nepali"), ("nl", "Dutch"), ("nn", "Nynorsk"),
+    ("no", "Norwegian"), ("oc", "Occitan"), ("pa", "Punjabi"), ("pl", "Polish"),
+    ("ps", "Pashto"), ("pt", "Portuguese"), ("ro", "Romanian"), ("ru", "Russian"),
+    ("sa", "Sanskrit"), ("sd", "Sindhi"), ("si", "Sinhala"), ("sk", "Slovak"),
+    ("sl", "Slovenian"), ("sn", "Shona"), ("so", "Somali"), ("sq", "Albanian"),
+    ("sr", "Serbian"), ("su", "Sundanese"), ("sv", "Swedish"), ("sw", "Swahili"),
+    ("ta", "Tamil"), ("te", "Telugu"), ("tg", "Tajik"), ("th", "Thai"),
+    ("tk", "Turkmen"), ("tl", "Tagalog"), ("tr", "Turkish"), ("tt", "Tatar"),
+    ("uk", "Ukrainian"), ("ur", "Urdu"), ("uz", "Uzbek"), ("vi", "Vietnamese"),
+    ("yi", "Yiddish"), ("yo", "Yoruba"), ("zh", "Chinese"),
+])
 
-# File extensions
 SUPPORTED_AUDIO_EXTENSIONS = [
-    ".aac", ".amr", ".asf", ".avi", ".flac", ".m4a", 
+    ".aac", ".amr", ".asf", ".avi", ".flac", ".m4a",
     ".mkv", ".mp3", ".mp4", ".wav", ".webm", ".wma"
 ]
 
-# Output formats
 OUTPUT_FORMATS = ["txt", "vtt", "srt", "tsv", "json"]
-
-# Task modes
 TASK_MODES = ["transcribe", "translate"]
 
-# Default settings
 DEFAULT_BEAM_SIZE = 1
 DEFAULT_BATCH_SIZE = 8
 DEFAULT_OUTPUT_FORMAT = "txt"
-DEFAULT_TASK_MODE = "transcribe"
+DEFAULT_TASK_MODE = "transcribe"
+DEFAULT_LANGUAGE = "en"
@@ -1,27 +1,25 @@
-"""Application settings management."""
 from dataclasses import dataclass
-from typing import List, Optional
+from typing import List
 
 @dataclass
 class TranscriptionSettings:
-    """Settings for transcription processing."""
     model_key: str
     device: str
     beam_size: int
     batch_size: int
     output_format: str
     task_mode: str
+    language: str
     recursive: bool
     selected_extensions: List[str]
-    
+
     def validate(self) -> List[str]:
-        """Validate settings and return list of warnings."""
         warnings = []
-        
+
         if self.device.lower() == "cpu" and self.batch_size > 8:
             warnings.append(
                 "CPU batch size > 8 may reduce performance. "
                 "Consider reducing batch size for better results."
             )
-        
-        return warnings
+
+        return warnings
@@ -7,7 +7,7 @@
 import whisper_s2t
 
 from config.constants import WHISPER_MODELS
-from utils.system_utils import get_logical_core_count
+from utils.system_utils import get_optimal_cpu_threads
 
 class ModelManager(QObject):
     model_loaded = Signal(str, str)
@@ -18,7 +18,7 @@ def __init__(self):
         self._current_model = None
         self._current_config = None
         self._model_mutex = QMutex()
-        self._cpu_threads = max(4, get_logical_core_count() - 8)
+        self._cpu_threads = get_optimal_cpu_threads()
 
     def get_or_load_model(self, model_key: str, device: str, 
                          beam_size: int, precision: str) -> Optional[Any]:
 
@@ -1,6 +1,3 @@
-import threading
-from typing import List, Optional
-
 from PySide6.QtCore import QObject, Signal
 
 from core.monitoring.system_metrics import SystemMetrics
@@ -10,23 +7,5 @@ class MetricsStore(QObject):
 
     metrics_ready = Signal(object)
 
-    def __init__(self, buffer_size: int = 100, parent=None):
-        super().__init__(parent)
-        self.buffer_size = buffer_size
-        self.metrics_history: List[SystemMetrics] = []
-        self._lock = threading.Lock()
-
     def add_metrics(self, metrics: SystemMetrics) -> None:
-        with self._lock:
-            self.metrics_history.append(metrics)
-            if len(self.metrics_history) > self.buffer_size:
-                self.metrics_history.pop(0)
         self.metrics_ready.emit(metrics)
-
-    def get_latest_metrics(self) -> Optional[SystemMetrics]:
-        with self._lock:
-            return self.metrics_history[-1] if self.metrics_history else None
-
-    def clear(self) -> None:
-        with self._lock:
-            self.metrics_history.clear()