perf: optimize LanguageTool API calls using persistent session

sl5net · sl5net · commit 13fff08cdc95 · 2026-01-31T13:20:44.000+01:00
- Implement requests.Session() to enable TCP connection reuse
- Reduce latency for sequential text processing by avoiding repeated handshakes
- Switch localhost to 127.0.0.1 to prevent IPv6 resolution delays on Windows
- Improve real-time responsiveness during text correction
diff --git a/aura_engine.py b/aura_engine.py
@@ -11,6 +11,7 @@
 import psutil
 import time, re
 
+#from config.settings import LANGUAGETOOL_CHECK_URL
 
 # Python path to ensure reliable imports on all platforms
 # This solves potential issues when running from a batch script on Windows
@@ -1015,8 +1016,8 @@ def system_memory_watchdog(logging):
     # atexit.register(lambda: stop_languagetool_server(logger, languagetool_process))
 
     # aura_engine.py:760
-    active_lt_url = f"http://localhost:{settings.LANGUAGETOOL_PORT}/v2/check"
-
+    # active_lt_url = f"http://localhost:{settings.LANGUAGETOOL_PORT}/v2/check"
+    active_lt_url = f"{settings.LANGUAGETOOL_CHECK_URL}"
 
 if not languagetool_process:
     notify("Vosk Startup Error", "LanguageTool Server failed to start.", "critical")
diff --git a/config/maps/plugins/git/de-DE/FUZZY_MAP_pre.py b/config/maps/plugins/git/de-DE/FUZZY_MAP_pre.py
@@ -15,6 +15,9 @@
 # EXAMPLE: git
 gitGit = r'(git|Geht|Sie geht|git|get|gitter|glitch|Gliedstaat|kids|kate|geht[^\s]*|geh|gitter|Gitta|kate|käthe|kitte|fiat|mit|kit|peach|quitt)'
 
+# ein kit mit text in english
+
+
 # EXAMPLE: Commit
 commitGit = r'(Commit|Komet|Komik|Comics|Gummi|gummis|kommt|kommend|mit|hitch|komm|Kometen|kubicki|komisch|gewinnen|gromit|komme|kubis|cobit|cubic|beach|gemütlich|quitt|google)'
 
@@ -47,6 +50,11 @@
     # EXAMPLE: git commit
     ('git commit ', rf'\bgittern komet\b\s*', 80, {'flags': re.IGNORECASE}),
 
+    # EXAMPLE: git commit Text in english
+    ('git commit Text in english', rf'\bein {gitGit}\b\s*\b{commitGit} text in english\b', 80, {'flags': re.IGNORECASE}),
+
+
+
 
     # EXAMPLE: git clone
     ('git clone ', rf'^\s*{gitGit}\s+(klar|klon|clone)\s*$', 80, {'flags': re.IGNORECASE}),
diff --git a/config/settings.py b/config/settings.py
@@ -65,7 +65,7 @@
     r"0 a\.d\.": ("SL5net >> Aura", 1),        # 14400 = 4 h autocivp/moddata/autocivP_IconNames_README.txt
     r"Matrix|Discord": ("🗣SL5net ⟫ Aura", 3600),   # 1 Stunde für Chat
     r"Outlook|Mail": ("-- Sent via Aura --", 86400), # 1 Tag für E-Mails
-    r"Konsole|kate": ("", 86400),
+    r"Konsole|kate|Google AI Studio|google ai studio": ("", 86400),
     r".*": ("🗣[ SL5net Aura ]", 1800)             # 30 Min Fallback
 }
 
diff --git a/scripts/py/func/correct_text_by_languagetool.py b/scripts/py/func/correct_text_by_languagetool.py
@@ -1,50 +1,66 @@
-# file script/py/func/correct_text_by_languagetool
+# scripts/py/func/correct_text_by_languagetool.py:1
 import requests
+from requests.adapters import HTTPAdapter
+from urllib3.util.retry import Retry
+
+# scripts/py/func/correct_text_by_languagetool.py:6
+lt_session = requests.Session()
+
+
+retries = Retry(total=2, backoff_factor=0.1)
+lt_session.mount('http://', HTTPAdapter(max_retries=retries))
 
-# from config.settings import LANGUAGETOOL_BASE_URL
 
 def correct_text_by_languagetool(logger, active_lt_url, LT_LANGUAGE, text: str) -> str:
-    # scripts/py/func/correct_text_by_languagetool.py:7
-    # LANGUAGETOOL_URL = f"{LANGUAGETOOL_BASE_URL}/v2/check"
-    # LANGUAGETOOL_URL active_lt_url
+    if not text or not text.strip():
+        return text
 
     log_all_changes = True
-    # log_all_changes = False
 
-    if not text.strip(): return text
+    # 1. Daten-Payload optimieren
+    # Tipp: Deaktivieren Sie "picky" Regeln oder schränken Sie Kategorien ein
+    data = {
+        'language': LT_LANGUAGE,
+        'text': text,
+        'maxSuggestions': 1,
+        # 'enabledCategories': 'PUNCTUATION,GRAMMAR', # Nur das Nötigste
+        # 'disabledRules': 'WHITESPACE_RULE', # Beispiel für langsame Regeln
+        'level': 'default'  # 'picky' wäre deutlich langsamer
+    }
 
-    if log_all_changes:
-        logger.info(f"-----> rawInput to LT:  '{text}'")
-    # data = {'language': LT_LANGUAGE, 'text': text, 'maxSuggestions': 1, 'enabledCategories': 'PUNCTUATION,GRAMMAR',
-    #         'Categories': 'PUNCTUATION,GRAMMAR'  }
-    data = {'language': LT_LANGUAGE, 'text': text, 'maxSuggestions': 1  }
     try:
-        # scripts/py/func/correct_text_by_languagetool.py:19
-        response = requests.post(active_lt_url, data, timeout=20) # timeout was 10 but Windows OS seems need much more at the moment 18.1.'26 21:28 Sun
+        # 2. Timeout senken (z.B. 5 Sekunden)
+        # Wenn der lokale Server länger braucht, ist er überlastet
+        response = lt_session.post(active_lt_url, data=data, timeout=5)
         response.raise_for_status()
+
         matches = response.json().get('matches', [])
         if not matches:
-            if log_all_changes:
-                logger.info("  <- Output from LT: (No changes)")
             return text
+
+        # Korrektur-Logik (unverändert, aber effizienter)
         sorted_matches = sorted(matches, key=lambda m: m['offset'])
         new_text_parts, last_index = [], 0
+
         for match in sorted_matches:
-            new_text_parts.append(text[last_index:match['offset']])
-            if match['replacements']:
-                new_text_parts.append(match['replacements'][0]['value'])
-            else:
-                # FIX: Keep original text if there is no replacement
-                original_slice = text[match['offset'] : match['offset'] + match['length']]
-                new_text_parts.append(original_slice)
+            # Überspringe Korrektur, wenn keine Replacements vorhanden sind
+            if not match.get('replacements'):
+                continue
 
+            new_text_parts.append(text[last_index:match['offset']])
+            new_text_parts.append(match['replacements'][0]['value'])
             last_index = match['offset'] + match['length']
+
         new_text_parts.append(text[last_index:])
         corrected_text = "".join(new_text_parts)
+
         if log_all_changes:
-            logger.info(f"🔁 📚{text}📚 ->LT-> 📚{corrected_text}📚")
+            logger.info(f"🔁 LT-Korrektur durchgeführt.")
         return corrected_text
+
+    except requests.exceptions.Timeout:
+        logger.error(f"  <- TIMEOUT: LT Server war zu langsam.")
+        return text
     except requests.exceptions.RequestException as e:
         logger.error(f"  <- ERROR: LanguageTool request failed: {e}")
-        return text
-
+        return text

Original file line number	Diff line number	Diff line change
`@@ -65,7 +65,7 @@`
`65`	`65`	`r"0 a\.d\.": ("SL5net >> Aura", 1), # 14400 = 4 h autocivp/moddata/autocivP_IconNames_README.txt`
`66`	`66`	`r"Matrix\|Discord": ("🗣SL5net ⟫ Aura", 3600), # 1 Stunde für Chat`
`67`	`67`	`r"Outlook\|Mail": ("-- Sent via Aura --", 86400), # 1 Tag für E-Mails`
`68`		`- r"Konsole\|kate": ("", 86400),`
	`68`	`+ r"Konsole\|kate\|Google AI Studio\|google ai studio": ("", 86400),`
`69`	`69`	`r".*": ("🗣[ SL5net Aura ]", 1800) # 30 Min Fallback`
`70`	`70`	`}`
`71`	`71`