fix: improve language disambiguation (#704)

JarbasAl · web-flow · commit 9ab5ec5bb8f4 · 2025-06-16T01:59:11.000+01:00
* tests/increase_coverage

coverage for language disambiguation

* improve lang matching

* test invalid lang detection
diff --git a/ovos_core/intent_services/service.py b/ovos_core/intent_services/service.py
@@ -20,6 +20,7 @@
 from typing import Tuple, Callable, List
 
 import requests
+from langcodes import closest_match
 from ovos_bus_client.message import Message
 from ovos_bus_client.session import SessionManager
 from ovos_bus_client.util import get_message_lang
@@ -151,20 +152,24 @@ def disambiguate_lang(message):
         4 - config lang (or from message.data)
         """
         default_lang = get_message_lang(message)
-        valid_langs = get_valid_languages()
+        valid_langs = message.context.get("valid_langs") or get_valid_languages()
         valid_langs = [standardize_lang_tag(l) for l in valid_langs]
         lang_keys = ["stt_lang",
                      "request_lang",
                      "detected_lang"]
         for k in lang_keys:
             if k in message.context:
-                v = standardize_lang_tag(message.context[k])
-                if v in valid_langs:  # TODO - use lang distance instead to choose best dialect
-                    if v != default_lang:
-                        LOG.info(f"replaced {default_lang} with {k}: {v}")
-                    return v
-                else:
+                try:
+                    v = standardize_lang_tag(message.context[k])
+                    best_lang, _ = closest_match(v, valid_langs, max_distance=10)
+                except:
+                    v = message.context[k]
+                    best_lang = "und"
+                if best_lang == "und":
                     LOG.warning(f"ignoring {k}, {v} is not in enabled languages: {valid_langs}")
+                    continue
+                LOG.info(f"replaced {default_lang} with {k}: {v}")
+                return v
 
         return default_lang
 
@@ -484,6 +489,7 @@ def handle_utterance(self, message: Message):
             else:
                 # Nothing was able to handle the intent
                 # Ask politely for forgiveness for failing in this vital task
+                message.data["lang"] = lang
                 self.send_complete_intent_failure(message)
 
         LOG.debug(f"intent matching took: {stopwatch.time}")
@@ -504,7 +510,7 @@ def send_complete_intent_failure(self, message):
         sound = Configuration().get('sounds', {}).get('error', "snd/error.mp3")
         # NOTE: message.reply to ensure correct message destination
         self.bus.emit(message.reply('mycroft.audio.play_sound', {"uri": sound}))
-        self.bus.emit(message.reply('complete_intent_failure'))
+        self.bus.emit(message.reply('complete_intent_failure', message.data))
         self.bus.emit(message.reply("ovos.utterance.handled"))
 
     @staticmethod
diff --git a/test/end2end/test_lang_detect.py b/test/end2end/test_lang_detect.py
@@ -0,0 +1,131 @@
+from unittest import TestCase
+
+from ovos_bus_client.message import Message
+from ovos_bus_client.session import Session
+from ovos_utils.log import LOG
+
+from ovoscope import End2EndTest, get_minicroft
+
+
+class TestLangDisambiguation(TestCase):
+
+    def setUp(self):
+        LOG.set_level("DEBUG")
+        self.minicroft = get_minicroft([])  # reuse for speed, but beware if skills keeping internal state
+
+    def tearDown(self):
+        if self.minicroft:
+            self.minicroft.stop()
+        LOG.set_level("CRITICAL")
+
+    def test_stt_lang(self):
+        session = Session("123")
+        session.lang = "en-US"
+        message = Message("recognizer_loop:utterance",
+                          {"utterances": ["hello world"], "lang": session.lang},
+                          {"session": session.serialize()})
+        lang_keys = {
+            "stt_lang": "ca-ES", # lang detection from audio plugin
+            "request_lang": "pt-PT",  # lang tagged in source message (wake word config)
+            "detected_lang": "nl-NL"  # lang detection from utterance (text) plugin
+        }
+        message.context.update(lang_keys)
+        message.context["valid_langs"] = list(lang_keys.values())
+        test = End2EndTest(
+            minicroft=self.minicroft,
+            skill_ids=[],
+            eof_msgs=["ovos.utterance.handled"],
+            flip_points=["recognizer_loop:utterance"],
+            source_message=message,
+            expected_messages=[
+                message,
+                Message("mycroft.audio.play_sound", {"uri": "snd/error.mp3"}),
+                Message("complete_intent_failure", {"lang": lang_keys["stt_lang"]}),
+                Message("ovos.utterance.handled", {}),
+            ]
+        )
+
+        test.execute()
+
+
+    def test_lang_text_detection(self):
+        session = Session("123")
+        session.lang = "en-US"
+        message = Message("recognizer_loop:utterance",
+                          {"utterances": ["hello world"], "lang": session.lang},
+                          {"session": session.serialize()})
+        lang_keys = {
+            "detected_lang": "nl-NL"  # lang detection from utterance (text) plugin
+        }
+        message.context.update(lang_keys)
+        message.context["valid_langs"] = list(lang_keys.values())
+        test = End2EndTest(
+            minicroft=self.minicroft,
+            skill_ids=[],
+            eof_msgs=["ovos.utterance.handled"],
+            flip_points=["recognizer_loop:utterance"],
+            source_message=message,
+            expected_messages=[
+                message,
+                Message("mycroft.audio.play_sound", {"uri": "snd/error.mp3"}),
+                Message("complete_intent_failure", {"lang": lang_keys["detected_lang"]}),
+                Message("ovos.utterance.handled", {}),
+            ]
+        )
+
+        test.execute()
+
+    def test_metadata_preferred_over_text_detection(self):
+        session = Session("123")
+        session.lang = "en-US"
+        message = Message("recognizer_loop:utterance",
+                          {"utterances": ["hello world"], "lang": session.lang},
+                          {"session": session.serialize()})
+        lang_keys = {
+            "request_lang": "pt-PT",  # lang tagged in source message (wake word config)
+            "detected_lang": "nl-NL"  # lang detection from utterance (text) plugin
+        }
+        message.context.update(lang_keys)
+        message.context["valid_langs"] = list(lang_keys.values())
+        test = End2EndTest(
+            minicroft=self.minicroft,
+            skill_ids=[],
+            eof_msgs=["ovos.utterance.handled"],
+            flip_points=["recognizer_loop:utterance"],
+            source_message=message,
+            expected_messages=[
+                message,
+                Message("mycroft.audio.play_sound", {"uri": "snd/error.mp3"}),
+                Message("complete_intent_failure", {"lang": lang_keys["request_lang"]}),
+                Message("ovos.utterance.handled", {}),
+            ]
+        )
+
+        test.execute()
+
+    def test_invalid_lang_detection(self):
+        session = Session("123")
+        session.lang = "en-US"
+        message = Message("recognizer_loop:utterance",
+                          {"utterances": ["hello world"], "lang": session.lang},
+                          {"session": session.serialize()})
+        lang_keys = {
+            "detected_lang": "nl-NL"
+        }
+        message.context.update(lang_keys)
+        message.context["valid_langs"] = [session.lang]  # no nl-NL
+        test = End2EndTest(
+            minicroft=self.minicroft,
+            skill_ids=[],
+            eof_msgs=["ovos.utterance.handled"],
+            flip_points=["recognizer_loop:utterance"],
+            source_message=message,
+            expected_messages=[
+                message,
+                Message("mycroft.audio.play_sound", {"uri": "snd/error.mp3"}),
+                Message("complete_intent_failure", {"lang": session.lang}),
+                Message("ovos.utterance.handled", {}),
+            ]
+        )
+
+        test.execute()