khoj-ai · majiayu000 · Dec 30, 2025
diff --git a/src/khoj/processor/speech/text_to_speech.py b/src/khoj/processor/speech/text_to_speech.py
@@ -17,12 +17,18 @@ def is_eleven_labs_enabled():
     return ELEVEN_LABS_API_KEY is not None
 
 
+class TextToSpeechError(Exception):
+    """Exception raised when text-to-speech generation fails."""
+
+    pass
+
+
 def generate_text_to_speech(
     text_to_speak: str,
     voice_id: str = VOICE_ID,
 ):
     if not is_eleven_labs_enabled():
-        return "Eleven Labs API key is not set"
+        raise TextToSpeechError("Eleven Labs API key is not set")
 
     # Convert the incoming text from markdown format to plain text
     html = markdown_renderer.render(text_to_speak)

diff --git a/src/khoj/routers/api_chat.py b/src/khoj/routers/api_chat.py
@@ -43,7 +43,7 @@
 )
 from khoj.processor.image.generate import text_to_image
 from khoj.processor.operator import operate_environment
-from khoj.processor.speech.text_to_speech import generate_text_to_speech
+from khoj.processor.speech.text_to_speech import TextToSpeechError, generate_text_to_speech
 from khoj.processor.tools.online_search import (
     deduplicate_organic_results,
     read_webpages,
@@ -208,7 +208,10 @@ async def text_to_speech(
     if voice_model:
         params["voice_id"] = voice_model.model_id
 
-    speech_stream = generate_text_to_speech(**params)
+    try:
+        speech_stream = generate_text_to_speech(**params)
+    except TextToSpeechError as e:
+        raise HTTPException(status_code=501, detail=str(e))
     return StreamingResponse(speech_stream.iter_content(chunk_size=1024), media_type="audio/mpeg")