1Panel-dev · zhanweizhang7 · Nov 12, 2025 · Nov 12, 2025 · shaohuzhang1 · Nov 12, 2025
diff --git a/apps/models_provider/impl/vllm_model_provider/credential/whisper_stt.py b/apps/models_provider/impl/vllm_model_provider/credential/whisper_stt.py
@@ -13,7 +13,7 @@
 
 class VLLMWhisperModelParams(BaseForm):
     Language = forms.TextInputField(
-        TooltipLabel(_('Language'),
+        TooltipLabel(_('language'),
                      _("If not passed, the default value is 'zh'")),
         required=True,
         default_value='zh',

diff --git a/apps/models_provider/impl/vllm_model_provider/model/whisper_sst.py b/apps/models_provider/impl/vllm_model_provider/model/whisper_sst.py
@@ -52,11 +52,11 @@ def speech_to_text(self, audio_file):
                 api_key=self.api_key,
                 base_url=base_url
             )
-
+            buf = audio_file.read()
             filter_params = {k: v for k, v in self.params.items() if k not in {'model_id', 'use_local', 'streaming'}}
             transcription_params = {
                 'model': self.model,
-                'file': audio_file,
+                'file': buf,
                 'language': 'zh',
             }
             result = client.audio.transcriptions.create(