Add OVHcloud AI Endpoints provider

eliasto · eliasto · commit ff215682c6a5 · 2025-11-10T10:08:09.000-05:00
diff --git a/docs/source/en/guides/inference.md b/docs/source/en/guides/inference.md
diff --git a/src/huggingface_hub/inference/_client.py b/src/huggingface_hub/inference/_client.py
@@ -135,7 +135,7 @@ class InferenceClient:
             Note: for better compatibility with OpenAI's client, `model` has been aliased as `base_url`. Those 2
             arguments are mutually exclusive. If a URL is passed as `model` or `base_url` for chat completion, the `(/v1)/chat/completions` suffix path will be appended to the URL.
         provider (`str`, *optional*):
-            Name of the provider to use for inference. Can be `"black-forest-labs"`, `"cerebras"`, `"clarifai"`, `"cohere"`, `"fal-ai"`, `"featherless-ai"`, `"fireworks-ai"`, `"groq"`, `"hf-inference"`, `"hyperbolic"`, `"nebius"`, `"novita"`, `"nscale"`, `"openai"`, `"publicai"`, `"replicate"`, `"sambanova"`, `"scaleway"`, `"together"`, `"wavespeed"` or `"zai-org"`.
+            Name of the provider to use for inference. Can be `"black-forest-labs"`, `"cerebras"`, `"clarifai"`, `"cohere"`, `"fal-ai"`, `"featherless-ai"`, `"fireworks-ai"`, `"groq"`, `"hf-inference"`, `"hyperbolic"`, `"nebius"`, `"novita"`, `"nscale"`, `"openai"`, `"ovhcloud"`, `"publicai"`, `"replicate"`, `"sambanova"`, `"scaleway"`, `"together"`, `"wavespeed"` or `"zai-org"`.
             Defaults to "auto" i.e. the first of the providers available for the model, sorted by the user's order in https://hf.co/settings/inference-providers.
             If model is a URL or `base_url` is passed, then `provider` is not used.
         token (`str`, *optional*):
diff --git a/src/huggingface_hub/inference/_generated/_async_client.py b/src/huggingface_hub/inference/_generated/_async_client.py
@@ -126,7 +126,7 @@ class AsyncInferenceClient:
             Note: for better compatibility with OpenAI's client, `model` has been aliased as `base_url`. Those 2
             arguments are mutually exclusive. If a URL is passed as `model` or `base_url` for chat completion, the `(/v1)/chat/completions` suffix path will be appended to the URL.
         provider (`str`, *optional*):
-            Name of the provider to use for inference. Can be `"black-forest-labs"`, `"cerebras"`, `"clarifai"`, `"cohere"`, `"fal-ai"`, `"featherless-ai"`, `"fireworks-ai"`, `"groq"`, `"hf-inference"`, `"hyperbolic"`, `"nebius"`, `"novita"`, `"nscale"`, `"openai"`, `"publicai"`, `"replicate"`, `"sambanova"`, `"scaleway"`, `"together"`, `"wavespeed"` or `"zai-org"`.
+            Name of the provider to use for inference. Can be `"black-forest-labs"`, `"cerebras"`, `"clarifai"`, `"cohere"`, `"fal-ai"`, `"featherless-ai"`, `"fireworks-ai"`, `"groq"`, `"hf-inference"`, `"hyperbolic"`, `"nebius"`, `"novita"`, `"nscale"`, `"openai"`, `"ovhcloud"`, `"publicai"`, `"replicate"`, `"sambanova"`, `"scaleway"`, `"together"`, `"wavespeed"` or `"zai-org"`.
             Defaults to "auto" i.e. the first of the providers available for the model, sorted by the user's order in https://hf.co/settings/inference-providers.
             If model is a URL or `base_url` is passed, then `provider` is not used.
         token (`str`, *optional*):
diff --git a/src/huggingface_hub/inference/_providers/__init__.py b/src/huggingface_hub/inference/_providers/__init__.py
@@ -38,6 +38,7 @@
 from .novita import NovitaConversationalTask, NovitaTextGenerationTask, NovitaTextToVideoTask
 from .nscale import NscaleConversationalTask, NscaleTextToImageTask
 from .openai import OpenAIConversationalTask
+from .ovhcloud import OVHcloudAIEndpointsAutomaticSpeechRecognitionTask, OVHcloudAIEndpointsConversationalTask, OVHcloudAIEndpointsFeatureExtractionTask, OVHcloudAIEndpointsTextToImageTask
 from .publicai import PublicAIConversationalTask
 from .replicate import ReplicateImageToImageTask, ReplicateTask, ReplicateTextToImageTask, ReplicateTextToSpeechTask
 from .sambanova import SambanovaConversationalTask, SambanovaFeatureExtractionTask
@@ -70,6 +71,7 @@
     "novita",
     "nscale",
     "openai",
+    "ovhcloud",
     "publicai",
     "replicate",
     "sambanova",
@@ -166,6 +168,12 @@
     "openai": {
         "conversational": OpenAIConversationalTask(),
     },
+    "ovhcloud": {
+        "conversational": OVHcloudAIEndpointsConversationalTask(),
+        "text-to-image": OVHcloudAIEndpointsTextToImageTask(),
+        "feature-extraction": OVHcloudAIEndpointsFeatureExtractionTask(),
+        "automatic-speech-recognition": OVHcloudAIEndpointsAutomaticSpeechRecognitionTask(),
+    },
     "publicai": {
         "conversational": PublicAIConversationalTask(),
     },
diff --git a/src/huggingface_hub/inference/_providers/_common.py b/src/huggingface_hub/inference/_providers/_common.py
@@ -32,6 +32,7 @@
     "hyperbolic": {},
     "nebius": {},
     "nscale": {},
+    "ovhcloud": {},
     "replicate": {},
     "sambanova": {},
     "scaleway": {},
diff --git a/src/huggingface_hub/inference/_providers/ovhcloud.py b/src/huggingface_hub/inference/_providers/ovhcloud.py
@@ -0,0 +1,84 @@
+import base64
+from abc import ABC
+from typing import Any, Dict, Optional, Union
+
+from huggingface_hub.hf_api import InferenceProviderMapping
+from huggingface_hub.inference._common import RequestParameters, _as_dict
+from huggingface_hub.inference._providers._common import (
+    TaskProviderHelper,
+    filter_none,
+)
+
+_PROVIDER = "ovhcloud"
+_BASE_URL = "https://oai.endpoints.kepler.ai.cloud.ovh.net"
+
+class OVHcloudAIEndpointsTask(TaskProviderHelper, ABC):
+    def __init__(self, task: str):
+        super().__init__(provider=_PROVIDER, base_url=_BASE_URL, task=task)
+
+    def _prepare_route(self, mapped_model: str, api_key: str) -> str:
+        if self.task == "text-to-image":
+            return "/v1/images/generations"
+        elif self.task == "conversational":
+            return "/v1/chat/completions"
+        elif self.task == "feature-extraction":
+            return "/v1/embeddings"
+        elif self.task == "automatic-speech-recognition":
+            return "/v1/audio/transcriptions"
+        raise ValueError(f"Unsupported task '{self.task}' for OVHcloud AI Endpoints.")
+    
+    def _prepare_payload_as_dict(
+        self, messages: Any, parameters: Dict, provider_mapping_info: InferenceProviderMapping
+    ) -> Optional[Dict]:
+        return {"messages": messages, "model": provider_mapping_info.provider_id, **filter_none(parameters)}
+
+
+class OVHcloudAIEndpointsConversationalTask(OVHcloudAIEndpointsTask):
+    def __init__(self):
+        super().__init__("conversational")
+
+    def _prepare_payload_as_dict(
+        self, messages: Any, parameters: dict, provider_mapping_info: InferenceProviderMapping
+    ) -> Optional[dict]:
+        return super()._prepare_payload_as_dict(messages, parameters, provider_mapping_info)
+        
+
+class OVHcloudAIEndpointsTextToImageTask(OVHcloudAIEndpointsTask):
+    def __init__(self):
+        super().__init__("text-to-image")
+
+    def _prepare_payload_as_dict(
+        self, inputs: Any, parameters: dict, provider_mapping_info: InferenceProviderMapping
+    ) -> Optional[dict]:
+        mapped_model = provider_mapping_info.provider_id
+        return {"prompt": inputs, "model": mapped_model, **filter_none(parameters)}
+
+    def get_response(self, response: Union[bytes, dict], request_params: Optional[RequestParameters] = None) -> Any:
+        response_dict = _as_dict(response)
+        return base64.b64decode(response_dict["data"][0]["b64_json"])
+    
+class OVHcloudAIEndpointsFeatureExtractionTask(OVHcloudAIEndpointsTask):
+    def __init__(self):
+        super().__init__("feature-extraction")
+
+    def _prepare_payload_as_dict(
+        self, inputs: Any, parameters: Dict, provider_mapping_info: InferenceProviderMapping
+    ) -> Optional[Dict]:
+        return {"input": inputs, "model": provider_mapping_info.provider_id, **filter_none(parameters)}
+    
+    def get_response(self, response: Union[bytes, dict], request_params: Optional[RequestParameters] = None) -> Any:
+        embeddings = _as_dict(response)["data"]
+        return [embedding["embedding"] for embedding in embeddings]
+    
+class OVHcloudAIEndpointsAutomaticSpeechRecognitionTask(OVHcloudAIEndpointsTask):
+    def __init__(self):
+        super().__init__("automatic-speech-recognition")
+
+    def _prepare_payload_as_dict(
+        self, inputs: Any, parameters: dict, provider_mapping_info: InferenceProviderMapping
+    ) -> Optional[dict]:
+        return {"file": inputs, "model": provider_mapping_info.provider_id, **filter_none(parameters)}
+
+    def get_response(self, response: Union[bytes, dict], request_params: Optional[RequestParameters] = None) -> Any:
+        response_dict = _as_dict(response)
+        return response_dict["text"]
diff --git a/tests/test_inference_client.py b/tests/test_inference_client.py
@@ -117,6 +117,12 @@
         "text-generation": "NousResearch/Nous-Hermes-Llama2-13b",
         "conversational": "meta-llama/Llama-3.1-8B-Instruct",
     },
+    "ovhcloud": {
+        "automatic-speech-recognition": "openai/whisper-large-v3",
+        "conversational": "meta-llama/Llama-3.1-8B-Instruct",
+        "feature-extraction": "BAAI/bge-m3",
+        "text-to-image": "stabilityai/stable-diffusion-xl-base-1.0",
+    },
     "replicate": {
         "text-to-image": "ByteDance/SDXL-Lightning",
     },
diff --git a/tests/test_inference_providers.py b/tests/test_inference_providers.py
@@ -46,6 +46,7 @@
 from huggingface_hub.inference._providers.novita import NovitaConversationalTask, NovitaTextGenerationTask
 from huggingface_hub.inference._providers.nscale import NscaleConversationalTask, NscaleTextToImageTask
 from huggingface_hub.inference._providers.openai import OpenAIConversationalTask
+from huggingface_hub.inference._providers.ovhcloud import OVHcloudAIEndpointsAutomaticSpeechRecognitionTask, OVHcloudAIEndpointsConversationalTask, OVHcloudAIEndpointsFeatureExtractionTask, OVHcloudAIEndpointsTextToImageTask
 from huggingface_hub.inference._providers.publicai import PublicAIConversationalTask
 from huggingface_hub.inference._providers.replicate import (
     ReplicateImageToImageTask,
@@ -1422,6 +1423,142 @@ def test_prepare_url(self):
         assert helper._prepare_url("sk-XXXXXX", "gpt-4o-mini") == "https://api.openai.com/v1/chat/completions"
 
 
+class TestOVHcloudAIEndpointsProvider:
+    def test_prepare_hf_url_conversational(self):
+        helper = OVHcloudAIEndpointsConversationalTask()
+        url = helper._prepare_url("hf_token", "username/repo_name")
+        assert url == "https://router.huggingface.co/ovhcloud/v1/chat/completions"
+
+    def test_prepare_url_conversational(self):
+        helper = OVHcloudAIEndpointsConversationalTask()
+        url = helper._prepare_url("ovhcloud_token", "username/repo_name")
+        assert url == "https://oai.endpoints.kepler.ai.cloud.ovh.net/v1/chat/completions"
+
+    def test_prepare_payload_as_dict(self):
+        helper = OVHcloudAIEndpointsConversationalTask()
+        payload = helper._prepare_payload_as_dict(
+            [
+                {"role": "system", "content": "You are a helpful assistant"},
+                {"role": "user", "content": "Hello!"},
+            ],
+            {
+                "max_tokens": 512,
+                "temperature": 0.15,
+                "top_p": 1,
+                "presence_penalty": 0,
+                "stream": True,
+            },
+            InferenceProviderMapping(
+                provider="ovhcloud",
+                hf_model_id="meta-llama/Llama-3.1-8B-Instruct",
+                providerId="Llama-3.1-8B-Instruct",
+                task="conversational",
+                status="live",
+            ),
+        )
+        assert payload == {
+            "max_tokens": 512,
+            "messages": [
+                {"content": "You are a helpful assistant", "role": "system"},
+                {"role": "user", "content": "Hello!"},
+            ],
+            "model": "Llama-3.1-8B-Instruct",
+            "presence_penalty": 0,
+            "stream": True,
+            "temperature": 0.15,
+            "top_p": 1,
+        }
+
+    def test_prepare_url_feature_extraction(self):
+        helper = OVHcloudAIEndpointsFeatureExtractionTask()
+        assert (
+            helper._prepare_url("hf_token", "username/repo_name")
+            == "https://router.huggingface.co/ovhcloud/v1/embeddings"
+        )
+
+    def test_prepare_payload_as_dict_feature_extraction(self):
+        helper = OVHcloudAIEndpointsFeatureExtractionTask()
+        payload = helper._prepare_payload_as_dict(
+            "Example text to embed",
+            {"truncate": True},
+            InferenceProviderMapping(
+                provider="ovhcloud",
+                hf_model_id="BAAI/bge-m3",
+                providerId="BGE-M3",
+                task="feature-extraction",
+                status="live",
+            ),
+        )
+        assert payload == {"input": "Example text to embed", "model": "BGE-M3", "truncate": True}
+
+    def test_prepare_url_text_to_image(self):
+        helper = OVHcloudAIEndpointsTextToImageTask()
+        assert (
+            helper._prepare_url("hf_token", "username/repo_name")
+            == "https://router.huggingface.co/ovhcloud/v1/images/generations"
+        )
+        
+        url = helper._prepare_url("ovhcloud_token", "username/repo_name")
+        assert url == "https://oai.endpoints.kepler.ai.cloud.ovh.net/v1/images/generations"
+
+    def test_prepare_payload_as_dict_text_to_image(self):
+        helper = OVHcloudAIEndpointsTextToImageTask()
+        payload = helper._prepare_payload_as_dict(
+            inputs="a beautiful cat",
+            provider_mapping_info=InferenceProviderMapping(
+                provider="ovhcloud",
+                hf_model_id="stabilityai/stable-diffusion-xl-base-1.0",
+                providerId="stable-diffusion-xl-base-v10",
+                task="text-to-image",
+                status="live",
+            ),
+            parameters={}
+        )
+        assert payload == {
+            "prompt": "a beautiful cat",
+            "model": "stable-diffusion-xl-base-v10",
+        }
+
+    def test_text_to_image_get_response(self):
+        helper = OVHcloudAIEndpointsTextToImageTask()
+        response = helper.get_response({"data": [{"b64_json": base64.b64encode(b"image_bytes").decode()}]})
+        assert response == b"image_bytes"
+
+    def test_prepare_url_automatic_speech_recognition(self):
+        helper = OVHcloudAIEndpointsAutomaticSpeechRecognitionTask()
+        assert (
+            helper._prepare_url("hf_token", "username/repo_name")
+            == "https://router.huggingface.co/ovhcloud/v1/audio/transcriptions"
+        )
+        
+        url = helper._prepare_url("ovhcloud_token", "username/repo_name")
+        assert url == "https://oai.endpoints.kepler.ai.cloud.ovh.net/v1/audio/transcriptions"
+
+    def test_prepare_payload_as_dict_automatic_speech_recognition(self):
+        helper = OVHcloudAIEndpointsAutomaticSpeechRecognitionTask()
+        
+        payload = helper._prepare_payload_as_dict(
+            f"data:audio/mpeg;base64,{base64.b64encode(b'dummy_audio_data').decode()}",
+            {},
+            InferenceProviderMapping(
+                provider="ovhcloud",
+                hf_model_id="openai/whisper-large-v3",
+                providerId="whisper-large-v3",
+                task="automatic-speech-recognition",
+                status="live",
+            ),
+        )
+        assert payload == {
+            "file": f"data:audio/mpeg;base64,{base64.b64encode(b'dummy_audio_data').decode()}",
+            "model": "whisper-large-v3",
+        }
+
+    def test_automatic_speech_recognition_get_response(self):
+        helper = OVHcloudAIEndpointsAutomaticSpeechRecognitionTask()
+        response = helper.get_response({"text": "Hello world"})
+        assert response == "Hello world"
+
+
 class TestReplicateProvider:
     def test_prepare_headers(self):
         helper = ReplicateTask("text-to-image")