refactor: Cerebras to use OpenAI client instead of SDK

sebastiand-cerebras · sebastiand-cerebras · commit 12a46aeb19de · 2025-11-20T15:28:42.000-08:00
- Changed CerebrasProvider to use AsyncOpenAI instead of AsyncCerebras SDK
- Simplified CerebrasModel by removing custom _completions_create override
- Updated dependency from cerebras-cloud-sdk to openai package
- Follows OpenRouter pattern for consistency
- Reduced codebase by ~200 lines while maintaining all functionality
- All Cerebras tests passing (5/5)

This aligns with Pydantic team's request to use OpenAI-compatible approach
and removes the need for a separate SDK dependency.
diff --git a/docs/models/cerebras.md b/docs/models/cerebras.md
@@ -2,7 +2,7 @@
 
 ## Install
 
-To use `CerebrasModel`, you need to either install `pydantic-ai`, or install `pydantic-ai-slim` with the `cerebras` optional group (which installs the `cerebras-cloud-sdk`):
+To use `CerebrasModel`, you need to either install `pydantic-ai`, or install `pydantic-ai-slim` with the `cerebras` optional group (which installs `openai`):
 
 ```bash
 pip install "pydantic-ai-slim[cerebras]"
diff --git a/pydantic_ai_slim/pydantic_ai/models/__init__.py b/pydantic_ai_slim/pydantic_ai/models/__init__.py
@@ -819,7 +819,7 @@ def infer_model(  # noqa: C901
     if model_kind == 'cerebras':
         from .cerebras import CerebrasModel
 
-        return CerebrasModel(model_name, provider=provider)
+        return CerebrasModel(model_name, provider=provider)  # type: ignore[arg-type]
     elif model_kind == 'openai-chat':
         from .openai import OpenAIChatModel
 
diff --git a/pydantic_ai_slim/pydantic_ai/models/cerebras.py b/pydantic_ai_slim/pydantic_ai/models/cerebras.py
@@ -3,24 +3,21 @@
 from __future__ import annotations as _annotations
 
 from dataclasses import dataclass
-from typing import Any, Literal
+from typing import Literal
+
+from ..profiles import ModelProfileSpec
+from ..providers import Provider
+from ..settings import ModelSettings
+from .openai import OpenAIChatModel
 
 try:
-    from cerebras.cloud.sdk import AsyncCerebras  # noqa: F401
+    from openai import AsyncOpenAI
 except ImportError as _import_error:  # pragma: no cover
     raise ImportError(
-        'Please install the `cerebras-cloud-sdk` package to use the Cerebras model, '
-        'you can use the `cerebras` optional group — `pip install "pydantic-ai-slim[cerebras]"`'
+        'Please install the `openai` package to use the Cerebras model, '
+        'you can use the `cerebras` optional group — `pip install "pydantic-ai-slim[cerebras]"'
     ) from _import_error
 
-from ..profiles import ModelProfile, ModelProfileSpec
-from ..profiles.harmony import harmony_model_profile
-from ..profiles.meta import meta_model_profile
-from ..profiles.qwen import qwen_model_profile
-from ..providers import Provider
-from ..settings import ModelSettings
-from .openai import OpenAIChatModel, OpenAIModelProfile  # type: ignore[attr-defined]
-
 __all__ = ('CerebrasModel', 'CerebrasModelName')
 
 CerebrasModelName = Literal[
@@ -46,101 +43,16 @@ def __init__(
         self,
         model_name: CerebrasModelName,
         *,
-        provider: Literal['cerebras'] | Provider[Any] = 'cerebras',
+        provider: Literal['cerebras'] | Provider[AsyncOpenAI] = 'cerebras',
         profile: ModelProfileSpec | None = None,
         settings: ModelSettings | None = None,
     ):
         """Initialize a Cerebras model.
 
         Args:
             model_name: The name of the Cerebras model to use.
-            provider: The provider to use. Can be 'cerebras' or a Provider instance.
+            provider: The provider to use. Defaults to 'cerebras'.
             profile: The model profile to use. Defaults to a profile based on the model name.
             settings: Model-specific settings that will be used as defaults for this model.
         """
-        if provider == 'cerebras':
-            from ..providers.cerebras import CerebrasProvider
-
-            # Extract api_key from settings if provided
-            api_key = settings.get('api_key') if settings else None
-            provider = CerebrasProvider(api_key=api_key) if api_key else CerebrasProvider()  # type: ignore[call-overload]
-
-        # Use our custom model_profile method if no profile is provided
-        if profile is None:
-            profile = self._cerebras_model_profile
-
-        super().__init__(model_name, provider=provider, profile=profile, settings=settings)  # type: ignore[arg-type]
-
-    def _cerebras_model_profile(self, model_name: str) -> ModelProfile:
-        """Get the model profile for this Cerebras model.
-
-        Returns a profile with web search disabled since Cerebras doesn't support it.
-        """
-        model_name_lower = model_name.lower()
-
-        # Get base profile based on model family
-        if model_name_lower.startswith('llama'):
-            base_profile = meta_model_profile(model_name)
-        elif model_name_lower.startswith('qwen'):
-            base_profile = qwen_model_profile(model_name)
-        elif model_name_lower.startswith('gpt-oss'):
-            base_profile = harmony_model_profile(model_name)
-        else:
-            # Default profile for unknown models
-            base_profile = ModelProfile()
-
-        # Wrap in OpenAIModelProfile with web search disabled
-        return OpenAIModelProfile(
-            openai_chat_supports_web_search=False,
-        ).update(base_profile)
-
-    async def _completions_create(
-        self,
-        messages: list[Any],
-        stream: bool,
-        model_settings: dict[str, Any],
-        model_request_parameters: Any,
-    ) -> Any:
-        """Override to remove web_search_options parameter and convert Cerebras response to OpenAI format."""
-        from openai._types import NOT_GIVEN
-        from openai.types.chat import ChatCompletion
-
-        # Get the original client method
-        original_create = self.client.chat.completions.create
-
-        # Create a wrapper that removes web_search_options and filters OMIT values
-        async def create_without_web_search(**kwargs):
-            # Remove web_search_options if present
-            kwargs.pop('web_search_options', None)
-
-            # Remove all keys with OMIT or NOT_GIVEN values
-            keys_to_remove = []
-            for key, value in kwargs.items():
-                # Check if it's OMIT by checking the type name
-                if hasattr(value, '__class__') and value.__class__.__name__ == 'Omit':
-                    keys_to_remove.append(key)
-                elif value is NOT_GIVEN:
-                    keys_to_remove.append(key)
-
-            for key in keys_to_remove:
-                del kwargs[key]
-
-            # Call Cerebras SDK
-            cerebras_response = await original_create(**kwargs)
-
-            # Convert Cerebras response to OpenAI ChatCompletion
-            # The Cerebras SDK returns a compatible structure, we just need to convert the type
-            response_dict = (
-                cerebras_response.model_dump() if hasattr(cerebras_response, 'model_dump') else cerebras_response
-            )
-            return ChatCompletion.model_validate(response_dict)
-
-        # Temporarily replace the method
-        self.client.chat.completions.create = create_without_web_search  # type: ignore
-
-        try:
-            # Call the parent implementation
-            return await super()._completions_create(messages, stream, model_settings, model_request_parameters)  # type: ignore
-        finally:
-            # Restore the original method
-            self.client.chat.completions.create = original_create  # type: ignore
+        super().__init__(model_name, provider=provider, profile=profile, settings=settings)
diff --git a/pydantic_ai_slim/pydantic_ai/providers/cerebras.py b/pydantic_ai_slim/pydantic_ai/providers/cerebras.py
@@ -10,19 +10,20 @@
 from pydantic_ai.models import cached_async_http_client
 from pydantic_ai.profiles.harmony import harmony_model_profile
 from pydantic_ai.profiles.meta import meta_model_profile
+from pydantic_ai.profiles.openai import OpenAIModelProfile
 from pydantic_ai.profiles.qwen import qwen_model_profile
 from pydantic_ai.providers import Provider
 
 try:
-    from cerebras.cloud.sdk import AsyncCerebras
+    from openai import AsyncOpenAI
 except ImportError as _import_error:  # pragma: no cover
     raise ImportError(
-        'Please install the `cerebras-cloud-sdk` package to use the Cerebras provider, '
+        'Please install the `openai` package to use the Cerebras provider, '
         'you can use the `cerebras` optional group — `pip install "pydantic-ai-slim[cerebras]"`'
     ) from _import_error
 
 
-class CerebrasProvider(Provider[AsyncCerebras]):
+class CerebrasProvider(Provider[AsyncOpenAI]):
     """Provider for Cerebras API."""
 
     @property
@@ -31,10 +32,10 @@ def name(self) -> str:
 
     @property
     def base_url(self) -> str:
-        return 'https://api.cerebras.ai'
+        return 'https://api.cerebras.ai/v1'
 
     @property
-    def client(self) -> AsyncCerebras:
+    def client(self) -> AsyncOpenAI:
         return self._client
 
     def model_profile(self, model_name: str) -> ModelProfile | None:
@@ -44,54 +45,58 @@ def model_profile(self, model_name: str) -> ModelProfile | None:
             'gpt-oss': harmony_model_profile,
         }
 
+        profile = None
+        model_name_lower = model_name.lower()
         for prefix, profile_func in prefix_to_profile.items():
-            model_name = model_name.lower()
-            if model_name.startswith(prefix):
-                return profile_func(model_name)
+            if model_name_lower.startswith(prefix):
+                profile = profile_func(model_name)
+                break
 
-        return None
+        # Wrap in OpenAIModelProfile with web search disabled
+        # Cerebras doesn't support web search
+        return OpenAIModelProfile(openai_chat_supports_web_search=False).update(profile)
 
     @overload
-    def __init__(self, *, cerebras_client: AsyncCerebras | None = None) -> None: ...
+    def __init__(self) -> None: ...
 
     @overload
-    def __init__(
-        self, *, api_key: str | None = None, base_url: str | None = None, http_client: httpx.AsyncClient | None = None
-    ) -> None: ...
+    def __init__(self, *, api_key: str) -> None: ...
+
+    @overload
+    def __init__(self, *, api_key: str, http_client: httpx.AsyncClient) -> None: ...
+
+    @overload
+    def __init__(self, *, http_client: httpx.AsyncClient) -> None: ...
+
+    @overload
+    def __init__(self, *, openai_client: AsyncOpenAI | None = None) -> None: ...
 
     def __init__(
         self,
         *,
         api_key: str | None = None,
-        base_url: str | None = None,
-        cerebras_client: AsyncCerebras | None = None,
+        openai_client: AsyncOpenAI | None = None,
         http_client: httpx.AsyncClient | None = None,
     ) -> None:
         """Create a new Cerebras provider.
 
         Args:
             api_key: The API key to use for authentication, if not provided, the `CEREBRAS_API_KEY` environment variable
                 will be used if available.
-            base_url: The base url for the Cerebras requests. If not provided, defaults to Cerebras's base url.
-            cerebras_client: An existing `AsyncCerebras` client to use. If provided, `api_key` and `http_client` must be `None`.
+            openai_client: An existing `AsyncOpenAI` client to use. If provided, `api_key` and `http_client` must be `None`.
             http_client: An existing `httpx.AsyncClient` to use for making HTTP requests.
         """
-        if cerebras_client is not None:
-            assert http_client is None, 'Cannot provide both `cerebras_client` and `http_client`'
-            assert api_key is None, 'Cannot provide both `cerebras_client` and `api_key`'
-            assert base_url is None, 'Cannot provide both `cerebras_client` and `base_url`'
-            self._client = cerebras_client
+        api_key = api_key or os.getenv('CEREBRAS_API_KEY')
+        if not api_key and openai_client is None:
+            raise UserError(
+                'Set the `CEREBRAS_API_KEY` environment variable or pass it via `CerebrasProvider(api_key=...)` '
+                'to use the Cerebras provider.'
+            )
+
+        if openai_client is not None:
+            self._client = openai_client
+        elif http_client is not None:
+            self._client = AsyncOpenAI(base_url=self.base_url, api_key=api_key, http_client=http_client)
         else:
-            api_key = api_key or os.getenv('CEREBRAS_API_KEY')
-            base_url = base_url or 'https://api.cerebras.ai'
-
-            if not api_key:
-                raise UserError(
-                    'Set the `CEREBRAS_API_KEY` environment variable or pass it via `CerebrasProvider(api_key=...)` '
-                    'to use the Cerebras provider.'
-                )
-            elif http_client is not None:
-                self._client = AsyncCerebras(base_url=base_url, api_key=api_key, http_client=http_client)
-            else:
-                http_client = cached_async_http_client(provider='cerebras')
-                self._client = AsyncCerebras(base_url=base_url, api_key=api_key, http_client=http_client)
+            http_client = cached_async_http_client(provider='cerebras')
+            self._client = AsyncOpenAI(base_url=self.base_url, api_key=api_key, http_client=http_client)
diff --git a/pydantic_ai_slim/pyproject.toml b/pydantic_ai_slim/pyproject.toml
@@ -72,7 +72,7 @@ cohere = ["cohere>=5.18.0; platform_system != 'Emscripten'"]
 vertexai = ["google-auth>=2.36.0", "requests>=2.32.2"]
 google = ["google-genai>=1.51.0"]
 anthropic = ["anthropic>=0.70.0"]
-cerebras = ["cerebras-cloud-sdk>=1.0.0"]
+cerebras = ["openai>=1.107.2"]
 groq = ["groq>=0.25.0"]
 mistral = ["mistralai>=1.9.10"]
 bedrock = ["boto3>=1.40.14"]
diff --git a/tests/models/test_cerebras.py b/tests/models/test_cerebras.py
@@ -13,36 +13,38 @@
 
 
 def test_cerebras_model_init():
-    model = CerebrasModel('llama-3.3-70b', settings={'api_key': 'test_key'})
+    model = CerebrasModel('llama-3.3-70b', provider=CerebrasProvider(api_key='test_key'))
     assert model.model_name == 'llama-3.3-70b'
-    assert isinstance(model._provider, CerebrasProvider)
-    assert model._provider.client.api_key == 'test_key'
+    assert isinstance(model._provider, CerebrasProvider)  # type: ignore[reportPrivateUsage]
+    assert model._provider.client.api_key == 'test_key'  # type: ignore[reportPrivateUsage]
 
 
 def test_cerebras_model_profile():
+    provider = CerebrasProvider(api_key='test_key')
+
     # Test Llama model
-    model = CerebrasModel('llama-3.3-70b', settings={'api_key': 'test_key'})
+    model = CerebrasModel('llama-3.3-70b', provider=provider)
     profile = model.profile
     assert isinstance(profile, OpenAIModelProfile)
     assert profile.json_schema_transformer == InlineDefsJsonSchemaTransformer
     assert OpenAIModelProfile.from_profile(profile).openai_chat_supports_web_search is False
 
     # Test Qwen model
-    model = CerebrasModel('qwen-3-235b-a22b-instruct-2507', settings={'api_key': 'test_key'})
+    model = CerebrasModel('qwen-3-235b-a22b-instruct-2507', provider=provider)
     profile = model.profile
     assert isinstance(profile, OpenAIModelProfile)
     assert profile.json_schema_transformer == InlineDefsJsonSchemaTransformer
     assert OpenAIModelProfile.from_profile(profile).openai_chat_supports_web_search is False
 
     # Test GPT-OSS model
-    model = CerebrasModel('gpt-oss-120b', settings={'api_key': 'test_key'})
+    model = CerebrasModel('gpt-oss-120b', provider=provider)
     profile = model.profile
     assert isinstance(profile, OpenAIModelProfile)
     assert profile.json_schema_transformer == OpenAIJsonSchemaTransformer
     assert OpenAIModelProfile.from_profile(profile).openai_chat_supports_web_search is False
 
     # Test unknown model - use zai-glm which is valid but won't match any prefix
-    model = CerebrasModel('zai-glm-4.6', settings={'api_key': 'test_key'})
+    model = CerebrasModel('zai-glm-4.6', provider=provider)
     profile = model.profile
     assert isinstance(profile, OpenAIModelProfile)
     assert OpenAIModelProfile.from_profile(profile).openai_chat_supports_web_search is False
diff --git a/tests/models/test_openai.py b/tests/models/test_openai.py
@@ -3022,7 +3022,7 @@ async def test_openai_model_settings_temperature_ignored_on_gpt_5(allow_model_re
 
 
 async def test_openai_model_cerebras_provider(allow_model_requests: None, cerebras_api_key: str):
-    m = OpenAIChatModel('llama3.3-70b', provider=CerebrasProvider(api_key=cerebras_api_key))
+    m = OpenAIChatModel('llama3.3-70b', provider=CerebrasProvider(api_key=cerebras_api_key))  # type: ignore[arg-type]
     agent = Agent(m)
 
     result = await agent.run('What is the capital of France?')
@@ -3034,15 +3034,15 @@ class Location(TypedDict):
         city: str
         country: str
 
-    m = OpenAIChatModel('qwen-3-coder-480b', provider=CerebrasProvider(api_key=cerebras_api_key))
+    m = OpenAIChatModel('qwen-3-coder-480b', provider=CerebrasProvider(api_key=cerebras_api_key))  # type: ignore[arg-type]
     agent = Agent(m, output_type=Location)
 
     result = await agent.run('What is the capital of France?')
     assert result.output == snapshot({'city': 'Paris', 'country': 'France'})
 
 
 async def test_openai_model_cerebras_provider_harmony(allow_model_requests: None, cerebras_api_key: str):
-    m = OpenAIChatModel('gpt-oss-120b', provider=CerebrasProvider(api_key=cerebras_api_key))
+    m = OpenAIChatModel('gpt-oss-120b', provider=CerebrasProvider(api_key=cerebras_api_key))  # type: ignore[arg-type]
     agent = Agent(m)
 
     result = await agent.run('What is the capital of France?')
diff --git a/uv.lock b/uv.lock