support reasoning effort

aorwall · aorwall · commit 2d303dc0329f · 2025-08-13T07:31:38.000+02:00
diff --git a/moatless/completion/base.py b/moatless/completion/base.py
@@ -119,6 +119,10 @@ class BaseCompletionModel(MoatlessComponent, ABC):
         default=False,
         description="Whether to merge messages with the same role into a single message as this is required by models like Deepseek-R1",
     )
+    reasoning_effort: Optional[str] = Field(
+        default=None,
+        description="The reasoning effort level for the completion (e.g., 'low', 'medium', 'high')",
+    )
 
     _response_schema: Optional[list[type[ResponseSchema]]] = PrivateAttr(default=None)
     _system_prompt: Optional[str] = PrivateAttr(default=None)
@@ -484,15 +488,20 @@ async def _do_completion_with_rate_limit_retry():
                     if "claude" in self.model:
                         self._inject_prompt_caching(messages)
 
-                    response = await litellm.acompletion(
-                        model=self.model,
-                        max_tokens=self.max_tokens,
-                        temperature=self.temperature,
-                        messages=messages,
-                        metadata=self.metadata or {},
-                        timeout=self.timeout,
+                    completion_kwargs = {
+                        "model": self.model,
+                        "max_tokens": self.max_tokens,
+                        "temperature": self.temperature,
+                        "messages": messages,
+                        "metadata": self.metadata or {},
+                        "timeout": self.timeout,
                         **self._completion_params,
-                    )
+                    }
+                    
+                    if self.reasoning_effort:
+                        completion_kwargs["reasoning_effort"] = self.reasoning_effort
+                    
+                    response = await litellm.acompletion(**completion_kwargs)
 
                     if invocation.current_attempt:
                         invocation.current_attempt.update_from_response(response, self.model)
diff --git a/pyproject.toml b/pyproject.toml
@@ -4,7 +4,7 @@ build-backend = "pdm.backend"
 
 [project]
 name = "moatless"
-version = "0.1.0"
+version = "0.1.1"
 description = ""
 readme = "README.md"
 
@@ -24,7 +24,7 @@ dependencies = [
     "unidiff<1.0.0,>=0.7.5",
     "python-dotenv==1.0.1",
     "docstring-parser<1.0,>=0.17.0",
-    "litellm<2.0.0,>=1.75.5",
+    "litellm<2.0.0,>=1.75.5.post1",
     "openai<2.0.0,>=1.99.9",
     "anthropic<1.0.0,>=0.62.0",
     "llama-index<2.0.0,>=0.13.1",
diff --git a/uv.lock b/uv.lock