cleanlab
diff --git a/‎.stats.yml‎
Lines changed: 2 additions & 2 deletions b/‎.stats.yml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎api.md‎
Lines changed: 0 additions & 2 deletions b/‎api.md‎
Lines changed: 0 additions & 2 deletions
diff --git a/‎src/codex/resources/projects/projects.py‎
Lines changed: 12 additions & 10 deletions b/‎src/codex/resources/projects/projects.py‎
Lines changed: 12 additions & 10 deletions
diff --git a/‎src/codex/resources/projects/query_logs.py‎
Lines changed: 1 addition & 101 deletions b/‎src/codex/resources/projects/query_logs.py‎
Lines changed: 1 addition & 101 deletions
diff --git a/‎src/codex/resources/tlm.py‎
Lines changed: 24 additions & 20 deletions b/‎src/codex/resources/tlm.py‎
Lines changed: 24 additions & 20 deletions
diff --git a/‎src/codex/types/project_validate_params.py‎
Lines changed: 6 additions & 7 deletions b/‎src/codex/types/project_validate_params.py‎
Lines changed: 6 additions & 7 deletions
diff --git a/‎src/codex/types/project_validate_response.py‎
Lines changed: 0 additions & 3 deletions b/‎src/codex/types/project_validate_response.py‎
Lines changed: 0 additions & 3 deletions
@@ -1,3 +1,3 @@
-configured_endpoints: 55
-openapi_spec_hash: d69252c7252423bc98ecc17807eb33ec
+configured_endpoints: 54
+openapi_spec_hash: 04e1b7aefbeff10daab249b153de147f
 config_hash: bed87752f4056d0c4bf2ddf856307800
@@ -202,7 +202,6 @@ Types:
 from codex.types.projects import (
     QueryLogRetrieveResponse,
     QueryLogListResponse,
-    QueryLogAddUserFeedbackResponse,
     QueryLogListByGroupResponse,
     QueryLogListGroupsResponse,
     QueryLogStartRemediationResponse,
@@ -213,7 +212,6 @@ Methods:
 
 - <code title="get /api/projects/{project_id}/query_logs/{query_log_id}">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">retrieve</a>(query_log_id, \*, project_id) -> <a href="./src/codex/types/projects/query_log_retrieve_response.py">QueryLogRetrieveResponse</a></code>
 - <code title="get /api/projects/{project_id}/query_logs/">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">list</a>(project_id, \*\*<a href="src/codex/types/projects/query_log_list_params.py">params</a>) -> <a href="./src/codex/types/projects/query_log_list_response.py">SyncOffsetPageQueryLogs[QueryLogListResponse]</a></code>
-- <code title="post /api/projects/{project_id}/query_logs/{query_log_id}/user_feedback">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">add_user_feedback</a>(query_log_id, \*, project_id, \*\*<a href="src/codex/types/projects/query_log_add_user_feedback_params.py">params</a>) -> <a href="./src/codex/types/projects/query_log_add_user_feedback_response.py">QueryLogAddUserFeedbackResponse</a></code>
 - <code title="get /api/projects/{project_id}/query_logs/logs_by_group">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">list_by_group</a>(project_id, \*\*<a href="src/codex/types/projects/query_log_list_by_group_params.py">params</a>) -> <a href="./src/codex/types/projects/query_log_list_by_group_response.py">QueryLogListByGroupResponse</a></code>
 - <code title="get /api/projects/{project_id}/query_logs/groups">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">list_groups</a>(project_id, \*\*<a href="src/codex/types/projects/query_log_list_groups_params.py">params</a>) -> <a href="./src/codex/types/projects/query_log_list_groups_response.py">SyncOffsetPageQueryLogGroups[QueryLogListGroupsResponse]</a></code>
 - <code title="post /api/projects/{project_id}/query_logs/{query_log_id}/start_remediation">client.projects.query_logs.<a href="./src/codex/resources/projects/query_logs.py">start_remediation</a>(query_log_id, \*, project_id) -> <a href="./src/codex/types/projects/query_log_start_remediation_response.py">QueryLogStartRemediationResponse</a></code>
 
@@ -527,11 +527,12 @@ def validate(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
-              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
-              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
-              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
-              for low latency/costs: "gpt-4.1-nano", "nova-micro".
+              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
+              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
+              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
+              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
+              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
+              "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -1105,11 +1106,12 @@ async def validate(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
-              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
-              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
-              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
-              for low latency/costs: "gpt-4.1-nano", "nova-micro".
+              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
+              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
+              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
+              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
+              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
+              "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
 
@@ -25,17 +25,11 @@
     AsyncOffsetPageQueryLogGroups,
 )
 from ..._base_client import AsyncPaginator, make_request_options
-from ...types.projects import (
-    query_log_list_params,
-    query_log_list_groups_params,
-    query_log_list_by_group_params,
-    query_log_add_user_feedback_params,
-)
+from ...types.projects import query_log_list_params, query_log_list_groups_params, query_log_list_by_group_params
 from ...types.projects.query_log_list_response import QueryLogListResponse
 from ...types.projects.query_log_retrieve_response import QueryLogRetrieveResponse
 from ...types.projects.query_log_list_groups_response import QueryLogListGroupsResponse
 from ...types.projects.query_log_list_by_group_response import QueryLogListByGroupResponse
-from ...types.projects.query_log_add_user_feedback_response import QueryLogAddUserFeedbackResponse
 from ...types.projects.query_log_start_remediation_response import QueryLogStartRemediationResponse
 
 __all__ = ["QueryLogsResource", "AsyncQueryLogsResource"]
@@ -190,46 +184,6 @@ def list(
             model=QueryLogListResponse,
         )
 
-    def add_user_feedback(
-        self,
-        query_log_id: str,
-        *,
-        project_id: str,
-        key: str,
-        # Use the following arguments if you need to pass additional parameters to the API that aren't available via kwargs.
-        # The extra values given here take precedence over values defined on the client or passed to this method.
-        extra_headers: Headers | None = None,
-        extra_query: Query | None = None,
-        extra_body: Body | None = None,
-        timeout: float | httpx.Timeout | None | NotGiven = NOT_GIVEN,
-    ) -> QueryLogAddUserFeedbackResponse:
-        """
-        Add User Feedback Route
-
-        Args:
-          key: A key describing the criteria of the feedback, eg 'rating'
-
-          extra_headers: Send extra headers
-
-          extra_query: Add additional query parameters to the request
-
-          extra_body: Add additional JSON properties to the request
-
-          timeout: Override the client-level default timeout for this request, in seconds
-        """
-        if not project_id:
-            raise ValueError(f"Expected a non-empty value for `project_id` but received {project_id!r}")
-        if not query_log_id:
-            raise ValueError(f"Expected a non-empty value for `query_log_id` but received {query_log_id!r}")
-        return self._post(
-            f"/api/projects/{project_id}/query_logs/{query_log_id}/user_feedback",
-            body=maybe_transform({"key": key}, query_log_add_user_feedback_params.QueryLogAddUserFeedbackParams),
-            options=make_request_options(
-                extra_headers=extra_headers, extra_query=extra_query, extra_body=extra_body, timeout=timeout
-            ),
-            cast_to=QueryLogAddUserFeedbackResponse,
-        )
-
     def list_by_group(
         self,
         project_id: str,
@@ -614,48 +568,6 @@ def list(
             model=QueryLogListResponse,
         )
 
-    async def add_user_feedback(
-        self,
-        query_log_id: str,
-        *,
-        project_id: str,
-        key: str,
-        # Use the following arguments if you need to pass additional parameters to the API that aren't available via kwargs.
-        # The extra values given here take precedence over values defined on the client or passed to this method.
-        extra_headers: Headers | None = None,
-        extra_query: Query | None = None,
-        extra_body: Body | None = None,
-        timeout: float | httpx.Timeout | None | NotGiven = NOT_GIVEN,
-    ) -> QueryLogAddUserFeedbackResponse:
-        """
-        Add User Feedback Route
-
-        Args:
-          key: A key describing the criteria of the feedback, eg 'rating'
-
-          extra_headers: Send extra headers
-
-          extra_query: Add additional query parameters to the request
-
-          extra_body: Add additional JSON properties to the request
-
-          timeout: Override the client-level default timeout for this request, in seconds
-        """
-        if not project_id:
-            raise ValueError(f"Expected a non-empty value for `project_id` but received {project_id!r}")
-        if not query_log_id:
-            raise ValueError(f"Expected a non-empty value for `query_log_id` but received {query_log_id!r}")
-        return await self._post(
-            f"/api/projects/{project_id}/query_logs/{query_log_id}/user_feedback",
-            body=await async_maybe_transform(
-                {"key": key}, query_log_add_user_feedback_params.QueryLogAddUserFeedbackParams
-            ),
-            options=make_request_options(
-                extra_headers=extra_headers, extra_query=extra_query, extra_body=extra_body, timeout=timeout
-            ),
-            cast_to=QueryLogAddUserFeedbackResponse,
-        )
-
     async def list_by_group(
         self,
         project_id: str,
@@ -901,9 +813,6 @@ def __init__(self, query_logs: QueryLogsResource) -> None:
         self.list = to_raw_response_wrapper(
             query_logs.list,
         )
-        self.add_user_feedback = to_raw_response_wrapper(
-            query_logs.add_user_feedback,
-        )
         self.list_by_group = to_raw_response_wrapper(
             query_logs.list_by_group,
         )
@@ -925,9 +834,6 @@ def __init__(self, query_logs: AsyncQueryLogsResource) -> None:
         self.list = async_to_raw_response_wrapper(
             query_logs.list,
         )
-        self.add_user_feedback = async_to_raw_response_wrapper(
-            query_logs.add_user_feedback,
-        )
         self.list_by_group = async_to_raw_response_wrapper(
             query_logs.list_by_group,
         )
@@ -949,9 +855,6 @@ def __init__(self, query_logs: QueryLogsResource) -> None:
         self.list = to_streamed_response_wrapper(
             query_logs.list,
         )
-        self.add_user_feedback = to_streamed_response_wrapper(
-            query_logs.add_user_feedback,
-        )
         self.list_by_group = to_streamed_response_wrapper(
             query_logs.list_by_group,
         )
@@ -973,9 +876,6 @@ def __init__(self, query_logs: AsyncQueryLogsResource) -> None:
         self.list = async_to_streamed_response_wrapper(
             query_logs.list,
         )
-        self.add_user_feedback = async_to_streamed_response_wrapper(
-            query_logs.add_user_feedback,
-        )
         self.list_by_group = async_to_streamed_response_wrapper(
             query_logs.list_by_group,
         )
 
@@ -101,11 +101,12 @@ def prompt(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
-              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
-              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
-              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
-              for low latency/costs: "gpt-4.1-nano", "nova-micro".
+              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
+              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
+              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
+              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
+              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
+              "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -244,11 +245,12 @@ def score(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
-              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
-              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
-              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
-              for low latency/costs: "gpt-4.1-nano", "nova-micro".
+              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
+              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
+              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
+              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
+              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
+              "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -403,11 +405,12 @@ async def prompt(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
-              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
-              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
-              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
-              for low latency/costs: "gpt-4.1-nano", "nova-micro".
+              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
+              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
+              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
+              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
+              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
+              "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -546,11 +549,12 @@ async def score(
               "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
               "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
               (better models yield better results, faster models yield faster results). -
-              Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
-              "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
-              "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
-              "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
-              for low latency/costs: "gpt-4.1-nano", "nova-micro".
+              Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
+              "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
+              "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
+              models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
+              "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
+              "nova-micro".
 
                   log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
                   For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
 
@@ -130,11 +130,12 @@ class ProjectValidateParams(TypedDict, total=False):
     "claude-3.5-sonnet", "claude-3.5-haiku", "claude-3-haiku", "nova-micro",
     "nova-lite", "nova-pro"}, default = "gpt-4.1-mini"): Underlying base LLM to use
     (better models yield better results, faster models yield faster results). -
-    Models still in beta: "o3", "o1", "o4-mini", "o3-mini", "o1-mini",
-    "gpt-4.5-preview", "claude-opus-4-0", "claude-sonnet-4-0", "claude-3.7-sonnet",
-    "claude-3.5-haiku". - Recommended models for accuracy: "gpt-5", "gpt-4.1",
-    "o4-mini", "o3", "claude-opus-4-0", "claude-sonnet-4-0". - Recommended models
-    for low latency/costs: "gpt-4.1-nano", "nova-micro".
+    Models still in beta: "gpt-5", "gpt-5-mini", "gpt-5-nano", "o3", "o1",
+    "o4-mini", "o3-mini", "o1-mini", "gpt-4.5-preview", "claude-opus-4-0",
+    "claude-sonnet-4-0", "claude-3.7-sonnet", "claude-3.5-haiku". - Recommended
+    models for accuracy: "gpt-5", "gpt-4.1", "o4-mini", "o3", "claude-opus-4-0",
+    "claude-sonnet-4-0". - Recommended models for low latency/costs: "gpt-4.1-nano",
+    "nova-micro".
 
         log (list[str], default = []): optionally specify additional logs or metadata that TLM should return.
         For instance, include "explanation" here to get explanations of why a response is scored with low trustworthiness.
@@ -652,8 +653,6 @@ class MessageChatCompletionDeveloperMessageParam(TypedDict, total=False):
 class Options(TypedDict, total=False):
     custom_eval_criteria: Iterable[object]
 
-    disable_persistence: bool
-
     disable_trustworthiness: bool
 
     log: List[str]
 
@@ -59,9 +59,6 @@ class ProjectValidateResponse(BaseModel):
     to answer, if it does not already exist.
     """
 
-    log_id: str
-    """The UUID of the query log entry created for this validation request."""
-
     should_guardrail: bool
     """
     True if the response should be guardrailed by the AI system, False if the