fix: Fix cost calculation for responses

tcx4c70 · tcx4c70 · commit f11083e992dd · 2025-09-18T18:31:41.000+08:00
Signed-off-by: Adam Tao &lt;tcx4c70@gmail.com&gt;
diff --git a/litellm/responses/utils.py b/litellm/responses/utils.py
@@ -23,7 +23,7 @@
     ResponseText,
 )
 from litellm.types.responses.main import DecodedResponseId
-from litellm.types.utils import SpecialEnums, Usage
+from litellm.types.utils import PromptTokensDetails, SpecialEnums, Usage
 
 
 class ResponsesAPIRequestUtils:
@@ -375,8 +375,15 @@ def _transform_response_api_usage_to_chat_usage(
         )
         prompt_tokens: int = response_api_usage.input_tokens or 0
         completion_tokens: int = response_api_usage.output_tokens or 0
+        prompt_tokens_details: Optional[PromptTokensDetails] = None
+        if response_api_usage.input_tokens_details:
+            prompt_tokens_details = PromptTokensDetails(
+                cached_tokens=response_api_usage.input_tokens_details.cached_tokens,
+                audio_tokens=response_api_usage.input_tokens_details.audio_tokens,
+            )
         return Usage(
             prompt_tokens=prompt_tokens,
             completion_tokens=completion_tokens,
             total_tokens=prompt_tokens + completion_tokens,
-        )
+            prompt_tokens_details=prompt_tokens_details,
+        )