Portkey-AI · vrushankportkey · Jan 26, 2026
diff --git a/src/providers/anthropic/chatComplete.ts b/src/providers/anthropic/chatComplete.ts
@@ -731,8 +731,14 @@ export const getAnthropicStreamChunkTransform = (provider: string) => {
 
     // final chunk
     if (parsedChunk.type === 'message_delta' && parsedChunk.usage) {
+      // Use input_tokens from message_delta if not available from message_start
+      const promptTokens =
+        streamState?.usage?.prompt_tokens ??
+        parsedChunk.usage?.input_tokens ??
+        0;
+
       const totalTokens =
-        (streamState?.usage?.prompt_tokens ?? 0) +
+        promptTokens +
         (streamState?.usage?.cache_creation_input_tokens ?? 0) +
         (streamState?.usage?.cache_read_input_tokens ?? 0) +
         (parsedChunk.usage.output_tokens ?? 0);
@@ -755,6 +761,7 @@ export const getAnthropicStreamChunkTransform = (provider: string) => {
           ],
           usage: {
             ...streamState.usage,
+            prompt_tokens: promptTokens,
             completion_tokens: parsedChunk.usage?.output_tokens,
             total_tokens: totalTokens,
             prompt_tokens_details: {

diff --git a/src/providers/google-vertex-ai/chatComplete.ts b/src/providers/google-vertex-ai/chatComplete.ts
@@ -1014,8 +1014,12 @@ export const VertexAnthropicChatCompleteStreamChunkTransform: (
   }
 
   if (parsedChunk.type === 'message_delta' && parsedChunk.usage) {
+    // Use input_tokens from message_delta if not available from message_start
+    const promptTokens =
+      streamState?.usage?.prompt_tokens ?? parsedChunk.usage?.input_tokens ?? 0;
+
     const totalTokens =
-      (streamState?.usage?.prompt_tokens ?? 0) +
+      promptTokens +
       (streamState?.usage?.cache_creation_input_tokens ?? 0) +
       (streamState?.usage?.cache_read_input_tokens ?? 0) +
       (parsedChunk.usage.output_tokens ?? 0);
@@ -1039,6 +1043,7 @@ export const VertexAnthropicChatCompleteStreamChunkTransform: (
         ],
         usage: {
           ...streamState.usage,
+          prompt_tokens: promptTokens,
           completion_tokens: parsedChunk.usage?.output_tokens,
           total_tokens: totalTokens,
           prompt_tokens_details: {