RooCodeInc
diff --git a/‎src/api/providers/__tests__/gemini.test.ts‎
Lines changed: 5 additions & 8 deletions b/‎src/api/providers/__tests__/gemini.test.ts‎
Lines changed: 5 additions & 8 deletions
diff --git a/‎src/api/providers/gemini.ts‎
Lines changed: 78 additions & 16 deletions b/‎src/api/providers/gemini.ts‎
Lines changed: 78 additions & 16 deletions
diff --git a/‎src/api/transform/stream.ts‎
Lines changed: 2 additions & 1 deletion b/‎src/api/transform/stream.ts‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎src/exports/roo-code.d.ts‎
Lines changed: 45 additions & 0 deletions b/‎src/exports/roo-code.d.ts‎
Lines changed: 45 additions & 0 deletions
diff --git a/‎src/exports/types.ts‎
Lines changed: 45 additions & 0 deletions b/‎src/exports/types.ts‎
Lines changed: 45 additions & 0 deletions
diff --git a/‎src/schemas/index.ts‎
Lines changed: 11 additions & 0 deletions b/‎src/schemas/index.ts‎
Lines changed: 11 additions & 0 deletions
@@ -72,18 +72,15 @@ describe("GeminiHandler", () => {
 
 			// Should have 3 chunks: 'Hello', ' world!', and usage info
 			expect(chunks.length).toBe(3)
-			expect(chunks[0]).toEqual({
-				type: "text",
-				text: "Hello",
-			})
-			expect(chunks[1]).toEqual({
-				type: "text",
-				text: " world!",
-			})
+			expect(chunks[0]).toEqual({ type: "text", text: "Hello" })
+			expect(chunks[1]).toEqual({ type: "text", text: " world!" })
 			expect(chunks[2]).toEqual({
 				type: "usage",
 				inputTokens: 10,
 				outputTokens: 5,
+				cacheReadTokens: undefined,
+				cacheWriteTokens: undefined,
+				thinkingTokens: undefined,
 			})
 
 			// Verify the call to generateContentStream
 
@@ -14,6 +14,8 @@ import { convertAnthropicContentToGemini, convertAnthropicMessageToGemini } from
 import type { ApiStream } from "../transform/stream"
 import { BaseProvider } from "./base-provider"
 
+const CACHE_TTL = 5
+
 export class GeminiHandler extends BaseProvider implements SingleCompletionHandler {
 	protected options: ApiHandlerOptions
 	private client: GoogleGenAI
@@ -31,15 +33,15 @@ export class GeminiHandler extends BaseProvider implements SingleCompletionHandl
 		messages: Anthropic.Messages.MessageParam[],
 		taskId?: string,
 	): ApiStream {
-		const { id: model, thinkingConfig, maxOutputTokens, supportsPromptCache } = this.getModel()
+		const { id: model, thinkingConfig, maxOutputTokens, info } = this.getModel()
 
 		const contents = messages.map(convertAnthropicMessageToGemini)
 		let uncachedContent: Content[] | undefined = undefined
 		let cachedContent: string | undefined = undefined
-		let cacheWriteTokens: number = 0
+		let cacheWriteTokens: number | undefined = undefined
 
 		// https://ai.google.dev/gemini-api/docs/caching?lang=node
-		if (supportsPromptCache && taskId) {
+		if (info.supportsPromptCache && taskId) {
 			const cacheEntry = this.contentCaches.get(taskId)
 
 			if (cacheEntry) {
@@ -49,7 +51,7 @@ export class GeminiHandler extends BaseProvider implements SingleCompletionHandl
 
 			const newCacheEntry = await this.client.caches.create({
 				model,
-				config: { contents, systemInstruction, ttl: "300s" },
+				config: { contents, systemInstruction, ttl: `${CACHE_TTL * 60}s` },
 			})
 
 			if (newCacheEntry.name) {
@@ -89,26 +91,31 @@ export class GeminiHandler extends BaseProvider implements SingleCompletionHandl
 
 		if (lastUsageMetadata) {
 			const inputTokens = lastUsageMetadata.promptTokenCount ?? 0
-			const cachedInputTokens = lastUsageMetadata.cachedContentTokenCount ?? 0
 			const outputTokens = lastUsageMetadata.candidatesTokenCount ?? 0
+			const cacheReadTokens = lastUsageMetadata.cachedContentTokenCount
+			const thinkingTokens = lastUsageMetadata.thoughtsTokenCount
+
+			const totalCost = this.calculateCost({
+				info,
+				inputTokens,
+				outputTokens,
+				cacheWriteTokens,
+				cacheReadTokens,
+			})
 
 			yield {
 				type: "usage",
-				inputTokens: inputTokens - cachedInputTokens,
+				inputTokens,
 				outputTokens,
 				cacheWriteTokens,
-				cacheReadTokens: cachedInputTokens,
+				cacheReadTokens,
+				thinkingTokens,
+				totalCost,
 			}
 		}
 	}
 
-	override getModel(): {
-		id: GeminiModelId
-		info: ModelInfo
-		thinkingConfig?: ThinkingConfig
-		maxOutputTokens?: number
-		supportsPromptCache?: boolean
-	} {
+	override getModel() {
 		let id = this.options.apiModelId ? (this.options.apiModelId as GeminiModelId) : geminiDefaultModelId
 		let info: ModelInfo = geminiModels[id]
 
@@ -125,7 +132,6 @@ export class GeminiHandler extends BaseProvider implements SingleCompletionHandl
 						? { thinkingBudget: this.options.modelMaxThinkingTokens }
 						: undefined,
 					maxOutputTokens: this.options.modelMaxTokens ?? info.maxTokens ?? undefined,
-					supportsPromptCache: info.supportsPromptCache,
 				}
 			}
 		}
@@ -135,7 +141,7 @@ export class GeminiHandler extends BaseProvider implements SingleCompletionHandl
 			info = geminiModels[geminiDefaultModelId]
 		}
 
-		return { id, info, supportsPromptCache: info.supportsPromptCache }
+		return { id, info }
 	}
 
 	async completePrompt(prompt: string): Promise<string> {
@@ -183,4 +189,60 @@ export class GeminiHandler extends BaseProvider implements SingleCompletionHandl
 			return super.countTokens(content)
 		}
 	}
+
+	private calculateCost({
+		info,
+		inputTokens,
+		outputTokens,
+		cacheWriteTokens,
+		cacheReadTokens,
+	}: {
+		info: ModelInfo
+		inputTokens: number
+		outputTokens: number
+		cacheWriteTokens?: number
+		cacheReadTokens?: number
+	}) {
+		if (!info.inputPrice || !info.outputPrice || !info.cacheWritesPrice || !info.cacheReadsPrice) {
+			return undefined
+		}
+
+		let inputPrice = info.inputPrice
+		let outputPrice = info.outputPrice
+		let cacheWritesPrice = info.cacheWritesPrice
+		let cacheReadsPrice = info.cacheReadsPrice
+
+		// If there's tiered pricing then adjust the input and output token prices
+		// based on the input tokens used.
+		if (info.tiers) {
+			const tier = info.tiers.find((tier) => inputTokens <= tier.contextWindow)
+
+			if (tier) {
+				inputPrice = tier.inputPrice ?? inputPrice
+				outputPrice = tier.outputPrice ?? outputPrice
+				cacheWritesPrice = tier.cacheWritesPrice ?? cacheWritesPrice
+				cacheReadsPrice = tier.cacheReadsPrice ?? cacheReadsPrice
+			}
+		}
+
+		let inputTokensCost = inputPrice * (inputTokens / 1_000_000)
+		let outputTokensCost = outputPrice * (outputTokens / 1_000_000)
+		let cacheWriteCost = 0
+		let cacheReadCost = 0
+
+		// Cache Writes: Charged at the input token cost plus 5 minutes of cache storage.
+		// Example: Cache write cost = Input token price + (Cache storage price × (5 minutes / 60 minutes))
+		if (cacheWriteTokens) {
+			cacheWriteCost = cacheWritesPrice * (cacheWriteTokens / 1_000_000) * (CACHE_TTL / 60)
+		}
+
+		// Cache Reads: Charged at 0.25 × the original input token cost.
+		if (cacheReadTokens) {
+			const uncachedReadTokens = inputTokens - cacheReadTokens
+			cacheReadCost = cacheReadsPrice * (cacheReadTokens / 1_000_000)
+			inputTokensCost = inputPrice * (uncachedReadTokens / 1_000_000)
+		}
+
+		return inputTokensCost + outputTokensCost + cacheWriteCost + cacheReadCost
+	}
 }
@@ -17,5 +17,6 @@ export interface ApiStreamUsageChunk {
 	outputTokens: number
 	cacheWriteTokens?: number
 	cacheReadTokens?: number
-	totalCost?: number // openrouter
+	thinkingTokens?: number
+	totalCost?: number
 }
@@ -46,6 +46,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	glamaApiKey?: string | undefined
@@ -69,6 +78,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	openRouterBaseUrl?: string | undefined
@@ -112,6 +130,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	openAiUseAzure?: boolean | undefined
@@ -158,6 +185,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	requestyApiKey?: string | undefined
@@ -180,6 +216,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	xaiApiKey?: string | undefined
 
@@ -47,6 +47,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	glamaApiKey?: string | undefined
@@ -70,6 +79,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	openRouterBaseUrl?: string | undefined
@@ -113,6 +131,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	openAiUseAzure?: boolean | undefined
@@ -159,6 +186,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	requestyApiKey?: string | undefined
@@ -181,6 +217,15 @@ type ProviderSettings = {
 				minTokensPerCachePoint?: number | undefined
 				maxCachePoints?: number | undefined
 				cachableFields?: string[] | undefined
+				tiers?:
+					| {
+							contextWindow: number
+							inputPrice?: number | undefined
+							outputPrice?: number | undefined
+							cacheWritesPrice?: number | undefined
+							cacheReadsPrice?: number | undefined
+					  }[]
+					| undefined
 		  } | null)
 		| undefined
 	xaiApiKey?: string | undefined
 
@@ -114,6 +114,17 @@ export const modelInfoSchema = z.object({
 	minTokensPerCachePoint: z.number().optional(),
 	maxCachePoints: z.number().optional(),
 	cachableFields: z.array(z.string()).optional(),
+	tiers: z
+		.array(
+			z.object({
+				contextWindow: z.number(),
+				inputPrice: z.number().optional(),
+				outputPrice: z.number().optional(),
+				cacheWritesPrice: z.number().optional(),
+				cacheReadsPrice: z.number().optional(),
+			}),
+		)
+		.optional(),
 })
 
 export type ModelInfo = z.infer<typeof modelInfoSchema>
Original file line number	Diff line number	Diff line change
`@@ -17,5 +17,6 @@ export interface ApiStreamUsageChunk {`
`17`	`17`	`outputTokens: number`
`18`	`18`	`cacheWriteTokens?: number`
`19`	`19`	`cacheReadTokens?: number`
`20`		`- totalCost?: number // openrouter`
	`20`	`+ thinkingTokens?: number`
	`21`	`+ totalCost?: number`
`21`	`22`	`}`