Add cache breakpoints for custom vertex models on Unbound

pugazhendhi-m · pugazhendhi-m · commit f38592f1bb02 · 2025-06-12T10:37:37.000+05:30
diff --git a/src/api/providers/fetchers/unbound.ts b/src/api/providers/fetchers/unbound.ts
@@ -20,7 +20,7 @@ export async function getUnboundModels(apiKey?: string | null): Promise<Record<s
 			for (const [modelId, model] of Object.entries(rawModels)) {
 				const modelInfo: ModelInfo = {
 					maxTokens: model?.maxTokens ? parseInt(model.maxTokens) : undefined,
-					contextWindow: model?.contextWindow ? parseInt(model.contextWindow) : 0,
+					contextWindow: model?.contextWindow ? parseInt(model.contextWindow) : 128_000,
 					supportsImages: model?.supportsImages ?? false,
 					supportsPromptCache: model?.supportsPromptCaching ?? false,
 					supportsComputerUse: model?.supportsComputerUse ?? false,
diff --git a/src/api/providers/unbound.ts b/src/api/providers/unbound.ts
@@ -9,6 +9,7 @@ import { ApiStream, ApiStreamUsageChunk } from "../transform/stream"
 import { convertToOpenAiMessages } from "../transform/openai-format"
 import { addCacheBreakpoints as addAnthropicCacheBreakpoints } from "../transform/caching/anthropic"
 import { addCacheBreakpoints as addGeminiCacheBreakpoints } from "../transform/caching/gemini"
+import { addCacheBreakpoints as addVertexCacheBreakpoints } from "../transform/caching/vertex"
 
 import type { SingleCompletionHandler, ApiHandlerCreateMessageMetadata } from "../index"
 import { RouterProvider } from "./router-provider"
@@ -70,6 +71,10 @@ export class UnboundHandler extends RouterProvider implements SingleCompletionHa
 				addAnthropicCacheBreakpoints(systemPrompt, openAiMessages)
 			}
 		}
+		// Custom models from Vertex AI (no configuration) need to be handled differently.
+		if (modelId.startsWith("vertex-ai/google.") || modelId.startsWith("vertex-ai/anthropic.")) {
+			addVertexCacheBreakpoints(messages)
+		}
 
 		// Required by Anthropic; other providers default to max tokens allowed.
 		let maxTokens: number | undefined