Add retry logic to API handlers with @withRetry decorator (RooCodeInc#3596)

ViezeVingertjes · web-flow · commit 9f85105186a4 · 2025-06-03T10:19:14.000-07:00
diff --git a/src/api/providers/asksage.ts b/src/api/providers/asksage.ts
@@ -9,6 +9,7 @@ import {
 	askSageDefaultURL,
 } from "@shared/api"
 import { ApiStream } from "../transform/stream"
+import { withRetry } from "../retry"
 
 type AskSageRequest = {
 	system_prompt: string
@@ -45,6 +46,7 @@ export class AskSageHandler implements ApiHandler {
 		}
 	}
 
+	@withRetry()
 	async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {
 		try {
 			const model = this.getModel()
diff --git a/src/api/providers/cline.ts b/src/api/providers/cline.ts
@@ -6,6 +6,7 @@ import { createOpenRouterStream } from "../transform/openrouter-stream"
 import { ApiStream, ApiStreamUsageChunk } from "../transform/stream"
 import axios from "axios"
 import { OpenRouterErrorResponse } from "./types"
+import { withRetry } from "../retry"
 
 export class ClineHandler implements ApiHandler {
 	private options: ApiHandlerOptions
@@ -25,6 +26,7 @@ export class ClineHandler implements ApiHandler {
 		})
 	}
 
+	@withRetry()
 	async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {
 		this.lastGenerationId = undefined
 
diff --git a/src/api/providers/doubao.ts b/src/api/providers/doubao.ts
@@ -4,6 +4,7 @@ import { Anthropic } from "@anthropic-ai/sdk"
 import OpenAI from "openai"
 import { convertToOpenAiMessages } from "../transform/openai-format"
 import { ApiStream } from "../transform/stream"
+import { withRetry } from "../retry"
 
 export class DoubaoHandler implements ApiHandler {
 	private options: ApiHandlerOptions
@@ -28,6 +29,7 @@ export class DoubaoHandler implements ApiHandler {
 		}
 	}
 
+	@withRetry()
 	async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {
 		const model = this.getModel()
 		let openAiMessages: OpenAI.Chat.ChatCompletionMessageParam[] = [
diff --git a/src/api/providers/gemini.ts b/src/api/providers/gemini.ts
@@ -171,8 +171,22 @@ export class GeminiHandler implements ApiHandler {
 
 				// Gemini doesn't include status codes in their errors
 				// https://github.com/googleapis/js-genai/blob/61f7f27b866c74333ca6331883882489bcb708b9/src/_api_client.ts#L569
-				if (error.name === "ClientError" && error.message.includes("got status: 429 Too Many Requests.")) {
-					;(error as any).status = 429
+				const rateLimitPatterns = [
+					/got status: 429/i,
+					/429 Too Many Requests/i,
+					/rate limit exceeded/i,
+					/too many requests/i,
+				]
+
+				const isRateLimit =
+					error.name === "ClientError" && rateLimitPatterns.some((pattern) => pattern.test(error.message))
+
+				if (isRateLimit) {
+					const rateLimitError = Object.assign(new Error(error.message), {
+						...error,
+						status: 429,
+					})
+					throw rateLimitError
 				}
 			} else {
 				apiError = String(error)
diff --git a/src/api/providers/litellm.ts b/src/api/providers/litellm.ts
@@ -4,6 +4,7 @@ import { ApiHandlerOptions, liteLlmDefaultModelId, liteLlmModelInfoSaneDefaults
 import { ApiHandler } from ".."
 import { ApiStream } from "../transform/stream"
 import { convertToOpenAiMessages } from "../transform/openai-format"
+import { withRetry } from "../retry"
 
 export class LiteLlmHandler implements ApiHandler {
 	private options: ApiHandlerOptions
@@ -51,6 +52,7 @@ export class LiteLlmHandler implements ApiHandler {
 		}
 	}
 
+	@withRetry()
 	async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {
 		const formattedMessages = convertToOpenAiMessages(messages)
 		const systemMessage: OpenAI.Chat.ChatCompletionSystemMessageParam = {
diff --git a/src/api/providers/lmstudio.ts b/src/api/providers/lmstudio.ts
@@ -4,6 +4,7 @@ import { ApiHandler } from "../"
 import { ApiHandlerOptions, ModelInfo, openAiModelInfoSaneDefaults } from "@shared/api"
 import { convertToOpenAiMessages } from "../transform/openai-format"
 import { ApiStream } from "../transform/stream"
+import { withRetry } from "../retry"
 
 export class LmStudioHandler implements ApiHandler {
 	private options: ApiHandlerOptions
@@ -17,6 +18,7 @@ export class LmStudioHandler implements ApiHandler {
 		})
 	}
 
+	@withRetry({ retryAllErrors: true })
 	async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {
 		const openAiMessages: OpenAI.Chat.ChatCompletionMessageParam[] = [
 			{ role: "system", content: systemPrompt },
diff --git a/src/api/providers/qwen.ts b/src/api/providers/qwen.ts
@@ -14,6 +14,7 @@ import {
 import { convertToOpenAiMessages } from "../transform/openai-format"
 import { ApiStream } from "../transform/stream"
 import { convertToR1Format } from "../transform/r1-format"
+import { withRetry } from "../retry"
 
 export class QwenHandler implements ApiHandler {
 	private options: ApiHandlerOptions
@@ -48,6 +49,7 @@ export class QwenHandler implements ApiHandler {
 		}
 	}
 
+	@withRetry()
 	async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {
 		const model = this.getModel()
 		const isDeepseekReasoner = model.id.includes("deepseek-r1")
diff --git a/src/api/providers/vscode-lm.ts b/src/api/providers/vscode-lm.ts
@@ -7,6 +7,7 @@ import { convertToVsCodeLmMessages } from "@api/transform/vscode-lm-format"
 import { SELECTOR_SEPARATOR, stringifyVsCodeLmModelSelector } from "@shared/vsCodeSelectorUtils"
 import { ApiHandlerOptions, ModelInfo, openAiModelInfoSaneDefaults } from "@shared/api"
 import type { LanguageModelChatSelector as LanguageModelChatSelectorFromTypes } from "./types"
+import { withRetry } from "../retry"
 
 // Cline does not update VSCode type definitions or engine requirements to maintain compatibility.
 // This declaration (as seen in src/integrations/TerminalManager.ts) provides types for the Language Model API in newer versions of VSCode.
@@ -406,6 +407,7 @@ export class VsCodeLmHandler implements ApiHandler, SingleCompletionHandler {
 		return content
 	}
 
+	@withRetry()
 	async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {
 		// Ensure clean state before starting a new request
 		this.ensureCleanState()
diff --git a/src/api/providers/xai.ts b/src/api/providers/xai.ts
@@ -5,6 +5,7 @@ import { ApiHandlerOptions, XAIModelId, ModelInfo, xaiDefaultModelId, xaiModels
 import { convertToOpenAiMessages } from "@api/transform/openai-format"
 import { ApiStream } from "@api/transform/stream"
 import { ChatCompletionReasoningEffort } from "openai/resources/chat/completions"
+import { withRetry } from "../retry"
 
 export class XAIHandler implements ApiHandler {
 	private options: ApiHandlerOptions
@@ -18,6 +19,7 @@ export class XAIHandler implements ApiHandler {
 		})
 	}
 
+	@withRetry()
 	async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {
 		const modelId = this.getModel().id
 		// ensure reasoning effort is either "low" or "high" for grok-3-mini

Original file line number	Diff line number	Diff line change
`@@ -9,6 +9,7 @@ import {`
`9`	`9`	`askSageDefaultURL,`
`10`	`10`	`} from "@shared/api"`
`11`	`11`	`import { ApiStream } from "../transform/stream"`
	`12`	`+import { withRetry } from "../retry"`
`12`	`13`
`13`	`14`	`type AskSageRequest = {`
`14`	`15`	`system_prompt: string`
`@@ -45,6 +46,7 @@ export class AskSageHandler implements ApiHandler {`
`45`	`46`	`}`
`46`	`47`	`}`
`47`	`48`
	`49`	`+ @withRetry()`
`48`	`50`	`async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {`
`49`	`51`	`try {`
`50`	`52`	`const model = this.getModel()`
Original file line number	Diff line number	Diff line change
`@@ -4,6 +4,7 @@ import { Anthropic } from "@anthropic-ai/sdk"`
`4`	`4`	`import OpenAI from "openai"`
`5`	`5`	`import { convertToOpenAiMessages } from "../transform/openai-format"`
`6`	`6`	`import { ApiStream } from "../transform/stream"`
	`7`	`+import { withRetry } from "../retry"`
`7`	`8`
`8`	`9`	`export class DoubaoHandler implements ApiHandler {`
`9`	`10`	`private options: ApiHandlerOptions`
`@@ -28,6 +29,7 @@ export class DoubaoHandler implements ApiHandler {`
`28`	`29`	`}`
`29`	`30`	`}`
`30`	`31`
	`32`	`+ @withRetry()`
`31`	`33`	`async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {`
`32`	`34`	`const model = this.getModel()`
`33`	`35`	`let openAiMessages: OpenAI.Chat.ChatCompletionMessageParam[] = [`
Original file line number	Diff line number	Diff line change
`@@ -4,6 +4,7 @@ import { ApiHandlerOptions, liteLlmDefaultModelId, liteLlmModelInfoSaneDefaults`
`4`	`4`	`import { ApiHandler } from ".."`
`5`	`5`	`import { ApiStream } from "../transform/stream"`
`6`	`6`	`import { convertToOpenAiMessages } from "../transform/openai-format"`
	`7`	`+import { withRetry } from "../retry"`
`7`	`8`
`8`	`9`	`export class LiteLlmHandler implements ApiHandler {`
`9`	`10`	`private options: ApiHandlerOptions`
`@@ -51,6 +52,7 @@ export class LiteLlmHandler implements ApiHandler {`
`51`	`52`	`}`
`52`	`53`	`}`
`53`	`54`
	`55`	`+ @withRetry()`
`54`	`56`	`async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {`
`55`	`57`	`const formattedMessages = convertToOpenAiMessages(messages)`
`56`	`58`	`const systemMessage: OpenAI.Chat.ChatCompletionSystemMessageParam = {`
Original file line number	Diff line number	Diff line change
`@@ -14,6 +14,7 @@ import {`
`14`	`14`	`import { convertToOpenAiMessages } from "../transform/openai-format"`
`15`	`15`	`import { ApiStream } from "../transform/stream"`
`16`	`16`	`import { convertToR1Format } from "../transform/r1-format"`
	`17`	`+import { withRetry } from "../retry"`
`17`	`18`
`18`	`19`	`export class QwenHandler implements ApiHandler {`
`19`	`20`	`private options: ApiHandlerOptions`
`@@ -48,6 +49,7 @@ export class QwenHandler implements ApiHandler {`
`48`	`49`	`}`
`49`	`50`	`}`
`50`	`51`
	`52`	`+ @withRetry()`
`51`	`53`	`async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {`
`52`	`54`	`const model = this.getModel()`
`53`	`55`	`const isDeepseekReasoner = model.id.includes("deepseek-r1")`