syntax-syndicate
diff --git a/‎src/api/providers/__tests__/openai.test.ts‎
Lines changed: 0 additions & 2 deletions b/‎src/api/providers/__tests__/openai.test.ts‎
Lines changed: 0 additions & 2 deletions
diff --git a/‎src/api/providers/anthropic.ts‎
Lines changed: 5 additions & 3 deletions b/‎src/api/providers/anthropic.ts‎
Lines changed: 5 additions & 3 deletions
diff --git a/‎src/api/providers/bedrock.ts‎
Lines changed: 4 additions & 2 deletions b/‎src/api/providers/bedrock.ts‎
Lines changed: 4 additions & 2 deletions
diff --git a/‎src/api/providers/gemini.ts‎
Lines changed: 4 additions & 2 deletions b/‎src/api/providers/gemini.ts‎
Lines changed: 4 additions & 2 deletions
diff --git a/‎src/api/providers/glama.ts‎
Lines changed: 4 additions & 3 deletions b/‎src/api/providers/glama.ts‎
Lines changed: 4 additions & 3 deletions
diff --git a/‎src/api/providers/lmstudio.ts‎
Lines changed: 4 additions & 2 deletions b/‎src/api/providers/lmstudio.ts‎
Lines changed: 4 additions & 2 deletions
diff --git a/‎src/api/providers/mistral.ts‎
Lines changed: 3 additions & 1 deletion b/‎src/api/providers/mistral.ts‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎src/api/providers/ollama.ts‎
Lines changed: 12 additions & 5 deletions b/‎src/api/providers/ollama.ts‎
Lines changed: 12 additions & 5 deletions
diff --git a/‎src/api/providers/openai-native.ts‎
Lines changed: 4 additions & 2 deletions b/‎src/api/providers/openai-native.ts‎
Lines changed: 4 additions & 2 deletions
diff --git a/‎src/api/providers/openai.ts‎
Lines changed: 6 additions & 1 deletion b/‎src/api/providers/openai.ts‎
Lines changed: 6 additions & 1 deletion
@@ -1,7 +1,5 @@
 import { OpenAiHandler } from "../openai"
 import { ApiHandlerOptions } from "../../../shared/api"
-import { ApiStream } from "../../transform/stream"
-import OpenAI from "openai"
 import { Anthropic } from "@anthropic-ai/sdk"
 
 // Mock OpenAI client
 
@@ -10,6 +10,8 @@ import {
 import { ApiHandler, SingleCompletionHandler } from "../index"
 import { ApiStream } from "../transform/stream"
 
+const ANTHROPIC_DEFAULT_TEMPERATURE = 0
+
 export class AnthropicHandler implements ApiHandler, SingleCompletionHandler {
 	private options: ApiHandlerOptions
 	private client: Anthropic
@@ -44,7 +46,7 @@ export class AnthropicHandler implements ApiHandler, SingleCompletionHandler {
 					{
 						model: modelId,
 						max_tokens: this.getModel().info.maxTokens || 8192,
-						temperature: 0,
+						temperature: this.options.modelTemperature ?? ANTHROPIC_DEFAULT_TEMPERATURE,
 						system: [{ text: systemPrompt, type: "text", cache_control: { type: "ephemeral" } }], // setting cache breakpoint for system prompt so new tasks can reuse it
 						messages: messages.map((message, index) => {
 							if (index === lastUserMsgIndex || index === secondLastMsgUserIndex) {
@@ -96,7 +98,7 @@ export class AnthropicHandler implements ApiHandler, SingleCompletionHandler {
 				stream = (await this.client.messages.create({
 					model: modelId,
 					max_tokens: this.getModel().info.maxTokens || 8192,
-					temperature: 0,
+					temperature: this.options.modelTemperature ?? ANTHROPIC_DEFAULT_TEMPERATURE,
 					system: [{ text: systemPrompt, type: "text" }],
 					messages,
 					// tools,
@@ -179,7 +181,7 @@ export class AnthropicHandler implements ApiHandler, SingleCompletionHandler {
 			const response = await this.client.messages.create({
 				model: this.getModel().id,
 				max_tokens: this.getModel().info.maxTokens || 8192,
-				temperature: 0,
+				temperature: this.options.modelTemperature ?? ANTHROPIC_DEFAULT_TEMPERATURE,
 				messages: [{ role: "user", content: prompt }],
 				stream: false,
 			})
 
@@ -11,6 +11,8 @@ import { ApiHandlerOptions, BedrockModelId, ModelInfo, bedrockDefaultModelId, be
 import { ApiStream } from "../transform/stream"
 import { convertToBedrockConverseMessages, convertToAnthropicMessage } from "../transform/bedrock-converse-format"
 
+const BEDROCK_DEFAULT_TEMPERATURE = 0.3
+
 // Define types for stream events based on AWS SDK
 export interface StreamEvent {
 	messageStart?: {
@@ -104,7 +106,7 @@ export class AwsBedrockHandler implements ApiHandler, SingleCompletionHandler {
 			system: [{ text: systemPrompt }],
 			inferenceConfig: {
 				maxTokens: modelConfig.info.maxTokens || 5000,
-				temperature: 0.3,
+				temperature: this.options.modelTemperature ?? BEDROCK_DEFAULT_TEMPERATURE,
 				topP: 0.1,
 				...(this.options.awsUsePromptCache
 					? {
@@ -262,7 +264,7 @@ export class AwsBedrockHandler implements ApiHandler, SingleCompletionHandler {
 				]),
 				inferenceConfig: {
 					maxTokens: modelConfig.info.maxTokens || 5000,
-					temperature: 0.3,
+					temperature: this.options.modelTemperature ?? BEDROCK_DEFAULT_TEMPERATURE,
 					topP: 0.1,
 				},
 			}
 
@@ -5,6 +5,8 @@ import { ApiHandlerOptions, geminiDefaultModelId, GeminiModelId, geminiModels, M
 import { convertAnthropicMessageToGemini } from "../transform/gemini-format"
 import { ApiStream } from "../transform/stream"
 
+const GEMINI_DEFAULT_TEMPERATURE = 0
+
 export class GeminiHandler implements ApiHandler, SingleCompletionHandler {
 	private options: ApiHandlerOptions
 	private client: GoogleGenerativeAI
@@ -23,7 +25,7 @@ export class GeminiHandler implements ApiHandler, SingleCompletionHandler {
 			contents: messages.map(convertAnthropicMessageToGemini),
 			generationConfig: {
 				// maxOutputTokens: this.getModel().info.maxTokens,
-				temperature: 0,
+				temperature: this.options.modelTemperature ?? GEMINI_DEFAULT_TEMPERATURE,
 			},
 		})
 
@@ -60,7 +62,7 @@ export class GeminiHandler implements ApiHandler, SingleCompletionHandler {
 			const result = await model.generateContent({
 				contents: [{ role: "user", parts: [{ text: prompt }] }],
 				generationConfig: {
-					temperature: 0,
+					temperature: this.options.modelTemperature ?? GEMINI_DEFAULT_TEMPERATURE,
 				},
 			})
 
 
@@ -5,7 +5,8 @@ import { ApiHandler, SingleCompletionHandler } from "../"
 import { ApiHandlerOptions, ModelInfo, glamaDefaultModelId, glamaDefaultModelInfo } from "../../shared/api"
 import { convertToOpenAiMessages } from "../transform/openai-format"
 import { ApiStream } from "../transform/stream"
-import delay from "delay"
+
+const GLAMA_DEFAULT_TEMPERATURE = 0
 
 export class GlamaHandler implements ApiHandler, SingleCompletionHandler {
 	private options: ApiHandlerOptions
@@ -79,7 +80,7 @@ export class GlamaHandler implements ApiHandler, SingleCompletionHandler {
 		}
 
 		if (this.supportsTemperature()) {
-			requestOptions.temperature = 0
+			requestOptions.temperature = this.options.modelTemperature ?? GLAMA_DEFAULT_TEMPERATURE
 		}
 
 		const { data: completion, response } = await this.client.chat.completions
@@ -172,7 +173,7 @@ export class GlamaHandler implements ApiHandler, SingleCompletionHandler {
 			}
 
 			if (this.supportsTemperature()) {
-				requestOptions.temperature = 0
+				requestOptions.temperature = this.options.modelTemperature ?? GLAMA_DEFAULT_TEMPERATURE
 			}
 
 			if (this.getModel().id.startsWith("anthropic/")) {
 
@@ -5,6 +5,8 @@ import { ApiHandlerOptions, ModelInfo, openAiModelInfoSaneDefaults } from "../..
 import { convertToOpenAiMessages } from "../transform/openai-format"
 import { ApiStream } from "../transform/stream"
 
+const LMSTUDIO_DEFAULT_TEMPERATURE = 0
+
 export class LmStudioHandler implements ApiHandler, SingleCompletionHandler {
 	private options: ApiHandlerOptions
 	private client: OpenAI
@@ -27,7 +29,7 @@ export class LmStudioHandler implements ApiHandler, SingleCompletionHandler {
 			const stream = await this.client.chat.completions.create({
 				model: this.getModel().id,
 				messages: openAiMessages,
-				temperature: 0,
+				temperature: this.options.modelTemperature ?? LMSTUDIO_DEFAULT_TEMPERATURE,
 				stream: true,
 			})
 			for await (const chunk of stream) {
@@ -59,7 +61,7 @@ export class LmStudioHandler implements ApiHandler, SingleCompletionHandler {
 			const response = await this.client.chat.completions.create({
 				model: this.getModel().id,
 				messages: [{ role: "user", content: prompt }],
-				temperature: 0,
+				temperature: this.options.modelTemperature ?? LMSTUDIO_DEFAULT_TEMPERATURE,
 				stream: false,
 			})
 			return response.choices[0]?.message.content || ""
 
@@ -14,6 +14,8 @@ import {
 import { convertToMistralMessages } from "../transform/mistral-format"
 import { ApiStream } from "../transform/stream"
 
+const MISTRAL_DEFAULT_TEMPERATURE = 0
+
 export class MistralHandler implements ApiHandler {
 	private options: ApiHandlerOptions
 	private client: Mistral
@@ -30,7 +32,7 @@ export class MistralHandler implements ApiHandler {
 		const stream = await this.client.chat.stream({
 			model: this.getModel().id,
 			// max_completion_tokens: this.getModel().info.maxTokens,
-			temperature: 0,
+			temperature: this.options.modelTemperature ?? MISTRAL_DEFAULT_TEMPERATURE,
 			messages: [{ role: "system", content: systemPrompt }, ...convertToMistralMessages(messages)],
 			stream: true,
 		})
 
@@ -5,6 +5,9 @@ import { ApiHandlerOptions, ModelInfo, openAiModelInfoSaneDefaults } from "../..
 import { convertToOpenAiMessages } from "../transform/openai-format"
 import { convertToR1Format } from "../transform/r1-format"
 import { ApiStream } from "../transform/stream"
+import { DEEP_SEEK_DEFAULT_TEMPERATURE } from "./openai"
+
+const OLLAMA_DEFAULT_TEMPERATURE = 0
 
 export class OllamaHandler implements ApiHandler, SingleCompletionHandler {
 	private options: ApiHandlerOptions
@@ -20,7 +23,7 @@ export class OllamaHandler implements ApiHandler, SingleCompletionHandler {
 
 	async *createMessage(systemPrompt: string, messages: Anthropic.Messages.MessageParam[]): ApiStream {
 		const modelId = this.getModel().id
-		const useR1Format = modelId.toLowerCase().includes('deepseek-r1')
+		const useR1Format = modelId.toLowerCase().includes("deepseek-r1")
 		const openAiMessages: OpenAI.Chat.ChatCompletionMessageParam[] = [
 			{ role: "system", content: systemPrompt },
 			...(useR1Format ? convertToR1Format(messages) : convertToOpenAiMessages(messages)),
@@ -29,7 +32,7 @@ export class OllamaHandler implements ApiHandler, SingleCompletionHandler {
 		const stream = await this.client.chat.completions.create({
 			model: this.getModel().id,
 			messages: openAiMessages,
-			temperature: 0,
+			temperature: this.options.modelTemperature ?? OLLAMA_DEFAULT_TEMPERATURE,
 			stream: true,
 		})
 		for await (const chunk of stream) {
@@ -53,11 +56,15 @@ export class OllamaHandler implements ApiHandler, SingleCompletionHandler {
 	async completePrompt(prompt: string): Promise<string> {
 		try {
 			const modelId = this.getModel().id
-			const useR1Format = modelId.toLowerCase().includes('deepseek-r1')
+			const useR1Format = modelId.toLowerCase().includes("deepseek-r1")
 			const response = await this.client.chat.completions.create({
 				model: this.getModel().id,
-				messages: useR1Format ? convertToR1Format([{ role: "user", content: prompt }]) : [{ role: "user", content: prompt }],
-				temperature: 0,
+				messages: useR1Format
+					? convertToR1Format([{ role: "user", content: prompt }])
+					: [{ role: "user", content: prompt }],
+				temperature:
+					this.options.modelTemperature ??
+					(useR1Format ? DEEP_SEEK_DEFAULT_TEMPERATURE : OLLAMA_DEFAULT_TEMPERATURE),
 				stream: false,
 			})
 			return response.choices[0]?.message.content || ""
 
@@ -11,6 +11,8 @@ import {
 import { convertToOpenAiMessages } from "../transform/openai-format"
 import { ApiStream } from "../transform/stream"
 
+const OPENAI_NATIVE_DEFAULT_TEMPERATURE = 0
+
 export class OpenAiNativeHandler implements ApiHandler, SingleCompletionHandler {
 	private options: ApiHandlerOptions
 	private client: OpenAI
@@ -88,7 +90,7 @@ export class OpenAiNativeHandler implements ApiHandler, SingleCompletionHandler
 	): ApiStream {
 		const stream = await this.client.chat.completions.create({
 			model: modelId,
-			temperature: 0,
+			temperature: this.options.modelTemperature ?? OPENAI_NATIVE_DEFAULT_TEMPERATURE,
 			messages: [{ role: "system", content: systemPrompt }, ...convertToOpenAiMessages(messages)],
 			stream: true,
 			stream_options: { include_usage: true },
@@ -189,7 +191,7 @@ export class OpenAiNativeHandler implements ApiHandler, SingleCompletionHandler
 		return {
 			model: modelId,
 			messages: [{ role: "user", content: prompt }],
-			temperature: 0,
+			temperature: this.options.modelTemperature ?? OPENAI_NATIVE_DEFAULT_TEMPERATURE,
 		}
 	}
 }
@@ -17,6 +17,9 @@ export interface OpenAiHandlerOptions extends ApiHandlerOptions {
 	defaultHeaders?: Record<string, string>
 }
 
+export const DEEP_SEEK_DEFAULT_TEMPERATURE = 0.6
+const OPENAI_DEFAULT_TEMPERATURE = 0
+
 export class OpenAiHandler implements ApiHandler, SingleCompletionHandler {
 	protected options: OpenAiHandlerOptions
 	private client: OpenAI
@@ -74,7 +77,9 @@ export class OpenAiHandler implements ApiHandler, SingleCompletionHandler {
 
 			const requestOptions: OpenAI.Chat.Completions.ChatCompletionCreateParamsStreaming = {
 				model: modelId,
-				temperature: 0,
+				temperature:
+					this.options.modelTemperature ??
+					(deepseekReasoner ? DEEP_SEEK_DEFAULT_TEMPERATURE : OPENAI_DEFAULT_TEMPERATURE),
 				messages: convertedMessages,
 				stream: true as const,
 				stream_options: { include_usage: true },
Original file line number	Diff line number	Diff line change
`@@ -5,7 +5,8 @@ import { ApiHandler, SingleCompletionHandler } from "../"`
`5`	`5`	`import { ApiHandlerOptions, ModelInfo, glamaDefaultModelId, glamaDefaultModelInfo } from "../../shared/api"`
`6`	`6`	`import { convertToOpenAiMessages } from "../transform/openai-format"`
`7`	`7`	`import { ApiStream } from "../transform/stream"`
`8`		`-import delay from "delay"`
	`8`	`+`
	`9`	`+const GLAMA_DEFAULT_TEMPERATURE = 0`
`9`	`10`
`10`	`11`	`export class GlamaHandler implements ApiHandler, SingleCompletionHandler {`
`11`	`12`	`private options: ApiHandlerOptions`
`@@ -79,7 +80,7 @@ export class GlamaHandler implements ApiHandler, SingleCompletionHandler {`
`79`	`80`	`}`
`80`	`81`
`81`	`82`	`if (this.supportsTemperature()) {`
`82`		`- requestOptions.temperature = 0`
	`83`	`+ requestOptions.temperature = this.options.modelTemperature ?? GLAMA_DEFAULT_TEMPERATURE`
`83`	`84`	`}`
`84`	`85`
`85`	`86`	`const { data: completion, response } = await this.client.chat.completions`
`@@ -172,7 +173,7 @@ export class GlamaHandler implements ApiHandler, SingleCompletionHandler {`
`172`	`173`	`}`
`173`	`174`
`174`	`175`	`if (this.supportsTemperature()) {`
`175`		`- requestOptions.temperature = 0`
	`176`	`+ requestOptions.temperature = this.options.modelTemperature ?? GLAMA_DEFAULT_TEMPERATURE`
`176`	`177`	`}`
`177`	`178`
`178`	`179`	`if (this.getModel().id.startsWith("anthropic/")) {`