carlrobertoh
diff --git a/‎src/main/java/ee/carlrobert/codegpt/toolwindow/chat/ui/ChatMessageResponseBody.java‎
Lines changed: 10 additions & 1 deletion b/‎src/main/java/ee/carlrobert/codegpt/toolwindow/chat/ui/ChatMessageResponseBody.java‎
Lines changed: 10 additions & 1 deletion
diff --git a/‎src/main/kotlin/ee/carlrobert/codegpt/agent/AgentFactory.kt‎
Lines changed: 112 additions & 5 deletions b/‎src/main/kotlin/ee/carlrobert/codegpt/agent/AgentFactory.kt‎
Lines changed: 112 additions & 5 deletions
diff --git a/‎src/main/kotlin/ee/carlrobert/codegpt/agent/ProxyAIAgent.kt‎
Lines changed: 37 additions & 6 deletions b/‎src/main/kotlin/ee/carlrobert/codegpt/agent/ProxyAIAgent.kt‎
Lines changed: 37 additions & 6 deletions
diff --git a/‎src/main/kotlin/ee/carlrobert/codegpt/agent/clients/CustomOpenAIChatCompletion.kt‎
Lines changed: 2 additions & 1 deletion b/‎src/main/kotlin/ee/carlrobert/codegpt/agent/clients/CustomOpenAIChatCompletion.kt‎
Lines changed: 2 additions & 1 deletion
@@ -130,12 +130,21 @@ public ChatMessageResponseBody(
 
   public ChatMessageResponseBody withResponse(@NotNull String response) {
     try {
-      for (var item : new CompleteMessageParser().parse(response)) {
+      var parser = new CompleteMessageParser();
+      var segments = parser.parse(response);
+      if (parser.getExtractedThought() != null && !parser.getExtractedThought().isBlank()) {
+        processThinkingOutput(parser.getExtractedThought());
+      }
+      for (var item : segments) {
         processResponse(item, false);
         currentlyProcessedTextPane = null;
         currentlyProcessedEditorPanel = null;
         currentlyProcessedMermaidPanel = null;
       }
+      var thoughtProcessPanel = getExistingThoughtProcessPanel();
+      if (thoughtProcessPanel != null && !thoughtProcessPanel.isFinished()) {
+        thoughtProcessPanel.setFinished();
+      }
     } catch (Exception e) {
       LOG.error("Something went wrong while processing input", e);
     }
 
@@ -13,21 +13,33 @@ import ai.koog.agents.core.environment.ReceivedToolResult
 import ai.koog.agents.core.environment.result
 import ai.koog.agents.core.feature.handler.tool.ToolCallCompletedContext
 import ai.koog.agents.core.feature.handler.tool.ToolCallStartingContext
+import ai.koog.agents.core.tools.ToolDescriptor
 import ai.koog.agents.core.tools.ToolRegistry
 import ai.koog.agents.ext.tool.ExitTool
 import ai.koog.agents.ext.tool.shell.ShellCommandConfirmation
 import ai.koog.agents.features.eventHandler.feature.handleEvents
 import ai.koog.agents.features.tokenizer.feature.MessageTokenizer
 import ai.koog.agents.features.tokenizer.feature.tokenizer
+import ai.koog.prompt.dsl.Prompt
 import ai.koog.prompt.dsl.prompt
+import ai.koog.prompt.executor.clients.anthropic.AnthropicParams
+import ai.koog.prompt.executor.clients.anthropic.models.AnthropicThinking
 import ai.koog.prompt.executor.clients.LLMClient
+import ai.koog.prompt.executor.clients.openai.OpenAIResponsesParams
+import ai.koog.prompt.executor.clients.openai.base.models.ReasoningEffort
+import ai.koog.prompt.executor.clients.openai.models.ReasoningConfig
+import ai.koog.prompt.executor.clients.openai.models.ReasoningSummary
 import ai.koog.prompt.executor.model.PromptExecutor
+import ai.koog.prompt.llm.LLMCapability
 import ai.koog.prompt.llm.LLMProvider
+import ai.koog.prompt.llm.LLModel
 import ai.koog.prompt.message.Message
+import ai.koog.prompt.params.LLMParams
 import ai.koog.prompt.tokenizer.Tokenizer
 import com.intellij.openapi.components.service
 import com.intellij.openapi.project.Project
 import ee.carlrobert.codegpt.EncodingManager
+import ee.carlrobert.codegpt.agent.clients.CustomOpenAILLMClient
 import ee.carlrobert.codegpt.agent.clients.RetryingPromptExecutor
 import ee.carlrobert.codegpt.agent.credits.extractCreditsSnapshot
 import ee.carlrobert.codegpt.agent.tools.*
@@ -46,6 +58,8 @@ import kotlin.time.Duration.Companion.seconds
 object AgentFactory {
 
     private const val MAX_AGENT_ITERATIONS = 250
+    private const val ANTHROPIC_MIN_THINKING_BUDGET = 512
+    private const val ANTHROPIC_DEFAULT_THINKING_BUDGET = 2_048
 
     fun createAgent(
         agentType: AgentType,
@@ -170,18 +184,111 @@ object AgentFactory {
         featureType: FeatureType = FeatureType.AGENT
     ): PromptExecutor {
         val llmClient = LLMClientFactory.createClient(provider, featureType)
-        return createRetryingExecutor(llmClient, events)
-    }
-
-    private fun createRetryingExecutor(client: LLMClient, events: AgentEvents?): PromptExecutor {
         val policy = RetryingPromptExecutor.RetryPolicy(
             maxAttempts = 5,
             initialDelay = 1.seconds,
             maxDelay = 30.seconds,
             backoffMultiplier = 2.0,
             jitterFactor = 0.1
         )
-        return RetryingPromptExecutor.fromClient(client, policy, events)
+        return createRetryingExecutor(llmClient, policy, events)
+    }
+
+    internal fun createRetryingExecutor(
+        client: LLMClient,
+        policy: RetryingPromptExecutor.RetryPolicy,
+        events: AgentEvents?
+    ): PromptExecutor {
+        val executor = RetryingPromptExecutor.fromClient(client, policy, events)
+        return object : PromptExecutor {
+            override fun executeStreaming(
+                prompt: Prompt,
+                model: LLModel,
+                tools: List<ToolDescriptor>
+            ) = executor.executeStreaming(prompt.withReasoningParams(model), model, tools)
+
+            override suspend fun execute(
+                prompt: Prompt,
+                model: LLModel,
+                tools: List<ToolDescriptor>
+            ) = executor.execute(prompt.withReasoningParams(model), model, tools)
+
+            override suspend fun moderate(prompt: Prompt, model: LLModel) =
+                executor.moderate(prompt, model)
+
+            override suspend fun models() = executor.models()
+
+            override fun close() = executor.close()
+        }
+    }
+
+    private fun Prompt.withReasoningParams(model: LLModel): Prompt {
+        val params = when (model.provider) {
+            LLMProvider.OpenAI -> params.withOpenAIReasoning()
+            CustomOpenAILLMClient.CustomOpenAI -> {
+                if (model.supports(LLMCapability.OpenAIEndpoint.Responses)) {
+                    params.withOpenAIReasoning()
+                } else {
+                    params
+                }
+            }
+            LLMProvider.Anthropic -> params.withAnthropicReasoning()
+            else -> params
+        }
+        return withParams(params)
+    }
+
+    private fun LLMParams.withOpenAIReasoning(): LLMParams {
+        val base = when (this) {
+            is OpenAIResponsesParams -> this
+            else -> OpenAIResponsesParams(
+                temperature = temperature,
+                maxTokens = maxTokens,
+                numberOfChoices = numberOfChoices,
+                speculation = speculation,
+                schema = schema,
+                toolChoice = toolChoice,
+                user = user,
+                additionalProperties = additionalProperties
+            )
+        }
+        return base.copy(
+            reasoning = base.reasoning ?: ReasoningConfig(
+                effort = ReasoningEffort.MEDIUM,
+                summary = ReasoningSummary.AUTO
+            )
+        )
+    }
+
+    private fun LLMParams.withAnthropicReasoning(): LLMParams {
+        val base = when (this) {
+            is AnthropicParams -> this
+            else -> AnthropicParams(
+                temperature = temperature,
+                maxTokens = maxTokens,
+                numberOfChoices = numberOfChoices,
+                speculation = speculation,
+                schema = schema,
+                toolChoice = toolChoice,
+                user = user,
+                additionalProperties = additionalProperties
+            )
+        }
+
+        if (base.thinking != null) return base
+
+        val thinkingBudget = resolveAnthropicThinkingBudget(base.maxTokens) ?: return base
+        return base.copy(thinking = AnthropicThinking.Enabled(budgetTokens = thinkingBudget))
+    }
+
+    private fun resolveAnthropicThinkingBudget(maxTokens: Int?): Int? {
+        val limit = maxTokens ?: ANTHROPIC_DEFAULT_THINKING_BUDGET
+        if (limit <= ANTHROPIC_MIN_THINKING_BUDGET) {
+            return null
+        }
+        return (limit / 2)
+            .coerceAtLeast(ANTHROPIC_MIN_THINKING_BUDGET)
+            .coerceAtMost(ANTHROPIC_DEFAULT_THINKING_BUDGET)
     }
 
     private fun createGeneralPurposeAgent(
 
@@ -23,7 +23,6 @@ import com.intellij.openapi.components.service
 import com.intellij.openapi.project.Project
 import ee.carlrobert.codegpt.EncodingManager
 import ee.carlrobert.codegpt.agent.clients.shouldStream
-import ee.carlrobert.codegpt.agent.clients.shouldStreamCustomOpenAI
 import ee.carlrobert.codegpt.agent.strategy.CODE_AGENT_COMPRESSION
 import ee.carlrobert.codegpt.agent.strategy.HistoryCompressionConfig
 import ee.carlrobert.codegpt.agent.strategy.SingleRunStrategyProvider
@@ -35,6 +34,7 @@ import ee.carlrobert.codegpt.settings.hooks.HookManager
 import ee.carlrobert.codegpt.settings.models.ModelSettings
 import ee.carlrobert.codegpt.settings.service.FeatureType
 import ee.carlrobert.codegpt.settings.service.ServiceType
+import ee.carlrobert.codegpt.settings.service.custom.CustomServicesSettings
 import ee.carlrobert.codegpt.settings.skills.SkillDiscoveryService
 import ee.carlrobert.codegpt.toolwindow.agent.ui.approval.BashPayload
 import ee.carlrobert.codegpt.toolwindow.agent.ui.approval.ToolApprovalRequest
@@ -89,7 +89,7 @@ object ProxyAIAgent {
         val modelSelection =
             service<ModelSettings>().getModelSelectionForFeature(FeatureType.AGENT)
         val skills = project.service<SkillDiscoveryService>().listSkills()
-        val stream = shouldStreamAgentToolLoop(provider)
+        val stream = shouldStreamAgentToolLoop(project, provider)
         val projectInstructions = loadProjectInstructions(project.basePath)
         val executor = AgentFactory.createExecutor(provider, events)
         val pendingMessageQueue = pendingMessages.getOrPut(sessionId) { ArrayDeque() }
@@ -163,21 +163,43 @@ object ProxyAIAgent {
                 val toolCallToUiId: MutableMap<String, String> = HashMap()
                 val anonymousToolIds: ArrayDeque<String> = ArrayDeque()
                 val frameAdapter = ReasoningFrameTextAdapter()
+                var streamedReasoningForCurrentNode = false
 
                 onLLMStreamingFrameReceived { ctx ->
                     if (!stream) return@onLLMStreamingFrameReceived
 
-                    frameAdapter.consume(ctx.streamFrame).forEach { chunk ->
+                    val frameType = ctx.streamFrame::class.simpleName
+                        ?: ctx.streamFrame::class.qualifiedName
+                        ?: "unknown"
+                    val chunks = frameAdapter.consume(ctx.streamFrame)
+                    if (frameType.contains("Reasoning") && chunks.isNotEmpty()) {
+                        streamedReasoningForCurrentNode = true
+                    }
+
+                    chunks.forEach { chunk ->
                         if (chunk.isNotEmpty()) {
                             events.onTextReceived(chunk)
                         }
                     }
                 }
 
                 onNodeExecutionCompleted { ctx ->
-                    if (stream) return@onNodeExecutionCompleted
+                    val output = (ctx.output as? List<*>) ?: emptyList<Any?>()
+                    if (stream) {
+                        if (!streamedReasoningForCurrentNode) {
+                            output.forEach { msg ->
+                                (msg as? Message.Reasoning)?.let {
+                                    if (it.content.isNotBlank()) {
+                                        events.onTextReceived("<think>${it.content}</think>")
+                                    }
+                                }
+                            }
+                        }
+                        streamedReasoningForCurrentNode = false
+                        return@onNodeExecutionCompleted
+                    }
 
-                    (ctx.output as? List<*>)?.forEach { msg ->
+                    output.forEach { msg ->
                         (msg as? Message.Assistant)?.let {
                             events.onTextReceived(it.content)
                         }
@@ -268,10 +290,19 @@ object ProxyAIAgent {
     }
 
     private fun shouldStreamAgentToolLoop(
+        project: Project,
         provider: ServiceType,
     ): Boolean {
         return when (provider) {
-            ServiceType.CUSTOM_OPENAI -> shouldStreamCustomOpenAI(FeatureType.AGENT)
+            ServiceType.CUSTOM_OPENAI -> {
+                val selectedModel =
+                    service<ModelSettings>().getModelSelectionForFeature(FeatureType.AGENT)
+                val selectedServiceId = selectedModel.serviceId
+                val selectedService = service<CustomServicesSettings>().state.services
+                    .firstOrNull { it.id == selectedServiceId }
+                selectedService?.chatCompletionSettings?.shouldStream() == true
+            }
+
             ServiceType.GOOGLE -> false
             else -> true
         }
 
@@ -7,7 +7,8 @@ import kotlinx.serialization.json.JsonElement
 
 @Serializable
 class CustomOpenAIChatCompletionRequest(
-    val messages: List<OpenAIMessage> = emptyList(),
+    val messages: List<OpenAIMessage>? = null,
+    val input: JsonElement? = null,
     val prompt: String? = null,
     override val model: String? = null,
     override val stream: Boolean? = null,