add reasoning parsing support

hugoaguirre · hugoaguirre · commit cd07d3c1bae5 · 2026-02-11T23:37:39.000Z
diff --git a/go/plugins/ollama/ollama.go b/go/plugins/ollama/ollama.go
@@ -252,7 +252,6 @@ func (g *generator) generate(ctx context.Context, input *ai.ModelRequest, cb fun
 			Images: images,
 			Stream: stream,
 		}
-
 	} else {
 		var messages []*ollamaMessage
 		// Translate all messages to ollama message format.
@@ -289,6 +288,7 @@ func (g *generator) generate(ctx context.Context, input *ai.ModelRequest, cb fun
 	if err != nil {
 		return nil, err
 	}
+	fmt.Printf("Ollama Request Payload: %s\n", string(payloadBytes))
 
 	// Determine the correct endpoint
 	endpoint := g.serverAddress + "/api/chat"
@@ -322,6 +322,7 @@ func (g *generator) generate(ctx context.Context, input *ai.ModelRequest, cb fun
 
 		var response *ai.ModelResponse
 		if isChatModel {
+			fmt.Printf("translating chat response\n")
 			response, err = translateChatResponse(body)
 		} else {
 			response, err = translateModelResponse(body)
@@ -453,6 +454,21 @@ func translateChatResponse(responseData []byte) (*ai.ModelResponse, error) {
 			Role: ai.RoleModel,
 		},
 	}
+
+	// Check for thinking/reasoning first
+	if response.Message.Thinking != "" {
+		aiPart := ai.NewReasoningPart(response.Message.Thinking, nil)
+		modelResponse.Message.Content = append(modelResponse.Message.Content, aiPart)
+	} else if strings.Contains(response.Message.Content, "<think>") {
+		// If thinking is not explicitly returned, check if it's in the content
+		thinking, content := parseThinking(response.Message.Content)
+		if thinking != "" {
+			aiPart := ai.NewReasoningPart(thinking, nil)
+			modelResponse.Message.Content = append(modelResponse.Message.Content, aiPart)
+			response.Message.Content = content
+		}
+	}
+
 	if len(response.Message.ToolCalls) > 0 {
 		for _, toolCall := range response.Message.ToolCalls {
 			toolRequest := &ai.ToolRequest{
@@ -462,12 +478,11 @@ func translateChatResponse(responseData []byte) (*ai.ModelResponse, error) {
 			toolPart := ai.NewToolRequestPart(toolRequest)
 			modelResponse.Message.Content = append(modelResponse.Message.Content, toolPart)
 		}
-	} else if response.Message.Content != "" {
-		aiPart := ai.NewTextPart(response.Message.Content)
-		modelResponse.Message.Content = append(modelResponse.Message.Content, aiPart)
 	}
-	if response.Message.Thinking != "" {
-		aiPart := ai.NewReasoningPart(response.Message.Thinking, nil)
+
+	// Add remaining content as text if present
+	if response.Message.Content != "" {
+		aiPart := ai.NewTextPart(response.Message.Content)
 		modelResponse.Message.Content = append(modelResponse.Message.Content, aiPart)
 	}
 
@@ -502,6 +517,10 @@ func translateChatChunk(input string) (*ai.ModelResponseChunk, error) {
 		return nil, fmt.Errorf("failed to parse response JSON: %v", err)
 	}
 	chunk := &ai.ModelResponseChunk{}
+	if response.Message.Content != "" {
+		aiPart := ai.NewTextPart(response.Message.Content)
+		chunk.Content = append(chunk.Content, aiPart)
+	}
 	if len(response.Message.ToolCalls) > 0 {
 		for _, toolCall := range response.Message.ToolCalls {
 			toolRequest := &ai.ToolRequest{
@@ -511,9 +530,6 @@ func translateChatChunk(input string) (*ai.ModelResponseChunk, error) {
 			toolPart := ai.NewToolRequestPart(toolRequest)
 			chunk.Content = append(chunk.Content, toolPart)
 		}
-	} else if response.Message.Content != "" {
-		aiPart := ai.NewTextPart(response.Message.Content)
-		chunk.Content = append(chunk.Content, aiPart)
 	}
 
 	if response.Message.Thinking != "" {
@@ -593,3 +609,15 @@ func concatImages(input *ai.ModelRequest, roleFilter []ai.Role) ([]string, error
 	}
 	return images, nil
 }
+
+// parseThinking extracts the thinking content from the response string.
+func parseThinking(content string) (string, string) {
+	start := strings.Index(content, "<think>")
+	end := strings.Index(content, "</think>")
+	if start != -1 && end != -1 && end > start {
+		thinking := content[start+len("<think>") : end]
+		rest := content[:start] + content[end+len("</think>"):]
+		return strings.TrimSpace(thinking), strings.TrimSpace(rest)
+	}
+	return "", content
+}
diff --git a/go/plugins/ollama/ollama_test.go b/go/plugins/ollama/ollama_test.go
@@ -125,9 +125,102 @@ func equalContent(a, b []*ai.Part) bool {
 		return false
 	}
 	for i := range a {
-		if a[i].Text != b[i].Text || !a[i].IsText() || !b[i].IsText() {
+		if a[i].IsText() {
+			if !b[i].IsText() || a[i].Text != b[i].Text {
+				return false
+			}
+		} else if a[i].IsReasoning() {
+			if !b[i].IsReasoning() || a[i].Text != b[i].Text {
+				return false
+			}
+		} else {
+			// For other types, we might need more specific checks,
+			// but for now return false if kinds don't match or not handled
 			return false
 		}
 	}
 	return true
 }
+
+func TestTranslateChatResponse(t *testing.T) {
+	tests := []struct {
+		name          string
+		input         string
+		want          *ai.ModelResponse
+		wantReasoning string
+		wantErr       bool
+	}{
+		{
+			name:  "Thinking field present",
+			input: `{"model": "deepseek-r1", "created_at": "2024-06-20T12:34:56Z", "message": {"role": "assistant", "content": "Hello", "thinking": "I should say hello"}}`,
+			want: &ai.ModelResponse{
+				Message: &ai.Message{
+					Role: ai.RoleModel,
+					Content: []*ai.Part{
+						ai.NewReasoningPart("I should say hello", nil),
+						ai.NewTextPart("Hello"),
+					},
+				},
+			},
+			wantReasoning: "I should say hello",
+		},
+		{
+			name:  "Thinking in content tag",
+			input: `{"model": "deepseek-r1", "created_at": "2024-06-20T12:34:56Z", "message": {"role": "assistant", "content": "<think>I should say hello</think>Hello"}}`,
+			want: &ai.ModelResponse{
+				Message: &ai.Message{
+					Role: ai.RoleModel,
+					Content: []*ai.Part{
+						ai.NewReasoningPart("I should say hello", nil),
+						ai.NewTextPart("Hello"),
+					},
+				},
+			},
+			wantReasoning: "I should say hello",
+		},
+		{
+			name:  "Only thinking in content",
+			input: `{"model": "deepseek-r1", "created_at": "2024-06-20T12:34:56Z", "message": {"role": "assistant", "content": "<think>Just thinking</think>"}}`,
+			want: &ai.ModelResponse{
+				Message: &ai.Message{
+					Role: ai.RoleModel,
+					Content: []*ai.Part{
+						ai.NewReasoningPart("Just thinking", nil),
+					},
+				},
+			},
+			wantReasoning: "Just thinking",
+		},
+		{
+			name:  "No thinking",
+			input: `{"model": "llama3", "created_at": "2024-06-20T12:34:56Z", "message": {"role": "assistant", "content": "Hello"}}`,
+			want: &ai.ModelResponse{
+				Message: &ai.Message{
+					Role: ai.RoleModel,
+					Content: []*ai.Part{
+						ai.NewTextPart("Hello"),
+					},
+				},
+			},
+			wantReasoning: "",
+		},
+	}
+
+	for _, tt := range tests {
+		t.Run(tt.name, func(t *testing.T) {
+			got, err := translateChatResponse([]byte(tt.input))
+			if (err != nil) != tt.wantErr {
+				t.Errorf("translateChatResponse() error = %v, wantErr %v", err, tt.wantErr)
+				return
+			}
+			if !tt.wantErr {
+				if got.Reasoning() != tt.wantReasoning {
+					t.Errorf("translateChatResponse() Reasoning = %q, want %q", got.Reasoning(), tt.wantReasoning)
+				}
+				if !equalContent(got.Message.Content, tt.want.Message.Content) {
+					t.Errorf("translateChatResponse() got = %v, want %v", got.Message.Content, tt.want.Message.Content)
+				}
+			}
+		})
+	}
+}