feat: improve OpenAI response handling and token usage reporting (#246)

appleboy · web-flow · commit b6af6b16d4df · 2025-08-10T11:09:05.000+08:00
- Ignore errors when determining if the config file exists before creating it
- Add support for returning detailed prompt token usage in OpenAI responses
- Use MaxCompletionTokens instead of MaxTokens when specifying completion limits
- Remove redundant handling for O-series OpenAI models in completion requests

Signed-off-by: appleboy &lt;appleboy.tw@gmail.com&gt;
diff --git a/cmd/cmd.go b/cmd/cmd.go
@@ -71,11 +71,7 @@ func initConfig() {
 	if cfgFile != "" {
 		// Use config file from the flag.
 		viper.SetConfigFile(cfgFile)
-		exists, err := file.IsFile(cfgFile)
-		if err != nil {
-			// Config file status could not be determined; handle or ignore as needed
-			// Optionally: log.Fatalf("failed to check if config file %s is a file: %v", cfgFile, err)
-		}
+		exists, _ := file.IsFile(cfgFile)
 		if !exists {
 			// Config file not found; ignore error if desired
 			_, err := os.Create(cfgFile)
diff --git a/provider/openai/openai.go b/provider/openai/openai.go
@@ -49,6 +49,7 @@ func (c *Client) Completion(ctx context.Context, content string) (*core.Response
 			CompletionTokens:        resp.Usage.CompletionTokens,
 			TotalTokens:             resp.Usage.TotalTokens,
 			CompletionTokensDetails: resp.Usage.CompletionTokensDetails,
+			PromptTokensDetails:     resp.Usage.PromptTokensDetails,
 		},
 	}, nil
 }
@@ -75,6 +76,7 @@ func (c *Client) GetSummaryPrefix(ctx context.Context, content string) (*core.Re
 		CompletionTokens:        resp.Usage.CompletionTokens,
 		TotalTokens:             resp.Usage.TotalTokens,
 		CompletionTokensDetails: resp.Usage.CompletionTokensDetails,
+		PromptTokensDetails:     resp.Usage.PromptTokensDetails,
 	}
 	if len(msg.ToolCalls) == 0 {
 		return &core.Response{
@@ -104,12 +106,12 @@ func (c *Client) CreateFunctionCall(
 	}
 
 	req := openai.ChatCompletionRequest{
-		Model:            c.model,
-		MaxTokens:        c.maxTokens,
-		Temperature:      c.temperature,
-		TopP:             c.topP,
-		FrequencyPenalty: c.frequencyPenalty,
-		PresencePenalty:  c.presencePenalty,
+		Model:               c.model,
+		MaxCompletionTokens: c.maxTokens,
+		Temperature:         c.temperature,
+		TopP:                c.topP,
+		FrequencyPenalty:    c.frequencyPenalty,
+		PresencePenalty:     c.presencePenalty,
 		Messages: []openai.ChatCompletionMessage{
 			{
 				Role:    openai.ChatMessageRoleAssistant,
@@ -129,11 +131,6 @@ func (c *Client) CreateFunctionCall(
 		},
 	}
 
-	if checkOSeriesModels.MatchString(c.model) {
-		req.MaxTokens = 0
-		req.MaxCompletionTokens = c.maxTokens
-	}
-
 	return c.client.CreateChatCompletion(ctx, req)
 }
 
@@ -143,12 +140,12 @@ func (c *Client) CreateChatCompletion(
 	content string,
 ) (resp openai.ChatCompletionResponse, err error) {
 	req := openai.ChatCompletionRequest{
-		Model:            c.model,
-		MaxTokens:        c.maxTokens,
-		Temperature:      c.temperature,
-		TopP:             c.topP,
-		FrequencyPenalty: c.frequencyPenalty,
-		PresencePenalty:  c.presencePenalty,
+		Model:               c.model,
+		MaxCompletionTokens: c.maxTokens,
+		Temperature:         c.temperature,
+		TopP:                c.topP,
+		FrequencyPenalty:    c.frequencyPenalty,
+		PresencePenalty:     c.presencePenalty,
 		Messages: []openai.ChatCompletionMessage{
 			{
 				Role:    openai.ChatMessageRoleAssistant,
@@ -161,11 +158,6 @@ func (c *Client) CreateChatCompletion(
 		},
 	}
 
-	if checkOSeriesModels.MatchString(c.model) {
-		req.MaxTokens = 0
-		req.MaxCompletionTokens = c.maxTokens
-	}
-
 	return c.client.CreateChatCompletion(ctx, req)
 }