fix

codelion · codelion · commit fd23db31b0d2 · 2025-09-09T02:31:00.000+08:00
diff --git a/optillm/plugins/proxy_plugin.py b/optillm/plugins/proxy_plugin.py
@@ -54,7 +54,9 @@ def run(system_prompt: str, initial_query: str, client, model: str,
                     {"role": "user", "content": initial_query}
                 ]
             )
-            return response.choices[0].message.content, response.usage.completion_tokens
+            # Return full response dict to preserve all usage information
+            response_dict = response.model_dump() if hasattr(response, 'model_dump') else response
+            return response_dict, 0
         
         # Create or reuse proxy client to maintain state (important for round-robin)
         config_key = str(config)  # Simple config-based cache key
@@ -128,7 +130,9 @@ def run(system_prompt: str, initial_query: str, client, model: str,
             **(request_config or {})
         )
         
-        return response.choices[0].message.content, response.usage.completion_tokens
+        # Return full response dict to preserve all usage information
+        response_dict = response.model_dump() if hasattr(response, 'model_dump') else response
+        return response_dict, 0
         
     except Exception as e:
         logger.error(f"Proxy plugin error: {e}", exc_info=True)
@@ -141,4 +145,6 @@ def run(system_prompt: str, initial_query: str, client, model: str,
                 {"role": "user", "content": initial_query}
             ]
         )
-        return response.choices[0].message.content, response.usage.completion_tokens
+        # Return full response dict to preserve all usage information
+        response_dict = response.model_dump() if hasattr(response, 'model_dump') else response
+        return response_dict, 0
diff --git a/optillm/server.py b/optillm/server.py
@@ -788,6 +788,22 @@ def proxy():
 
         # Handle non-none approaches with n attempts
         response, completion_tokens = execute_n_times(n, approaches, operation, system_prompt, initial_query, client, model, request_config, request_id)
+        
+        # Check if the response is a full dict (like from proxy plugin or none approach)
+        if operation == 'SINGLE' and isinstance(response, dict) and 'choices' in response and 'usage' in response:
+            # This is a full response dict, return it directly
+            if conversation_logger and request_id:
+                conversation_logger.log_final_response(request_id, response)
+                conversation_logger.finalize_conversation(request_id)
+            
+            if stream:
+                if request_id:
+                    logger.info(f'Request {request_id}: Completed (streaming response)')
+                return Response(generate_streaming_response(extract_contents(response), model), content_type='text/event-stream')
+            else:
+                if request_id:
+                    logger.info(f'Request {request_id}: Completed')
+                return jsonify(response), 200
 
     except Exception as e:
         # Log error to conversation logger if enabled

Original file line number	Diff line number	Diff line change
`@@ -54,7 +54,9 @@ def run(system_prompt: str, initial_query: str, client, model: str,`
`54`	`54`	`{"role": "user", "content": initial_query}`
`55`	`55`	`]`
`56`	`56`	`)`
`57`		`- return response.choices[0].message.content, response.usage.completion_tokens`
	`57`	`+ # Return full response dict to preserve all usage information`
	`58`	`+ response_dict = response.model_dump() if hasattr(response, 'model_dump') else response`
	`59`	`+ return response_dict, 0`
`58`	`60`
`59`	`61`	`# Create or reuse proxy client to maintain state (important for round-robin)`
`60`	`62`	`config_key = str(config) # Simple config-based cache key`
`@@ -128,7 +130,9 @@ def run(system_prompt: str, initial_query: str, client, model: str,`
`128`	`130`	`**(request_config or {})`
`129`	`131`	`)`
`130`	`132`
`131`		`- return response.choices[0].message.content, response.usage.completion_tokens`
	`133`	`+ # Return full response dict to preserve all usage information`
	`134`	`+ response_dict = response.model_dump() if hasattr(response, 'model_dump') else response`
	`135`	`+ return response_dict, 0`
`132`	`136`
`133`	`137`	`except Exception as e:`
`134`	`138`	`logger.error(f"Proxy plugin error: {e}", exc_info=True)`
`@@ -141,4 +145,6 @@ def run(system_prompt: str, initial_query: str, client, model: str,`
`141`	`145`	`{"role": "user", "content": initial_query}`
`142`	`146`	`]`
`143`	`147`	`)`
`144`		`- return response.choices[0].message.content, response.usage.completion_tokens`
	`148`	`+ # Return full response dict to preserve all usage information`
	`149`	`+ response_dict = response.model_dump() if hasattr(response, 'model_dump') else response`
	`150`	`+ return response_dict, 0`