feat: Add MCP tools integration and fix circular dependencies

lucaromagnoli · lucaromagnoli · commit d373369fc481 · 2025-09-29T22:42:33.000+01:00
- Add MCP tools support to LLMRequestConfig with OpenAI::ToolVariant
- Move function implementations from headers to .cpp files to avoid circular dependencies
- Fix LLMUsage redefinition by keeping single definition in OpenAITypes.h
- Update OpenAI responses API to handle tools configuration
- Enable structured output and tool calling for LLM requests
diff --git a/include/core/LLMTypes.h b/include/core/LLMTypes.h
@@ -1,10 +1,15 @@
 #pragma once
 #include <functional>
+#include <memory>
 #include <nlohmann/json.hpp>
 #include <optional>
 #include <string>
+#include <variant>
 #include <vector>
 
+// Include OpenAITypes.h to get the full definition of ToolVariant
+#include "openai/OpenAITypes.h"
+
 using json = nlohmann::json;
 
 // Context type using standard C++ vectors of generic objects
@@ -20,6 +25,7 @@ struct LLMRequestConfig {
 
     std::optional<float> temperature;  // Optional temperature (filtered by model support)
     std::optional<int> maxTokens;      // Optional max tokens
+    std::optional<std::vector<OpenAI::ToolVariant>> tools;  // Optional tools for function calling
 
     // Convenience method for any model name
     void setModel(const std::string& modelName) { model = modelName; }
@@ -31,10 +37,12 @@ struct LLMRequestConfig {
     std::string toString() const {
         std::string schemaStr = schemaObject.has_value() ? schemaObject->dump() : jsonSchema;
         std::string tempStr = temperature.has_value() ? std::to_string(*temperature) : "not set";
+        std::string toolsStr = tools.has_value() ? std::to_string(tools->size()) + " tools" : "no tools";
         return "LLMRequestConfig { client: " + client + ", model: " + getModelString() +
                ", functionName: " + functionName + ", schema: " + schemaStr +
                ", temperature: " + tempStr +
-               ", maxTokens: " + std::to_string(maxTokens.has_value() ? *maxTokens : 0) + " }";
+               ", maxTokens: " + std::to_string(maxTokens.has_value() ? *maxTokens : 0) +
+               ", tools: " + toolsStr + " }";
     }
 };
 
@@ -79,18 +87,7 @@ struct LLMRequest {
     }
 };
 
-struct LLMUsage {
-    int inputTokens = 0;
-    int outputTokens = 0;
-
-    int totalTokens() const { return inputTokens + outputTokens; }
-
-    std::string toString() const {
-        return "LLMUsage { inputTokens: " + std::to_string(inputTokens) +
-               ", outputTokens: " + std::to_string(outputTokens) +
-               ", totalTokens: " + std::to_string(totalTokens()) + " }";
-    }
-};
+// LLMUsage is now defined in OpenAITypes.h to avoid circular dependency
 
 struct LLMResponse {
     json result = json::object();
diff --git a/include/openai/OpenAITypes.h b/include/openai/OpenAITypes.h
@@ -6,7 +6,23 @@
 #include <variant>
 #include <vector>
 
-#include "core/LLMTypes.h"
+// Forward declarations to avoid circular dependency
+struct LLMRequest;
+struct LLMResponse;
+
+// Define LLMUsage here to avoid circular dependency
+struct LLMUsage {
+    int inputTokens = 0;
+    int outputTokens = 0;
+
+    int totalTokens() const { return inputTokens + outputTokens; }
+
+    std::string toString() const {
+        return "LLMUsage { inputTokens: " + std::to_string(inputTokens) +
+               ", outputTokens: " + std::to_string(outputTokens) +
+               ", totalTokens: " + std::to_string(totalTokens()) + " }";
+    }
+};
 
 using json = nlohmann::json;
 
@@ -1037,100 +1053,7 @@ const std::vector<std::string> CHAT_COMPLETION_MODELS = {"gpt-4", "gpt-4-turbo",
  * These will be implemented in the source files
  */
 
-// ResponsesRequest conversion methods
-inline ResponsesRequest ResponsesRequest::fromLLMRequest(const LLMRequest& request) {
-    ResponsesRequest responsesReq;
-    responsesReq.model = request.config.model;
-
-    // Map prompt to OpenAI instructions field
-    if (!request.prompt.empty()) {
-        responsesReq.instructions = request.prompt;
-    }
-
-    // Map context to OpenAI inputValues
-    if (!request.context.empty()) {
-        // Convert context (vector of json) to InputMessages
-        std::vector<InputMessage> messages;
-
-        for (const auto& contextItem : request.context) {
-            // Case 1: Single JSON object with role/content
-            if (contextItem.is_object() && contextItem.contains("role") &&
-                contextItem.contains("content")) {
-                InputMessage msg;
-                msg.role = InputMessage::stringToRole(contextItem["role"].get<std::string>());
-                msg.content = contextItem["content"].get<std::string>();
-                messages.push_back(msg);
-                continue;
-            }
-
-            // Case 2: Array of message-like objects [{role, content}, ...]
-            if (contextItem.is_array()) {
-                for (const auto& item : contextItem) {
-                    if (item.is_object() && item.contains("role") && item.contains("content")) {
-                        InputMessage msg;
-                        msg.role = InputMessage::stringToRole(item["role"].get<std::string>());
-                        msg.content = item["content"].get<std::string>();
-                        messages.push_back(msg);
-                    }
-                }
-                continue;
-            }
-
-            // Fallback: stringify unknown item as a user message
-            InputMessage msg;
-            msg.role = InputMessage::Role::User;
-            msg.content = contextItem.dump();
-            messages.push_back(msg);
-        }
-
-        responsesReq.input = ResponsesInput::fromContentList(messages);
-    } else if (!request.prompt.empty()) {
-        // If context is empty but prompt is present, use prompt as input
-        responsesReq.input = ResponsesInput::fromText(request.prompt);
-    } else {
-        // If both context and prompt are empty, do not set input at all
-        responsesReq.input = std::nullopt;
-    }
-    responsesReq.toolChoice =
-        ToolChoiceMode::Auto;  // Explicitly initialize to fix cppcheck warning
-    if (request.config.maxTokens.has_value() && *request.config.maxTokens > 0) {
-        responsesReq.maxOutputTokens = *request.config.maxTokens;
-    }
-    // Only set temperature if it's provided and valid
-    if (request.config.temperature.has_value() && *request.config.temperature >= 0.0f) {
-        responsesReq.temperature = static_cast<double>(*request.config.temperature);
-    }
-    if (!request.previousResponseId.empty()) {
-        responsesReq.previousResponseID = request.previousResponseId;
-    }
-
-    // Handle JSON schema for structured outputs
-    if (request.config.schemaObject.has_value()) {
-        // Use the structured schema object directly
-        const json& schemaJson = request.config.schemaObject.value();
-        // Use the function name as schema name (like aideas-core does)
-        std::string schemaName = request.config.functionName;
-        if (schemaName.empty()) {
-            schemaName = "response_schema";
-        }
-        responsesReq.text = TextOutputConfig(schemaName, schemaJson, true);
-    } else if (!request.config.jsonSchema.empty()) {
-        // Fallback to string schema for backward compatibility
-        try {
-            json schemaJson = json::parse(request.config.jsonSchema);
-            // Use the function name as schema name (like aideas-core does)
-            std::string schemaName = request.config.functionName;
-            if (schemaName.empty()) {
-                schemaName = "response_schema";
-            }
-            responsesReq.text = TextOutputConfig(schemaName, schemaJson, true);
-        } catch (const std::exception& e) {
-            throw std::runtime_error("Invalid JSON schema: " + std::string(e.what()));
-        }
-    }
-
-    return responsesReq;
-}
+// Conversion methods - implementations moved to .cpp file to avoid circular dependency
 
 inline ResponsesRequest ResponsesRequest::fromJson(const json& j) {
     ResponsesRequest req;
@@ -1246,57 +1169,7 @@ inline ResponsesResponse ResponsesResponse::fromJson(const json& j) {
     return resp;
 }
 
-inline LLMResponse ResponsesResponse::toLLMResponse(bool expectStructuredOutput) const {
-    LLMResponse llmResp;
-    llmResp.success = (status == ResponseStatus::Completed);
-    llmResp.responseId = id;
-    llmResp.usage = usage;
-
-    if (hasError()) {
-        llmResp.errorMessage = error->dump();
-    } else {
-        // Extract text output from the response
-        std::string textOutput = getOutputText();
-        if (!textOutput.empty()) {
-            if (expectStructuredOutput) {
-                // Parse as JSON for structured output
-                llmResp.result = json::parse(textOutput);
-            } else {
-                // Wrap free-form text in text field
-                llmResp.result = json{{"text", textOutput}};
-            }
-        } else {
-            llmResp.result = json::object();
-        }
-
-        // Add function calls if any
-        auto functionCalls = getFunctionCalls();
-        if (!functionCalls.empty()) {
-            json calls = json::array();
-            std::transform(functionCalls.begin(), functionCalls.end(), std::back_inserter(calls),
-                           [](const FunctionCall& call) {
-                               return json{{"id", call.id},
-                                           {"name", call.name},
-                                           {"arguments", call.arguments}};
-                           });
-            llmResp.result["function_calls"] = calls;
-        }
-
-        // Add images if any
-        auto images = getImageGenerations();
-        if (!images.empty()) {
-            json imageArray = json::array();
-            for (const auto& img : images) {
-                if (img.result) {
-                    imageArray.push_back(*img.result);
-                }
-            }
-            llmResp.result["images"] = imageArray;
-        }
-    }
-
-    return llmResp;
-}
+// Implementation moved to .cpp file
 
 // Convenience methods for ResponsesResponse
 inline std::string ResponsesResponse::getOutputText() const {
@@ -1338,49 +1211,7 @@ inline std::vector<ImageGenerationCall> ResponsesResponse::getImageGenerations()
 }
 
 // ChatCompletionRequest conversion methods
-inline ChatCompletionRequest ChatCompletionRequest::fromLLMRequest(const LLMRequest& request) {
-    ChatCompletionRequest chatReq;
-    chatReq.model = request.config.model;
-
-    // Convert prompt to messages
-    if (!request.prompt.empty()) {
-        ChatMessage userMsg;
-        userMsg.role = "user";
-        userMsg.content = request.prompt;
-        chatReq.messages.push_back(userMsg);
-    }
-
-    if (request.config.maxTokens.has_value() && *request.config.maxTokens > 0) {
-        chatReq.maxTokens = *request.config.maxTokens;
-    }
-    // Only set temperature if it's provided and valid
-    if (request.config.temperature.has_value() && *request.config.temperature >= 0.0f) {
-        chatReq.temperature = static_cast<double>(*request.config.temperature);
-    }
-
-    return chatReq;
-}
-
-inline LLMRequest ChatCompletionRequest::toLLMRequest() const {
-    LLMRequestConfig config;
-    config.client = "openai";
-    config.model = model;
-    if (temperature) config.temperature = static_cast<float>(*temperature);
-    if (maxTokens) config.maxTokens = *maxTokens;
-
-    std::string prompt;
-    if (!messages.empty()) {
-        // Use the last user message as prompt
-        for (auto it = messages.rbegin(); it != messages.rend(); ++it) {
-            if (it->role == "user") {
-                prompt = it->content;
-                break;
-            }
-        }
-    }
-
-    return LLMRequest(config, prompt);
-}
+// Implementation moved to .cpp file
 
 // ChatCompletionResponse conversion methods
 inline ChatCompletionResponse ChatCompletionResponse::fromJson(const json& j) {
@@ -1411,41 +1242,12 @@ inline ChatCompletionResponse ChatCompletionResponse::fromJson(const json& j) {
     return resp;
 }
 
-inline LLMResponse ChatCompletionResponse::toLLMResponse(bool expectStructuredOutput) const {
-    LLMResponse llmResp;
-    llmResp.success = !choices.empty();
-    llmResp.responseId = id;
-    llmResp.usage = usage;
-
-    if (!choices.empty()) {
-        llmResp.result = json::object();
-        llmResp.result["text"] = choices[0].message.content;
-        if (choices[0].message.toolCalls) {
-            llmResp.result["tool_calls"] = *choices[0].message.toolCalls;
-        }
-    } else {
-        llmResp.errorMessage = "No choices returned";
-    }
-
-    return llmResp;
-}
+// Implementation moved to .cpp file
 
 /**
  * Utility functions implementation
  */
-inline ApiType detectApiType(const LLMRequest& request) {
-    const std::string& model = request.config.model;
-
-    // Check if it's a Responses API model
-    if (std::any_of(
-            RESPONSES_MODELS.begin(), RESPONSES_MODELS.end(),
-            [&model](const std::string& responsesModel) { return model == responsesModel; })) {
-        return ApiType::RESPONSES;
-    }
-
-    // Default to Chat Completions for most models
-    return ApiType::CHAT_COMPLETIONS;
-}
+// Implementation moved to .cpp file to avoid circular dependency
 
 inline bool supportsResponses(const std::string& model) {
     return std::any_of(
diff --git a/src/openai/OpenAIResponsesApi.cpp b/src/openai/OpenAIResponsesApi.cpp
@@ -5,10 +5,12 @@
 #include <stdexcept>
 
 #include "openai/OpenAIHttpClient.h"
+#include "core/LLMTypes.h"  // Include for complete type definitions
 
 OpenAIResponsesApi::OpenAIResponsesApi(std::shared_ptr<OpenAIHttpClient> httpClient)
     : httpClient_(std::move(httpClient)) {}
 
+
 // Core Responses API methods
 OpenAI::ResponsesResponse OpenAIResponsesApi::create(const OpenAI::ResponsesRequest& request) {
     try {
diff --git a/src/openai/OpenAITypes.cpp b/src/openai/OpenAITypes.cpp