Merge pull request #40 from lucaromagnoli/feat/gpt5

lucaromagnoli · web-flow · commit 2fe289b9b4fd · 2025-08-08T19:04:26.000+01:00
Feat/gpt5
diff --git a/include/openai/OpenAITypes.h b/include/openai/OpenAITypes.h
@@ -17,6 +17,9 @@ namespace OpenAI {
  * Provides type safety and IDE auto-completion for model selection
  */
 enum class Model {
+    // GPT-5 series (Latest - 2025)
+    GPT_5,  // gpt-5 - Next-generation model
+
     // O3 series (Latest - 2025)
     O3,       // o3 - Latest reasoning model
     O3_Mini,  // o3-mini - Cost-effective reasoning model
@@ -56,6 +59,8 @@ enum class Model {
  */
 inline std::string toString(Model model) {
     switch (model) {
+        case Model::GPT_5:
+            return "gpt-5";
         case Model::O3:
             return "o3";
         case Model::O3_Mini:
@@ -96,6 +101,7 @@ inline std::string toString(Model model) {
  * Convert API string to OpenAI Model enum
  */
 inline Model modelFromString(const std::string& modelStr) {
+    if (modelStr == "gpt-5") return Model::GPT_5;
     if (modelStr == "o3") return Model::O3;
     if (modelStr == "o3-mini") return Model::O3_Mini;
     if (modelStr == "o1") return Model::O1;
@@ -119,6 +125,7 @@ inline Model modelFromString(const std::string& modelStr) {
  */
 inline bool supportsStructuredOutputs(Model model) {
     switch (model) {
+        case Model::GPT_5:
         case Model::O3:
         case Model::O3_Mini:
         case Model::O1:
@@ -592,7 +599,7 @@ struct McpApprovalResponse {
 };
 
 // Response status enumeration
-enum class ResponseStatus { Queued, InProgress, Completed, Failed, Cancelled };
+enum class ResponseStatus { Queued, InProgress, Completed, Failed, Cancelled, Incomplete };
 
 inline std::string toString(ResponseStatus status) {
     switch (status) {
@@ -606,6 +613,8 @@ inline std::string toString(ResponseStatus status) {
             return "failed";
         case ResponseStatus::Cancelled:
             return "cancelled";
+        case ResponseStatus::Incomplete:
+            return "incomplete";
     }
     return "";
 }
@@ -616,6 +625,7 @@ inline ResponseStatus responseStatusFromString(const std::string& str) {
     if (str == "completed") return ResponseStatus::Completed;
     if (str == "failed") return ResponseStatus::Failed;
     if (str == "cancelled") return ResponseStatus::Cancelled;
+    if (str == "incomplete") return ResponseStatus::Incomplete;
     throw std::invalid_argument("Invalid response status: " + str);
 }
 
@@ -656,11 +666,11 @@ struct ResponsesRequest {
         // Convert model string to enum for easier checking
         auto modelEnum = modelFromString(model);
 
-        // Reasoning models (O-series) have different parameter support
-        if (modelEnum == Model::O3 || modelEnum == Model::O3_Mini || modelEnum == Model::O1 ||
-            modelEnum == Model::O1_Mini || modelEnum == Model::O1_Preview ||
-            modelEnum == Model::O1_Pro || modelEnum == Model::O4_Mini ||
-            modelEnum == Model::O4_Mini_Deep_Research) {
+        // Reasoning models (O-series + GPT-5) have different parameter support
+        if (modelEnum == Model::GPT_5 || modelEnum == Model::O3 || modelEnum == Model::O3_Mini ||
+            modelEnum == Model::O1 || modelEnum == Model::O1_Mini ||
+            modelEnum == Model::O1_Preview || modelEnum == Model::O1_Pro ||
+            modelEnum == Model::O4_Mini || modelEnum == Model::O4_Mini_Deep_Research) {
             // Parameters NOT supported by reasoning models
             if (paramName == "temperature" || paramName == "top_p" || paramName == "top_logprobs" ||
                 paramName == "truncation") {
@@ -1004,8 +1014,8 @@ std::string getRecommendedApiForModel(const std::string& model);
 
 // Model lists for different APIs
 const std::vector<std::string> RESPONSES_MODELS = {
-    "gpt-4o", "gpt-4o-mini", "gpt-4.1", "gpt-4.1-nano", "gpt-4.1-mini",        "gpt-image-1",
-    "o1",     "o3-mini",     "o3",      "o4-mini",      "computer-use-preview"};
+    "gpt-5",       "gpt-4o", "gpt-4o-mini", "gpt-4.1", "gpt-4.1-nano", "gpt-4.1-mini",
+    "gpt-image-1", "o1",     "o3-mini",     "o3",      "o4-mini",      "computer-use-preview"};
 
 const std::vector<std::string> CHAT_COMPLETION_MODELS = {"gpt-4", "gpt-4-turbo", "gpt-4o",
                                                          "gpt-4o-mini", "gpt-3.5-turbo"};
@@ -1029,21 +1039,38 @@ inline ResponsesRequest ResponsesRequest::fromLLMRequest(const LLMRequest& reque
     if (!request.context.empty()) {
         // Convert context (vector of json) to InputMessages
         std::vector<InputMessage> messages;
+
         for (const auto& contextItem : request.context) {
+            // Case 1: Single JSON object with role/content
             if (contextItem.is_object() && contextItem.contains("role") &&
                 contextItem.contains("content")) {
                 InputMessage msg;
                 msg.role = InputMessage::stringToRole(contextItem["role"].get<std::string>());
                 msg.content = contextItem["content"].get<std::string>();
                 messages.push_back(msg);
-            } else {
-                // If it's not a proper message format, treat as user message
-                InputMessage msg;
-                msg.role = InputMessage::Role::User;
-                msg.content = contextItem.dump();
-                messages.push_back(msg);
+                continue;
             }
+
+            // Case 2: Array of message-like objects [{role, content}, ...]
+            if (contextItem.is_array()) {
+                for (const auto& item : contextItem) {
+                    if (item.is_object() && item.contains("role") && item.contains("content")) {
+                        InputMessage msg;
+                        msg.role = InputMessage::stringToRole(item["role"].get<std::string>());
+                        msg.content = item["content"].get<std::string>();
+                        messages.push_back(msg);
+                    }
+                }
+                continue;
+            }
+
+            // Fallback: stringify unknown item as a user message
+            InputMessage msg;
+            msg.role = InputMessage::Role::User;
+            msg.content = contextItem.dump();
+            messages.push_back(msg);
         }
+
         responsesReq.input = ResponsesInput::fromContentList(messages);
     } else if (!request.prompt.empty()) {
         // If context is empty but prompt is present, use prompt as input
diff --git a/src/openai/OpenAIClient.cpp b/src/openai/OpenAIClient.cpp
@@ -166,7 +166,22 @@ OpenAI::ResponsesResponse OpenAIClient::sendResponsesRequest(
         throw std::invalid_argument("Invalid request: " + errorMessage);
     }
 
-    return responsesApi_->create(request);
+    // Create initial response
+    auto response = responsesApi_->create(request);
+
+    // If the model returns a non-completed status (e.g., queued/in_progress/incomplete),
+    // poll until completion or failure. This particularly affects reasoning models like GPT-5.
+    if (!response.isCompleted() && !response.id.empty()) {
+        try {
+            // Reasonable defaults: wait up to 90s, polling every 2s
+            response = responsesApi_->waitForCompletion(response.id, /*timeoutSeconds=*/90,
+                                                       /*pollIntervalSeconds=*/2);
+        } catch (const std::exception& /*e*/) {
+            // Fall through and return the last known response (likely non-completed)
+        }
+    }
+
+    return response;
 }
 
 std::future<OpenAI::ResponsesResponse> OpenAIClient::sendResponsesRequestAsync(
@@ -337,7 +352,7 @@ OpenAI::Model OpenAIClient::stringToModel(const std::string& modelStr) {
 }
 
 std::vector<OpenAI::Model> OpenAIClient::getAvailableModelEnums() {
-    return {OpenAI::Model::GPT_4_1,       OpenAI::Model::GPT_4_1_Mini, OpenAI::Model::GPT_4_1_Nano,
-            OpenAI::Model::GPT_4o,        OpenAI::Model::GPT_4o_Mini,  OpenAI::Model::GPT_4_5,
-            OpenAI::Model::GPT_3_5_Turbo, OpenAI::Model::Custom};
+    return {OpenAI::Model::GPT_5,        OpenAI::Model::GPT_4_1,       OpenAI::Model::GPT_4_1_Mini,
+            OpenAI::Model::GPT_4_1_Nano, OpenAI::Model::GPT_4o,        OpenAI::Model::GPT_4o_Mini,
+            OpenAI::Model::GPT_4_5,      OpenAI::Model::GPT_3_5_Turbo, OpenAI::Model::Custom};
 }
diff --git a/src/openai/OpenAIHttpClient.cpp b/src/openai/OpenAIHttpClient.cpp
@@ -108,7 +108,6 @@ class OpenAIHttpClient::HttpClientImpl {
     httplib::Headers buildHeaders() const {
         httplib::Headers headers;
         headers.emplace("Authorization", "Bearer " + config_.apiKey);
-        headers.emplace("Content-Type", "application/json");
         headers.emplace("User-Agent", "llmcpp/1.0.0");
 
         if (!config_.organization.empty()) {
@@ -254,7 +253,6 @@ std::unordered_map<std::string, std::string> OpenAIHttpClient::buildHeaders(
     const json& requestBody [[maybe_unused]]) const {
     std::unordered_map<std::string, std::string> headers;
     headers["Authorization"] = "Bearer " + config_.apiKey;
-    headers["Content-Type"] = "application/json";
     headers["User-Agent"] = userAgent_;
 
     if (!config_.organization.empty()) {
diff --git a/src/openai/OpenAIResponsesApi.cpp b/src/openai/OpenAIResponsesApi.cpp
@@ -34,6 +34,20 @@ OpenAI::ResponsesResponse OpenAIResponsesApi::create(const OpenAI::ResponsesRequ
         // Parse the JSON response
         json responseJson = json::parse(httpResponse.body);
 
+        // Extra debug for GPT-5 incomplete
+        try {
+            auto model = OpenAI::safeGetRequiredJson<std::string>(responseJson, "model");
+            auto status = OpenAI::safeGetJson(responseJson, "status", std::string(""));
+            if (model == "gpt-5" && status != "completed") {
+                std::cerr << "⚠️ GPT-5 non-completed status: " << status << std::endl;
+                if (responseJson.contains("incomplete_details")) {
+                    std::cerr << "⚠️ Incomplete details: "
+                              << responseJson["incomplete_details"].dump(2) << std::endl;
+                }
+            }
+        } catch (...) {
+        }
+
         // Check for API errors using safe JSON function
         auto error = OpenAI::safeGetOptionalJson<json>(responseJson, "error");
         if (error.has_value()) {
@@ -142,7 +156,8 @@ OpenAI::ResponsesResponse OpenAIResponsesApi::waitForCompletion(const std::strin
                                                                 int timeoutSeconds [[maybe_unused]],
                                                                 int pollIntervalSeconds
                                                                 [[maybe_unused]]) {
-    throw std::runtime_error("OpenAIResponsesApi::waitForCompletion not yet implemented");
+    const int maxAttempts = std::max(1, timeoutSeconds / std::max(1, pollIntervalSeconds));
+    return pollForCompletion(responseId, maxAttempts, pollIntervalSeconds);
 }
 
 std::future<OpenAI::ResponsesResponse> OpenAIResponsesApi::resumeStreaming(
@@ -399,6 +414,15 @@ OpenAI::ResponsesResponse OpenAIResponsesApi::pollForCompletion(const std::strin
                                                                 int maxAttempts [[maybe_unused]],
                                                                 int intervalSeconds
                                                                 [[maybe_unused]]) {
-    // TODO: Implement polling
-    throw std::runtime_error("OpenAIResponsesApi::pollForCompletion not yet implemented");
+    for (int attempt = 0; attempt < maxAttempts; ++attempt) {
+        auto resp = retrieve(responseId);
+        if (resp.status == OpenAI::ResponseStatus::Completed ||
+            resp.status == OpenAI::ResponseStatus::Failed ||
+            resp.status == OpenAI::ResponseStatus::Cancelled) {
+            return resp;
+        }
+        std::this_thread::sleep_for(std::chrono::seconds(std::max(1, intervalSeconds)));
+    }
+    // Final retrieve before giving up
+    return retrieve(responseId);
 }
diff --git a/tests/integration/test_openai_integration.cpp b/tests/integration/test_openai_integration.cpp
@@ -3,6 +3,8 @@
 #include <fstream>
 #include <iostream>
 #include <nlohmann/json.hpp>
+#include <chrono>
+#include <thread>
 
 #include "core/ClientManager.h"
 #include "core/LLMTypes.h"
@@ -84,7 +86,6 @@ TEST_CASE("OpenAI Integration - Simple text completion", "[openai][integration][
         LLMRequestConfig config;
         config.client = "openai";
         config.model = "gpt-4o-mini";  // Cheaper model for testing
-        config.maxTokens = 50;
         config.temperature = 0.1f;  // Low temperature for predictable results
 
         json context = json::array({json{{"role", "user"}, {"content", "What is 2+2?"}}});
@@ -94,7 +95,6 @@ TEST_CASE("OpenAI Integration - Simple text completion", "[openai][integration][
 
         std::cout << "Making API call to OpenAI..." << std::endl;
         auto response = client.sendRequest(request);
-
         REQUIRE(response.success == true);
         REQUIRE(response.errorMessage.empty());
         REQUIRE(!response.responseId.empty());
@@ -112,6 +112,95 @@ TEST_CASE("OpenAI Integration - Simple text completion", "[openai][integration][
             std::cout << "Output: " << response.result["text"].get<std::string>() << std::endl;
         }
     }
+
+    SECTION("Basic text completion with gpt-5 (no temperature, reasoning)") {
+        OpenAIClient client(apiKey);
+
+        LLMRequestConfig config;
+        config.client = "openai";
+        config.model = "gpt-5";  // Try GPT-5
+        // Do not set temperature; GPT-5 treated as reasoning model
+
+        json context = json::array({json{{"role", "user"}, {"content", "What is 5+7?"}}});
+
+        LLMRequest request(config, "You are a math assistant. Answer with just the number.",
+                           context);
+
+        std::cout << "Making API call to OpenAI (gpt-5)..." << std::endl;
+        auto response = client.sendRequest(request);
+        if (!response.success) {
+            std::cout << "❌ GPT-5 request failed. Error: " << response.errorMessage << std::endl;
+            std::cout << "🔎 Full result: " << response.result.dump(2) << std::endl;
+        }
+        REQUIRE(response.success == true);
+        REQUIRE(response.errorMessage.empty());
+        REQUIRE(!response.responseId.empty());
+        REQUIRE(response.usage.inputTokens > 0);
+        REQUIRE(response.usage.outputTokens > 0);
+
+        REQUIRE((response.result.contains("text") || response.result.contains("choices")));
+    }
+
+    SECTION("GPT-5 structured output via Responses API") {
+        OpenAIClient client(apiKey);
+
+        LLMRequestConfig config;
+        config.client = "openai";
+        config.model = "gpt-5";  // Reasoning family, omit temperature
+        config.functionName = "sum_two";
+
+        auto schema = OpenAIResponsesSchemaBuilder("sum_two")
+                           .property("result", JsonSchemaBuilder::integer())
+                           .required({"result"})
+                           .additionalProperties(false)
+                           .buildSchema();
+        config.schemaObject = schema;
+
+        json context = json::array({json{{"role", "user"}, {"content", "Return only JSON."}}});
+
+        LLMRequest request(config,
+                           "Sum 5 and 7. Respond only with the sum_two JSON: {\\\"result\\\": 12}.",
+                           context);
+
+        std::cout << "Making structured API call to OpenAI (gpt-5)..." << std::endl;
+        auto response = client.sendRequest(request);
+        if (!response.success) {
+            std::cout << "❌ GPT-5 structured request failed. Error: " << response.errorMessage
+                      << std::endl;
+            std::cout << "🔎 Full result: " << response.result.dump(2) << std::endl;
+        }
+        REQUIRE(response.success == true);
+        REQUIRE(!response.responseId.empty());
+        REQUIRE(response.result.contains("text"));
+
+        auto text = response.result["text"].get<std::string>();
+        auto parsed = json::parse(text);
+        REQUIRE(parsed.contains("result"));
+        REQUIRE(parsed["result"].is_number());
+        REQUIRE(parsed["result"].get<int>() == 12);
+    }
+
+    SECTION("GPT-5 should not fail authentication with valid key") {
+        OpenAIClient client(apiKey);
+
+        LLMRequestConfig config;
+        config.client = "openai";
+        config.model = "gpt-5";  // Reasoning family
+
+        LLMRequest request(config, "Say OK");
+
+        std::cout << "Auth check call to GPT-5..." << std::endl;
+        auto response = client.sendRequest(request);
+        if (!response.success) {
+            // If we ever get invalid_api_key here, make it explicit
+            bool invalidKey = response.errorMessage.find("invalid_api_key") != std::string::npos ||
+                              response.errorMessage.find("Incorrect API key") != std::string::npos;
+            if (invalidKey) {
+                FAIL("Received invalid_api_key from OpenAI for GPT-5 despite OPENAI_API_KEY being set.");
+            }
+        }
+        REQUIRE(response.success == true);
+    }
 }
 
 TEST_CASE("OpenAI Integration - Async request", "[openai][integration][manual]") {
diff --git a/tests/integration/test_simple_integration.cpp b/tests/integration/test_simple_integration.cpp
@@ -101,7 +101,7 @@ TEST_CASE("OpenAI Integration - Simple request", "[openai][integration]") {
         LLMRequestConfig config;
         config.client = "openai";
         config.model = "gpt-4o-mini";  // Use cheaper model for testing
-        config.maxTokens = 20;         // Limit tokens to minimize cost
+        // Do not set maxTokens explicitly; let server default decide
         config.temperature = 0.1f;     // Low temperature for consistency
 
         LLMRequest request(config, "Say 'Hello, World!' and nothing else.");
diff --git a/tests/unit/test_model_enum.cpp b/tests/unit/test_model_enum.cpp
@@ -5,6 +5,7 @@
 
 TEST_CASE("OpenAI Model enum functionality", "[openai][model][enum]") {
     SECTION("Model enum to string conversion") {
+        REQUIRE(OpenAIClient::modelToString(OpenAI::Model::GPT_5) == "gpt-5");
         REQUIRE(OpenAIClient::modelToString(OpenAI::Model::GPT_4_1) == "gpt-4.1");
         REQUIRE(OpenAIClient::modelToString(OpenAI::Model::GPT_4_1_Mini) == "gpt-4.1-mini");
         REQUIRE(OpenAIClient::modelToString(OpenAI::Model::GPT_4_1_Nano) == "gpt-4.1-nano");
@@ -16,6 +17,7 @@ TEST_CASE("OpenAI Model enum functionality", "[openai][model][enum]") {
     }
 
     SECTION("String to Model enum conversion") {
+        REQUIRE(OpenAIClient::stringToModel("gpt-5") == OpenAI::Model::GPT_5);
         REQUIRE(OpenAIClient::stringToModel("gpt-4.1") == OpenAI::Model::GPT_4_1);
         REQUIRE(OpenAIClient::stringToModel("gpt-4.1-mini") == OpenAI::Model::GPT_4_1_Mini);
         REQUIRE(OpenAIClient::stringToModel("gpt-4.1-nano") == OpenAI::Model::GPT_4_1_Nano);
@@ -29,6 +31,7 @@ TEST_CASE("OpenAI Model enum functionality", "[openai][model][enum]") {
     SECTION("Model support checking") {
         OpenAIClient client("test-key");
 
+        REQUIRE(client.isModelSupported(OpenAI::Model::GPT_5) == true);
         REQUIRE(client.isModelSupported(OpenAI::Model::GPT_4_1) == true);
         REQUIRE(client.isModelSupported(OpenAI::Model::GPT_4o_Mini) == true);
         REQUIRE(client.isModelSupported(OpenAI::Model::GPT_3_5_Turbo) == true);
@@ -37,9 +40,10 @@ TEST_CASE("OpenAI Model enum functionality", "[openai][model][enum]") {
 
     SECTION("Available model enums") {
         auto models = OpenAIClient::getAvailableModelEnums();
-        REQUIRE(models.size() >= 8);  // Should include all defined models
+        REQUIRE(models.size() >= 9);  // Should include all defined models
 
         // Check that all expected models are present
+        REQUIRE(std::find(models.begin(), models.end(), OpenAI::Model::GPT_5) != models.end());
         REQUIRE(std::find(models.begin(), models.end(), OpenAI::Model::GPT_4_1) != models.end());
         REQUIRE(std::find(models.begin(), models.end(), OpenAI::Model::GPT_4_1_Mini) !=
                 models.end());