Merge pull request #747 from teramawi/issue-746

stephanj · web-flow · commit 2be102ca804a · 2025-07-14T08:12:57.000+02:00
Issue 746 - use temperature and topP 1,0 for azure openai reasoning models
diff --git a/src/main/java/com/devoxx/genie/chatmodel/cloud/azureopenai/AzureOpenAIChatModelFactory.java b/src/main/java/com/devoxx/genie/chatmodel/cloud/azureopenai/AzureOpenAIChatModelFactory.java
@@ -18,24 +18,46 @@
 
 public class AzureOpenAIChatModelFactory implements ChatModelFactory {
 
-    private final ModelProvider MODEL_PROVIDER = ModelProvider.AzureOpenAI;;
+    private final ModelProvider MODEL_PROVIDER = ModelProvider.AzureOpenAI;
 
     @Override
     public ChatLanguageModel createChatModel(@NotNull ChatModel chatModel) {
-        boolean isO1 = chatModel.getModelName().startsWith("o1-");
+        String modelName = chatModel.getModelName();
+
+        boolean isReasoningModel = isReasoningModelWithLimitedParameters(modelName);
 
         final var builder = AzureOpenAiChatModel.builder()
                 .apiKey(getApiKey(MODEL_PROVIDER))
                 .deploymentName(DevoxxGenieStateService.getInstance().getAzureOpenAIDeployment())
                 .maxRetries(chatModel.getMaxRetries())
+                .temperature(isReasoningModel ? 1.0 : chatModel.getTemperature())
                 .timeout(Duration.ofSeconds(chatModel.getTimeout()))
-                .topP(isO1 ? 1.0 : chatModel.getTopP())
+                .topP(isReasoningModel ? 1.0 : chatModel.getTopP())
                 .endpoint(DevoxxGenieStateService.getInstance().getAzureOpenAIEndpoint())
                 .listeners(getListener());
 
         return builder.build();
     }
 
+    /**
+     * Returns whether the model is a reasoning model with limited parameter support, in order to provide default
+     * values instead of given configuration.
+     * <p>
+     * @see <a href="https://learn.microsoft.com/en-us/azure/ai-foundry/openai/how-to/reasoning?tabs=python-secure%2Cpy#not-supported">Azure OpenAI reasoning models - parameters not supported</a>
+     * for details on parameter support for reasoning models.
+     *
+     * @param modelName name of the model to check
+     * @return true if the model name indicates a reasoning model
+     */
+    static boolean isReasoningModelWithLimitedParameters(String modelName) {
+        boolean isO1 = modelName.startsWith("o1");
+        boolean isO3 = modelName.startsWith("o3");
+        boolean isO4 = modelName.startsWith("o4-mini");
+        boolean isCodex = modelName.equalsIgnoreCase("codex-mini");
+
+        return isO1 || isO3 || isO4 || isCodex;
+    }
+
     @Override
     public StreamingChatLanguageModel createStreamingChatModel(@NotNull ChatModel chatModel) {
         boolean isO1 = chatModel.getModelName().startsWith("o1-");
diff --git a/src/test/java/com/devoxx/genie/chatmodel/cloud/azureopenai/AzureOpenAiChatModelFactoryTest.java b/src/test/java/com/devoxx/genie/chatmodel/cloud/azureopenai/AzureOpenAiChatModelFactoryTest.java
@@ -6,6 +6,7 @@
 import com.devoxx.genie.ui.settings.DevoxxGenieStateService;
 import com.intellij.openapi.application.ApplicationManager;
 import com.intellij.testFramework.ServiceContainerUtil;
+import dev.langchain4j.model.azure.AzureOpenAiChatModel;
 import dev.langchain4j.model.chat.ChatLanguageModel;
 import org.junit.jupiter.api.BeforeEach;
 import org.junit.jupiter.api.Test;
@@ -38,12 +39,13 @@ void createChatModel() {
         AzureOpenAIChatModelFactory factory = new AzureOpenAIChatModelFactory();
         ChatModel chatModel = new ChatModel();
         chatModel.setModelName("gpt-3.5-turbo");
-        chatModel.setTemperature(0.7);
+        chatModel.setTemperature(0.6);
         chatModel.setMaxTokens(100);
 
         ChatLanguageModel result = factory.createChatModel(chatModel);
 
-        assertThat(result).isNotNull();
+        // cannot verify more because model does not offer more access to data inside
+        assertThat(result).isInstanceOf(AzureOpenAiChatModel.class);
     }
 
     @Test