quarkiverse
diff --git a/‎model-providers/ollama/deployment/src/main/java/io/quarkiverse/langchain4j/ollama/deployment/OllamaProcessor.java‎
Lines changed: 3 additions & 1 deletion b/‎model-providers/ollama/deployment/src/main/java/io/quarkiverse/langchain4j/ollama/deployment/OllamaProcessor.java‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎model-providers/ollama/runtime/src/main/java/io/quarkiverse/langchain4j/ollama/OllamaStreamingChatLanguageModel.java‎
Lines changed: 121 additions & 6 deletions b/‎model-providers/ollama/runtime/src/main/java/io/quarkiverse/langchain4j/ollama/OllamaStreamingChatLanguageModel.java‎
Lines changed: 121 additions & 6 deletions
diff --git a/‎model-providers/ollama/runtime/src/main/java/io/quarkiverse/langchain4j/ollama/runtime/OllamaRecorder.java‎
Lines changed: 10 additions & 5 deletions b/‎model-providers/ollama/runtime/src/main/java/io/quarkiverse/langchain4j/ollama/runtime/OllamaRecorder.java‎
Lines changed: 10 additions & 5 deletions
diff --git a/‎model-providers/openai/azure-openai/deployment/src/main/java/io/quarkiverse/langchain4j/azure/openai/deployment/AzureOpenAiProcessor.java‎
Lines changed: 2 additions & 0 deletions b/‎model-providers/openai/azure-openai/deployment/src/main/java/io/quarkiverse/langchain4j/azure/openai/deployment/AzureOpenAiProcessor.java‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎model-providers/openai/azure-openai/runtime/src/main/java/io/quarkiverse/langchain4j/azure/openai/AzureOpenAiChatModel.java‎
Lines changed: 0 additions & 1 deletion b/‎model-providers/openai/azure-openai/runtime/src/main/java/io/quarkiverse/langchain4j/azure/openai/AzureOpenAiChatModel.java‎
Lines changed: 0 additions & 1 deletion
@@ -161,7 +161,9 @@ void generateBeans(OllamaRecorder recorder,
                         .setRuntimeInit()
                         .defaultBean()
                         .scope(ApplicationScoped.class)
-                        .supplier(recorder.streamingChatModel(config, fixedRuntimeConfig, configName));
+                        .addInjectionPoint(ParameterizedType.create(DotNames.CDI_INSTANCE,
+                                new Type[] { ClassType.create(DotNames.CHAT_MODEL_LISTENER) }, null))
+                        .createWith(recorder.streamingChatModel(config, fixedRuntimeConfig, configName));
                 addQualifierIfNecessary(streamingBuilder, configName);
                 beanProducer.produce(streamingBuilder.done());
             }
 
@@ -6,16 +6,27 @@
 
 import java.time.Duration;
 import java.util.ArrayList;
+import java.util.Collections;
 import java.util.List;
+import java.util.Map;
+import java.util.concurrent.ConcurrentHashMap;
 import java.util.function.Consumer;
 import java.util.stream.Collectors;
 
+import org.jboss.logging.Logger;
+
 import dev.langchain4j.agent.tool.ToolExecutionRequest;
 import dev.langchain4j.agent.tool.ToolSpecification;
 import dev.langchain4j.data.message.AiMessage;
 import dev.langchain4j.data.message.ChatMessage;
 import dev.langchain4j.model.StreamingResponseHandler;
 import dev.langchain4j.model.chat.StreamingChatLanguageModel;
+import dev.langchain4j.model.chat.listener.ChatModelErrorContext;
+import dev.langchain4j.model.chat.listener.ChatModelListener;
+import dev.langchain4j.model.chat.listener.ChatModelRequest;
+import dev.langchain4j.model.chat.listener.ChatModelRequestContext;
+import dev.langchain4j.model.chat.listener.ChatModelResponse;
+import dev.langchain4j.model.chat.listener.ChatModelResponseContext;
 import dev.langchain4j.model.output.Response;
 import dev.langchain4j.model.output.TokenUsage;
 import io.smallrye.mutiny.Context;
@@ -24,20 +35,26 @@
  * Use to have streaming feature on models used trough Ollama.
  */
 public class OllamaStreamingChatLanguageModel implements StreamingChatLanguageModel {
+
+    private static final Logger log = Logger.getLogger(OllamaStreamingChatLanguageModel.class);
+
     private static final String TOOLS_CONTEXT = "TOOLS";
     private static final String TOKEN_USAGE_CONTEXT = "TOKEN_USAGE";
     private static final String RESPONSE_CONTEXT = "RESPONSE";
+    private static final String MODEL_ID = "MODEL_ID";
     private final OllamaClient client;
     private final String model;
     private final String format;
     private final Options options;
+    private final List<ChatModelListener> listeners;
 
     private OllamaStreamingChatLanguageModel(OllamaStreamingChatLanguageModel.Builder builder) {
         client = new OllamaClient(builder.baseUrl, builder.timeout, builder.logRequests, builder.logResponses,
                 builder.configName, builder.tlsConfigurationName);
         model = builder.model;
         format = builder.format;
         options = builder.options;
+        this.listeners = builder.listeners;
     }
 
     public static OllamaStreamingChatLanguageModel.Builder builder() {
@@ -60,13 +77,25 @@ public void generate(List<ChatMessage> messages, List<ToolSpecification> toolSpe
                 .build();
 
         Context context = Context.empty();
+        context.put(MODEL_ID, "");
         context.put(RESPONSE_CONTEXT, new ArrayList<ChatResponse>());
         context.put(TOOLS_CONTEXT, new ArrayList<ToolExecutionRequest>());
 
+        ChatModelRequest modelListenerRequest = createModelListenerRequest(request, messages, toolSpecifications);
+        Map<Object, Object> attributes = new ConcurrentHashMap<>();
+        ChatModelRequestContext requestContext = new ChatModelRequestContext(modelListenerRequest, attributes);
+        listeners.forEach(listener -> {
+            try {
+                listener.onRequest(requestContext);
+            } catch (Exception e) {
+                log.warn("Exception while calling model listener", e);
+            }
+        });
+
         client.streamingChat(request)
                 .subscribe()
                 .with(context,
-                        new Consumer<ChatResponse>() {
+                        new Consumer<>() {
                             @Override
                             @SuppressWarnings("unchecked")
                             public void accept(ChatResponse response) {
@@ -89,6 +118,9 @@ public void accept(ChatResponse response) {
                                     }
 
                                     if (response.done()) {
+                                        if (response.model() != null) {
+                                            context.put(MODEL_ID, response.model());
+                                        }
                                         TokenUsage tokenUsage = new TokenUsage(
                                                 response.evalCount(),
                                                 response.promptEvalCount(),
@@ -101,9 +133,36 @@ public void accept(ChatResponse response) {
                                 }
                             }
                         },
-                        new Consumer<Throwable>() {
+                        new Consumer<>() {
                             @Override
                             public void accept(Throwable error) {
+                                List<ChatResponse> chatResponses = context.get(RESPONSE_CONTEXT);
+                                String stringResponse = chatResponses.stream()
+                                        .map(ChatResponse::message)
+                                        .map(Message::content)
+                                        .collect(Collectors.joining());
+                                AiMessage aiMessage = new AiMessage(stringResponse);
+                                Response<AiMessage> aiMessageResponse = Response.from(aiMessage);
+
+                                ChatModelResponse modelListenerPartialResponse = createModelListenerResponse(
+                                        null,
+                                        context.get(MODEL_ID),
+                                        aiMessageResponse);
+
+                                ChatModelErrorContext errorContext = new ChatModelErrorContext(
+                                        error,
+                                        modelListenerRequest,
+                                        modelListenerPartialResponse,
+                                        attributes);
+
+                                listeners.forEach(listener -> {
+                                    try {
+                                        listener.onError(errorContext);
+                                    } catch (Exception e) {
+                                        log.warn("Exception while calling model listener", e);
+                                    }
+                                });
+
                                 handler.onError(error);
                             }
                         },
@@ -115,22 +174,72 @@ public void run() {
                                 List<ChatResponse> chatResponses = context.get(RESPONSE_CONTEXT);
                                 List<ToolExecutionRequest> toolExecutionRequests = context.get(TOOLS_CONTEXT);
 
-                                if (toolExecutionRequests.size() > 0) {
+                                if (!toolExecutionRequests.isEmpty()) {
                                     handler.onComplete(Response.from(AiMessage.from(toolExecutionRequests), tokenUsage));
                                     return;
                                 }
 
-                                String response = chatResponses.stream()
+                                String stringResponse = chatResponses.stream()
                                         .map(ChatResponse::message)
                                         .map(Message::content)
                                         .collect(Collectors.joining());
 
-                                AiMessage message = new AiMessage(response);
-                                handler.onComplete(Response.from(message, tokenUsage));
+                                AiMessage aiMessage = new AiMessage(stringResponse);
+                                Response<AiMessage> aiMessageResponse = Response.from(aiMessage, tokenUsage);
+
+                                ChatModelResponse modelListenerResponse = createModelListenerResponse(
+                                        null,
+                                        context.get(MODEL_ID),
+                                        aiMessageResponse);
+                                ChatModelResponseContext responseContext = new ChatModelResponseContext(
+                                        modelListenerResponse,
+                                        modelListenerRequest,
+                                        attributes);
+                                listeners.forEach(listener -> {
+                                    try {
+                                        listener.onResponse(responseContext);
+                                    } catch (Exception e) {
+                                        log.warn("Exception while calling model listener", e);
+                                    }
+                                });
+
+                                handler.onComplete(aiMessageResponse);
                             }
                         });
     }
 
+    private ChatModelRequest createModelListenerRequest(ChatRequest request,
+            List<ChatMessage> messages,
+            List<ToolSpecification> toolSpecifications) {
+        Options options = request.options();
+        var builder = ChatModelRequest.builder()
+                .model(request.model())
+                .messages(messages)
+                .toolSpecifications(toolSpecifications);
+        if (options != null) {
+            builder.temperature(options.temperature())
+                    .topP(options.topP())
+                    .maxTokens(options.numPredict());
+        }
+        return builder.build();
+    }
+
+    private ChatModelResponse createModelListenerResponse(String responseId,
+            String responseModel,
+            Response<AiMessage> response) {
+        if (response == null) {
+            return null;
+        }
+
+        return ChatModelResponse.builder()
+                .id(responseId)
+                .model(responseModel)
+                .tokenUsage(response.tokenUsage())
+                .finishReason(response.finishReason())
+                .aiMessage(response.content())
+                .build();
+    }
+
     @Override
     public void generate(List<ChatMessage> messages, ToolSpecification toolSpecification,
             StreamingResponseHandler<AiMessage> handler) {
@@ -161,6 +270,7 @@ private Builder() {
         private boolean logRequests = false;
         private boolean logResponses = false;
         private String configName;
+        private List<ChatModelListener> listeners = Collections.emptyList();
 
         public Builder baseUrl(String val) {
             baseUrl = val;
@@ -207,6 +317,11 @@ public Builder configName(String configName) {
             return this;
         }
 
+        public Builder listeners(List<ChatModelListener> listeners) {
+            this.listeners = listeners;
+            return this;
+        }
+
         public OllamaStreamingChatLanguageModel build() {
             return new OllamaStreamingChatLanguageModel(this);
         }
 
@@ -133,7 +133,8 @@ public EmbeddingModel get() {
         }
     }
 
-    public Supplier<StreamingChatLanguageModel> streamingChatModel(LangChain4jOllamaConfig runtimeConfig,
+    public Function<SyntheticCreationalContext<StreamingChatLanguageModel>, StreamingChatLanguageModel> streamingChatModel(
+            LangChain4jOllamaConfig runtimeConfig,
             LangChain4jOllamaFixedRuntimeConfig fixedRuntimeConfig, String configName) {
         LangChain4jOllamaConfig.OllamaConfig ollamaConfig = correspondingOllamaConfig(runtimeConfig, configName);
         LangChain4jOllamaFixedRuntimeConfig.OllamaConfig ollamaFixedConfig = correspondingOllamaFixedConfig(fixedRuntimeConfig,
@@ -166,16 +167,20 @@ public Supplier<StreamingChatLanguageModel> streamingChatModel(LangChain4jOllama
                     .options(optionsBuilder.build())
                     .configName(NamedConfigUtil.isDefault(configName) ? null : configName);
 
-            return new Supplier<>() {
+            return new Function<>() {
                 @Override
-                public StreamingChatLanguageModel get() {
+                public StreamingChatLanguageModel apply(
+                        SyntheticCreationalContext<StreamingChatLanguageModel> context) {
+                    builder.listeners(context.getInjectedReference(CHAT_MODEL_LISTENER_TYPE_LITERAL).stream()
+                            .collect(Collectors.toList()));
                     return builder.build();
                 }
             };
         } else {
-            return new Supplier<>() {
+            return new Function<>() {
                 @Override
-                public StreamingChatLanguageModel get() {
+                public StreamingChatLanguageModel apply(
+                        SyntheticCreationalContext<StreamingChatLanguageModel> context) {
                     return new DisabledStreamingChatLanguageModel();
                 }
             };
 
@@ -108,6 +108,8 @@ void generateBeans(AzureOpenAiRecorder recorder,
                         .setRuntimeInit()
                         .defaultBean()
                         .scope(ApplicationScoped.class)
+                        .addInjectionPoint(ParameterizedType.create(DotNames.CDI_INSTANCE,
+                                new Type[] { ClassType.create(DotNames.CHAT_MODEL_LISTENER) }, null))
                         .createWith(streamingChatModel);
                 addQualifierIfNecessary(streamingBuilder, configName);
                 beanProducer.produce(streamingBuilder.done());
 
@@ -126,7 +126,6 @@ public AzureOpenAiChatModel(String endpoint,
                 : ResponseFormat.builder()
                         .type(ResponseFormatType.valueOf(responseFormat.toUpperCase(Locale.ROOT)))
                         .build();
-        ;
     }
 
     @Override
Original file line number	Diff line number	Diff line change
`@@ -126,7 +126,6 @@ public AzureOpenAiChatModel(String endpoint,`
`126`	`126`	`: ResponseFormat.builder()`
`127`	`127`	`.type(ResponseFormatType.valueOf(responseFormat.toUpperCase(Locale.ROOT)))`
`128`	`128`	`.build();`
`129`		`- ;`
`130`	`129`	`}`
`131`	`130`
`132`	`131`	`@Override`