quarkiverse
diff --git a/‎bam/deployment/src/main/java/io/quarkiverse/langchain4j/bam/deployment/BamProcessor.java‎
Lines changed: 23 additions & 0 deletions b/‎bam/deployment/src/main/java/io/quarkiverse/langchain4j/bam/deployment/BamProcessor.java‎
Lines changed: 23 additions & 0 deletions
diff --git a/‎bam/deployment/src/main/java/io/quarkiverse/langchain4j/bam/deployment/ChatModelBuildConfig.java‎
Lines changed: 5 additions & 0 deletions b/‎bam/deployment/src/main/java/io/quarkiverse/langchain4j/bam/deployment/ChatModelBuildConfig.java‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎bam/deployment/src/main/java/io/quarkiverse/langchain4j/bam/deployment/EmbeddingModelBuildConfig.java‎
Lines changed: 16 additions & 0 deletions b/‎bam/deployment/src/main/java/io/quarkiverse/langchain4j/bam/deployment/EmbeddingModelBuildConfig.java‎
Lines changed: 16 additions & 0 deletions
diff --git a/‎bam/deployment/src/main/java/io/quarkiverse/langchain4j/bam/deployment/Langchain4jBamBuildConfig.java‎
Lines changed: 5 additions & 0 deletions b/‎bam/deployment/src/main/java/io/quarkiverse/langchain4j/bam/deployment/Langchain4jBamBuildConfig.java‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎bam/deployment/src/test/java/io/quarkiverse/langchain4j/bam/deployment/AiServiceTest.java‎
Lines changed: 108 additions & 0 deletions b/‎bam/deployment/src/test/java/io/quarkiverse/langchain4j/bam/deployment/AiServiceTest.java‎
Lines changed: 108 additions & 0 deletions
diff --git a/‎bam/deployment/src/test/java/io/quarkiverse/langchain4j/bam/deployment/AllPropertiesTest.java‎
Lines changed: 152 additions & 0 deletions b/‎bam/deployment/src/test/java/io/quarkiverse/langchain4j/bam/deployment/AllPropertiesTest.java‎
Lines changed: 152 additions & 0 deletions
@@ -1,6 +1,7 @@
 package io.quarkiverse.langchain4j.bam.deployment;
 
 import static io.quarkiverse.langchain4j.deployment.Langchain4jDotNames.CHAT_MODEL;
+import static io.quarkiverse.langchain4j.deployment.Langchain4jDotNames.EMBEDDING_MODEL;
 
 import java.util.Optional;
 
@@ -9,7 +10,9 @@
 import io.quarkiverse.langchain4j.bam.runtime.BamRecorder;
 import io.quarkiverse.langchain4j.bam.runtime.config.Langchain4jBamConfig;
 import io.quarkiverse.langchain4j.deployment.items.ChatModelProviderCandidateBuildItem;
+import io.quarkiverse.langchain4j.deployment.items.EmbeddingModelProviderCandidateBuildItem;
 import io.quarkiverse.langchain4j.deployment.items.SelectedChatModelProviderBuildItem;
+import io.quarkiverse.langchain4j.deployment.items.SelectedEmbeddingModelCandidateBuildItem;
 import io.quarkus.arc.deployment.SyntheticBeanBuildItem;
 import io.quarkus.deployment.annotations.BuildProducer;
 import io.quarkus.deployment.annotations.BuildStep;
@@ -30,19 +33,27 @@ FeatureBuildItem feature() {
 
     @BuildStep
     public void providerCandidates(BuildProducer<ChatModelProviderCandidateBuildItem> chatProducer,
+            BuildProducer<EmbeddingModelProviderCandidateBuildItem> embeddingProducer,
             Langchain4jBamBuildConfig config) {
+
         if (config.chatModel().enabled().isEmpty() || config.chatModel().enabled().get()) {
             chatProducer.produce(new ChatModelProviderCandidateBuildItem(PROVIDER));
         }
+
+        if (config.embeddingModel().enabled().isEmpty() || config.embeddingModel().enabled().get()) {
+            embeddingProducer.produce(new EmbeddingModelProviderCandidateBuildItem(PROVIDER));
+        }
     }
 
     @SuppressWarnings("OptionalUsedAsFieldOrParameterType")
     @BuildStep
     @Record(ExecutionTime.RUNTIME_INIT)
     void generateBeans(BamRecorder recorder,
             Optional<SelectedChatModelProviderBuildItem> selectedChatItem,
+            Optional<SelectedEmbeddingModelCandidateBuildItem> selectedEmbedding,
             Langchain4jBamConfig config,
             BuildProducer<SyntheticBeanBuildItem> beanProducer) {
+
         if (selectedChatItem.isPresent() && PROVIDER.equals(selectedChatItem.get().getProvider())) {
             beanProducer.produce(SyntheticBeanBuildItem
                     .configure(CHAT_MODEL)
@@ -52,5 +63,17 @@ void generateBeans(BamRecorder recorder,
                     .supplier(recorder.chatModel(config))
                     .done());
         }
+
+        if (selectedEmbedding.isPresent() && PROVIDER.equals(selectedEmbedding.get().getProvider())) {
+            beanProducer.produce(
+                    SyntheticBeanBuildItem
+                            .configure(EMBEDDING_MODEL)
+                            .setRuntimeInit()
+                            .defaultBean()
+                            .scope(ApplicationScoped.class)
+                            .supplier(recorder.embeddingModel(config))
+                            .unremovable()
+                            .done());
+        }
     }
 }
@@ -13,4 +13,9 @@ public interface ChatModelBuildConfig {
      */
     @ConfigDocDefault("true")
     Optional<Boolean> enabled();
+
+    /**
+     * Embedding model related settings
+     */
+    EmbeddingModelBuildConfig embeddingModel();
 }
@@ -0,0 +1,16 @@
+package io.quarkiverse.langchain4j.bam.deployment;
+
+import java.util.Optional;
+
+import io.quarkus.runtime.annotations.ConfigDocDefault;
+import io.quarkus.runtime.annotations.ConfigGroup;
+
+@ConfigGroup
+public interface EmbeddingModelBuildConfig {
+
+    /**
+     * Whether the model should be enabled
+     */
+    @ConfigDocDefault("true")
+    Optional<Boolean> enabled();
+}
@@ -13,4 +13,9 @@ public interface Langchain4jBamBuildConfig {
      * Chat model related settings
      */
     ChatModelBuildConfig chatModel();
+
+    /**
+     * Embedding model related settings
+     */
+    EmbeddingModelBuildConfig embeddingModel();
 }
@@ -0,0 +1,108 @@
+package io.quarkiverse.langchain4j.bam.deployment;
+
+import static com.github.tomakehurst.wiremock.core.WireMockConfiguration.options;
+import static org.junit.jupiter.api.Assertions.assertEquals;
+
+import java.util.List;
+
+import jakarta.inject.Inject;
+import jakarta.inject.Singleton;
+
+import org.jboss.shrinkwrap.api.ShrinkWrap;
+import org.jboss.shrinkwrap.api.spec.JavaArchive;
+import org.junit.jupiter.api.AfterAll;
+import org.junit.jupiter.api.BeforeAll;
+import org.junit.jupiter.api.Test;
+import org.junit.jupiter.api.extension.RegisterExtension;
+
+import com.fasterxml.jackson.databind.ObjectMapper;
+import com.github.tomakehurst.wiremock.WireMockServer;
+
+import dev.langchain4j.service.SystemMessage;
+import dev.langchain4j.service.UserMessage;
+import io.quarkiverse.langchain4j.RegisterAiService;
+import io.quarkiverse.langchain4j.bam.BamRestApi;
+import io.quarkiverse.langchain4j.bam.Message;
+import io.quarkiverse.langchain4j.bam.Parameters;
+import io.quarkiverse.langchain4j.bam.TextGenerationRequest;
+import io.quarkiverse.langchain4j.bam.runtime.config.Langchain4jBamConfig;
+import io.quarkus.test.QuarkusUnitTest;
+
+public class AiServiceTest {
+
+    static WireMockServer wireMockServer;
+    static ObjectMapper mapper;
+    static WireMockUtil mockServers;
+
+    @RegisterExtension
+    static QuarkusUnitTest unitTest = new QuarkusUnitTest()
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.base-url", WireMockUtil.URL)
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.api-key", WireMockUtil.API_KEY)
+            .setArchiveProducer(() -> ShrinkWrap.create(JavaArchive.class).addClass(WireMockUtil.class));
+
+    @BeforeAll
+    static void beforeAll() {
+        wireMockServer = new WireMockServer(options().port(WireMockUtil.PORT));
+        wireMockServer.start();
+        mapper = BamRestApi.objectMapper(new ObjectMapper());
+        mockServers = new WireMockUtil(wireMockServer);
+    }
+
+    @AfterAll
+    static void afterAll() {
+        wireMockServer.stop();
+    }
+
+    @RegisterAiService
+    @Singleton
+    interface NewAIService {
+
+        @SystemMessage("This is a systemMessage")
+        @UserMessage("This is a userMessage {text}")
+        String chat(String text);
+    }
+
+    @Inject
+    NewAIService service;
+
+    @Inject
+    Langchain4jBamConfig config;
+
+    @Test
+    void chat() throws Exception {
+
+        var modelId = config.chatModel().modelId();
+
+        var parameters = Parameters.builder()
+                .decodingMethod(config.chatModel().decodingMethod())
+                .temperature(config.chatModel().temperature())
+                .minNewTokens(config.chatModel().minNewTokens())
+                .maxNewTokens(config.chatModel().maxNewTokens())
+                .build();
+
+        List<Message> messages = List.of(
+                new Message("system", "This is a systemMessage"),
+                new Message("user", "This is a userMessage Hello"));
+
+        var body = new TextGenerationRequest(modelId, messages, parameters);
+
+        mockServers.mockBuilder(200)
+                .body(mapper.writeValueAsString(body))
+                .response("""
+                        {
+                            "results": [
+                                {
+                                    "generated_token_count": 20,
+                                    "input_token_count": 146,
+                                    "stop_reason": "max_tokens",
+                                    "seed": 40268626,
+                                    "generated_text": "AI Response"
+                                }
+                            ]
+                        }
+                        """)
+                .build();
+
+        assertEquals("AI Response", service.chat("Hello"));
+    }
+}
@@ -0,0 +1,152 @@
+package io.quarkiverse.langchain4j.bam.deployment;
+
+import static com.github.tomakehurst.wiremock.core.WireMockConfiguration.options;
+import static org.junit.jupiter.api.Assertions.assertEquals;
+
+import java.time.Duration;
+import java.util.List;
+
+import jakarta.inject.Inject;
+
+import org.jboss.shrinkwrap.api.ShrinkWrap;
+import org.jboss.shrinkwrap.api.spec.JavaArchive;
+import org.junit.jupiter.api.AfterAll;
+import org.junit.jupiter.api.BeforeAll;
+import org.junit.jupiter.api.Test;
+import org.junit.jupiter.api.extension.RegisterExtension;
+
+import com.fasterxml.jackson.databind.ObjectMapper;
+import com.github.tomakehurst.wiremock.WireMockServer;
+
+import dev.langchain4j.model.chat.ChatLanguageModel;
+import io.quarkiverse.langchain4j.bam.BamRestApi;
+import io.quarkiverse.langchain4j.bam.Message;
+import io.quarkiverse.langchain4j.bam.Parameters;
+import io.quarkiverse.langchain4j.bam.TextGenerationRequest;
+import io.quarkiverse.langchain4j.bam.runtime.config.Langchain4jBamConfig;
+import io.quarkus.test.QuarkusUnitTest;
+
+public class AllPropertiesTest {
+
+    static WireMockServer wireMockServer;
+    static ObjectMapper mapper;
+    static WireMockUtil mockServers;
+
+    @RegisterExtension
+    static QuarkusUnitTest unitTest = new QuarkusUnitTest()
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.base-url", WireMockUtil.URL)
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.api-key", WireMockUtil.API_KEY)
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.timeout", "60s")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.log-requests", "true")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.log-responses", "true")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.timeout", "60s")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.version", "aaaa-mm-dd")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.model-id", "my_super_model")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.decoding-method", "greedy")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.include-stop-sequence", "true")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.max-new-tokens", "200")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.min-new-tokens", "10")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.random-seed", "2")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.stop-sequences", "\n,\n\n")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.temperature", "1.5")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.time-limit", "1500")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.top-k", "90")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.top-p", "0.5")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.typical-p", "0.5")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.repetition-penalty", "2.0")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.truncate-input-tokens", "0")
+            .overrideRuntimeConfigKey("quarkus.langchain4j.bam.chat-model.beam-width", "2")
+            .setArchiveProducer(() -> ShrinkWrap.create(JavaArchive.class).addClass(WireMockUtil.class));
+
+    @Inject
+    Langchain4jBamConfig config;
+
+    @Inject
+    ChatLanguageModel model;
+
+    @BeforeAll
+    static void beforeAll() {
+        wireMockServer = new WireMockServer(options().port(WireMockUtil.PORT));
+        wireMockServer.start();
+        mapper = BamRestApi.objectMapper(new ObjectMapper());
+        mockServers = new WireMockUtil(wireMockServer);
+    }
+
+    @AfterAll
+    static void afterAll() {
+        wireMockServer.stop();
+    }
+
+    @Test
+    void generate() throws Exception {
+
+        assertEquals(WireMockUtil.URL, config.baseUrl().get().toString());
+        assertEquals(WireMockUtil.API_KEY, config.apiKey());
+        assertEquals(Duration.ofSeconds(60), config.timeout());
+        assertEquals(true, config.logRequests());
+        assertEquals(true, config.logResponses());
+        assertEquals("aaaa-mm-dd", config.version());
+        assertEquals("my_super_model", config.chatModel().modelId());
+        assertEquals("greedy", config.chatModel().decodingMethod());
+        assertEquals(true, config.chatModel().includeStopSequence().get());
+        assertEquals(200, config.chatModel().maxNewTokens());
+        assertEquals(10, config.chatModel().minNewTokens());
+        assertEquals(2, config.chatModel().randomSeed().get());
+        assertEquals(List.of("\n", "\n\n"), config.chatModel().stopSequences().get());
+        assertEquals(1.5, config.chatModel().temperature());
+        assertEquals(1500, config.chatModel().timeLimit().get());
+        assertEquals(90, config.chatModel().topK().get());
+        assertEquals(0.5, config.chatModel().topP().get());
+        assertEquals(0.5, config.chatModel().typicalP().get());
+        assertEquals(2.0, config.chatModel().repetitionPenalty().get());
+        assertEquals(0, config.chatModel().truncateInputTokens().get());
+        assertEquals(2, config.chatModel().beamWidth().get());
+
+        var modelId = config.chatModel().modelId();
+
+        var parameters = Parameters.builder()
+                .minNewTokens(10)
+                .maxNewTokens(200)
+                .decodingMethod("greedy")
+                .includeStopSequence(true)
+                .randomSeed(2)
+                .stopSequences(List.of("\n", "\n\n"))
+                .temperature(1.5)
+                .timeLimit(1500)
+                .topK(90)
+                .topP(0.5)
+                .typicalP(0.5)
+                .repetitionPenalty(2.0)
+                .truncateInputTokens(0)
+                .beamWidth(2)
+                .build();
+
+        List<Message> messages = List.of(
+                new Message("user", "Hello how are you?"));
+
+        var body = new TextGenerationRequest(modelId, messages, parameters);
+
+        mockServers.mockBuilder(200, config.version())
+                .body(mapper.writeValueAsString(body))
+                .response("""
+                        {
+                            "id": "05a245ad-1da7-4b9d-9807-ae1733177c1d",
+                            "model_id": "meta-llama/llama-2-70b-chat",
+                            "created_at": "2023-09-01T09:28:29.378Z",
+                            "results": [
+                                {
+                                    "generated_token_count": 20,
+                                    "input_token_count": 146,
+                                    "stop_reason": "max_tokens",
+                                    "seed": 40268626,
+                                    "generated_text": "Hello! I'm doing well, thanks for asking. I'm here to assist you"
+                                }
+                            ],
+                            "conversation_id": "cd3a9bca-b88e-41e4-9d62-bab33098fe39"
+                        }
+                        """)
+                .build();
+
+        assertEquals("Hello! I'm doing well, thanks for asking. I'm here to assist you", model.generate("Hello how are you?"));
+    }
+}