Make model names configuration runtime fixed in Jlama

geoand · geoand · commit dd931edbfefe · 2024-10-21T11:15:12.000+03:00
This is needed so we can now at build time what the
values are and therefore download the models at build
diff --git a/model-providers/jlama/deployment/src/main/java/io/quarkiverse/langchain4j/jlama/deployment/JlamaAiProcessor.java b/model-providers/jlama/deployment/src/main/java/io/quarkiverse/langchain4j/jlama/deployment/JlamaAiProcessor.java
@@ -18,7 +18,8 @@
 import io.quarkiverse.langchain4j.deployment.items.SelectedChatModelProviderBuildItem;
 import io.quarkiverse.langchain4j.deployment.items.SelectedEmbeddingModelCandidateBuildItem;
 import io.quarkiverse.langchain4j.jlama.runtime.JlamaAiRecorder;
-import io.quarkiverse.langchain4j.jlama.runtime.config.LangChain4jJlamaAiConfig;
+import io.quarkiverse.langchain4j.jlama.runtime.config.LangChain4jJlamaConfig;
+import io.quarkiverse.langchain4j.jlama.runtime.config.LangChain4jJlamaFixedRuntimeConfig;
 import io.quarkiverse.langchain4j.runtime.NamedConfigUtil;
 import io.quarkus.arc.deployment.SyntheticBeanBuildItem;
 import io.quarkus.deployment.annotations.BuildProducer;
@@ -60,20 +61,23 @@ public void providerCandidates(BuildProducer<ChatModelProviderCandidateBuildItem
     @BuildStep
     @Record(ExecutionTime.RUNTIME_INIT)
     void generateBeans(JlamaAiRecorder recorder, List<SelectedChatModelProviderBuildItem> selectedChatItem,
-            List<SelectedEmbeddingModelCandidateBuildItem> selectedEmbedding, LangChain4jJlamaAiConfig config,
+            List<SelectedEmbeddingModelCandidateBuildItem> selectedEmbedding,
+            LangChain4jJlamaConfig runtimeConfig,
+            LangChain4jJlamaFixedRuntimeConfig fixedRuntimeConfig,
             BuildProducer<SyntheticBeanBuildItem> beanProducer) {
 
         for (var selected : selectedChatItem) {
             if (PROVIDER.equals(selected.getProvider())) {
                 String configName = selected.getConfigName();
                 var builder = SyntheticBeanBuildItem.configure(CHAT_MODEL).setRuntimeInit().defaultBean()
-                        .scope(ApplicationScoped.class).supplier(recorder.chatModel(config, configName));
+                        .scope(ApplicationScoped.class)
+                        .supplier(recorder.chatModel(runtimeConfig, fixedRuntimeConfig, configName));
                 addQualifierIfNecessary(builder, configName);
                 beanProducer.produce(builder.done());
 
                 var streamingBuilder = SyntheticBeanBuildItem.configure(STREAMING_CHAT_MODEL).setRuntimeInit()
                         .defaultBean().scope(ApplicationScoped.class)
-                        .supplier(recorder.streamingChatModel(config, configName));
+                        .supplier(recorder.streamingChatModel(runtimeConfig, fixedRuntimeConfig, configName));
                 addQualifierIfNecessary(streamingBuilder, configName);
                 beanProducer.produce(streamingBuilder.done());
             }
@@ -84,7 +88,7 @@ void generateBeans(JlamaAiRecorder recorder, List<SelectedChatModelProviderBuild
                 String configName = selected.getConfigName();
                 var builder = SyntheticBeanBuildItem.configure(EMBEDDING_MODEL).setRuntimeInit().defaultBean()
                         .unremovable().scope(ApplicationScoped.class)
-                        .supplier(recorder.embeddingModel(config, configName));
+                        .supplier(recorder.embeddingModel(runtimeConfig, fixedRuntimeConfig, configName));
                 addQualifierIfNecessary(builder, configName);
                 beanProducer.produce(builder.done());
             }
diff --git a/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/JlamaAiRecorder.java b/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/JlamaAiRecorder.java
@@ -12,21 +12,25 @@
 import io.quarkiverse.langchain4j.jlama.JlamaEmbeddingModel;
 import io.quarkiverse.langchain4j.jlama.JlamaStreamingChatModel;
 import io.quarkiverse.langchain4j.jlama.runtime.config.ChatModelConfig;
-import io.quarkiverse.langchain4j.jlama.runtime.config.EmbeddingModelConfig;
-import io.quarkiverse.langchain4j.jlama.runtime.config.LangChain4jJlamaAiConfig;
+import io.quarkiverse.langchain4j.jlama.runtime.config.LangChain4jJlamaConfig;
+import io.quarkiverse.langchain4j.jlama.runtime.config.LangChain4jJlamaFixedRuntimeConfig;
 import io.quarkiverse.langchain4j.runtime.NamedConfigUtil;
 import io.quarkus.runtime.annotations.Recorder;
 
 @Recorder
 public class JlamaAiRecorder {
 
-    public Supplier<ChatLanguageModel> chatModel(LangChain4jJlamaAiConfig runtimeConfig, String configName) {
-        LangChain4jJlamaAiConfig.JlamaAiConfig jlamaConfig = correspondingJlamaConfig(runtimeConfig, configName);
+    public Supplier<ChatLanguageModel> chatModel(LangChain4jJlamaConfig runtimeConfig,
+            LangChain4jJlamaFixedRuntimeConfig fixedRuntimeConfig,
+            String configName) {
+        LangChain4jJlamaConfig.JlamaConfig jlamaConfig = correspondingJlamaConfig(runtimeConfig, configName);
+        LangChain4jJlamaFixedRuntimeConfig.JlamaConfig jlamaFixedRuntimeConfig = correspondingJlamaFixedRuntimeConfig(
+                fixedRuntimeConfig, configName);
 
         if (jlamaConfig.enableIntegration()) {
             ChatModelConfig chatModelConfig = jlamaConfig.chatModel();
 
-            var builder = JlamaChatModel.builder().modelName(chatModelConfig.modelName());
+            var builder = JlamaChatModel.builder().modelName(jlamaFixedRuntimeConfig.chatModel().modelName());
 
             if (chatModelConfig.temperature().isPresent()) {
                 builder.temperature((float) chatModelConfig.temperature().getAsDouble());
@@ -51,14 +55,17 @@ public ChatLanguageModel get() {
         }
     }
 
-    public Supplier<StreamingChatLanguageModel> streamingChatModel(LangChain4jJlamaAiConfig runtimeConfig,
+    public Supplier<StreamingChatLanguageModel> streamingChatModel(LangChain4jJlamaConfig runtimeConfig,
+            LangChain4jJlamaFixedRuntimeConfig fixedRuntimeConfig,
             String configName) {
-        LangChain4jJlamaAiConfig.JlamaAiConfig jlamaConfig = correspondingJlamaConfig(runtimeConfig, configName);
+        LangChain4jJlamaConfig.JlamaConfig jlamaConfig = correspondingJlamaConfig(runtimeConfig, configName);
+        LangChain4jJlamaFixedRuntimeConfig.JlamaConfig jlamaFixedRuntimeConfig = correspondingJlamaFixedRuntimeConfig(
+                fixedRuntimeConfig, configName);
 
         if (jlamaConfig.enableIntegration()) {
             ChatModelConfig chatModelConfig = jlamaConfig.chatModel();
 
-            var builder = JlamaStreamingChatModel.builder().modelName(chatModelConfig.modelName());
+            var builder = JlamaStreamingChatModel.builder().modelName(jlamaFixedRuntimeConfig.chatModel().modelName());
 
             if (chatModelConfig.temperature().isPresent()) {
                 builder.temperature((float) chatModelConfig.temperature().getAsDouble());
@@ -79,12 +86,15 @@ public StreamingChatLanguageModel get() {
         }
     }
 
-    public Supplier<EmbeddingModel> embeddingModel(LangChain4jJlamaAiConfig runtimeConfig, String configName) {
-        LangChain4jJlamaAiConfig.JlamaAiConfig jlamaConfig = correspondingJlamaConfig(runtimeConfig, configName);
+    public Supplier<EmbeddingModel> embeddingModel(LangChain4jJlamaConfig runtimeConfig,
+            LangChain4jJlamaFixedRuntimeConfig fixedRuntimeConfig,
+            String configName) {
+        LangChain4jJlamaConfig.JlamaConfig jlamaConfig = correspondingJlamaConfig(runtimeConfig, configName);
+        LangChain4jJlamaFixedRuntimeConfig.JlamaConfig jlamaFixedRuntimeConfig = correspondingJlamaFixedRuntimeConfig(
+                fixedRuntimeConfig, configName);
 
         if (jlamaConfig.enableIntegration()) {
-            EmbeddingModelConfig embeddingModelConfig = jlamaConfig.embeddingModel();
-            var builder = JlamaEmbeddingModel.builder().modelName(embeddingModelConfig.modelName());
+            var builder = JlamaEmbeddingModel.builder().modelName(jlamaFixedRuntimeConfig.embeddingModel().modelName());
 
             return new Supplier<>() {
                 @Override
@@ -102,15 +112,27 @@ public EmbeddingModel get() {
         }
     }
 
-    private LangChain4jJlamaAiConfig.JlamaAiConfig correspondingJlamaConfig(LangChain4jJlamaAiConfig runtimeConfig,
+    private LangChain4jJlamaConfig.JlamaConfig correspondingJlamaConfig(LangChain4jJlamaConfig runtimeConfig,
+            String configName) {
+        LangChain4jJlamaConfig.JlamaConfig jlamaConfig;
+        if (NamedConfigUtil.isDefault(configName)) {
+            jlamaConfig = runtimeConfig.defaultConfig();
+        } else {
+            jlamaConfig = runtimeConfig.namedConfig().get(configName);
+        }
+        return jlamaConfig;
+    }
+
+    private LangChain4jJlamaFixedRuntimeConfig.JlamaConfig correspondingJlamaFixedRuntimeConfig(
+            LangChain4jJlamaFixedRuntimeConfig runtimeConfig,
             String configName) {
-        LangChain4jJlamaAiConfig.JlamaAiConfig huggingFaceConfig;
+        LangChain4jJlamaFixedRuntimeConfig.JlamaConfig jlamaConfig;
         if (NamedConfigUtil.isDefault(configName)) {
-            huggingFaceConfig = runtimeConfig.defaultConfig();
+            jlamaConfig = runtimeConfig.defaultConfig();
         } else {
-            huggingFaceConfig = runtimeConfig.namedConfig().get(configName);
+            jlamaConfig = runtimeConfig.namedConfig().get(configName);
         }
-        return huggingFaceConfig;
+        return jlamaConfig;
     }
 
 }
diff --git a/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/ChatModelConfig.java b/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/ChatModelConfig.java
@@ -5,17 +5,10 @@
 
 import io.quarkus.runtime.annotations.ConfigDocDefault;
 import io.quarkus.runtime.annotations.ConfigGroup;
-import io.smallrye.config.WithDefault;
 
 @ConfigGroup
 public interface ChatModelConfig {
 
-    /**
-     * Model name to use
-     */
-    @WithDefault("tjake/TinyLlama-1.1B-Chat-v1.0-Jlama-Q4")
-    String modelName();
-
     /**
      * What sampling temperature to use, between 0.0 and 1.0. Higher values like 0.8
      * will make the output more random, while lower values like 0.2 will make it
diff --git a/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/ChatModelFixedRuntimeConfig.java b/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/ChatModelFixedRuntimeConfig.java
@@ -0,0 +1,14 @@
+package io.quarkiverse.langchain4j.jlama.runtime.config;
+
+import io.quarkus.runtime.annotations.ConfigGroup;
+import io.smallrye.config.WithDefault;
+
+@ConfigGroup
+public interface ChatModelFixedRuntimeConfig {
+
+    /**
+     * Model name to use
+     */
+    @WithDefault("tjake/TinyLlama-1.1B-Chat-v1.0-Jlama-Q4")
+    String modelName();
+}
diff --git a/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/EmbeddingModelFixedRuntimeConfig.java b/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/EmbeddingModelFixedRuntimeConfig.java
@@ -4,7 +4,7 @@
 import io.smallrye.config.WithDefault;
 
 @ConfigGroup
-public interface EmbeddingModelConfig {
+public interface EmbeddingModelFixedRuntimeConfig {
 
     /**
      * Model name to use
diff --git a/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/LangChain4jJlamaConfig.java b/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/LangChain4jJlamaConfig.java
@@ -15,13 +15,13 @@
 
 @ConfigRoot(phase = RUN_TIME)
 @ConfigMapping(prefix = "quarkus.langchain4j.jlama")
-public interface LangChain4jJlamaAiConfig {
+public interface LangChain4jJlamaConfig {
 
     /**
      * Default model config.
      */
     @WithParentName
-    JlamaAiConfig defaultConfig();
+    JlamaConfig defaultConfig();
 
     /**
      * Named model config.
@@ -30,21 +30,16 @@ public interface LangChain4jJlamaAiConfig {
     @ConfigDocMapKey("model-name")
     @WithParentName
     @WithDefaults
-    Map<String, JlamaAiConfig> namedConfig();
+    Map<String, JlamaConfig> namedConfig();
 
     @ConfigGroup
-    interface JlamaAiConfig {
+    interface JlamaConfig {
 
         /**
          * Chat model related settings
          */
         ChatModelConfig chatModel();
 
-        /**
-         * Embedding model related settings
-         */
-        EmbeddingModelConfig embeddingModel();
-
         /**
          * Whether to enable the integration. Set to {@code false} to disable
          * all requests.
diff --git a/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/LangChain4jJlamaFixedRuntimeConfig.java b/model-providers/jlama/runtime/src/main/java/io/quarkiverse/langchain4j/jlama/runtime/config/LangChain4jJlamaFixedRuntimeConfig.java
@@ -0,0 +1,47 @@
+package io.quarkiverse.langchain4j.jlama.runtime.config;
+
+import static io.quarkus.runtime.annotations.ConfigPhase.BUILD_AND_RUN_TIME_FIXED;
+
+import java.util.Map;
+
+import io.quarkus.runtime.annotations.ConfigDocMapKey;
+import io.quarkus.runtime.annotations.ConfigDocSection;
+import io.quarkus.runtime.annotations.ConfigGroup;
+import io.quarkus.runtime.annotations.ConfigRoot;
+import io.smallrye.config.ConfigMapping;
+import io.smallrye.config.WithDefaults;
+import io.smallrye.config.WithParentName;
+
+@ConfigRoot(phase = BUILD_AND_RUN_TIME_FIXED)
+@ConfigMapping(prefix = "quarkus.langchain4j.jlama")
+public interface LangChain4jJlamaFixedRuntimeConfig {
+
+    /**
+     * Default model config.
+     */
+    @WithParentName
+    JlamaConfig defaultConfig();
+
+    /**
+     * Named model config.
+     */
+    @ConfigDocSection
+    @ConfigDocMapKey("model-name")
+    @WithParentName
+    @WithDefaults
+    Map<String, JlamaConfig> namedConfig();
+
+    @ConfigGroup
+    interface JlamaConfig {
+
+        /**
+         * Chat model related settings
+         */
+        ChatModelFixedRuntimeConfig chatModel();
+
+        /**
+         * Embedding model related settings
+         */
+        EmbeddingModelFixedRuntimeConfig embeddingModel();
+    }
+}