feat: limit response size, use required context window

Angular2Guy · Angular2Guy · commit 5aab87179121 · 2024-12-08T11:11:46.000+01:00
diff --git a/backend/src/main/java/ch/xxx/aidoclibchat/adapter/client/OpenLibraryRestClient.java b/backend/src/main/java/ch/xxx/aidoclibchat/adapter/client/OpenLibraryRestClient.java
@@ -44,7 +44,7 @@ public Response apply(Request request) {
 		var paramsStr = List.of(authorOpt, titleOpt, subjectOpt).stream()
 				.filter(Optional::isPresent).map(Optional::get).collect(Collectors.joining("&"));
 		var urlStr = 
-				String.format("%s?%s", this.baseUrl, paramsStr);
+				String.format("%s?%s&limit=10", this.baseUrl, paramsStr);
 		LOGGER.info(urlStr);
 		var response = this.restClient.get().uri(urlStr).retrieve().body(Response.class);
 		return response;
diff --git a/backend/src/main/resources/application-ollama.properties b/backend/src/main/resources/application-ollama.properties
@@ -18,7 +18,8 @@ spring.ai.ollama.chat.options.num-ctx=12288
 #spring.ai.embedding.transformer.tokenizer.uri=https://huggingface.co/mixedbread-ai/mxbai-embed-large-v1/tree/main/tokenizer.json
 
 # function calling
-#spring.ai.ollama.chat.model=mixtral:8x7b-text-v0.1-q6_K
+#spring.ai.ollama.chat.model=llama3.1:8b
+#spring.ai.ollama.chat.options.num-ctx=65535
 
 # image processing
 #spring.ai.ollama.chat.model=llava:34b-v1.6-q6_K