spring-projects
diff --git a/‎models/spring-ai-qianfan/pom.xml‎
Lines changed: 6 additions & 0 deletions b/‎models/spring-ai-qianfan/pom.xml‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/QianFanChatModel.java‎
Lines changed: 137 additions & 26 deletions b/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/QianFanChatModel.java‎
Lines changed: 137 additions & 26 deletions
diff --git a/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/QianFanChatOptions.java‎
Lines changed: 1 addition & 1 deletion b/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/QianFanChatOptions.java‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/QianFanApi.java‎
Lines changed: 7 additions & 4 deletions b/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/QianFanApi.java‎
Lines changed: 7 additions & 4 deletions
diff --git a/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/ApiUtils.java‎ renamed to ‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/QianFanConstants.java‎
Lines changed: 3 additions & 8 deletions b/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/ApiUtils.java‎ renamed to ‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/QianFanConstants.java‎
Lines changed: 3 additions & 8 deletions
diff --git a/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/QianFanImageApi.java‎
Lines changed: 2 additions & 2 deletions b/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/QianFanImageApi.java‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/QianFanUtils.java‎
Lines changed: 14 additions & 0 deletions b/‎models/spring-ai-qianfan/src/main/java/org/springframework/ai/qianfan/api/QianFanUtils.java‎
Lines changed: 14 additions & 0 deletions
@@ -54,6 +54,12 @@
             <scope>test</scope>
         </dependency>
 
+		<dependency>
+			<groupId>io.micrometer</groupId>
+			<artifactId>micrometer-observation-test</artifactId>
+			<scope>test</scope>
+		</dependency>
+
     </dependencies>
 
 </project>
@@ -15,13 +15,25 @@
  */
 package org.springframework.ai.qianfan;
 
+import io.micrometer.observation.Observation;
+import io.micrometer.observation.ObservationRegistry;
+import io.micrometer.observation.contextpropagation.ObservationThreadLocalAccessor;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
+import org.springframework.ai.chat.messages.AssistantMessage;
+import org.springframework.ai.chat.metadata.ChatResponseMetadata;
+import org.springframework.ai.chat.metadata.EmptyUsage;
 import org.springframework.ai.chat.model.ChatModel;
 import org.springframework.ai.chat.model.ChatResponse;
 import org.springframework.ai.chat.model.Generation;
+import org.springframework.ai.chat.model.MessageAggregator;
 import org.springframework.ai.chat.model.StreamingChatModel;
+import org.springframework.ai.chat.observation.ChatModelObservationContext;
+import org.springframework.ai.chat.observation.ChatModelObservationConvention;
+import org.springframework.ai.chat.observation.ChatModelObservationDocumentation;
+import org.springframework.ai.chat.observation.DefaultChatModelObservationConvention;
 import org.springframework.ai.chat.prompt.ChatOptions;
+import org.springframework.ai.chat.prompt.ChatOptionsBuilder;
 import org.springframework.ai.chat.prompt.Prompt;
 import org.springframework.ai.model.ModelOptionsUtils;
 import org.springframework.ai.qianfan.api.QianFanApi;
@@ -30,11 +42,14 @@
 import org.springframework.ai.qianfan.api.QianFanApi.ChatCompletionMessage;
 import org.springframework.ai.qianfan.api.QianFanApi.ChatCompletionMessage.Role;
 import org.springframework.ai.qianfan.api.QianFanApi.ChatCompletionRequest;
+import org.springframework.ai.qianfan.api.QianFanConstants;
+import org.springframework.ai.qianfan.metadata.QianFanUsage;
 import org.springframework.ai.retry.RetryUtils;
 import org.springframework.http.ResponseEntity;
 import org.springframework.retry.support.RetryTemplate;
 import org.springframework.util.Assert;
 import reactor.core.publisher.Flux;
+import reactor.core.publisher.Mono;
 
 import java.util.Collections;
 import java.util.List;
@@ -45,15 +60,17 @@
  * backed by {@link QianFanApi}.
  *
  * @author Geng Rong
- * @since 1.0
  * @see ChatModel
  * @see StreamingChatModel
  * @see QianFanApi
+ * @since 1.0
  */
 public class QianFanChatModel implements ChatModel, StreamingChatModel {
 
 	private static final Logger logger = LoggerFactory.getLogger(QianFanChatModel.class);
 
+	private static final ChatModelObservationConvention DEFAULT_OBSERVATION_CONVENTION = new DefaultChatModelObservationConvention();
+
 	/**
 	 * The default options used for the chat completion requests.
 	 */
@@ -69,6 +86,16 @@ public class QianFanChatModel implements ChatModel, StreamingChatModel {
 	 */
 	private final QianFanApi qianFanApi;
 
+	/**
+	 * Observation registry used for instrumentation.
+	 */
+	private final ObservationRegistry observationRegistry;
+
+	/**
+	 * Conventions to use for generating observations.
+	 */
+	private ChatModelObservationConvention observationConvention = DEFAULT_OBSERVATION_CONVENTION;
+
 	/**
 	 * Creates an instance of the QianFanChatModel.
 	 * @param qianFanApi The QianFanApi instance to be used for interacting with the
@@ -98,52 +125,113 @@ public QianFanChatModel(QianFanApi qianFanApi, QianFanChatOptions options) {
 	 * @param retryTemplate The retry template.
 	 */
 	public QianFanChatModel(QianFanApi qianFanApi, QianFanChatOptions options, RetryTemplate retryTemplate) {
+		this(qianFanApi, options, retryTemplate, ObservationRegistry.NOOP);
+	}
+
+	/**
+	 * Initializes a new instance of the QianFanChatModel.
+	 * @param qianFanApi The QianFanApi instance to be used for interacting with the
+	 * QianFan Chat API.
+	 * @param options The QianFanChatOptions to configure the chat client.
+	 * @param retryTemplate The retry template.
+	 * @param observationRegistry The ObservationRegistry used for instrumentation.
+	 */
+	public QianFanChatModel(QianFanApi qianFanApi, QianFanChatOptions options, RetryTemplate retryTemplate,
+			ObservationRegistry observationRegistry) {
 		Assert.notNull(qianFanApi, "QianFanApi must not be null");
 		Assert.notNull(options, "Options must not be null");
 		Assert.notNull(retryTemplate, "RetryTemplate must not be null");
+		Assert.notNull(observationRegistry, "ObservationRegistry must not be null");
 		this.qianFanApi = qianFanApi;
 		this.defaultOptions = options;
 		this.retryTemplate = retryTemplate;
+		this.observationRegistry = observationRegistry;
 	}
 
 	@Override
 	public ChatResponse call(Prompt prompt) {
 
 		ChatCompletionRequest request = createRequest(prompt, false);
 
-		return this.retryTemplate.execute(ctx -> {
+		ChatModelObservationContext observationContext = ChatModelObservationContext.builder()
+			.prompt(prompt)
+			.provider(QianFanConstants.PROVIDER_NAME)
+			.requestOptions(buildRequestOptions(request))
+			.build();
 
-			ResponseEntity<ChatCompletion> completionEntity = this.doChatCompletion(request);
+		return ChatModelObservationDocumentation.CHAT_MODEL_OPERATION
+			.observation(this.observationConvention, DEFAULT_OBSERVATION_CONVENTION, () -> observationContext,
+					this.observationRegistry)
+			.observe(() -> {
+				ResponseEntity<ChatCompletion> completionEntity = this.retryTemplate
+					.execute(ctx -> this.qianFanApi.chatCompletionEntity(request));
 
-			var chatCompletion = completionEntity.getBody();
-			if (chatCompletion == null) {
-				logger.warn("No chat completion returned for prompt: {}", prompt);
-				return new ChatResponse(List.of());
-			}
+				var chatCompletion = completionEntity.getBody();
+				if (chatCompletion == null) {
+					logger.warn("No chat completion returned for prompt: {}", prompt);
+					return new ChatResponse(List.of());
+				}
 
-			// if (chatCompletion.baseResponse() != null &&
-			// chatCompletion.baseResponse().statusCode() != 0) {
-			// throw new RuntimeException(chatCompletion.baseResponse().message());
-			// }
+			// @formatter:off
+					Map<String, Object> metadata = Map.of(
+						"id", chatCompletion.id(),
+						"role", Role.ASSISTANT
+					);
+					// @formatter:on
 
-			var generation = new Generation(chatCompletion.result(),
-					Map.of("id", chatCompletion.id(), "role", Role.ASSISTANT));
-			return new ChatResponse(Collections.singletonList(generation));
-		});
+				var assistantMessage = new AssistantMessage(chatCompletion.result(), metadata);
+				List<Generation> generations = Collections.singletonList(new Generation(assistantMessage));
+				ChatResponse chatResponse = new ChatResponse(generations, from(chatCompletion, request.model()));
+				observationContext.setResponse(chatResponse);
+				return chatResponse;
+			});
 	}
 
 	@Override
 	public Flux<ChatResponse> stream(Prompt prompt) {
-		var request = createRequest(prompt, true);
 
-		return retryTemplate.execute(ctx -> {
+		return Flux.deferContextual(contextView -> {
+			ChatCompletionRequest request = createRequest(prompt, true);
+
 			var completionChunks = this.qianFanApi.chatCompletionStream(request);
 
-			return completionChunks.map(this::toChatCompletion).map(chatCompletion -> {
-				String id = chatCompletion.id();
-				var generation = new Generation(chatCompletion.result(), Map.of("id", id, "role", Role.ASSISTANT));
-				return new ChatResponse(Collections.singletonList(generation));
-			});
+			final ChatModelObservationContext observationContext = ChatModelObservationContext.builder()
+				.prompt(prompt)
+				.provider(QianFanConstants.PROVIDER_NAME)
+				.requestOptions(buildRequestOptions(request))
+				.build();
+
+			Observation observation = ChatModelObservationDocumentation.CHAT_MODEL_OPERATION.observation(
+					this.observationConvention, DEFAULT_OBSERVATION_CONVENTION, () -> observationContext,
+					this.observationRegistry);
+
+			observation.parentObservation(contextView.getOrDefault(ObservationThreadLocalAccessor.KEY, null)).start();
+
+			Flux<ChatResponse> chatResponse = completionChunks.map(this::toChatCompletion)
+				.switchMap(chatCompletion -> Mono.just(chatCompletion).map(chatCompletion2 -> {
+				// @formatter:off
+						Map<String, Object> metadata = Map.of(
+								"id", chatCompletion.id(),
+								"role", Role.ASSISTANT
+						);
+						// @formatter:on
+
+					var assistantMessage = new AssistantMessage(chatCompletion.result(), metadata);
+					List<Generation> generations = Collections.singletonList(new Generation(assistantMessage));
+					return new ChatResponse(generations, from(chatCompletion, request.model()));
+				}))
+				.doOnError(observation::error)
+				.doFinally(s -> {
+					// TODO: Consider a custom ObservationContext and
+					// include additional metadata
+					// if (s == SignalType.CANCEL) {
+					// observationContext.setAborted(true);
+					// }
+					observation.stop();
+				})
+				.contextWrite(ctx -> ctx.put(ObservationThreadLocalAccessor.KEY, observation));
+			return new MessageAggregator().aggregate(chatResponse, observationContext::setResponse);
+
 		});
 	}
 
@@ -153,7 +241,8 @@ public Flux<ChatResponse> stream(Prompt prompt) {
 	 * @return the ChatCompletion
 	 */
 	private ChatCompletion toChatCompletion(ChatCompletionChunk chunk) {
-		return new ChatCompletion(chunk.id(), chunk.object(), chunk.created(), chunk.result(), chunk.usage());
+		return new ChatCompletion(chunk.id(), chunk.object(), chunk.created(), chunk.result(), chunk.finishReason(),
+				chunk.usage());
 	}
 
 	/**
@@ -193,8 +282,30 @@ public ChatOptions getDefaultOptions() {
 		return QianFanChatOptions.fromOptions(this.defaultOptions);
 	}
 
-	private ResponseEntity<ChatCompletion> doChatCompletion(ChatCompletionRequest request) {
-		return this.qianFanApi.chatCompletionEntity(request);
+	private ChatOptions buildRequestOptions(QianFanApi.ChatCompletionRequest request) {
+		return ChatOptionsBuilder.builder()
+			.withModel(request.model())
+			.withFrequencyPenalty(request.frequencyPenalty())
+			.withMaxTokens(request.maxTokens())
+			.withPresencePenalty(request.presencePenalty())
+			.withStopSequences(request.stop())
+			.withTemperature(request.temperature())
+			.withTopP(request.topP())
+			.build();
+	}
+
+	private ChatResponseMetadata from(QianFanApi.ChatCompletion result, String model) {
+		Assert.notNull(result, "QianFan ChatCompletionResult must not be null");
+		return ChatResponseMetadata.builder()
+			.withId(result.id() != null ? result.id() : "")
+			.withUsage(result.usage() != null ? QianFanUsage.from(result.usage()) : new EmptyUsage())
+			.withModel(model)
+			.withKeyValue("created", result.created() != null ? result.created() : 0L)
+			.build();
+	}
+
+	public void setObservationConvention(ChatModelObservationConvention observationConvention) {
+		this.observationConvention = observationConvention;
 	}
 
 }
@@ -51,7 +51,7 @@ public class QianFanChatOptions implements ChatOptions {
 	 * The maximum number of tokens to generate in the chat completion. The total length of input
 	 * tokens and generated tokens is limited by the model's context length.
 	 */
-	private @JsonProperty("max_tokens") Integer maxTokens;
+	private @JsonProperty("max_output_tokens") Integer maxTokens;
 	/**
 	 * Number between -2.0 and 2.0. Positive values penalize new tokens based on whether they
 	 * appear in the text so far, increasing the model's likelihood to talk about new topics.
 
@@ -60,7 +60,7 @@ public class QianFanApi extends AuthApi {
 	 * @param secretKey QianFan secret key.
 	 */
 	public QianFanApi(String apiKey, String secretKey) {
-		this(ApiUtils.DEFAULT_BASE_URL, apiKey, secretKey);
+		this(QianFanConstants.DEFAULT_BASE_URL, apiKey, secretKey);
 	}
 
 	/**
@@ -110,18 +110,18 @@ public QianFanApi(String baseUrl, String apiKey, String secretKey, RestClient.Bu
 	 * @param responseErrorHandler Response error handler.
 	 */
 	public QianFanApi(String baseUrl, String apiKey, String secretKey, RestClient.Builder restClientBuilder,
-					  WebClient.Builder webClientBuilder,ResponseErrorHandler responseErrorHandler) {
+					  WebClient.Builder webClientBuilder, ResponseErrorHandler responseErrorHandler) {
 		super(apiKey, secretKey);
 
 		this.restClient = restClientBuilder
 				.baseUrl(baseUrl)
-				.defaultHeaders(ApiUtils.getJsonContentHeaders())
+				.defaultHeaders(QianFanUtils.defaultHeaders())
 				.defaultStatusHandler(responseErrorHandler)
 				.build();
 
 		this.webClient = webClientBuilder
 				.baseUrl(baseUrl)
-				.defaultHeaders(ApiUtils.getJsonContentHeaders())
+				.defaultHeaders(QianFanUtils.defaultHeaders())
 				.build();
 	}
 
@@ -308,6 +308,7 @@ public record ChatCompletion(
 			@JsonProperty("object") String object,
 			@JsonProperty("created") Long created,
 			@JsonProperty("result") String result,
+			@JsonProperty("finish_reason") String finishReason,
 			@JsonProperty("usage") Usage usage) {
 	}
 
@@ -319,6 +320,7 @@ public record ChatCompletion(
 	 */
 	@JsonInclude(Include.NON_NULL)
 	public record Usage(
+			@JsonProperty("completion_tokens") Integer completionTokens,
 			@JsonProperty("prompt_tokens") Integer promptTokens,
 			@JsonProperty("total_tokens") Integer totalTokens) {
 
@@ -339,6 +341,7 @@ public record ChatCompletionChunk(
 			@JsonProperty("object") String object,
 			@JsonProperty("created") Long created,
 			@JsonProperty("result") String result,
+			@JsonProperty("finish_reason") String finishReason,
 			@JsonProperty("is_end") Boolean end,
 
 			@JsonProperty("usage") Usage usage
 
@@ -15,10 +15,7 @@
  */
 package org.springframework.ai.qianfan.api;
 
-import org.springframework.http.HttpHeaders;
-import org.springframework.http.MediaType;
-
-import java.util.function.Consumer;
+import org.springframework.ai.observation.conventions.AiProvider;
 
 /**
  * The ApiUtils class provides utility methods for working with API requests and
@@ -27,12 +24,10 @@
  * @author Geng Rong
  * @since 1.0
  */
-public class ApiUtils {
+public class QianFanConstants {
 
 	public static final String DEFAULT_BASE_URL = "https://aip.baidubce.com/rpc/2.0/ai_custom";
 
-	public static Consumer<HttpHeaders> getJsonContentHeaders() {
-		return headers -> headers.setContentType(MediaType.APPLICATION_JSON);
-	}
+	public static final String PROVIDER_NAME = AiProvider.QIANFAN.value();
 
 }
@@ -44,7 +44,7 @@ public class QianFanImageApi extends AuthApi {
 	 * @param secretKey QianFan secret key.
 	 */
 	public QianFanImageApi(String apiKey, String secretKey) {
-		this(ApiUtils.DEFAULT_BASE_URL, apiKey, secretKey, RestClient.builder());
+		this(QianFanConstants.DEFAULT_BASE_URL, apiKey, secretKey, RestClient.builder());
 	}
 
 	/**
@@ -71,7 +71,7 @@ public QianFanImageApi(String baseUrl, String apiKey, String secretKey, RestClie
 		super(apiKey, secretKey);
 
 		this.restClient = restClientBuilder.baseUrl(baseUrl)
-			.defaultHeaders(ApiUtils.getJsonContentHeaders())
+			.defaultHeaders(QianFanUtils.defaultHeaders())
 			.defaultStatusHandler(responseErrorHandler)
 			.build();
 	}
 
@@ -0,0 +1,14 @@
+package org.springframework.ai.qianfan.api;
+
+import org.springframework.http.HttpHeaders;
+import org.springframework.http.MediaType;
+
+import java.util.function.Consumer;
+
+public class QianFanUtils {
+
+	public static Consumer<HttpHeaders> defaultHeaders() {
+		return headers -> headers.setContentType(MediaType.APPLICATION_JSON);
+	}
+
+}