Extract and assert chatCompletion toolCalls single and streamed

ygree · ygree · commit 6e654e54f821 · 2025-12-09T11:17:09.000-08:00
diff --git a/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/main/java/datadog/trace/instrumentation/openai_java/OpenAiDecorator.java b/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/main/java/datadog/trace/instrumentation/openai_java/OpenAiDecorator.java
@@ -4,6 +4,7 @@
 import com.openai.core.JsonField;
 import com.openai.core.http.Headers;
 import com.openai.core.http.HttpResponse;
+import com.openai.helpers.ChatCompletionAccumulator;
 import com.openai.models.ResponsesModel;
 import com.openai.models.chat.completions.ChatCompletion;
 import com.openai.models.chat.completions.ChatCompletionChunk;
@@ -319,24 +320,99 @@ public void withChatCompletionChunks(AgentSpan span, List<ChatCompletionChunk> c
     for (int i = 0; i < choiceNum; i++) {
       contents[i] = new StringBuilder(128);
     }
+    // collect tool calls by choices for all chunks
+    // Map from choice index -> (tool call index -> accumulated tool call data)
+    @SuppressWarnings("unchecked")
+    Map<Long, StreamingToolCallData>[] toolCallsByChoice = new Map[choiceNum];
+    for (int i = 0; i < choiceNum; i++) {
+      toolCallsByChoice[i] = new HashMap<>();
+    }
+
+    // Create an accumulator
+    ChatCompletionAccumulator accumulator = ChatCompletionAccumulator.create();
+
+// Accumulate each chunk as it arrives
+    for (ChatCompletionChunk chunk : chunks) {
+      accumulator.accumulate(chunk);
+    }
+
+// Get the final ChatCompletion
+    ChatCompletion chatCompletion = accumulator.chatCompletion();
+
     for (ChatCompletionChunk chunk : chunks) {
       // choices can be empty for the last chunk
       List<ChatCompletionChunk.Choice> choices = chunk.choices();
       for (int i = 0; i < choiceNum && i < choices.size(); i++) {
         ChatCompletionChunk.Choice choice = choices.get(i);
         ChatCompletionChunk.Choice.Delta delta = choice.delta();
         delta.content().ifPresent(contents[i]::append);
+
+        // accumulate tool calls
+        Optional<List<ChatCompletionChunk.Choice.Delta.ToolCall>> toolCallsOpt = delta.toolCalls();
+        if (toolCallsOpt.isPresent()) {
+          for (ChatCompletionChunk.Choice.Delta.ToolCall toolCall : toolCallsOpt.get()) {
+            long index = toolCall.index();
+            StreamingToolCallData data =
+                toolCallsByChoice[i].computeIfAbsent(index, k -> new StreamingToolCallData());
+            toolCall.id().ifPresent(id -> data.id = id);
+            toolCall
+                .type()
+                .flatMap(t -> t._value().asString())
+                .ifPresent(type -> data.type = type);
+            toolCall
+                .function()
+                .ifPresent(
+                    fn -> {
+                      fn.name().ifPresent(data.name::append);
+                      fn.arguments().ifPresent(data.arguments::append);
+                    });
+          }
+        }
       }
       chunk.usage().ifPresent(usage -> withCompletionUsage(span, usage));
     }
     // build LLMMessages
     List<LLMObs.LLMMessage> llmMessages = new ArrayList<>(choiceNum);
     for (int i = 0; i < choiceNum; i++) {
-      llmMessages.add(LLMObs.LLMMessage.from(roles[i], contents[i].toString()));
+      List<LLMObs.ToolCall> toolCalls = buildToolCallsFromStreamingData(toolCallsByChoice[i]);
+      llmMessages.add(LLMObs.LLMMessage.from(roles[i], contents[i].toString(), toolCalls));
     }
     span.setTag("_ml_obs_tag.output", llmMessages);
   }
 
+  /** Helper class to accumulate streaming tool call data across chunks */
+  private static class StreamingToolCallData {
+    String id;
+    String type = "function";
+    StringBuilder name = new StringBuilder();
+    StringBuilder arguments = new StringBuilder();
+  }
+
+  private List<LLMObs.ToolCall> buildToolCallsFromStreamingData(
+      Map<Long, StreamingToolCallData> toolCallDataMap) {
+    if (toolCallDataMap.isEmpty()) {
+      return Collections.emptyList();
+    }
+    List<LLMObs.ToolCall> toolCalls = new ArrayList<>();
+    // Sort by index to maintain order
+    toolCallDataMap.entrySet().stream()
+        .sorted(Map.Entry.comparingByKey())
+        .forEach(
+            entry -> {
+              StreamingToolCallData data = entry.getValue();
+              String name = data.name.toString();
+              String argumentsJson = data.arguments.toString();
+              Map<String, Object> arguments = Collections.singletonMap("value", argumentsJson);
+              try {
+                arguments = ToolCallExtractor.parseArguments(argumentsJson);
+              } catch (Exception e) {
+                // keep default map with raw value
+              }
+              toolCalls.add(LLMObs.ToolCall.from(name, data.type, data.id, arguments));
+            });
+    return toolCalls;
+  }
+
   public void withEmbeddingCreateParams(AgentSpan span, EmbeddingCreateParams params) {
     span.setTag("_ml_obs_tag.span.kind", Tags.LLMOBS_EMBEDDING_SPAN_KIND);
     span.setResourceName(EMBEDDINGS_CREATE);
diff --git a/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/main/java/datadog/trace/instrumentation/openai_java/OpenAiModule.java b/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/main/java/datadog/trace/instrumentation/openai_java/OpenAiModule.java
@@ -16,6 +16,8 @@ public OpenAiModule() {
   public String[] helperClassNames() {
     return new String[] {
       packageName + ".OpenAiDecorator",
+      packageName + ".OpenAiDecorator$1",
+      packageName + ".OpenAiDecorator$StreamingToolCallData",
       packageName + ".ResponseWrappers",
       packageName + ".ResponseWrappers$DDHttpResponseFor",
       packageName + ".ResponseWrappers$1",
diff --git a/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/main/java/datadog/trace/instrumentation/openai_java/ToolCallExtractor.java b/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/main/java/datadog/trace/instrumentation/openai_java/ToolCallExtractor.java
@@ -29,11 +29,12 @@ public static LLMObs.ToolCall getToolCall(ChatCompletionMessageToolCall toolCall
       String name = function.name();
       String argumentsJson = function.arguments();
 
-      Map<String, Object> arguments = Collections.singletonMap("value", argumentsJson);
+      Map<String, Object> arguments;
       try {
-        arguments = MAPPER.readValue(argumentsJson, MAP_TYPE_REF);
+        arguments = parseArguments(argumentsJson);
       } catch (Exception e) {
         log.debug("Failed to parse tool call arguments as JSON: {}", argumentsJson, e);
+        arguments = Collections.singletonMap("value", argumentsJson);
       }
 
       String type = "function";
@@ -48,4 +49,8 @@ public static LLMObs.ToolCall getToolCall(ChatCompletionMessageToolCall toolCall
     }
     return null;
   }
+
+  public static Map<String, Object> parseArguments(String argumentsJson) throws Exception {
+    return MAPPER.readValue(argumentsJson, MAP_TYPE_REF);
+  }
 }
diff --git a/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/test/groovy/ChatCompletionServiceTest.groovy b/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/test/groovy/ChatCompletionServiceTest.groovy
@@ -8,6 +8,7 @@ import com.openai.models.chat.completions.ChatCompletion
 import com.openai.models.chat.completions.ChatCompletionChunk
 import com.openai.models.completions.Completion
 import datadog.trace.api.DDSpanTypes
+import datadog.trace.api.llmobs.LLMObs
 import datadog.trace.bootstrap.instrumentation.api.Tags
 import datadog.trace.instrumentation.openai_java.OpenAiDecorator
 import java.util.concurrent.CompletableFuture
@@ -119,21 +120,65 @@ class ChatCompletionServiceTest extends OpenAiTest {
   }
 
   def "create chat/completion test with tool calls"() {
-    ChatCompletion resp = runUnderTrace("parent") {
+    runUnderTrace("parent") {
       openAiClient.chat().completions().create(chatCompletionCreateParamsWithTools())
     }
 
     expect:
-    resp != null
-    resp.choices().size() == 1
-    resp.choices().get(0).message().toolCalls().isPresent()
-    resp.choices().get(0).message().toolCalls().get().size() == 1
-    resp.choices().get(0).message().toolCalls().get().get(0).function().get().function().name() == "extract_student_info"
+    List<LLMObs.LLMMessage> outputTag = []
+    assertChatCompletionTrace(false, outputTag)
     and:
-    assertChatCompletionTrace(false)
+    outputTag.size() == 1
+    LLMObs.LLMMessage outputMsg = outputTag.get(0)
+    outputMsg.toolCalls.size() == 1
+    def toolcall = outputMsg.toolCalls.get(0)
+    toolcall.name == "extract_student_info"
+    toolcall.toolId instanceof String
+    toolcall.type == "function"
+    toolcall.arguments == [
+        name: 'David Nguyen',
+        major: 'computer science',
+        school: 'Stanford University',
+        grades: 3.8,
+        clubs: ['Chess Club', 'South Asian Student Association']
+    ]
+  }
+
+  def "create streaming chat/completion test with tool calls"() {
+    runnableUnderTrace("parent") {
+      StreamResponse<ChatCompletionChunk> streamCompletion = openAiClient.chat().completions().createStreaming(chatCompletionCreateParamsWithTools())
+      try (Stream stream = streamCompletion.stream()) {
+        stream.forEach { chunk ->
+          // chunks.add(chunk)
+        }
+      }
+    }
+
+    expect:
+    List<LLMObs.LLMMessage> outputTag = []
+    assertChatCompletionTrace(true, outputTag)
+    and:
+    outputTag.size() == 1
+    LLMObs.LLMMessage outputMsg = outputTag.get(0)
+    outputMsg.toolCalls.size() == 1
+    def toolcall = outputMsg.toolCalls.get(0)
+    toolcall.name == "extract_student_info"
+    toolcall.toolId instanceof String
+    toolcall.type == "function"
+    toolcall.arguments == [
+        name: 'David Nguyen',
+        major: 'computer science',
+        school: 'Stanford University',
+        grades: 3.8,
+        clubs: ['Chess Club', 'South Asian Student Association']
+    ]
   }
 
   private void assertChatCompletionTrace(boolean isStreaming) {
+    assertChatCompletionTrace(isStreaming, null)
+  }
+
+  private void assertChatCompletionTrace(boolean isStreaming, List outputTagsOut) {
     assertTraces(1) {
       trace(3) {
         sortSpansByStart()
@@ -155,6 +200,10 @@ class ChatCompletionServiceTest extends OpenAiTest {
             "_ml_obs_tag.metadata" Map
             "_ml_obs_tag.input" List
             "_ml_obs_tag.output" List
+            def outputTags = tag("_ml_obs_tag.output")
+            if (outputTagsOut != null && outputTags != null) {
+              outputTagsOut.addAll(outputTags)
+            }
             if (!isStreaming) {
               // streamed completions missing usage data
               "_ml_obs_metric.input_tokens" Long
diff --git a/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/test/resources/http-records/chat/completions/d6d3881e8743ea24+154d4ae4e0a9a9b6.POST.rec b/dd-java-agent/instrumentation/openai-java/openai-java-3.0/src/test/resources/http-records/chat/completions/d6d3881e8743ea24+154d4ae4e0a9a9b6.POST.rec

Original file line number	Diff line number	Diff line change
`@@ -29,11 +29,12 @@ public static LLMObs.ToolCall getToolCall(ChatCompletionMessageToolCall toolCall`
`29`	`29`	`String name = function.name();`
`30`	`30`	`String argumentsJson = function.arguments();`
`31`	`31`
`32`		`- Map<String, Object> arguments = Collections.singletonMap("value", argumentsJson);`
	`32`	`+ Map<String, Object> arguments;`
`33`	`33`	`try {`
`34`		`- arguments = MAPPER.readValue(argumentsJson, MAP_TYPE_REF);`
	`34`	`+ arguments = parseArguments(argumentsJson);`
`35`	`35`	`} catch (Exception e) {`
`36`	`36`	`log.debug("Failed to parse tool call arguments as JSON: {}", argumentsJson, e);`
	`37`	`+ arguments = Collections.singletonMap("value", argumentsJson);`
`37`	`38`	`}`
`38`	`39`
`39`	`40`	`String type = "function";`
`@@ -48,4 +49,8 @@ public static LLMObs.ToolCall getToolCall(ChatCompletionMessageToolCall toolCall`
`48`	`49`	`}`
`49`	`50`	`return null;`
`50`	`51`	`}`
	`52`	`+`
	`53`	`+ public static Map<String, Object> parseArguments(String argumentsJson) throws Exception {`
	`54`	`+ return MAPPER.readValue(argumentsJson, MAP_TYPE_REF);`
	`55`	`+ }`
`51`	`56`	`}`