wip

shellmayr · shellmayr · commit 44ec30626a23 · 2025-10-15T15:02:50.000+02:00
diff --git a/sentry_sdk/ai/utils.py b/sentry_sdk/ai/utils.py
@@ -127,19 +127,22 @@ def truncate_messages_by_size(messages, max_bytes=MAX_GEN_AI_MESSAGE_BYTES):
         truncated_messages.pop(0)
 
     if len(truncated_messages) == 1:
-        serialized = serialize(
-            truncated_messages, is_vars=False, max_value_length=round(max_bytes * 0.8)
-        )
-        serialized_json = json.dumps(serialized, separators=(",", ":"))
-        current_size = len(serialized_json.encode("utf-8"))
+        last_message = truncated_messages[0].copy()
+        content = last_message.get("content", "")
 
-        if current_size > max_bytes:
-            last_message = truncated_messages[0].copy()
-            content = last_message.get("content", "")
+        if content and isinstance(content, str):
+            if len(content) > int(max_bytes * 0.8):
+                last_message["content"] = content[: int(max_bytes * 0.8)] + "..."
+            else:
+                last_message["content"] = content
+            truncated_messages[0] = last_message
 
-            if content and isinstance(content, str):
+        if content and isinstance(content, list):
+            if len(content) > int(max_bytes * 0.8):
                 last_message["content"] = content[: int(max_bytes * 0.8)] + "..."
-                truncated_messages[0] = last_message
+            else:
+                last_message["content"] = content
+            truncated_messages[0] = last_message
 
     return truncated_messages
 
diff --git a/sentry_sdk/integrations/anthropic.py b/sentry_sdk/integrations/anthropic.py
@@ -151,7 +151,9 @@ def _set_input_data(span, kwargs, integration):
             role_normalized_messages, span, scope
         )
         if messages_data is not None:
-            span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+            set_data_normalized(
+                span, SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data, unpack=False
+            )
 
     set_data_normalized(
         span, SPANDATA.GEN_AI_RESPONSE_STREAMING, kwargs.get("stream", False)
diff --git a/sentry_sdk/integrations/langchain.py b/sentry_sdk/integrations/langchain.py
@@ -227,7 +227,12 @@ def on_llm_start(
                     normalized_messages, span, scope
                 )
                 if messages_data is not None:
-                    span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+                    set_data_normalized(
+                        span,
+                        SPANDATA.GEN_AI_REQUEST_MESSAGES,
+                        messages_data,
+                        unpack=False,
+                    )
 
     def on_chat_model_start(self, serialized, messages, *, run_id, **kwargs):
         # type: (SentryLangchainCallback, Dict[str, Any], List[List[BaseMessage]], UUID, Any) -> Any
@@ -284,7 +289,12 @@ def on_chat_model_start(self, serialized, messages, *, run_id, **kwargs):
                     normalized_messages, span, scope
                 )
                 if messages_data is not None:
-                    span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+                    set_data_normalized(
+                        span,
+                        SPANDATA.GEN_AI_REQUEST_MESSAGES,
+                        messages_data,
+                        unpack=False,
+                    )
 
     def on_chat_model_end(self, response, *, run_id, **kwargs):
         # type: (SentryLangchainCallback, LLMResult, UUID, Any) -> Any
@@ -763,7 +773,12 @@ def new_invoke(self, *args, **kwargs):
                     normalized_messages, span, scope
                 )
                 if messages_data is not None:
-                    span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+                    set_data_normalized(
+                        span,
+                        SPANDATA.GEN_AI_REQUEST_MESSAGES,
+                        messages_data,
+                        unpack=False,
+                    )
 
             output = result.get("output")
             if (
@@ -817,7 +832,9 @@ def new_stream(self, *args, **kwargs):
                 normalized_messages, span, sentry_sdk.get_current_scope()
             )
             if messages_data is not None:
-                span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+                set_data_normalized(
+                    span, SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data, unpack=False
+                )
 
         # Run the agent
         result = f(self, *args, **kwargs)
diff --git a/sentry_sdk/integrations/langgraph.py b/sentry_sdk/integrations/langgraph.py
@@ -190,7 +190,12 @@ def new_invoke(self, *args, **kwargs):
                         normalized_input_messages, span, scope
                     )
                     if messages_data is not None:
-                        span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+                        set_data_normalized(
+                            span,
+                            SPANDATA.GEN_AI_REQUEST_MESSAGES,
+                            messages_data,
+                            unpack=False,
+                        )
 
             result = f(self, *args, **kwargs)
 
@@ -241,7 +246,12 @@ async def new_ainvoke(self, *args, **kwargs):
                         normalized_input_messages, span, scope
                     )
                     if messages_data is not None:
-                        span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+                        set_data_normalized(
+                            span,
+                            SPANDATA.GEN_AI_REQUEST_MESSAGES,
+                            messages_data,
+                            unpack=False,
+                        )
 
             result = await f(self, *args, **kwargs)
 
diff --git a/sentry_sdk/integrations/litellm.py b/sentry_sdk/integrations/litellm.py
@@ -81,7 +81,9 @@ def _input_callback(kwargs):
         scope = sentry_sdk.get_current_scope()
         messages_data = truncate_and_annotate_messages(normalized_messages, span, scope)
         if messages_data is not None:
-            span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+            set_data_normalized(
+                span, SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data, unpack=False
+            )
 
     # Record other parameters
     params = {
diff --git a/sentry_sdk/integrations/openai.py b/sentry_sdk/integrations/openai.py
@@ -190,7 +190,9 @@ def _set_input_data(span, kwargs, operation, integration):
         scope = sentry_sdk.get_current_scope()
         messages_data = truncate_and_annotate_messages(normalized_messages, span, scope)
         if messages_data is not None:
-            span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+            set_data_normalized(
+                span, SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data, unpack=False
+            )
 
     # Input attributes: Common
     set_data_normalized(span, SPANDATA.GEN_AI_SYSTEM, "openai")
diff --git a/sentry_sdk/integrations/openai_agents/spans/invoke_agent.py b/sentry_sdk/integrations/openai_agents/spans/invoke_agent.py
@@ -67,7 +67,9 @@ def invoke_agent_span(context, agent, kwargs):
                 normalized_messages, span, scope
             )
             if messages_data is not None:
-                span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)
+                set_data_normalized(
+                    span, SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data, unpack=False
+                )
 
     _set_agent_data(span, agent)
 
diff --git a/tests/integrations/anthropic/test_anthropic.py b/tests/integrations/anthropic/test_anthropic.py
@@ -124,9 +124,10 @@ def test_nonstreaming_create_message(
     assert span["data"][SPANDATA.GEN_AI_REQUEST_MODEL] == "model"
 
     if send_default_pii and include_prompts:
-        assert span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES] == [
-            {"role": "user", "content": "Hello, Claude"}
-        ]
+        assert (
+            span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
+            == '[{"role": "user", "content": "Hello, Claude"}]'
+        )
         assert span["data"][SPANDATA.GEN_AI_RESPONSE_TEXT] == "Hi, I'm Claude."
     else:
         assert SPANDATA.GEN_AI_REQUEST_MESSAGES not in span["data"]
@@ -192,9 +193,10 @@ async def test_nonstreaming_create_message_async(
     assert span["data"][SPANDATA.GEN_AI_REQUEST_MODEL] == "model"
 
     if send_default_pii and include_prompts:
-        assert span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES] == [
-            {"role": "user", "content": "Hello, Claude"}
-        ]
+        assert (
+            span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
+            == '[{"role": "user", "content": "Hello, Claude"}]'
+        )
         assert span["data"][SPANDATA.GEN_AI_RESPONSE_TEXT] == "Hi, I'm Claude."
     else:
         assert SPANDATA.GEN_AI_REQUEST_MESSAGES not in span["data"]
@@ -291,9 +293,10 @@ def test_streaming_create_message(
     assert span["data"][SPANDATA.GEN_AI_REQUEST_MODEL] == "model"
 
     if send_default_pii and include_prompts:
-        assert span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES] == [
-            {"role": "user", "content": "Hello, Claude"}
-        ]
+        assert (
+            span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
+            == '[{"role": "user", "content": "Hello, Claude"}]'
+        )
         assert span["data"][SPANDATA.GEN_AI_RESPONSE_TEXT] == "Hi! I'm Claude!"
 
     else:
@@ -394,9 +397,10 @@ async def test_streaming_create_message_async(
     assert span["data"][SPANDATA.GEN_AI_REQUEST_MODEL] == "model"
 
     if send_default_pii and include_prompts:
-        assert span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES] == [
-            {"role": "user", "content": "Hello, Claude"}
-        ]
+        assert (
+            span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
+            == '[{"role": "user", "content": "Hello, Claude"}]'
+        )
         assert span["data"][SPANDATA.GEN_AI_RESPONSE_TEXT] == "Hi! I'm Claude!"
 
     else:
@@ -524,9 +528,10 @@ def test_streaming_create_message_with_input_json_delta(
     assert span["data"][SPANDATA.GEN_AI_REQUEST_MODEL] == "model"
 
     if send_default_pii and include_prompts:
-        assert span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES] == [
-            {"role": "user", "content": "What is the weather like in San Francisco?"}
-        ]
+        assert (
+            span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
+            == '[{"role": "user", "content": "What is the weather like in San Francisco?"}]'
+        )
         assert (
             span["data"][SPANDATA.GEN_AI_RESPONSE_TEXT]
             == "{'location': 'San Francisco, CA'}"
@@ -663,9 +668,10 @@ async def test_streaming_create_message_with_input_json_delta_async(
     assert span["data"][SPANDATA.GEN_AI_REQUEST_MODEL] == "model"
 
     if send_default_pii and include_prompts:
-        assert span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES] == [
-            {"role": "user", "content": "What is the weather like in San Francisco?"}
-        ]
+        assert (
+            span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
+            == '[{"role": "user", "content": "What is the weather like in San Francisco?"}]'
+        )
         assert (
             span["data"][SPANDATA.GEN_AI_RESPONSE_TEXT]
             == "{'location': 'San Francisco, CA'}"
@@ -919,7 +925,7 @@ def test_anthropic_message_role_mapping(sentry_init, capture_events):
     assert span["op"] == "gen_ai.chat"
     assert SPANDATA.GEN_AI_REQUEST_MESSAGES in span["data"]
 
-    stored_messages = span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
+    stored_messages = json.loads(span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES])
     assert len(stored_messages) == 4
     assert stored_messages[0]["role"] == "system"
     assert stored_messages[1]["role"] == "user"
@@ -975,10 +981,13 @@ def test_anthropic_message_truncation(sentry_init, capture_events):
 
     assert SPANDATA.GEN_AI_REQUEST_MESSAGES in span["data"]
     messages_data = span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
-    assert isinstance(messages_data, list)
-    assert len(messages_data) <= len(large_messages)
+    assert isinstance(messages_data, str)
+
+    parsed_messages = json.loads(messages_data)
+    assert isinstance(parsed_messages, list)
+    assert len(parsed_messages) <= len(large_messages)
 
-    result_size = len(serialize(messages_data, is_vars=False))
+    result_size = len(messages_data.encode("utf-8"))
     assert result_size <= MAX_GEN_AI_MESSAGE_BYTES
 
 
@@ -1021,8 +1030,10 @@ def test_anthropic_single_large_message_preservation(sentry_init, capture_events
 
     assert SPANDATA.GEN_AI_REQUEST_MESSAGES in span["data"]
     messages_data = span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
-    assert isinstance(messages_data, list)
+    assert isinstance(messages_data, str)
 
-    assert len(messages_data) == 1
-    assert messages_data[0]["role"] == "user"
-    assert len(messages_data[0]["content"]) < len(huge_content)
+    parsed_messages = json.loads(messages_data)
+    assert isinstance(parsed_messages, list)
+    assert len(parsed_messages) == 1
+    assert parsed_messages[0]["role"] == "user"
+    assert len(parsed_messages[0]["content"]) < len(huge_content)
diff --git a/tests/integrations/langgraph/test_langgraph.py b/tests/integrations/langgraph/test_langgraph.py
@@ -672,7 +672,9 @@ def __init__(self, content, message_type="human"):
 
     # If messages were captured, verify role mapping
     if SPANDATA.GEN_AI_REQUEST_MESSAGES in span["data"]:
-        stored_messages = span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
+        import json
+
+        stored_messages = json.loads(span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES])
 
         # Find messages with specific content to verify role mapping
         ai_message = next(
diff --git a/tests/integrations/litellm/test_litellm.py b/tests/integrations/litellm/test_litellm.py
@@ -637,8 +637,10 @@ def test_litellm_single_large_message_preservation(sentry_init, capture_events):
 
     assert SPANDATA.GEN_AI_REQUEST_MESSAGES in span["data"]
     messages_data = span["data"][SPANDATA.GEN_AI_REQUEST_MESSAGES]
-    assert isinstance(messages_data, list)
+    assert isinstance(messages_data, str)
 
-    assert len(messages_data) == 1
-    assert messages_data[0]["role"] == "user"
-    assert len(messages_data[0]["content"]) < len(huge_content)
+    parsed_messages = json.loads(messages_data)
+    assert isinstance(parsed_messages, list)
+    assert len(parsed_messages) == 1
+    assert parsed_messages[0]["role"] == "user"
+    assert len(parsed_messages[0]["content"]) < len(huge_content)
diff --git a/tests/integrations/openai/test_openai.py b/tests/integrations/openai/test_openai.py
diff --git a/tests/integrations/openai_agents/test_openai_agents.py b/tests/integrations/openai_agents/test_openai_agents.py
diff --git a/tests/test_ai_message_utils.py b/tests/test_ai_message_utils.py

Original file line number	Diff line number	Diff line change
`@@ -67,7 +67,9 @@ def invoke_agent_span(context, agent, kwargs):`
`67`	`67`	`normalized_messages, span, scope`
`68`	`68`	`)`
`69`	`69`	`if messages_data is not None:`
`70`		`- span.set_data(SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data)`
	`70`	`+ set_data_normalized(`
	`71`	`+ span, SPANDATA.GEN_AI_REQUEST_MESSAGES, messages_data, unpack=False`
	`72`	`+ )`
`71`	`73`
`72`	`74`	`_set_agent_data(span, agent)`
`73`	`75`