Add attributes mode to InstrumentedModel (#1010)

alexmojaki · web-flow · commit 28cc2afbb76c · 2025-02-28T13:39:13.000+02:00
diff --git a/pydantic_ai_slim/pydantic_ai/models/instrumented.py b/pydantic_ai_slim/pydantic_ai/models/instrumented.py
@@ -1,5 +1,6 @@
 from __future__ import annotations
 
+import json
 from collections.abc import AsyncIterator, Iterator
 from contextlib import asynccontextmanager, contextmanager
 from dataclasses import dataclass, field
@@ -9,6 +10,7 @@
 import logfire_api
 from opentelemetry._events import Event, EventLogger, EventLoggerProvider, get_event_logger_provider
 from opentelemetry.trace import Tracer, TracerProvider, get_tracer_provider
+from opentelemetry.util.types import AttributeValue
 
 from ..messages import (
     ModelMessage,
@@ -46,40 +48,42 @@
     'frequency_penalty',
 )
 
-NOT_GIVEN = object()
-
 
 @dataclass
 class InstrumentedModel(WrapperModel):
-    """Model which is instrumented with logfire."""
+    """Model which is instrumented with OpenTelemetry."""
 
     tracer: Tracer = field(repr=False)
     event_logger: EventLogger = field(repr=False)
+    event_mode: Literal['attributes', 'logs'] = 'attributes'
 
     def __init__(
         self,
         wrapped: Model | KnownModelName,
         tracer_provider: TracerProvider | None = None,
         event_logger_provider: EventLoggerProvider | None = None,
+        event_mode: Literal['attributes', 'logs'] = 'attributes',
     ):
         super().__init__(wrapped)
         tracer_provider = tracer_provider or get_tracer_provider()
         event_logger_provider = event_logger_provider or get_event_logger_provider()
         self.tracer = tracer_provider.get_tracer('pydantic-ai')
         self.event_logger = event_logger_provider.get_event_logger('pydantic-ai')
+        self.event_mode = event_mode
 
     @classmethod
     def from_logfire(
         cls,
         wrapped: Model | KnownModelName,
         logfire_instance: logfire_api.Logfire = logfire_api.DEFAULT_LOGFIRE_INSTANCE,
+        event_mode: Literal['attributes', 'logs'] = 'attributes',
     ) -> InstrumentedModel:
         if hasattr(logfire_instance.config, 'get_event_logger_provider'):
             event_provider = logfire_instance.config.get_event_logger_provider()
         else:
             event_provider = None
         tracer_provider = logfire_instance.config.get_tracer_provider()
-        return cls(wrapped, tracer_provider, event_provider)
+        return cls(wrapped, tracer_provider, event_provider, event_mode)
 
     async def request(
         self,
@@ -111,7 +115,7 @@ async def request_stream(
                     finish(response_stream.get(), response_stream.usage())
 
     @contextmanager
-    def _instrument(
+    def _instrument(  # noqa: C901
         self,
         messages: list[ModelMessage],
         model_settings: ModelSettings | None,
@@ -126,18 +130,19 @@ def _instrument(
         #  - server.port: to parse from the base_url
         #  - error.type: unclear if we should do something here or just always rely on span exceptions
         #  - gen_ai.request.stop_sequences/top_k: model_settings doesn't include these
-        attributes: dict[str, Any] = {
+        attributes: dict[str, AttributeValue] = {
             'gen_ai.operation.name': operation,
             'gen_ai.system': system,
             'gen_ai.request.model': model_name,
         }
 
         if model_settings:
             for key in MODEL_SETTING_ATTRIBUTES:
-                if (value := model_settings.get(key, NOT_GIVEN)) is not NOT_GIVEN:
+                if isinstance(value := model_settings.get(key), (float, int)):
                     attributes[f'gen_ai.request.{key}'] = value
 
-        emit_event = partial(self._emit_event, system)
+        events_list = []
+        emit_event = partial(self._emit_event, system, events_list)
 
         with self.tracer.start_as_current_span(span_name, attributes=attributes) as span:
             if span.is_recording():
@@ -167,22 +172,36 @@ def finish(response: ModelResponse, usage: Usage):
                         )
                 span.set_attributes(
                     {
-                        k: v
-                        for k, v in {
-                            # TODO finish_reason (https://github.com/open-telemetry/semantic-conventions/issues/1277), id
-                            #  https://github.com/pydantic/pydantic-ai/issues/886
-                            'gen_ai.response.model': response.model_name or model_name,
-                            'gen_ai.usage.input_tokens': usage.request_tokens,
-                            'gen_ai.usage.output_tokens': usage.response_tokens,
-                        }.items()
-                        if v is not None
+                        # TODO finish_reason (https://github.com/open-telemetry/semantic-conventions/issues/1277), id
+                        #  https://github.com/pydantic/pydantic-ai/issues/886
+                        'gen_ai.response.model': response.model_name or model_name,
+                        **usage.opentelemetry_attributes(),
                     }
                 )
+                if events_list:
+                    attr_name = 'events'
+                    span.set_attributes(
+                        {
+                            attr_name: json.dumps(events_list),
+                            'logfire.json_schema': json.dumps(
+                                {
+                                    'type': 'object',
+                                    'properties': {attr_name: {'type': 'array'}},
+                                }
+                            ),
+                        }
+                    )
 
             yield finish
 
-    def _emit_event(self, system: str, event_name: str, body: dict[str, Any]) -> None:
-        self.event_logger.emit(Event(event_name, body=body, attributes={'gen_ai.system': system}))
+    def _emit_event(
+        self, system: str, events_list: list[dict[str, Any]], event_name: str, body: dict[str, Any]
+    ) -> None:
+        attributes = {'gen_ai.system': system}
+        if self.event_mode == 'logs':
+            self.event_logger.emit(Event(event_name, body=body, attributes=attributes))
+        else:
+            events_list.append({'event.name': event_name, **body, **attributes})
 
 
 def _request_part_body(part: ModelRequestPart) -> tuple[str, dict[str, Any]]:
diff --git a/pydantic_ai_slim/pydantic_ai/usage.py b/pydantic_ai_slim/pydantic_ai/usage.py
@@ -56,6 +56,16 @@ def __add__(self, other: Usage) -> Usage:
         new_usage.incr(other)
         return new_usage
 
+    def opentelemetry_attributes(self) -> dict[str, int]:
+        """Get the token limits as OpenTelemetry attributes."""
+        result = {
+            'gen_ai.usage.input_tokens': self.request_tokens,
+            'gen_ai.usage.output_tokens': self.response_tokens,
+        }
+        for key, value in (self.details or {}).items():
+            result[f'gen_ai.usage.details.{key}'] = value
+        return {k: v for k, v in result.items() if v is not None}
+
 
 @dataclass
 class UsageLimits:
diff --git a/tests/models/test_instrumented.py b/tests/models/test_instrumented.py
@@ -5,6 +5,7 @@
 from datetime import datetime
 
 import pytest
+from dirty_equals import IsJson
 from inline_snapshot import snapshot
 from logfire_api import DEFAULT_LOGFIRE_INSTANCE
 
@@ -105,7 +106,7 @@ def timestamp(self) -> datetime:
 @pytest.mark.anyio
 @requires_logfire_events
 async def test_instrumented_model(capfire: CaptureLogfire):
-    model = InstrumentedModel.from_logfire(MyModel())
+    model = InstrumentedModel.from_logfire(MyModel(), event_mode='logs')
     assert model.system == 'my_system'
     assert model.model_name == 'my_model'
 
@@ -323,7 +324,7 @@ async def test_instrumented_model_not_recording():
 @pytest.mark.anyio
 @requires_logfire_events
 async def test_instrumented_model_stream(capfire: CaptureLogfire):
-    model = InstrumentedModel.from_logfire(MyModel())
+    model = InstrumentedModel.from_logfire(MyModel(), event_mode='logs')
 
     messages: list[ModelMessage] = [
         ModelRequest(
@@ -405,7 +406,7 @@ async def test_instrumented_model_stream(capfire: CaptureLogfire):
 @pytest.mark.anyio
 @requires_logfire_events
 async def test_instrumented_model_stream_break(capfire: CaptureLogfire):
-    model = InstrumentedModel.from_logfire(MyModel())
+    model = InstrumentedModel.from_logfire(MyModel(), event_mode='logs')
 
     messages: list[ModelMessage] = [
         ModelRequest(
@@ -494,3 +495,140 @@ async def test_instrumented_model_stream_break(capfire: CaptureLogfire):
             },
         ]
     )
+
+
+@pytest.mark.anyio
+async def test_instrumented_model_attributes_mode(capfire: CaptureLogfire):
+    model = InstrumentedModel(MyModel(), event_mode='attributes')
+    assert model.system == 'my_system'
+    assert model.model_name == 'my_model'
+
+    messages = [
+        ModelRequest(
+            parts=[
+                SystemPromptPart('system_prompt'),
+                UserPromptPart('user_prompt'),
+                ToolReturnPart('tool3', 'tool_return_content', 'tool_call_3'),
+                RetryPromptPart('retry_prompt1', tool_name='tool4', tool_call_id='tool_call_4'),
+                RetryPromptPart('retry_prompt2'),
+                {},  # test unexpected parts  # type: ignore
+            ]
+        ),
+        ModelResponse(
+            parts=[
+                TextPart('text3'),
+            ]
+        ),
+    ]
+    await model.request(
+        messages,
+        model_settings=ModelSettings(temperature=1),
+        model_request_parameters=ModelRequestParameters(
+            function_tools=[],
+            allow_text_result=True,
+            result_tools=[],
+        ),
+    )
+
+    assert capfire.exporter.exported_spans_as_dict() == snapshot(
+        [
+            {
+                'name': 'chat my_model',
+                'context': {'trace_id': 1, 'span_id': 1, 'is_remote': False},
+                'parent': None,
+                'start_time': 1000000000,
+                'end_time': 2000000000,
+                'attributes': {
+                    'gen_ai.operation.name': 'chat',
+                    'gen_ai.system': 'my_system',
+                    'gen_ai.request.model': 'my_model',
+                    'gen_ai.request.temperature': 1,
+                    'logfire.msg': 'chat my_model',
+                    'logfire.span_type': 'span',
+                    'gen_ai.response.model': 'my_model_123',
+                    'gen_ai.usage.input_tokens': 100,
+                    'gen_ai.usage.output_tokens': 200,
+                    'events': IsJson(
+                        snapshot(
+                            [
+                                {
+                                    'event.name': 'gen_ai.system.message',
+                                    'content': 'system_prompt',
+                                    'role': 'system',
+                                    'gen_ai.system': 'my_system',
+                                },
+                                {
+                                    'event.name': 'gen_ai.user.message',
+                                    'content': 'user_prompt',
+                                    'role': 'user',
+                                    'gen_ai.system': 'my_system',
+                                },
+                                {
+                                    'event.name': 'gen_ai.tool.message',
+                                    'content': 'tool_return_content',
+                                    'role': 'tool',
+                                    'id': 'tool_call_3',
+                                    'gen_ai.system': 'my_system',
+                                },
+                                {
+                                    'event.name': 'gen_ai.tool.message',
+                                    'content': """\
+retry_prompt1
+
+Fix the errors and try again.\
+""",
+                                    'role': 'tool',
+                                    'id': 'tool_call_4',
+                                    'gen_ai.system': 'my_system',
+                                },
+                                {
+                                    'event.name': 'gen_ai.user.message',
+                                    'content': """\
+retry_prompt2
+
+Fix the errors and try again.\
+""",
+                                    'role': 'user',
+                                    'gen_ai.system': 'my_system',
+                                },
+                                {
+                                    'event.name': 'gen_ai.assistant.message',
+                                    'role': 'assistant',
+                                    'content': 'text3',
+                                    'gen_ai.system': 'my_system',
+                                },
+                                {
+                                    'event.name': 'gen_ai.choice',
+                                    'index': 0,
+                                    'message': {
+                                        'role': 'assistant',
+                                        'content': 'text1',
+                                        'tool_calls': [
+                                            {
+                                                'id': 'tool_call_1',
+                                                'type': 'function',
+                                                'function': {'name': 'tool1', 'arguments': 'args1'},
+                                            },
+                                            {
+                                                'id': 'tool_call_2',
+                                                'type': 'function',
+                                                'function': {'name': 'tool2', 'arguments': {'args2': 3}},
+                                            },
+                                        ],
+                                    },
+                                    'gen_ai.system': 'my_system',
+                                },
+                                {
+                                    'event.name': 'gen_ai.choice',
+                                    'index': 0,
+                                    'message': {'role': 'assistant', 'content': 'text2'},
+                                    'gen_ai.system': 'my_system',
+                                },
+                            ]
+                        )
+                    ),
+                    'logfire.json_schema': '{"type": "object", "properties": {"events": {"type": "array"}}}',
+                },
+            },
+        ]
+    )