fix(langchain): added vendors to llm calls (#3165)

avivhalfon · web-flow · commit 85da47ff504e · 2025-07-23T17:29:23.000+03:00
diff --git a/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/callback_handler.py b/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/callback_handler.py
@@ -41,6 +41,9 @@
     set_llm_request,
     set_request_params,
 )
+from opentelemetry.instrumentation.langchain.vendor_detection import (
+    detect_vendor_from_class,
+)
 from opentelemetry.instrumentation.langchain.utils import (
     CallbackFilteredJSONEncoder,
     dont_throw,
@@ -63,6 +66,25 @@
 from opentelemetry.trace.status import Status, StatusCode
 
 
+def _extract_class_name_from_serialized(serialized: Optional[dict[str, Any]]) -> str:
+    """
+    Extract class name from serialized model information.
+
+    Args:
+        serialized: Serialized model information from LangChain callback
+
+    Returns:
+        Class name string, or empty string if not found
+    """
+    class_id = (serialized or {}).get("id", [])
+    if isinstance(class_id, list) and len(class_id) > 0:
+        return class_id[-1]
+    elif class_id:
+        return str(class_id)
+    else:
+        return ""
+
+
 def _message_type_to_role(message_type: str) -> str:
     if message_type == "human":
         return "user"
@@ -258,6 +280,7 @@ def _create_llm_span(
         name: str,
         request_type: LLMRequestTypeValues,
         metadata: Optional[dict[str, Any]] = None,
+        serialized: Optional[dict[str, Any]] = None,
     ) -> Span:
         workflow_name = self.get_workflow_name(parent_run_id)
         entity_path = self.get_entity_path(parent_run_id)
@@ -271,7 +294,10 @@ def _create_llm_span(
             entity_path=entity_path,
             metadata=metadata,
         )
-        _set_span_attribute(span, SpanAttributes.LLM_SYSTEM, "Langchain")
+
+        vendor = detect_vendor_from_class(_extract_class_name_from_serialized(serialized))
+
+        _set_span_attribute(span, SpanAttributes.LLM_SYSTEM, vendor)
         _set_span_attribute(span, SpanAttributes.LLM_REQUEST_TYPE, request_type.value)
 
         return span
@@ -384,7 +410,7 @@ def on_chat_model_start(
 
         name = self._get_name_from_callback(serialized, kwargs=kwargs)
         span = self._create_llm_span(
-            run_id, parent_run_id, name, LLMRequestTypeValues.CHAT, metadata=metadata
+            run_id, parent_run_id, name, LLMRequestTypeValues.CHAT, metadata=metadata, serialized=serialized
         )
         set_request_params(span, kwargs, self.spans[run_id])
         if should_emit_events():
@@ -410,7 +436,7 @@ def on_llm_start(
 
         name = self._get_name_from_callback(serialized, kwargs=kwargs)
         span = self._create_llm_span(
-            run_id, parent_run_id, name, LLMRequestTypeValues.COMPLETION
+            run_id, parent_run_id, name, LLMRequestTypeValues.COMPLETION, serialized=serialized
         )
         set_request_params(span, kwargs, self.spans[run_id])
         if should_emit_events():
@@ -478,11 +504,12 @@ def on_llm_end(
             )
 
             # Record token usage metrics
+            vendor = span.attributes.get(SpanAttributes.LLM_SYSTEM, "Langchain")
             if prompt_tokens > 0:
                 self.token_histogram.record(
                     prompt_tokens,
                     attributes={
-                        SpanAttributes.LLM_SYSTEM: "Langchain",
+                        SpanAttributes.LLM_SYSTEM: vendor,
                         SpanAttributes.LLM_TOKEN_TYPE: "input",
                         SpanAttributes.LLM_RESPONSE_MODEL: model_name or "unknown",
                     },
@@ -492,7 +519,7 @@ def on_llm_end(
                 self.token_histogram.record(
                     completion_tokens,
                     attributes={
-                        SpanAttributes.LLM_SYSTEM: "Langchain",
+                        SpanAttributes.LLM_SYSTEM: vendor,
                         SpanAttributes.LLM_TOKEN_TYPE: "output",
                         SpanAttributes.LLM_RESPONSE_MODEL: model_name or "unknown",
                     },
@@ -506,10 +533,11 @@ def on_llm_end(
 
         # Record duration
         duration = time.time() - self.spans[run_id].start_time
+        vendor = span.attributes.get(SpanAttributes.LLM_SYSTEM, "Langchain")
         self.duration_histogram.record(
             duration,
             attributes={
-                SpanAttributes.LLM_SYSTEM: "Langchain",
+                SpanAttributes.LLM_SYSTEM: vendor,
                 SpanAttributes.LLM_RESPONSE_MODEL: model_name or "unknown",
             },
         )
diff --git a/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/span_utils.py b/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/span_utils.py
@@ -336,11 +336,13 @@ def set_chat_response_usage(
             cache_read_tokens,
         )
         if record_token_usage:
+            vendor = span.attributes.get(SpanAttributes.LLM_SYSTEM, "Langchain")
+
             if input_tokens > 0:
                 token_histogram.record(
                     input_tokens,
                     attributes={
-                        SpanAttributes.LLM_SYSTEM: "Langchain",
+                        SpanAttributes.LLM_SYSTEM: vendor,
                         SpanAttributes.LLM_TOKEN_TYPE: "input",
                         SpanAttributes.LLM_RESPONSE_MODEL: model_name,
                     },
@@ -350,7 +352,7 @@ def set_chat_response_usage(
                 token_histogram.record(
                     output_tokens,
                     attributes={
-                        SpanAttributes.LLM_SYSTEM: "Langchain",
+                        SpanAttributes.LLM_SYSTEM: vendor,
                         SpanAttributes.LLM_TOKEN_TYPE: "output",
                         SpanAttributes.LLM_RESPONSE_MODEL: model_name,
                     },
diff --git a/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/vendor_detection.py b/packages/opentelemetry-instrumentation-langchain/opentelemetry/instrumentation/langchain/vendor_detection.py
@@ -0,0 +1,120 @@
+from dataclasses import dataclass
+from typing import Set, List
+
+
+@dataclass(frozen=True)
+class VendorRule:
+    exact_matches: Set[str]
+    patterns: List[str]
+    vendor_name: str
+
+    def matches(self, class_name: str) -> bool:
+        if class_name in self.exact_matches:
+            return True
+        class_lower = class_name.lower()
+        return any(pattern in class_lower for pattern in self.patterns)
+
+
+def _get_vendor_rules() -> List[VendorRule]:
+    """
+    Get vendor detection rules ordered by specificity (most specific first).
+
+    Returns:
+        List of VendorRule objects for detecting LLM vendors from class names
+    """
+    return [
+        VendorRule(
+            exact_matches={"AzureChatOpenAI", "AzureOpenAI", "AzureOpenAIEmbeddings"},
+            patterns=["azure"],
+            vendor_name="Azure"
+        ),
+        VendorRule(
+            exact_matches={"ChatOpenAI", "OpenAI", "OpenAIEmbeddings"},
+            patterns=["openai"],
+            vendor_name="openai"
+        ),
+        VendorRule(
+            exact_matches={"ChatBedrock", "BedrockEmbeddings", "Bedrock", "BedrockChat"},
+            patterns=["bedrock", "aws"],
+            vendor_name="AWS"
+        ),
+        VendorRule(
+            exact_matches={"ChatAnthropic", "AnthropicLLM"},
+            patterns=["anthropic"],
+            vendor_name="Anthropic"
+        ),
+        VendorRule(
+            exact_matches={
+                "ChatVertexAI", "VertexAI", "VertexAIEmbeddings", "ChatGoogleGenerativeAI",
+                "GoogleGenerativeAI", "GooglePaLM", "ChatGooglePaLM"
+            },
+            patterns=["vertex", "google", "palm", "gemini"],
+            vendor_name="Google"
+        ),
+        VendorRule(
+            exact_matches={"ChatCohere", "CohereEmbeddings", "Cohere"},
+            patterns=["cohere"],
+            vendor_name="Cohere"
+        ),
+        VendorRule(
+            exact_matches={
+                "HuggingFacePipeline", "HuggingFaceTextGenInference",
+                "HuggingFaceEmbeddings", "ChatHuggingFace"
+            },
+            patterns=["huggingface"],
+            vendor_name="HuggingFace"
+        ),
+        VendorRule(
+            exact_matches={"ChatOllama", "OllamaEmbeddings", "Ollama"},
+            patterns=["ollama"],
+            vendor_name="Ollama"
+        ),
+        VendorRule(
+            exact_matches={"Together", "ChatTogether"},
+            patterns=["together"],
+            vendor_name="Together"
+        ),
+        VendorRule(
+            exact_matches={"Replicate", "ChatReplicate"},
+            patterns=["replicate"],
+            vendor_name="Replicate"
+        ),
+        VendorRule(
+            exact_matches={"ChatFireworks", "Fireworks"},
+            patterns=["fireworks"],
+            vendor_name="Fireworks"
+        ),
+        VendorRule(
+            exact_matches={"ChatGroq"},
+            patterns=["groq"],
+            vendor_name="Groq"
+        ),
+        VendorRule(
+            exact_matches={"ChatMistralAI", "MistralAI"},
+            patterns=["mistral"],
+            vendor_name="MistralAI"
+        ),
+    ]
+
+
+def detect_vendor_from_class(class_name: str) -> str:
+    """
+    Detect vendor from LangChain model class name.
+    Uses unified detection rules combining exact matches and patterns.
+
+    Args:
+        class_name: The class name extracted from serialized model information
+
+    Returns:
+        Vendor string, defaults to "Langchain" if no match found
+    """
+    if not class_name:
+        return "Langchain"
+
+    vendor_rules = _get_vendor_rules()
+
+    for rule in vendor_rules:
+        if rule.matches(class_name):
+            return rule.vendor_name
+
+    return "Langchain"
diff --git a/packages/opentelemetry-instrumentation-langchain/tests/metrics/test_langchain_metrics.py b/packages/opentelemetry-instrumentation-langchain/tests/metrics/test_langchain_metrics.py
@@ -44,7 +44,7 @@ def test_llm_chain_metrics(instrument_legacy, reader, chain):
                         assert data_point.sum > 0
                         assert (
                             data_point.attributes[SpanAttributes.LLM_SYSTEM]
-                            == "Langchain"
+                            == "openai"
                         )
 
                 if metric.name == Meters.LLM_OPERATION_DURATION:
@@ -58,7 +58,7 @@ def test_llm_chain_metrics(instrument_legacy, reader, chain):
                     for data_point in metric.data.data_points:
                         assert (
                             data_point.attributes[SpanAttributes.LLM_SYSTEM]
-                            == "Langchain"
+                            == "openai"
                         )
 
     assert found_token_metric is True
@@ -96,7 +96,7 @@ def test_llm_chain_streaming_metrics(instrument_legacy, reader, llm):
                         assert data_point.sum > 0
                         assert (
                             data_point.attributes[SpanAttributes.LLM_SYSTEM]
-                            == "Langchain"
+                            == "openai"
                         )
 
                 if metric.name == Meters.LLM_OPERATION_DURATION:
@@ -110,7 +110,7 @@ def test_llm_chain_streaming_metrics(instrument_legacy, reader, llm):
                     for data_point in metric.data.data_points:
                         assert (
                             data_point.attributes[SpanAttributes.LLM_SYSTEM]
-                            == "Langchain"
+                            == "openai"
                         )
 
     assert found_token_metric is True
@@ -124,14 +124,14 @@ def verify_token_metrics(data_points):
             "input",
         ]
         assert data_point.sum > 0
-        assert data_point.attributes[SpanAttributes.LLM_SYSTEM] == "Langchain"
+        assert data_point.attributes[SpanAttributes.LLM_SYSTEM] == "openai"
 
 
 def verify_duration_metrics(data_points):
     assert any(data_point.count > 0 for data_point in data_points)
     assert any(data_point.sum > 0 for data_point in data_points)
     for data_point in data_points:
-        assert data_point.attributes[SpanAttributes.LLM_SYSTEM] == "Langchain"
+        assert data_point.attributes[SpanAttributes.LLM_SYSTEM] == "openai"
 
 
 def verify_langchain_metrics(reader):
diff --git a/packages/opentelemetry-instrumentation-langchain/tests/test_llms.py b/packages/opentelemetry-instrumentation-langchain/tests/test_llms.py
@@ -143,6 +143,7 @@ def test_custom_llm(instrument_legacy, span_exporter, log_exporter):
 
     assert hugging_face_span.attributes[SpanAttributes.LLM_REQUEST_TYPE] == "completion"
     assert hugging_face_span.attributes[SpanAttributes.LLM_REQUEST_MODEL] == "unknown"
+    assert hugging_face_span.attributes[SpanAttributes.LLM_SYSTEM] == "HuggingFace"
     assert (
         hugging_face_span.attributes[f"{SpanAttributes.LLM_PROMPTS}.0.content"]
         == "System: You are a helpful assistant\nHuman: tell me a short joke"
@@ -276,6 +277,7 @@ def test_openai(instrument_legacy, span_exporter, log_exporter):
 
     assert openai_span.attributes[SpanAttributes.LLM_REQUEST_TYPE] == "chat"
     assert openai_span.attributes[SpanAttributes.LLM_REQUEST_MODEL] == "gpt-4o-mini"
+    assert openai_span.attributes[SpanAttributes.LLM_SYSTEM] == "openai"
     assert (
         (openai_span.attributes[f"{SpanAttributes.LLM_PROMPTS}.0.content"])
         == "You are a helpful assistant"
@@ -660,6 +662,7 @@ def test_anthropic(instrument_legacy, span_exporter, log_exporter):
 
     assert anthropic_span.attributes[SpanAttributes.LLM_REQUEST_TYPE] == "chat"
     assert anthropic_span.attributes[SpanAttributes.LLM_REQUEST_MODEL] == "claude-2.1"
+    assert anthropic_span.attributes[SpanAttributes.LLM_SYSTEM] == "Anthropic"
     assert anthropic_span.attributes[SpanAttributes.LLM_REQUEST_TEMPERATURE] == 0.5
     assert (
         (anthropic_span.attributes[f"{SpanAttributes.LLM_PROMPTS}.0.content"])
@@ -870,6 +873,7 @@ def test_bedrock(instrument_legacy, span_exporter, log_exporter):
         bedrock_span.attributes[SpanAttributes.LLM_REQUEST_MODEL]
         == "anthropic.claude-3-haiku-20240307-v1:0"
     )
+    assert bedrock_span.attributes[SpanAttributes.LLM_SYSTEM] == "AWS"
     assert (
         (bedrock_span.attributes[f"{SpanAttributes.LLM_PROMPTS}.0.content"])
         == "You are a helpful assistant"
@@ -1085,6 +1089,13 @@ def test_trace_propagation(instrument_legacy, span_exporter, log_exporter, LLM):
     spans = span_exporter.get_finished_spans()
     openai_span = next(span for span in spans if "OpenAI" in span.name)
 
+    expected_vendors = {
+        OpenAI: "openai",
+        VLLMOpenAI: "openai", 
+        ChatOpenAI: "openai"
+    }
+    assert openai_span.attributes[SpanAttributes.LLM_SYSTEM] == expected_vendors[LLM]
+
     args, kwargs = send_spy.mock.call_args
     request = args[0]