azure-sdk
diff --git a/‎eng/Packages.Data.props‎
Lines changed: 3 additions & 0 deletions b/‎eng/Packages.Data.props‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎sdk/ai/Azure.AI.Inference/Azure.AI.Inference.sln‎
Lines changed: 2 additions & 2 deletions b/‎sdk/ai/Azure.AI.Inference/Azure.AI.Inference.sln‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎sdk/ai/Azure.AI.Inference/README.md‎
Lines changed: 67 additions & 0 deletions b/‎sdk/ai/Azure.AI.Inference/README.md‎
Lines changed: 67 additions & 0 deletions
diff --git a/‎sdk/ai/Azure.AI.Inference/assets.json‎
Lines changed: 6 additions & 0 deletions b/‎sdk/ai/Azure.AI.Inference/assets.json‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎sdk/ai/Azure.AI.Inference/samples/Sample2_ChatCompletionsWithAoai.md‎
Lines changed: 1 addition & 1 deletion b/‎sdk/ai/Azure.AI.Inference/samples/Sample2_ChatCompletionsWithAoai.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎sdk/ai/Azure.AI.Inference/samples/Sample8_ChatCompletionsWithOpenTelemetry.md‎
Lines changed: 124 additions & 0 deletions b/‎sdk/ai/Azure.AI.Inference/samples/Sample8_ChatCompletionsWithOpenTelemetry.md‎
Lines changed: 124 additions & 0 deletions
diff --git a/‎sdk/ai/Azure.AI.Inference/samples/images/Sample8_ChatCompletionsWithOpenTelemetry.png‎
101 KB b/‎sdk/ai/Azure.AI.Inference/samples/images/Sample8_ChatCompletionsWithOpenTelemetry.png‎
101 KB
diff --git a/‎sdk/ai/Azure.AI.Inference/src/Azure.AI.Inference.csproj‎
Lines changed: 2 additions & 2 deletions b/‎sdk/ai/Azure.AI.Inference/src/Azure.AI.Inference.csproj‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎sdk/ai/Azure.AI.Inference/src/Customized/ChatCompletionsClient.cs‎
Lines changed: 60 additions & 30 deletions b/‎sdk/ai/Azure.AI.Inference/src/Customized/ChatCompletionsClient.cs‎
Lines changed: 60 additions & 30 deletions
@@ -340,7 +340,10 @@
     <PackageReference Update="NUnit" Version="3.13.2" />
     <PackageReference Update="NUnit3TestAdapter" Version="4.4.2" />
     <PackageReference Update="OpenTelemetry" Version="1.9.0" />
+    <PackageReference Update="OpenTelemetry.Exporter.Console" Version="1.9.0" />
     <PackageReference Update="OpenTelemetry.Exporter.InMemory" Version="1.9.0" />
+    <PackageReference Update="OpenTelemetry.Exporter.OpenTelemetryProtocol" Version="1.9.0" />
+    <PackageReference Update="OpenTelemetry.Instrumentation.Http" Version="1.9.0" />
     <PackageReference Update="OpenTelemetry.Instrumentation.SqlClient" Version="1.9.0-beta.1" />
     <PackageReference Update="Polly" Version="7.1.0" />
     <PackageReference Update="Polly.Contrib.WaitAndRetry" Version="1.1.1" />
 
@@ -5,9 +5,9 @@ VisualStudioVersion = 17.9.34723.18
 MinimumVisualStudioVersion = 10.0.40219.1
 Project("{9A19103F-16F7-4668-BE54-9A1E7A4F7556}") = "Azure.Core.TestFramework", "..\..\core\Azure.Core.TestFramework\src\Azure.Core.TestFramework.csproj", "{ECC730C1-4AEA-420C-916A-66B19B79E4DC}"
 EndProject
-Project("{FAE04EC0-301F-11D3-BF4B-00C04F79EFBC}") = "Azure.AI.Inference", "src\Azure.AI.Inference.csproj", "{C3781FDB-93C7-4636-95B1-7A6F2C00E25F}"
+Project("{9A19103F-16F7-4668-BE54-9A1E7A4F7556}") = "Azure.AI.Inference", "src\Azure.AI.Inference.csproj", "{C3781FDB-93C7-4636-95B1-7A6F2C00E25F}"
 EndProject
-Project("{FAE04EC0-301F-11D3-BF4B-00C04F79EFBC}") = "Azure.AI.Inference.Tests", "tests\Azure.AI.Inference.Tests.csproj", "{5FDDC1E7-3A88-4BAF-948B-909BC6B65E1A}"
+Project("{9A19103F-16F7-4668-BE54-9A1E7A4F7556}") = "Azure.AI.Inference.Tests", "tests\Azure.AI.Inference.Tests.csproj", "{5FDDC1E7-3A88-4BAF-948B-909BC6B65E1A}"
 EndProject
 Global
 	GlobalSection(SolutionConfigurationPlatforms) = preSolution
 
@@ -340,6 +340,73 @@ To generate embeddings for additional phrases, simply call `client.embed` multip
 
 ## Troubleshooting
 
+### Observability with OpenTelemetry
+
+Azure AI Inference client library supports tracing and metrics with OpenTelemetry. Refer to
+[Azure SDK Diagnostics](https://github.com/Azure/azure-sdk-for-net/blob/main/sdk/core/Azure.Core/samples/Diagnostics.md#distributed-tracing)
+documentation for general information on OpenTelemetry support in Azure client libraries.
+
+Distributed tracing and metrics with OpenTelemetry are supported in Azure AI Inference in experimental mode and could be enabled through either
+of these steps:
+
+- Set the `AZURE_EXPERIMENTAL_ENABLE_ACTIVITY_SOURCE` environment variable to `true`.
+- Set the `Azure.Experimental.EnableActivitySource` context switch to `true` in your application code
+
+Refer to [Azure Monitor documentation](https://learn.microsoft.com/azure/azure-monitor/app/opentelemetry-enable?tabs=aspnetcore) on how to use
+Azure Monitor OpenTelemetry Distro.
+
+> [!NOTE]
+> With the Azure Monitor OpenTelemetry Distro, you only need to opt-into Azure SDK experimental telemetry features with one of the ways documented at
+> the beginning of this section.
+> The distro enables activity sources and meters for Azure AI Inference automatically.
+
+The following section provides an example on how to configure OpenTelemetry and enable Azure AI Inference tracing and metrics if your
+OpenTelemetry distro does not include Azure AI Inference by default.
+
+#### Generic OpenTelemetry configuration
+
+In this example we're going to export traces and metrics to console, and to the local [OTLP](https://opentelemetry.io/docs/specs/otel/protocol/) destination.
+[Aspire dashboard](https://learn.microsoft.com/dotnet/aspire/fundamentals/dashboard/standalone) can be used for local testing and exploration.
+
+To run this example, you'll need to install the following dependencies (HTTP tracing and metrics instrumentation
+as well as console and OTLP exporters):
+
+```dotnetcli
+dotnet add package OpenTelemetry.Instrumentation.Http
+dotnet add package OpenTelemetry.Exporter.Console
+dotnet add package OpenTelemetry.Exporter.OpenTelemetryProtocol
+```
+
+These packages also bring [OpenTelemetry SDK](https://www.nuget.org/packages/OpenTelemetry) as a dependency.
+
+```C# Snippet:Azure_AI_Inference_EnableOpenTelemetry
+// Enables experimental Azure SDK observability
+AppContext.SetSwitch("Azure.Experimental.EnableActivitySource", true);
+
+// By default instrumentation captures chat messages without content
+// since content can be very verbose and have sensitive information.
+// The following AppContext switch enables content recording.
+AppContext.SetSwitch("Azure.Experimental.TraceGenAIMessageContent", true);
+
+using var tracerProvider = Sdk.CreateTracerProviderBuilder()
+    .AddHttpClientInstrumentation()
+    .AddSource("Azure.AI.Inference.*")
+    .ConfigureResource(r => r.AddService("sample"))
+    .AddConsoleExporter()
+    .AddOtlpExporter()
+    .Build();
+
+using var meterProvider = Sdk.CreateMeterProviderBuilder()
+    .AddHttpClientInstrumentation()
+    .AddMeter("Azure.AI.Inference.*")
+    .ConfigureResource(r => r.AddService("sample"))
+    .AddConsoleExporter()
+    .AddOtlpExporter()
+    .Build();
+```
+
+Check out [OpenTelemetry .NET](https://opentelemetry.io/docs/languages/net/) and your observability provider documentation on how to configure OpenTelemetry.
+
 ### Exceptions
 
 The `complete`, `get_model_info` methods raise a `RequestFailedException` for a non-success HTTP status code response from the service. The exception's `code` will hold the HTTP response status code. The exception's `message` contains a detailed message that may be helpful in diagnosing the issue:
 
@@ -0,0 +1,6 @@
+{
+  "AssetsRepo": "Azure/azure-sdk-assets",
+  "AssetsRepoPrefixPath": "net",
+  "TagPrefix": "net/ai/Azure.AI.Inference",
+  "Tag": "net/ai/Azure.AI.Inference_99a4be5ef1"
+}
@@ -1,4 +1,4 @@
-# Simple Chat Completions Targetting Azure OpenAI
+# Simple chat completions targeting Azure OpenAI
 
 This sample demonstrates how to get a chat completions response from the service using a synchronous call, targetting an Azure OpenAI (AOAI) endpoint.
 
 
@@ -0,0 +1,124 @@
+# Using telemetry with Azure.AI.Inference
+
+In this example we will demonstrate how to enable [OpenTelemetry](https://opentelemetry.io/) to get observability into Chat Completions call.
+
+## Project creation and dependency installation
+
+First, we will create the console application project and add `Azure.AI.Inference` as a dependency. The first command will create the project called `TelemetryDemo.csproj`. The `dotnet add package <…>` command will modify project file and in future we will need to run `dotnet restore` to install all dependencies, if we will remove the installed ones.
+
+```dotnetcli
+dotnet new console --name TelemetryDemo --output TelemetryDemo
+dotnet add package Azure.AI.Inference --prerelease
+```
+
+Now we will need to add the dependencies for OpenTelemetry exporters and HTTP client instrumentation.
+
+```dotnetcli
+dotnet add package OpenTelemetry.Exporter.Console
+dotnet add package OpenTelemetry.Exporter.OpenTelemetryProtocol
+dotnet add package OpenTelemetry.Instrumentation.Http
+```
+
+## Create the simple application with telemetry
+
+The `dotnet new` created the project with the single file called Program.cs. Let us edit this file with the IDE of choice.
+
+First we will import open telemetry and Azure.AI.Inference
+```C# Snippet:Azure_AI_Inference_EnableOpenTelemetry_import
+//Azure imports
+// Open telemetry imports
+using OpenTelemetry;
+using OpenTelemetry.Resources;
+using OpenTelemetry.Trace;
+using OpenTelemetry.Metrics;
+```
+
+In this example we will configure OpenTelemetry to export distributed traces and metrics to console and local [OTLP](https://opentelemetry.io/docs/specs/otel/protocol/) endpoint such as [Aspire Dashboard](https://learn.microsoft.com/dotnet/aspire/fundamentals/dashboard/standalone).
+
+Azure AI Inference reports distributed traces using [ActivitySources](https://learn.microsoft.com/dotnet/api/system.diagnostics.activitysource) and [Meters](https://learn.microsoft.com/dotnet/api/system.diagnostics.metrics.meter). We need to configure OpenTelemetry to listen to these sources.
+
+Check out general [Azure SDK Diagnostics](https://github.com/Azure/azure-sdk-for-net/blob/main/sdk/core/Azure.Core/samples/Diagnostics.md) documentation for the details.
+
+```C# Snippet:Azure_AI_Inference_EnableOpenTelemetry
+// Enables experimental Azure SDK observability
+AppContext.SetSwitch("Azure.Experimental.EnableActivitySource", true);
+
+// By default instrumentation captures chat messages without content
+// since content can be very verbose and have sensitive information.
+// The following AppContext switch enables content recording.
+AppContext.SetSwitch("Azure.Experimental.TraceGenAIMessageContent", true);
+
+using var tracerProvider = Sdk.CreateTracerProviderBuilder()
+    .AddHttpClientInstrumentation()
+    .AddSource("Azure.AI.Inference.*")
+    .ConfigureResource(r => r.AddService("sample"))
+    .AddConsoleExporter()
+    .AddOtlpExporter()
+    .Build();
+
+using var meterProvider = Sdk.CreateMeterProviderBuilder()
+    .AddHttpClientInstrumentation()
+    .AddMeter("Azure.AI.Inference.*")
+    .ConfigureResource(r => r.AddService("sample"))
+    .AddConsoleExporter()
+    .AddOtlpExporter()
+    .Build();
+```
+
+Now let's define the `endpoint`, `credential` and `model`.
+
+```C# Snippet:Azure_AI_Inference_EnableOpenTelemetry_variables
+var endpoint = new Uri(System.Environment.GetEnvironmentVariable("MODEL_ENDPOINT"));
+var credential = new AzureKeyCredential(System.Environment.GetEnvironmentVariable("GITHUB_TOKEN"));
+var model = System.Environment.GetEnvironmentVariable("MODEL_NAME");
+```
+
+Now we can create `ChatCompletionsClient` and make calls as usual - telemetry will be collected and exported without
+any additional code.
+
+```C# Snippet:Azure_AI_Inference_EnableOpenTelemetry_inference
+var client = new ChatCompletionsClient(
+    endpoint,
+    credential,
+    new ChatCompletionsClientOptions());
+
+var requestOptions = new ChatCompletionsOptions()
+{
+    Messages =
+    {
+        new ChatRequestSystemMessage("You are a helpful assistant."),
+        new ChatRequestUserMessage("What is the capital of France?"),
+    },
+    Model = model,
+    Temperature = 1,
+    MaxTokens = 1000
+};
+// Call the endpoint and output the response.
+Response<ChatCompletions> response = client.Complete(requestOptions);
+Console.WriteLine(response.Value.Choices[0].Message.Content);
+```
+
+## Running the application
+
+Optionally run the Aspire dashboard
+
+```bash
+docker run --rm -it \
+    -p 18888:18888 \
+    -p 4317:18889 -d \
+    --name aspire-dashboard \
+    mcr.microsoft.com/dotnet/aspire-dashboard:latest
+```
+
+Now run the application from IDE, or use
+```dotnetcli
+dotnet run
+```
+
+Check out telemetry in Aspire dashboard (at http://localhost:18888/traces):
+
+![image](./images/Sample8_ChatCompletionsWithOpenTelemetry.png)
+
+## Next steps
+
+After we have run the application, we can list all the metrics and events on the Application Insights. Please refer to the [documentation](https://learn.microsoft.com/azure/azure-monitor/app/opentelemetry-enable?tabs=aspnetcore). The events will be written to the table `traces`, metrics can be found in `customMetrics`.
@@ -1,6 +1,6 @@
-<Project Sdk="Microsoft.NET.Sdk">
+<Project Sdk="Microsoft.NET.Sdk">
   <PropertyGroup>
-    <Description>This is the Inference client library for developing .NET applications with rich experience.</Description>
+    <Description>This is the Microsoft Azure AI Inference Service client library</Description>
     <AssemblyTitle>Microsoft Azure.AI.Inference client library</AssemblyTitle>
     <Version>1.0.0-beta.2</Version>
     <PackageTags>Azure Inference</PackageTags>
 
@@ -5,6 +5,7 @@
 using System.Diagnostics.CodeAnalysis;
 using System.Threading;
 using System.Threading.Tasks;
+using Azure.AI.Inference.Telemetry;
 using Azure.Core;
 using Azure.Core.Pipeline;
 using Azure.Core.Sse;
@@ -47,8 +48,21 @@ public virtual async Task<Response<ChatCompletions>> CompleteAsync(ChatCompletio
 
             using RequestContent content = chatCompletionsOptions.ToRequestContent();
             RequestContext context = FromCancellationToken(cancellationToken);
-            Response response = await CompleteAsync(content, extraParams?.ToString(), context).ConfigureAwait(false);
-            return Response.FromValue(ChatCompletions.FromResponse(response), response);
+            using OpenTelemetryScope otelScope = OpenTelemetryScope.Start(chatCompletionsOptions, _endpoint);
+            Response response = null;
+            ChatCompletions chatCompletions = null;
+            try
+            {
+                response = await CompleteAsync(content, extraParams?.ToString(), context).ConfigureAwait(false);
+                chatCompletions = ChatCompletions.FromResponse(response);
+                otelScope?.RecordResponse(chatCompletions);
+            }
+            catch (Exception ex)
+            {
+                otelScope?.RecordError(ex);
+                throw;
+            }
+            return Response.FromValue(chatCompletions, response);
         }
 
         /// <summary>
@@ -81,8 +95,20 @@ public virtual Response<ChatCompletions> Complete(ChatCompletionsOptions chatCom
 
             using RequestContent content = chatCompletionsOptions.ToRequestContent();
             RequestContext context = FromCancellationToken(cancellationToken);
-            Response response = Complete(content, extraParams?.ToString(), context);
-            return Response.FromValue(ChatCompletions.FromResponse(response), response);
+            using OpenTelemetryScope otelScope = OpenTelemetryScope.Start(chatCompletionsOptions, _endpoint);
+            Response response = null;
+            ChatCompletions chatCompletions = null;
+            try
+            {
+                response = Complete(content, extraParams?.ToString(), context);
+                chatCompletions = ChatCompletions.FromResponse(response);
+                otelScope?.RecordResponse(chatCompletions);
+            }
+            catch (Exception ex) {
+                otelScope?.RecordError(ex);
+                throw;
+            }
+            return Response.FromValue(chatCompletions, response);
         }
 
         /// <summary>
@@ -112,36 +138,38 @@ public virtual async Task<StreamingResponse<StreamingChatCompletionsUpdate>> Com
         {
             Argument.AssertNotNull(chatCompletionsOptions, nameof(chatCompletionsOptions));
 
-            using DiagnosticScope scope = ClientDiagnostics.CreateScope("ChatCompletionsClient.CompleteStreaming");
-            scope.Start();
-
             chatCompletionsOptions.InternalShouldStreamResponse = true;
 
             RequestContent content = chatCompletionsOptions.ToRequestContent();
             RequestContext context = FromCancellationToken(cancellationToken);
 
+            OpenTelemetryScope otelScope = OpenTelemetryScope.Start(chatCompletionsOptions, _endpoint);
+            Response baseResponse = null;
             try
             {
-                // Response value object takes IDisposable ownership of message
+                // Response value object takes IDisposable ownership of message and scope.
                 HttpMessage message = CreatePostRequestMessage(chatCompletionsOptions, content, context);
                 message.BufferResponse = false;
-                Response baseResponse = await _pipeline.ProcessMessageAsync(
+                baseResponse = await _pipeline.ProcessMessageAsync(
                     message,
                     context,
                     cancellationToken).ConfigureAwait(false);
-                return StreamingResponse<StreamingChatCompletionsUpdate>.CreateFromResponse(
-                    baseResponse,
-                    (responseForEnumeration)
-                        => SseAsyncEnumerator<StreamingChatCompletionsUpdate>.EnumerateFromSseStream(
-                            responseForEnumeration.ContentStream,
-                            StreamingChatCompletionsUpdate.DeserializeStreamingChatCompletionsUpdates,
-                            cancellationToken));
             }
             catch (Exception e)
             {
-                scope.Failed(e);
+                otelScope?.RecordError(e);
+                otelScope?.Dispose();
                 throw;
             }
+            return StreamingResponse<StreamingChatCompletionsUpdate>.CreateFromResponse(
+                baseResponse,
+                (responseForEnumeration)
+                    => SseAsyncEnumerator<StreamingChatCompletionsUpdate>.EnumerateFromSseStream(
+                        responseForEnumeration.ContentStream,
+                        StreamingChatCompletionsUpdate.DeserializeStreamingChatCompletionsUpdates,
+                        otelScope,
+                        cancellationToken
+                        ));
         }
 
         /// <summary>
@@ -168,33 +196,35 @@ public virtual StreamingResponse<StreamingChatCompletionsUpdate> CompleteStreami
         {
             Argument.AssertNotNull(chatCompletionsOptions, nameof(chatCompletionsOptions));
 
-            using DiagnosticScope scope = ClientDiagnostics.CreateScope("ChatCompletionsClient.CompleteStreaming");
-            scope.Start();
-
             chatCompletionsOptions.InternalShouldStreamResponse = true;
 
             RequestContent content = chatCompletionsOptions.ToRequestContent();
             RequestContext context = FromCancellationToken(cancellationToken);
 
+            OpenTelemetryScope otelScope = OpenTelemetryScope.Start(chatCompletionsOptions, _endpoint);
+            Response baseResponse;
             try
             {
-                // Response value object takes IDisposable ownership of message
+                // Response value object takes IDisposable ownership of message and scope.
                 HttpMessage message = CreatePostRequestMessage(chatCompletionsOptions, content, context);
                 message.BufferResponse = false;
-                Response baseResponse = _pipeline.ProcessMessage(message, context, cancellationToken);
-                return StreamingResponse<StreamingChatCompletionsUpdate>.CreateFromResponse(
-                    baseResponse,
-                    (responseForEnumeration)
-                        => SseAsyncEnumerator<StreamingChatCompletionsUpdate>.EnumerateFromSseStream(
-                            responseForEnumeration.ContentStream,
-                            StreamingChatCompletionsUpdate.DeserializeStreamingChatCompletionsUpdates,
-                            cancellationToken));
+                baseResponse = _pipeline.ProcessMessage(message, context, cancellationToken);
             }
             catch (Exception e)
             {
-                scope.Failed(e);
+                otelScope?.RecordError(e);
+                otelScope?.Dispose();
                 throw;
             }
+            return StreamingResponse<StreamingChatCompletionsUpdate>.CreateFromResponse(
+                baseResponse,
+                (responseForEnumeration)
+                    => SseAsyncEnumerator<StreamingChatCompletionsUpdate>.EnumerateFromSseStream(
+                        responseForEnumeration.ContentStream,
+                        StreamingChatCompletionsUpdate.DeserializeStreamingChatCompletionsUpdates,
+                        otelScope,
+                        cancellationToken
+                        ));
         }
 
         internal HttpMessage CreatePostRequestMessage(
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-# Simple Chat Completions Targetting Azure OpenAI`
	`1`	`+# Simple chat completions targeting Azure OpenAI`
`2`	`2`
`3`	`3`	`This sample demonstrates how to get a chat completions response from the service using a synchronous call, targetting an Azure OpenAI (AOAI) endpoint.`
`4`	`4`