envoyproxy
diff --git a/‎cmd/extproc/mainlib/main.go‎
Lines changed: 4 additions & 4 deletions b/‎cmd/extproc/mainlib/main.go‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎internal/extproc/chatcompletion_processor.go‎
Lines changed: 2 additions & 2 deletions b/‎internal/extproc/chatcompletion_processor.go‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎internal/extproc/chatcompletion_processor_test.go‎
Lines changed: 4 additions & 1 deletion b/‎internal/extproc/chatcompletion_processor_test.go‎
Lines changed: 4 additions & 1 deletion
diff --git a/‎internal/extproc/completions_processor.go‎
Lines changed: 3 additions & 3 deletions b/‎internal/extproc/completions_processor.go‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎internal/extproc/completions_processor_test.go‎
Lines changed: 4 additions & 1 deletion b/‎internal/extproc/completions_processor_test.go‎
Lines changed: 4 additions & 1 deletion
diff --git a/‎internal/extproc/embeddings_processor.go‎
Lines changed: 2 additions & 2 deletions b/‎internal/extproc/embeddings_processor.go‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎internal/extproc/embeddings_processor_test.go‎
Lines changed: 4 additions & 1 deletion b/‎internal/extproc/embeddings_processor_test.go‎
Lines changed: 4 additions & 1 deletion
diff --git a/‎internal/extproc/messages_processor.go‎
Lines changed: 2 additions & 2 deletions b/‎internal/extproc/messages_processor.go‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎internal/extproc/messages_processor_test.go‎
Lines changed: 13 additions & 13 deletions b/‎internal/extproc/messages_processor_test.go‎
Lines changed: 13 additions & 13 deletions
diff --git a/‎internal/metrics/base_metrics.go‎
Lines changed: 17 additions & 13 deletions b/‎internal/metrics/base_metrics.go‎
Lines changed: 17 additions & 13 deletions
@@ -230,10 +230,10 @@ func Main(ctx context.Context, args []string, stderr io.Writer) (err error) {
 	if err != nil {
 		return fmt.Errorf("failed to create metrics: %w", err)
 	}
-	chatCompletionMetrics := metrics.NewChatCompletion(meter, metricsRequestHeaderAttributes)
-	messagesMetrics := metrics.NewMessages(meter, metricsRequestHeaderAttributes)
-	completionMetrics := metrics.NewCompletion(meter, metricsRequestHeaderAttributes)
-	embeddingsMetrics := metrics.NewEmbeddings(meter, metricsRequestHeaderAttributes)
+	chatCompletionMetrics := metrics.NewChatCompletionFactory(meter, metricsRequestHeaderAttributes)
+	messagesMetrics := metrics.NewMessagesFactory(meter, metricsRequestHeaderAttributes)
+	completionMetrics := metrics.NewCompletionFactory(meter, metricsRequestHeaderAttributes)
+	embeddingsMetrics := metrics.NewEmbeddingsFactory(meter, metricsRequestHeaderAttributes)
 	mcpMetrics := metrics.NewMCP(meter, metricsRequestHeaderAttributes)
 
 	tracing, err := tracing.NewTracingFromEnv(ctx, os.Stdout, spanRequestHeaderAttributes)
 
@@ -31,7 +31,7 @@ import (
 )
 
 // ChatCompletionProcessorFactory returns a factory method to instantiate the chat completion processor.
-func ChatCompletionProcessorFactory(ccm metrics.ChatCompletionMetrics) ProcessorFactory {
+func ChatCompletionProcessorFactory(f metrics.ChatCompletionMetricsFactory) ProcessorFactory {
 	return func(config *processorConfig, requestHeaders map[string]string, logger *slog.Logger, tracing tracing.Tracing, isUpstreamFilter bool) (Processor, error) {
 		logger = logger.With("processor", "chat-completion", "isUpstreamFilter", fmt.Sprintf("%v", isUpstreamFilter))
 		if !isUpstreamFilter {
@@ -46,7 +46,7 @@ func ChatCompletionProcessorFactory(ccm metrics.ChatCompletionMetrics) Processor
 			config:         config,
 			requestHeaders: requestHeaders,
 			logger:         logger,
-			metrics:        ccm,
+			metrics:        f(),
 		}, nil
 	}
 }
 
@@ -25,6 +25,7 @@ import (
 	"github.com/envoyproxy/ai-gateway/internal/filterapi"
 	"github.com/envoyproxy/ai-gateway/internal/internalapi"
 	"github.com/envoyproxy/ai-gateway/internal/llmcostcel"
+	"github.com/envoyproxy/ai-gateway/internal/metrics"
 	"github.com/envoyproxy/ai-gateway/internal/testing/testotel"
 	tracing "github.com/envoyproxy/ai-gateway/internal/tracing/api"
 )
@@ -39,7 +40,9 @@ func TestChatCompletion_Schema(t *testing.T) {
 	})
 	t.Run("supported openai / on upstream", func(t *testing.T) {
 		cfg := &processorConfig{}
-		routeFilter, err := ChatCompletionProcessorFactory(nil)(cfg, nil, slog.Default(), tracing.NoopTracing{}, true)
+		routeFilter, err := ChatCompletionProcessorFactory(func() metrics.ChatCompletionMetrics {
+			return &mockChatCompletionMetrics{}
+		})(cfg, nil, slog.Default(), tracing.NoopTracing{}, true)
 		require.NoError(t, err)
 		require.NotNil(t, routeFilter)
 		require.IsType(t, &chatCompletionProcessorUpstreamFilter{}, routeFilter)
 
@@ -29,7 +29,7 @@ import (
 )
 
 // CompletionsProcessorFactory returns a factory method to instantiate the completions processor.
-func CompletionsProcessorFactory(cm metrics.CompletionMetrics) ProcessorFactory {
+func CompletionsProcessorFactory(f metrics.CompletionMetricsFactory) ProcessorFactory {
 	return func(config *processorConfig, requestHeaders map[string]string, logger *slog.Logger, tracing tracing.Tracing, isUpstreamFilter bool) (Processor, error) {
 		logger = logger.With("processor", "completions", "isUpstreamFilter", fmt.Sprintf("%v", isUpstreamFilter))
 		if !isUpstreamFilter {
@@ -38,14 +38,14 @@ func CompletionsProcessorFactory(cm metrics.CompletionMetrics) ProcessorFactory
 				tracer:         tracing.CompletionTracer(),
 				requestHeaders: requestHeaders,
 				logger:         logger,
-				metrics:        cm,
+				metrics:        f(),
 			}, nil
 		}
 		return &completionsProcessorUpstreamFilter{
 			config:         config,
 			requestHeaders: requestHeaders,
 			logger:         logger,
-			metrics:        cm,
+			metrics:        f(),
 		}, nil
 	}
 }
 
@@ -24,6 +24,7 @@ import (
 	"github.com/envoyproxy/ai-gateway/internal/filterapi"
 	"github.com/envoyproxy/ai-gateway/internal/internalapi"
 	"github.com/envoyproxy/ai-gateway/internal/llmcostcel"
+	"github.com/envoyproxy/ai-gateway/internal/metrics"
 	tracing "github.com/envoyproxy/ai-gateway/internal/tracing/api"
 )
 
@@ -48,7 +49,9 @@ func TestCompletions_Schema(t *testing.T) {
 	for _, tt := range tests {
 		t.Run(tt.name, func(t *testing.T) {
 			cfg := &processorConfig{}
-			filter, err := CompletionsProcessorFactory(nil)(cfg, nil, slog.Default(), tracing.NoopTracing{}, tt.onUpstream)
+			filter, err := CompletionsProcessorFactory(func() metrics.CompletionMetrics {
+				return &mockCompletionMetrics{}
+			})(cfg, nil, slog.Default(), tracing.NoopTracing{}, tt.onUpstream)
 			require.NoError(t, err)
 			require.NotNil(t, filter)
 			require.IsType(t, tt.expectedType, filter)
 
@@ -28,7 +28,7 @@ import (
 )
 
 // EmbeddingsProcessorFactory returns a factory method to instantiate the embeddings processor.
-func EmbeddingsProcessorFactory(em metrics.EmbeddingsMetrics) ProcessorFactory {
+func EmbeddingsProcessorFactory(f metrics.EmbeddingsMetricsFactory) ProcessorFactory {
 	return func(config *processorConfig, requestHeaders map[string]string, logger *slog.Logger, tracing tracing.Tracing, isUpstreamFilter bool) (Processor, error) {
 		logger = logger.With("processor", "embeddings", "isUpstreamFilter", fmt.Sprintf("%v", isUpstreamFilter))
 		if !isUpstreamFilter {
@@ -43,7 +43,7 @@ func EmbeddingsProcessorFactory(em metrics.EmbeddingsMetrics) ProcessorFactory {
 			config:         config,
 			requestHeaders: requestHeaders,
 			logger:         logger,
-			metrics:        em,
+			metrics:        f(),
 		}, nil
 	}
 }
 
@@ -23,6 +23,7 @@ import (
 	"github.com/envoyproxy/ai-gateway/internal/filterapi"
 	"github.com/envoyproxy/ai-gateway/internal/internalapi"
 	"github.com/envoyproxy/ai-gateway/internal/llmcostcel"
+	"github.com/envoyproxy/ai-gateway/internal/metrics"
 	tracing "github.com/envoyproxy/ai-gateway/internal/tracing/api"
 )
 
@@ -36,7 +37,9 @@ func TestEmbeddings_Schema(t *testing.T) {
 	})
 	t.Run("supported openai / on upstream", func(t *testing.T) {
 		cfg := &processorConfig{}
-		routeFilter, err := EmbeddingsProcessorFactory(nil)(cfg, nil, slog.Default(), tracing.NoopTracing{}, true)
+		routeFilter, err := EmbeddingsProcessorFactory(func() metrics.EmbeddingsMetrics {
+			return &mockEmbeddingsMetrics{}
+		})(cfg, nil, slog.Default(), tracing.NoopTracing{}, true)
 		require.NoError(t, err)
 		require.NotNil(t, routeFilter)
 		require.IsType(t, &embeddingsProcessorUpstreamFilter{}, routeFilter)
 
@@ -31,7 +31,7 @@ import (
 //
 // Requests: Only accepts Anthropic format requests.
 // Responses: Returns Anthropic format responses.
-func MessagesProcessorFactory(ccm metrics.MessagesMetrics) ProcessorFactory {
+func MessagesProcessorFactory(f metrics.MessagesMetricsFactory) ProcessorFactory {
 	return func(config *processorConfig, requestHeaders map[string]string, logger *slog.Logger, _ tracing.Tracing, isUpstreamFilter bool) (Processor, error) {
 		logger = logger.With("processor", "anthropic-messages", "isUpstreamFilter", fmt.Sprintf("%v", isUpstreamFilter))
 		if !isUpstreamFilter {
@@ -45,7 +45,7 @@ func MessagesProcessorFactory(ccm metrics.MessagesMetrics) ProcessorFactory {
 			config:         config,
 			requestHeaders: requestHeaders,
 			logger:         logger,
-			metrics:        ccm,
+			metrics:        f(),
 		}, nil
 	}
 }
 
@@ -28,8 +28,8 @@ import (
 )
 
 func TestMessagesProcessorFactory(t *testing.T) {
-	chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
-	factory := MessagesProcessorFactory(chatMetrics)
+	m := metrics.NewMessagesFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})
+	factory := MessagesProcessorFactory(m)
 	require.NotNil(t, factory, "MessagesProcessorFactory should return a non-nil factory")
 
 	// Test creating a router filter.
@@ -401,7 +401,7 @@ func TestMessagesProcessorUpstreamFilter_ProcessRequestHeaders_WithMocks(t *test
 			}
 
 			// Create mock metrics.
-			chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+			chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 
 			// Create processor.
 			processor := &messagesProcessorUpstreamFilter{
@@ -436,7 +436,7 @@ func TestMessagesProcessorUpstreamFilter_ProcessResponseHeaders_WithMocks(t *tes
 		retErr:            nil,
 	}
 
-	chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+	chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 	processor := &messagesProcessorUpstreamFilter{
 		config:         &processorConfig{},
 		requestHeaders: make(map[string]string),
@@ -461,7 +461,7 @@ func TestMessagesProcessorUpstreamFilter_ProcessResponseBody_WithMocks(t *testin
 		retErr:            nil,
 	}
 
-	chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+	chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 	processor := &messagesProcessorUpstreamFilter{
 		config:         &processorConfig{},
 		requestHeaders: make(map[string]string),
@@ -532,7 +532,7 @@ func TestMessagesProcessorUpstreamFilter_ProcessResponseBody_CompletionOnlyAtEnd
 }
 
 func TestMessagesProcessorUpstreamFilter_MergeWithTokenLatencyMetadata(t *testing.T) {
-	chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+	chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 	processor := &messagesProcessorUpstreamFilter{
 		config:  &processorConfig{},
 		logger:  slog.Default(),
@@ -561,7 +561,7 @@ func TestMessagesProcessorUpstreamFilter_MergeWithTokenLatencyMetadata(t *testin
 
 func TestMessagesProcessorUpstreamFilter_SetBackend(t *testing.T) {
 	headers := map[string]string{":path": "/anthropic/v1/messages"}
-	chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+	chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 	processor := &messagesProcessorUpstreamFilter{
 		config: &processorConfig{
 			requestCosts: []processorConfigRequestCost{
@@ -587,7 +587,7 @@ func TestMessagesProcessorUpstreamFilter_SetBackend(t *testing.T) {
 
 func Test_messagesProcessorUpstreamFilter_SetBackend_Success(t *testing.T) {
 	headers := map[string]string{":path": "/anthropic/v1/messages", internalapi.ModelNameHeaderKeyDefault: "claude"}
-	chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+	chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 	p := &messagesProcessorUpstreamFilter{
 		config:         &processorConfig{},
 		requestHeaders: headers,
@@ -724,7 +724,7 @@ func TestMessagesProcessorUpstreamFilter_ProcessRequestHeaders_WithHeaderMutatio
 		}
 
 		// Create mock metrics.
-		chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+		chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 
 		// Create processor.
 		processor := &messagesProcessorUpstreamFilter{
@@ -801,7 +801,7 @@ func TestMessagesProcessorUpstreamFilter_ProcessRequestHeaders_WithHeaderMutatio
 		}
 
 		// Create mock metrics.
-		chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+		chatMetrics := metrics.NewMessagesFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 
 		// Create processor.
 		processor := &messagesProcessorUpstreamFilter{
@@ -888,7 +888,7 @@ func TestMessagesProcessorUpstreamFilter_ProcessRequestHeaders_WithHeaderMutatio
 		}
 
 		// Create mock metrics.
-		chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+		chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 
 		// Create processor.
 		processor := &messagesProcessorUpstreamFilter{
@@ -924,7 +924,7 @@ func TestMessagesProcessorUpstreamFilter_ProcessRequestHeaders_WithHeaderMutatio
 func TestMessagesProcessorUpstreamFilter_SetBackend_WithHeaderMutations(t *testing.T) {
 	t.Run("header mutator created correctly", func(t *testing.T) {
 		headers := map[string]string{":path": "/anthropic/v1/messages"}
-		chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+		chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 		p := &messagesProcessorUpstreamFilter{
 			config:         &processorConfig{},
 			requestHeaders: headers,
@@ -980,7 +980,7 @@ func TestMessagesProcessorUpstreamFilter_SetBackend_WithHeaderMutations(t *testi
 
 	t.Run("header mutator with original headers", func(t *testing.T) {
 		headers := map[string]string{":path": "/anthropic/v1/messages"}
-		chatMetrics := metrics.NewChatCompletion(noop.NewMeterProvider().Meter("test"), map[string]string{})
+		chatMetrics := metrics.NewChatCompletionFactory(noop.NewMeterProvider().Meter("test"), map[string]string{})()
 		p := &messagesProcessorUpstreamFilter{
 			config:         &processorConfig{},
 			requestHeaders: headers,
 
@@ -16,6 +16,23 @@ import (
 	"github.com/envoyproxy/ai-gateway/internal/internalapi"
 )
 
+type baseMetricsFactory struct {
+	metrics                       *genAI
+	requestHeaderAttributeMapping map[string]string // maps HTTP headers to metric attribute names.
+}
+
+func (f *baseMetricsFactory) newBaseMetrics(operation string) baseMetrics {
+	return baseMetrics{
+		metrics:                       f.metrics,
+		operation:                     operation,
+		originalModel:                 "unknown",
+		requestModel:                  "unknown",
+		responseModel:                 "unknown",
+		backend:                       "unknown",
+		requestHeaderAttributeMapping: f.requestHeaderAttributeMapping,
+	}
+}
+
 // baseMetrics provides shared functionality for AI Gateway metrics implementations.
 type baseMetrics struct {
 	metrics      *genAI
@@ -31,19 +48,6 @@ type baseMetrics struct {
 	requestHeaderAttributeMapping map[string]string // maps HTTP headers to metric attribute names.
 }
 
-// newBaseMetrics creates a new baseMetrics instance with the specified operation.
-func newBaseMetrics(meter metric.Meter, operation string, requestHeaderAttributeMapping map[string]string) baseMetrics {
-	return baseMetrics{
-		metrics:                       newGenAI(meter),
-		operation:                     operation,
-		originalModel:                 "unknown",
-		requestModel:                  "unknown",
-		responseModel:                 "unknown",
-		backend:                       "unknown",
-		requestHeaderAttributeMapping: requestHeaderAttributeMapping,
-	}
-}
-
 // StartRequest initializes timing for a new request.
 func (b *baseMetrics) StartRequest(_ map[string]string) {
 	b.requestStart = time.Now()
Original file line number	Diff line number	Diff line change
`@@ -31,7 +31,7 @@ import (`
`31`	`31`	`)`
`32`	`32`
`33`	`33`	`// ChatCompletionProcessorFactory returns a factory method to instantiate the chat completion processor.`
`34`		`-func ChatCompletionProcessorFactory(ccm metrics.ChatCompletionMetrics) ProcessorFactory {`
	`34`	`+func ChatCompletionProcessorFactory(f metrics.ChatCompletionMetricsFactory) ProcessorFactory {`
`35`	`35`	`return func(config processorConfig, requestHeaders map[string]string, logger slog.Logger, tracing tracing.Tracing, isUpstreamFilter bool) (Processor, error) {`
`36`	`36`	`logger = logger.With("processor", "chat-completion", "isUpstreamFilter", fmt.Sprintf("%v", isUpstreamFilter))`
`37`	`37`	`if !isUpstreamFilter {`
`@@ -46,7 +46,7 @@ func ChatCompletionProcessorFactory(ccm metrics.ChatCompletionMetrics) Processor`
`46`	`46`	`config: config,`
`47`	`47`	`requestHeaders: requestHeaders,`
`48`	`48`	`logger: logger,`
`49`		`- metrics: ccm,`
	`49`	`+ metrics: f(),`
`50`	`50`	`}, nil`
`51`	`51`	`}`
`52`	`52`	`}`
Original file line number	Diff line number	Diff line change
`@@ -29,7 +29,7 @@ import (`
`29`	`29`	`)`
`30`	`30`
`31`	`31`	`// CompletionsProcessorFactory returns a factory method to instantiate the completions processor.`
`32`		`-func CompletionsProcessorFactory(cm metrics.CompletionMetrics) ProcessorFactory {`
	`32`	`+func CompletionsProcessorFactory(f metrics.CompletionMetricsFactory) ProcessorFactory {`
`33`	`33`	`return func(config processorConfig, requestHeaders map[string]string, logger slog.Logger, tracing tracing.Tracing, isUpstreamFilter bool) (Processor, error) {`
`34`	`34`	`logger = logger.With("processor", "completions", "isUpstreamFilter", fmt.Sprintf("%v", isUpstreamFilter))`
`35`	`35`	`if !isUpstreamFilter {`
`@@ -38,14 +38,14 @@ func CompletionsProcessorFactory(cm metrics.CompletionMetrics) ProcessorFactory`
`38`	`38`	`tracer: tracing.CompletionTracer(),`
`39`	`39`	`requestHeaders: requestHeaders,`
`40`	`40`	`logger: logger,`
`41`		`- metrics: cm,`
	`41`	`+ metrics: f(),`
`42`	`42`	`}, nil`
`43`	`43`	`}`
`44`	`44`	`return &completionsProcessorUpstreamFilter{`
`45`	`45`	`config: config,`
`46`	`46`	`requestHeaders: requestHeaders,`
`47`	`47`	`logger: logger,`
`48`		`- metrics: cm,`
	`48`	`+ metrics: f(),`
`49`	`49`	`}, nil`
`50`	`50`	`}`
`51`	`51`	`}`
Original file line number	Diff line number	Diff line change
`@@ -28,7 +28,7 @@ import (`
`28`	`28`	`)`
`29`	`29`
`30`	`30`	`// EmbeddingsProcessorFactory returns a factory method to instantiate the embeddings processor.`
`31`		`-func EmbeddingsProcessorFactory(em metrics.EmbeddingsMetrics) ProcessorFactory {`
	`31`	`+func EmbeddingsProcessorFactory(f metrics.EmbeddingsMetricsFactory) ProcessorFactory {`
`32`	`32`	`return func(config processorConfig, requestHeaders map[string]string, logger slog.Logger, tracing tracing.Tracing, isUpstreamFilter bool) (Processor, error) {`
`33`	`33`	`logger = logger.With("processor", "embeddings", "isUpstreamFilter", fmt.Sprintf("%v", isUpstreamFilter))`
`34`	`34`	`if !isUpstreamFilter {`
`@@ -43,7 +43,7 @@ func EmbeddingsProcessorFactory(em metrics.EmbeddingsMetrics) ProcessorFactory {`
`43`	`43`	`config: config,`
`44`	`44`	`requestHeaders: requestHeaders,`
`45`	`45`	`logger: logger,`
`46`		`- metrics: em,`
	`46`	`+ metrics: f(),`
`47`	`47`	`}, nil`
`48`	`48`	`}`
`49`	`49`	`}`