fix: return llama stack model id from embeddings (llamastack#3525)

mattf · iamemilio · commit f74a11f26897 · 2025-09-24T15:11:55.000-04:00
# What does this PR do?

the openai_embeddings method on OpenAIMixin was returning the provider's
model id instead of the llama stack name

## Test Plan

before -
```
$ ./scripts/integration-tests.sh --stack-config server:ci-tests --setup gpt --subdirs inference --inference-mode live --pattern test_openai_embeddings_single_string
...
FAILED tests/integration/inference/test_openai_embeddings.py::test_openai_embeddings_single_string[openai_client-emb=openai/text-embedding-3-small] - AssertionError: assert 'text-embedding-3-small' == 'openai/text-...dding-3-small'
FAILED tests/integration/inference/test_openai_embeddings.py::test_openai_embeddings_single_string[llama_stack_client-emb=openai/text-embedding-3-small] - AssertionError: assert 'text-embedding-3-small' == 'openai/text-...dding-3-small'
========================================== 2 failed, 95 deselected, 4 warnings in 3.87s ===========================================
```
after -
```
$ ./scripts/integration-tests.sh --stack-config server:ci-tests --setup gpt --subdirs inference --inference-mode live --pattern test_openai_embeddings_single_string ...
========================================== 2 passed, 95 deselected, 4 warnings in 2.12s ===========================================
```
diff --git a/llama_stack/providers/utils/inference/openai_mixin.py b/llama_stack/providers/utils/inference/openai_mixin.py
@@ -296,7 +296,7 @@ async def openai_embeddings(
 
         return OpenAIEmbeddingsResponse(
             data=data,
-            model=response.model,
+            model=model,
             usage=usage,
         )
 
diff --git a/tests/integration/suites.py b/tests/integration/suites.py
@@ -87,7 +87,7 @@ class Setup(BaseModel):
         description="OpenAI GPT models for high-quality responses and tool calling",
         defaults={
             "text_model": "openai/gpt-4o",
-            "embedding_model": "sentence-transformers/all-MiniLM-L6-v2",
+            "embedding_model": "openai/text-embedding-3-small",
         },
     ),
     "tgi": Setup(

Original file line number	Diff line number	Diff line change
`@@ -296,7 +296,7 @@ async def openai_embeddings(`
`296`	`296`
`297`	`297`	`return OpenAIEmbeddingsResponse(`
`298`	`298`	`data=data,`
`299`		`- model=response.model,`
	`299`	`+ model=model,`
`300`	`300`	`usage=usage,`
`301`	`301`	`)`
`302`	`302`