fix: Add gpt-4o support #967 and embedding model version as variable (#1090)

zihuq-msft · ross-p-smith · adamdougal · web-flow · commit ab670cb49fd5 · 2024-06-27T08:04:26.000Z
Co-authored-by: Ross Smith &lt;ross-p-smith@users.noreply.github.com&gt;
Co-authored-by: Adam Dougal &lt;adamdougal@users.noreply.github.com&gt;
diff --git a/docs/LOCAL_DEPLOYMENT.md b/docs/LOCAL_DEPLOYMENT.md
@@ -192,8 +192,11 @@ Execute the above [shell command](#L81) to run the function locally. You may nee
 |AZURE_OPENAI_RESOURCE||the name of your Azure OpenAI resource|
 |AZURE_OPENAI_MODEL||The name of your model deployment|
 |AZURE_OPENAI_MODEL_NAME|gpt-35-turbo|The name of the model|
+|AZURE_OPENAI_MODEL_VERSION|0613|The version of the model to use|
 |AZURE_OPENAI_API_KEY||One of the API keys of your Azure OpenAI resource|
-|AZURE_OPENAI_EMBEDDING_MODEL|text-embedding-ada-002|The name of you Azure OpenAI embeddings model deployment|
+|AZURE_OPENAI_EMBEDDING_MODEL|text-embedding-ada-002|The name of your Azure OpenAI embeddings model deployment|
+|AZURE_OPENAI_EMBEDDING_MODEL_NAME|text-embedding-ada-002|The name of the embeddings model (can be found in Azure AI Studio)|
+|AZURE_OPENAI_EMBEDDING_MODEL_VERSION|2|The version of the embeddings model to use (can be found in Azure AI Studio)|
 |AZURE_OPENAI_TEMPERATURE|0|What sampling temperature to use, between 0 and 2. Higher values like 0.8 will make the output more random, while lower values like 0.2 will make it more focused and deterministic. A value of 0 is recommended when using your data.|
 |AZURE_OPENAI_TOP_P|1.0|An alternative to sampling with temperature, called nucleus sampling, where the model considers the results of the tokens with top_p probability mass. We recommend setting this to 1.0 when using your data.|
 |AZURE_OPENAI_MAX_TOKENS|1000|The maximum number of tokens allowed for the generated answer.|
diff --git a/docs/model_configuration.md b/docs/model_configuration.md
@@ -0,0 +1,77 @@
+[Back to *Chat with your data* README](../README.md)
+
+# Overview
+
+This document outlines the necessary steps and configurations required for setting up and using models within the solution. It serves as a guide for developers to configure and customize model settings according to the project's needs.
+
+# Model Selection
+
+## Available Models
+
+- For a list of available models, see the [Microsoft Azure AI Services - OpenAI Models documentation](https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/models).
+
+## Environment Variables (as listed in Azure AI Studio)
+- You can access the Environment Variables section of the `LOCAL_DEPLOYMENT.md` file by clicking on this link: [Environment Variables section in LOCAL_DEPLOYMENT.md](docs/LOCAL_DEPLOYMENT.md#environment-variables).
+
+### LLM
+- `AZURE_OPENAI_MODEL`: The Azure OpenAI Model Deployment Name
+    - example: `my-gpt-35-turbo-16k`
+- `AZURE_OPENAI_MODEL_NAME`: The Azure OpenAI Model Name
+    - example: `gpt-35-turbo-16k`
+- `AZURE_OPENAI_MODEL_VERSION`: The Azure OpenAI Model Version
+    - example: `0613`
+- `AZURE_OPENAI_MODEL_CAPACITY`: The Tokens per Minute Rate Limit (thousands)
+    - example: `30`
+
+### VISION
+- `AZURE_OPENAI_VISION_MODEL`: The Azure OpenAI Model Deployment Name
+    - example: `my-gpt-4`
+- `AZURE_OPENAI_VISION_MODEL_NAME`: The Azure OpenAI Model Name
+    - example: `gpt-4`
+- `AZURE_OPENAI_VISION_MODEL_VERSION`: The Azure OpenAI Model Version
+    - example: `vision-preview`
+- `AZURE_OPENAI_VISION_MODEL_CAPACITY`: The Tokens per Minute Rate Limit (thousands)
+    - example: `10`
+
+### EMBEDDINGS
+- `AZURE_OPENAI_EMBEDDING_MODEL`: The Azure OpenAI Model Deployment Name
+    - example: `my-text-embedding-ada-002`
+- `AZURE_OPENAI_EMBEDDING_MODEL_NAME`: The Azure OpenAI Model Name
+    - example: `text-embedding-ada-002`
+- `AZURE_OPENAI_EMBEDDING_MODEL_VERSION`: The Azure OpenAI Model Version
+    - example: `2`
+- `AZURE_OPENAI_EMBEDDING_MODEL_CAPACITY`: The Tokens per Minute Rate Limit (thousands)
+    - example: `30`
+- `AZURE_SEARCH_DIMENSIONS`: Azure OpenAI Embeddings dimensions. A full list of dimensions can be found [here](https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/models#embeddings-models).
+    - example: `1536`
+
+### OPENAI API Configuration
+- `AZURE_OPENAI_API_VERSION`: The Azure OpenAI API Version
+    - example: `2024-02-01`
+- `AZURE_OPENAI_MAX_TOKENS`: The Maximum Tokens per Request
+    - example: `1000`
+- `AZURE_OPENAI_TEMPERATURE`: The Sampling Temperature (from 0 to 1)
+    - example: `0`
+- `AZURE_OPENAI_TOP_P`: The Top P Sampling Probability
+    - example: `1`
+
+# Model Configuration
+- To set an environment variable, you can use the following command:
+    - `azd env set <ENVIRONMENT_VARIABLE_NAME> <ENVIRONMENT_VARIABLE_VALUE>`
+
+- To get the value of an environment variable, you can use the following command:
+    - `azd env get <ENVIRONMENT_VARIABLE_NAME>`
+
+## GPT-4o & Text-Embeddings-3-Large
+- The following environment variables are set for the GPT-4o and Text-Embeddings-3-Large models:
+    - `AZURE_OPENAI_API_VERSION`: `2024-05-01-preview`
+    - `AZURE_OPENAI_MODEL`: `my-gpt-4o`
+    - `AZURE_OPENAI_MODEL_NAME`: `gpt-4o`
+    - `AZURE_OPENAI_MODEL_VERSION`: `2024-05-13`
+    - `AZURE_OPENAI_EMBEDDING_MODEL`: `my-text-embedding-3-large`
+    - `AZURE_OPENAI_EMBEDDING_MODEL_NAME`: `text-embedding-3-large`
+    - `AZURE_OPENAI_EMBEDDING_MODEL_VERSION`: `1`
+    - `AZURE_SEARCH_DIMENSIONS`: `3072`
+    - `AZURE_MAX_TOKENS`: `4096`
+
+---
diff --git a/infra/main.bicep b/infra/main.bicep
@@ -102,6 +102,7 @@ param azureOpenAIModel string = 'gpt-35-turbo-16k'
 @description('Azure OpenAI Model Name')
 param azureOpenAIModelName string = 'gpt-35-turbo-16k'
 
+@description('Azure OpenAI Model Version')
 param azureOpenAIModelVersion string = '0613'
 
 @description('Azure OpenAI Model Capacity - See here for more info  https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/quota')
@@ -168,6 +169,9 @@ param azureOpenAIEmbeddingModel string = 'text-embedding-ada-002'
 @description('Azure OpenAI Embedding Model Name')
 param azureOpenAIEmbeddingModelName string = 'text-embedding-ada-002'
 
+@description('Azure OpenAI Embedding Model Version')
+param azureOpenAIEmbeddingModelVersion string = '2'
+
 @description('Azure OpenAI Embedding Model Capacity - See here for more info  https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/quota')
 param azureOpenAIEmbeddingModelCapacity int = 30
 
@@ -327,7 +331,7 @@ var defaultOpenAiDeployments = [
     model: {
       format: 'OpenAI'
       name: azureOpenAIEmbeddingModelName
-      version: '2'
+      version: azureOpenAIEmbeddingModelVersion
     }
     sku: {
       name: 'Standard'
@@ -339,21 +343,21 @@ var defaultOpenAiDeployments = [
 var openAiDeployments = concat(
   defaultOpenAiDeployments,
   useAdvancedImageProcessing
-   ? [
-    {
-      name: azureOpenAIVisionModel
-      model: {
-        format: 'OpenAI'
-        name: azureOpenAIVisionModelName
-        version: azureOpenAIVisionModelVersion
-      }
-      sku: {
-        name: 'Standard'
-        capacity: azureOpenAIVisionModelCapacity
-      }
-    }
-  ]
-   : []
+    ? [
+        {
+          name: azureOpenAIVisionModel
+          model: {
+            format: 'OpenAI'
+            name: azureOpenAIVisionModelName
+            version: azureOpenAIVisionModelVersion
+          }
+          sku: {
+            name: 'Standard'
+            capacity: azureOpenAIVisionModelCapacity
+          }
+        }
+      ]
+    : []
 )
 
 module openai 'core/ai/cognitiveservices.bicep' = {
@@ -534,6 +538,7 @@ module web './app/web.bicep' = if (hostingModel == 'code') {
       AZURE_OPENAI_RESOURCE: azureOpenAIResourceName
       AZURE_OPENAI_MODEL: azureOpenAIModel
       AZURE_OPENAI_MODEL_NAME: azureOpenAIModelName
+      AZURE_OPENAI_MODEL_VERSION: azureOpenAIModelVersion
       AZURE_OPENAI_TEMPERATURE: azureOpenAITemperature
       AZURE_OPENAI_TOP_P: azureOpenAITopP
       AZURE_OPENAI_MAX_TOKENS: azureOpenAIMaxTokens
@@ -542,6 +547,8 @@ module web './app/web.bicep' = if (hostingModel == 'code') {
       AZURE_OPENAI_API_VERSION: azureOpenAIApiVersion
       AZURE_OPENAI_STREAM: azureOpenAIStream
       AZURE_OPENAI_EMBEDDING_MODEL: azureOpenAIEmbeddingModel
+      AZURE_OPENAI_EMBEDDING_MODEL_NAME: azureOpenAIEmbeddingModelName
+      AZURE_OPENAI_EMBEDDING_MODEL_VERSION: azureOpenAIEmbeddingModelVersion
       AZURE_SEARCH_USE_SEMANTIC_SEARCH: azureSearchUseSemanticSearch
       AZURE_SEARCH_SERVICE: 'https://${azureAISearchName}.search.windows.net'
       AZURE_SEARCH_INDEX: azureSearchIndex
@@ -608,6 +615,7 @@ module web_docker './app/web.bicep' = if (hostingModel == 'container') {
       AZURE_OPENAI_RESOURCE: azureOpenAIResourceName
       AZURE_OPENAI_MODEL: azureOpenAIModel
       AZURE_OPENAI_MODEL_NAME: azureOpenAIModelName
+      AZURE_OPENAI_MODEL_VERSION: azureOpenAIModelVersion
       AZURE_OPENAI_TEMPERATURE: azureOpenAITemperature
       AZURE_OPENAI_TOP_P: azureOpenAITopP
       AZURE_OPENAI_MAX_TOKENS: azureOpenAIMaxTokens
@@ -616,6 +624,8 @@ module web_docker './app/web.bicep' = if (hostingModel == 'container') {
       AZURE_OPENAI_API_VERSION: azureOpenAIApiVersion
       AZURE_OPENAI_STREAM: azureOpenAIStream
       AZURE_OPENAI_EMBEDDING_MODEL: azureOpenAIEmbeddingModel
+      AZURE_OPENAI_EMBEDDING_MODEL_NAME: azureOpenAIEmbeddingModelName
+      AZURE_OPENAI_EMBEDDING_MODEL_VERSION: azureOpenAIEmbeddingModelVersion
       AZURE_SEARCH_USE_SEMANTIC_SEARCH: azureSearchUseSemanticSearch
       AZURE_SEARCH_SERVICE: 'https://${azureAISearchName}.search.windows.net'
       AZURE_SEARCH_INDEX: azureSearchIndex
@@ -682,6 +692,7 @@ module adminweb './app/adminweb.bicep' = if (hostingModel == 'code') {
       AZURE_OPENAI_RESOURCE: azureOpenAIResourceName
       AZURE_OPENAI_MODEL: azureOpenAIModel
       AZURE_OPENAI_MODEL_NAME: azureOpenAIModelName
+      AZURE_OPENAI_MODEL_VERSION: azureOpenAIModelVersion
       AZURE_OPENAI_TEMPERATURE: azureOpenAITemperature
       AZURE_OPENAI_TOP_P: azureOpenAITopP
       AZURE_OPENAI_MAX_TOKENS: azureOpenAIMaxTokens
@@ -690,6 +701,8 @@ module adminweb './app/adminweb.bicep' = if (hostingModel == 'code') {
       AZURE_OPENAI_API_VERSION: azureOpenAIApiVersion
       AZURE_OPENAI_STREAM: azureOpenAIStream
       AZURE_OPENAI_EMBEDDING_MODEL: azureOpenAIEmbeddingModel
+      AZURE_OPENAI_EMBEDDING_MODEL_NAME: azureOpenAIEmbeddingModelName
+      AZURE_OPENAI_EMBEDDING_MODEL_VERSION: azureOpenAIEmbeddingModelVersion
       AZURE_SEARCH_SERVICE: 'https://${azureAISearchName}.search.windows.net'
       AZURE_SEARCH_INDEX: azureSearchIndex
       AZURE_SEARCH_USE_SEMANTIC_SEARCH: azureSearchUseSemanticSearch
@@ -754,6 +767,7 @@ module adminweb_docker './app/adminweb.bicep' = if (hostingModel == 'container')
       AZURE_OPENAI_RESOURCE: azureOpenAIResourceName
       AZURE_OPENAI_MODEL: azureOpenAIModel
       AZURE_OPENAI_MODEL_NAME: azureOpenAIModelName
+      AZURE_OPENAI_MODEL_VERSION: azureOpenAIModelVersion
       AZURE_OPENAI_TEMPERATURE: azureOpenAITemperature
       AZURE_OPENAI_TOP_P: azureOpenAITopP
       AZURE_OPENAI_MAX_TOKENS: azureOpenAIMaxTokens
@@ -762,6 +776,8 @@ module adminweb_docker './app/adminweb.bicep' = if (hostingModel == 'container')
       AZURE_OPENAI_API_VERSION: azureOpenAIApiVersion
       AZURE_OPENAI_STREAM: azureOpenAIStream
       AZURE_OPENAI_EMBEDDING_MODEL: azureOpenAIEmbeddingModel
+      AZURE_OPENAI_EMBEDDING_MODEL_NAME: azureOpenAIEmbeddingModelName
+      AZURE_OPENAI_EMBEDDING_MODEL_VERSION: azureOpenAIEmbeddingModelVersion
       AZURE_SEARCH_SERVICE: 'https://${azureAISearchName}.search.windows.net'
       AZURE_SEARCH_INDEX: azureSearchIndex
       AZURE_SEARCH_USE_SEMANTIC_SEARCH: azureSearchUseSemanticSearch
@@ -812,8 +828,8 @@ module workbook './app/workbook.bicep' = {
     functionName: hostingModel == 'container' ? function_docker.outputs.functionName : function.outputs.functionName
     websiteName: hostingModel == 'container' ? web_docker.outputs.FRONTEND_API_NAME : web.outputs.FRONTEND_API_NAME
     adminWebsiteName: hostingModel == 'container'
-     ? adminweb_docker.outputs.WEBSITE_ADMIN_NAME
-     : adminweb.outputs.WEBSITE_ADMIN_NAME
+      ? adminweb_docker.outputs.WEBSITE_ADMIN_NAME
+      : adminweb.outputs.WEBSITE_ADMIN_NAME
     eventGridSystemTopicName: eventgrid.outputs.name
     logAnalyticsName: monitoring.outputs.logAnalyticsWorkspaceName
     azureOpenAIResourceName: openai.outputs.name
@@ -860,7 +876,11 @@ module function './app/function.bicep' = if (hostingModel == 'code') {
       AZURE_CONTENT_SAFETY_ENDPOINT: contentsafety.outputs.endpoint
       AZURE_FORM_RECOGNIZER_ENDPOINT: formrecognizer.outputs.endpoint
       AZURE_OPENAI_MODEL: azureOpenAIModel
+      AZURE_OPENAI_MODEL_NAME: azureOpenAIModelName
+      AZURE_OPENAI_MODEL_VERSION: azureOpenAIModelVersion
       AZURE_OPENAI_EMBEDDING_MODEL: azureOpenAIEmbeddingModel
+      AZURE_OPENAI_EMBEDDING_MODEL_NAME: azureOpenAIEmbeddingModelName
+      AZURE_OPENAI_EMBEDDING_MODEL_VERSION: azureOpenAIEmbeddingModelVersion
       AZURE_OPENAI_RESOURCE: azureOpenAIResourceName
       AZURE_OPENAI_API_VERSION: azureOpenAIApiVersion
       AZURE_SEARCH_INDEX: azureSearchIndex
@@ -913,7 +933,11 @@ module function_docker './app/function.bicep' = if (hostingModel == 'container')
       AZURE_CONTENT_SAFETY_ENDPOINT: contentsafety.outputs.endpoint
       AZURE_FORM_RECOGNIZER_ENDPOINT: formrecognizer.outputs.endpoint
       AZURE_OPENAI_MODEL: azureOpenAIModel
+      AZURE_OPENAI_MODEL_NAME: azureOpenAIModelName
+      AZURE_OPENAI_MODEL_VERSION: azureOpenAIModelVersion
       AZURE_OPENAI_EMBEDDING_MODEL: azureOpenAIEmbeddingModel
+      AZURE_OPENAI_EMBEDDING_MODEL_NAME: azureOpenAIEmbeddingModelName
+      AZURE_OPENAI_EMBEDDING_MODEL_VERSION: azureOpenAIEmbeddingModelVersion
       AZURE_OPENAI_RESOURCE: azureOpenAIResourceName
       AZURE_OPENAI_API_VERSION: azureOpenAIApiVersion
       AZURE_SEARCH_INDEX: azureSearchIndex
@@ -973,11 +997,11 @@ module storage 'core/storage/storage-account.bicep' = {
       name: 'Standard_GRS'
     }
     deleteRetentionPolicy: azureSearchUseIntegratedVectorization
-     ? {
-      enabled: true
-      days: 7
-    }
-     : {}
+      ? {
+          enabled: true
+          days: 7
+        }
+      : {}
     containers: [
       {
         name: blobContainerName
@@ -1078,6 +1102,7 @@ output AZURE_KEY_VAULT_ENDPOINT string = useKeyVault ? keyvault.outputs.endpoint
 output AZURE_KEY_VAULT_NAME string = useKeyVault || authType == 'rbac' ? keyvault.outputs.name : ''
 output AZURE_LOCATION string = location
 output AZURE_OPENAI_MODEL_NAME string = azureOpenAIModelName
+output AZURE_OPENAI_MODEL_VERSION string = azureOpenAIModelVersion
 output AZURE_OPENAI_STREAM string = azureOpenAIStream
 output AZURE_OPENAI_SYSTEM_MESSAGE string = azureOpenAISystemMessage
 output AZURE_OPENAI_STOP_SEQUENCE string = azureOpenAIStopSequence
@@ -1086,8 +1111,8 @@ output AZURE_OPENAI_TOP_P string = azureOpenAITopP
 output AZURE_OPENAI_TEMPERATURE string = azureOpenAITemperature
 output AZURE_OPENAI_API_VERSION string = azureOpenAIApiVersion
 output AZURE_OPENAI_RESOURCE string = azureOpenAIResourceName
-output AZURE_OPENAI_EMBEDDING_MODEL string = azureOpenAIEmbeddingModel
-output AZURE_OPENAI_MODEL string = azureOpenAIModel
+output AZURE_OPENAI_EMBEDDING_MODEL_NAME string = azureOpenAIEmbeddingModelName
+output AZURE_OPENAI_EMBEDDING_MODEL_VERSION string = azureOpenAIEmbeddingModelVersion
 output AZURE_OPENAI_API_KEY string = useKeyVault ? storekeys.outputs.OPENAI_KEY_NAME : ''
 output AZURE_RESOURCE_GROUP string = rgName
 output AZURE_SEARCH_KEY string = useKeyVault ? storekeys.outputs.SEARCH_KEY_NAME : ''
@@ -1116,16 +1141,16 @@ output DOCUMENT_PROCESSING_QUEUE_NAME string = queueName
 output ORCHESTRATION_STRATEGY string = orchestrationStrategy
 output USE_KEY_VAULT bool = useKeyVault
 output FRONTEND_WEBSITE_NAME string = hostingModel == 'code'
- ? web.outputs.FRONTEND_API_URI
- : web_docker.outputs.FRONTEND_API_URI
+  ? web.outputs.FRONTEND_API_URI
+  : web_docker.outputs.FRONTEND_API_URI
 output ADMIN_WEBSITE_NAME string = hostingModel == 'code'
- ? adminweb.outputs.WEBSITE_ADMIN_URI
- : adminweb_docker.outputs.WEBSITE_ADMIN_URI
+  ? adminweb.outputs.WEBSITE_ADMIN_URI
+  : adminweb_docker.outputs.WEBSITE_ADMIN_URI
 output LOGLEVEL string = logLevel
 output CONVERSATION_FLOW string = conversationFlow
 output USE_ADVANCED_IMAGE_PROCESSING bool = useAdvancedImageProcessing
 output ADVANCED_IMAGE_PROCESSING_MAX_IMAGES int = advancedImageProcessingMaxImages
 output AZURE_ML_WORKSPACE_NAME string = orchestrationStrategy == 'prompt_flow'
- ? machineLearning.outputs.workspaceName
- : ''
+  ? machineLearning.outputs.workspaceName
+  : ''
 output RESOURCE_TOKEN string = resourceToken
diff --git a/infra/main.bicepparam b/infra/main.bicepparam
@@ -33,6 +33,8 @@ param azureOpenAIVisionModelVersion = readEnvironmentVariable('AZURE_OPENAI_VISI
 param azureOpenAIVisionModelCapacity = int(readEnvironmentVariable('AZURE_OPENAI_VISION_MODEL_CAPACITY', '10'))
 param azureOpenAIEmbeddingModelCapacity = int(readEnvironmentVariable('AZURE_OPENAI_EMBEDDING_MODEL_CAPACITY', '30'))
 param azureOpenAIEmbeddingModel = readEnvironmentVariable('AZURE_OPENAI_EMBEDDING_MODEL', 'text-embedding-ada-002')
+param azureOpenAIEmbeddingModelName = readEnvironmentVariable('AZURE_OPENAI_EMBEDDING_MODEL_NAME', 'text-embedding-ada-002')
+param azureOpenAIEmbeddingModelVersion = readEnvironmentVariable('AZURE_OPENAI_EMBEDDING_MODEL_VERSION', '2')
 param azureOpenAIMaxTokens = readEnvironmentVariable('AZURE_OPENAI_MAX_TOKENS', '1000')
 param azureOpenAITemperature = readEnvironmentVariable('AZURE_OPENAI_TEMPERATURE', '0')
 param azureOpenAITopP = readEnvironmentVariable('AZURE_OPENAI_TOP_P', '1')
diff --git a/infra/main.json b/infra/main.json