udpated LangChain semantic caching example

jcodella · jcodella · commit c7c0891e16f5 · 2024-03-22T13:38:38.000-04:00
diff --git a/Python/CosmosDB-MongoDB-vCore/Semantic-Caching-Tutorial.ipynb b/Python/CosmosDB-MongoDB-vCore/Semantic-Caching-Tutorial.ipynb
@@ -1,5 +1,33 @@
 {
  "cells": [
+  {
+   "cell_type": "markdown",
+   "id": "74e01527",
+   "metadata": {},
+   "source": [
+    "# Introduction\n",
+    "\n",
+    "In this tutorial, we'll demonstrate how to leverage a semantic caching with Azure Cosmos DB for MongoDB and LangChain.\n",
+    "\n",
+    "[Learn more here from the LangChain docs.](https://python.langchain.com/docs/integrations/llms/llm_caching#azure-cosmos-db-semantic-cache)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "c19c036d",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# ! pip install langchain\n",
+    "# ! pip install langchain_openai\n",
+    "# ! pip install langchain_community\n",
+    "# ! pip install pymongo\n",
+    "# ! pip install python-dotenv\n",
+    "# ! pip install azure-core\n",
+    "# ! pip install azure-cosmos"
+   ]
+  },
   {
    "cell_type": "code",
    "execution_count": null,
@@ -17,13 +45,13 @@
     "    CosmosDBVectorSearchType,\n",
     ")\n",
     "\n",
-    "from langchain_openai import OpenAIEmbeddings, AzureOpenAIEmbeddings\n",
-    "from langchain_openai import OpenAI, AzureOpenAI\n",
-    "from langchain.globals import set_llm_cache\n",
+    "from langchain.chains import ConversationalRetrievalChain, LLMChain\n",
+    "from langchain.prompts import PromptTemplate\n",
     "\n",
-    "from azure.core.exceptions import AzureError\n",
-    "from azure.core.credentials import AzureKeyCredential\n",
+    "from langchain_openai import AzureChatOpenAI, AzureOpenAIEmbeddings\n",
+    "from langchain.globals import set_llm_cache\n",
     "\n",
+    "import pymongo\n",
     "from dotenv import load_dotenv"
    ]
   },
@@ -42,7 +70,8 @@
     "\n",
     "COSMOS_MONGO_USER = config['cosmos_db_mongo_user']\n",
     "COSMOS_MONGO_PWD = config['cosmos_db_mongo_pwd']\n",
-    "COSMOS_MONGO_SERVER = config['cosmos_db_mongo_server']          "
+    "COSMOS_MONGO_SERVER = config['cosmos_db_mongo_server']\n",
+    "DIMENSIONS = int(config['openai_embeddings_dimensions'])       "
    ]
   },
   {
@@ -57,7 +86,8 @@
     "\n",
     "CONNECTION_STRING = (\"mongodb+srv://\"+COSMOS_MONGO_USER+\":\"+COSMOS_MONGO_PWD+\"@\"+COSMOS_MONGO_SERVER+\"?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000\")\n",
     "\n",
-    "DB_NAME, COLLECTION_NAME = NAMESPACE.split(\".\")"
+    "DB_NAME, COLLECTION_NAME = NAMESPACE.split(\".\")\n",
+    "mongo_client = pymongo.MongoClient(CONNECTION_STRING)\n"
    ]
   },
   {
@@ -67,24 +97,66 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "# Requires model version 0301 or more recent\n",
-    "llm = AzureOpenAI(\n",
-    "    deployment_name=config['openai_completions_deployment'],\n",
-    "    model_name=config['openai_completions_model'],\n",
-    "    openai_api_key=config['openai_api_key'],\n",
-    "    azure_endpoint=config['openai_api_endpoint'],\n",
-    "    openai_api_version=config['openai_api_version'],\n",
-    "    n=2,\n",
-    "    best_of=2,\n",
-    "    cache=True)\n",
-    "\n",
-    "\n",
-    "embeddings = AzureOpenAIEmbeddings(\n",
-    "    azure_deployment=config['openai_embeddings_deployment'],\n",
-    "    model=config['openai_embeddings_model'],\n",
-    "    openai_api_key=config['openai_api_key'],\n",
-    "    azure_endpoint=config['openai_api_endpoint'],\n",
-    "    openai_api_version=config['openai_api_version'])"
+    "def init_llm_chain():\n",
+    "\n",
+    "    # Clear old cache if it exists\n",
+    "    mongo_client[DB_NAME][COLLECTION_NAME].drop_indexes()\n",
+    "    mongo_client[DB_NAME].drop_collection(COLLECTION_NAME)\n",
+    "\n",
+    "    # Define a template for the LLM prompt\n",
+    "    prompt_template = \"\"\"\n",
+    "    You are an upbeat AI assistant who is excited to help answer questions. \n",
+    "\n",
+    "    Question: {question}\n",
+    "    If you don't know the answer, just say that you don't know, don't try to make up an answer.\n",
+    "    \"\"\"\n",
+    "    chatbot_prompt = PromptTemplate(\n",
+    "        template = prompt_template, input_variables = [\"question\", \"context\"])\n",
+    "\n",
+    "    # Requires model version 0301 or more recent\n",
+    "    # Point to completions model deployed in Azure OpenAI\n",
+    "    llm = AzureChatOpenAI(\n",
+    "        deployment_name=config['openai_completions_deployment'],\n",
+    "        model_name=config['openai_completions_model'],\n",
+    "        api_key=config['openai_api_key'],\n",
+    "        azure_endpoint=config['openai_api_endpoint'],\n",
+    "        api_version=config['openai_api_version'],\n",
+    "        cache=True,\n",
+    "        n=1)\n",
+    "\n",
+    "    # Point to embeddings model deployed in Azure OpenAI\n",
+    "    embeddings = AzureOpenAIEmbeddings(\n",
+    "        azure_deployment=config['openai_embeddings_deployment'],\n",
+    "        model=config['openai_embeddings_model'],\n",
+    "        api_key=config['openai_api_key'],\n",
+    "        azure_endpoint=config['openai_api_endpoint'],\n",
+    "        dimensions=DIMENSIONS)\n",
+    "\n",
+    "    # Setup simple LLM chain\n",
+    "    llm_chain = LLMChain(llm = llm, prompt=chatbot_prompt)\n",
+    "\n",
+    "    # Setup semantic cache for LLM\n",
+    "    num_lists = 1\n",
+    "    similarity_algorithm = CosmosDBSimilarityType.COS\n",
+    "    kind = CosmosDBVectorSearchType.VECTOR_IVF\n",
+    "\n",
+    "    score_threshold = 0.9\n",
+    "\n",
+    "    sem_cache = AzureCosmosDBSemanticCache(\n",
+    "            cosmosdb_connection_string=CONNECTION_STRING,\n",
+    "            cosmosdb_client=None,\n",
+    "            embedding=embeddings,\n",
+    "            database_name=DB_NAME,\n",
+    "            collection_name=COLLECTION_NAME,\n",
+    "            num_lists=num_lists,\n",
+    "            similarity=similarity_algorithm,\n",
+    "            kind=kind,\n",
+    "            dimensions=DIMENSIONS,\n",
+    "            score_threshold=score_threshold)\n",
+    "\n",
+    "    set_llm_cache(sem_cache)\n",
+    "\n",
+    "    return llm_chain"
    ]
   },
   {
@@ -96,32 +168,8 @@
    },
    "outputs": [],
    "source": [
-    "# Default value for these params\n",
-    "num_lists = 1\n",
-    "dimensions = 1536\n",
-    "similarity_algorithm = CosmosDBSimilarityType.COS\n",
-    "kind = CosmosDBVectorSearchType.VECTOR_IVF\n",
-    "m = 16\n",
-    "ef_construction = 64\n",
-    "ef_search = 40\n",
-    "score_threshold = 0.9\n",
-    "\n",
-    "set_llm_cache(\n",
-    "    AzureCosmosDBSemanticCache(\n",
-    "        cosmosdb_connection_string=CONNECTION_STRING,\n",
-    "        cosmosdb_client=None,\n",
-    "        embedding=embeddings,\n",
-    "        database_name=DB_NAME,\n",
-    "        collection_name=COLLECTION_NAME,\n",
-    "        num_lists=num_lists,\n",
-    "        similarity=similarity_algorithm,\n",
-    "        kind=kind,\n",
-    "        dimensions=dimensions,\n",
-    "        m=m,\n",
-    "        ef_construction=ef_construction,\n",
-    "        ef_search=ef_search,\n",
-    "        score_threshold=score_threshold    )\n",
-    ")"
+    "# Initialize llm chain\n",
+    "llm_chain = init_llm_chain()"
    ]
   },
   {
@@ -133,7 +181,7 @@
    "source": [
     "%%time\n",
     "# The first time, the quesiton/response is not yet cachced in Cosmos DB, so retrieval should be slower\n",
-    "llm(\"Tell me about beer making\")"
+    "llm_chain.invoke(\"Tell me something interesting about beer making\")"
    ]
   },
   {
@@ -145,7 +193,7 @@
    "source": [
     "%%time\n",
     "# This quesiton/response is not yet cachced in Cosmos DB, so retrieval should be slower\n",
-    "llm(\"Tell me a joke?\")"
+    "llm_chain(\"Tell me a joke about tomatoes and food.\")"
    ]
   },
   {
@@ -157,7 +205,7 @@
    "source": [
     "%%time\n",
     "# The second time, the quesiton/response is cached in Cosmos DB, so retrieval should be faster\n",
-    "llm(\"Tell me about beer making\")"
+    "llm_chain(\"Tell me something interesting about beer making\")"
    ]
   },
   {
@@ -169,7 +217,7 @@
    "source": [
     "%%time\n",
     "# This question is semantically similar to the previous one within the score_threshold amount, so retrieval should be faster\n",
-    "llm(\"How do I make beer?\")"
+    "llm_chain(\"How do I make beer?\")"
    ]
   }
  ],
diff --git a/Python/CosmosDB-MongoDB-vCore/example.env b/Python/CosmosDB-MongoDB-vCore/example.env
@@ -1,11 +1,12 @@
-cosmos_db_mongo_user = "sample"
-cosmos_db_mongo_pwd = "sample"
-cosmos_db_mongo_server = "sample_endpoint.com/"
-openai_api_endpoint = "sample_endpoint.com/"
-openai_api_key =
+cosmos_db_mongo_user = ""
+cosmos_db_mongo_pwd = ""
+cosmos_db_mongo_server = "yourcdbresource.mongocluster.cosmos.azure.com/"
+openai_api_endpoint = "https://your_endpoint.openai.azure.com/"
+openai_api_key = """
 openai_api_type = "azure"
 openai_api_version = "2023-05-15" 
-openai_embeddings_deployment = "deployment_name"
-openai_embeddings_model = "model_type"
-openai_completions_deployment = "deployment_name"
-openai_completions_model = "model_type"
+openai_embeddings_deployment = "embedding-deployment-name"
+openai_embeddings_model = "embedding-model-type"
+openai_embeddings_dimensions = 1536
+openai_completions_deployment = "completions-deployment-name"
+openai_completions_model = "completions-model-type"