fix: clarify the transmission of response_id

zakahan · zakahan · commit 44a249e469fa · 2025-11-12T16:41:13.000+08:00
diff --git a/veadk/models/ark_llm.py b/veadk/models/ark_llm.py
@@ -39,7 +39,6 @@
 
 from veadk.models.ark_transform import (
     CompletionToResponsesAPIHandler,
-    get_previous_response_id,
 )
 from veadk.utils.logger import get_logger
 
@@ -89,7 +88,6 @@ async def generate_content_async(
         Yields:
           LlmResponse: The model response.
         """
-        agent_name = llm_request.config.labels["adk_agent_name"]
         self._maybe_append_user_content(llm_request)
         # logger.debug(_build_request_log(llm_request))
 
@@ -104,10 +102,7 @@ async def generate_content_async(
         # get previous_response_id
         previous_response_id = None
         if llm_request.cache_metadata and llm_request.cache_metadata.cache_name:
-            previous_response_id = get_previous_response_id(
-                llm_request.cache_metadata,
-                agent_name,
-            )
+            previous_response_id = llm_request.cache_metadata.cache_name
         completion_args = {
             "model": self.model,
             "messages": messages,
@@ -212,7 +207,6 @@ async def generate_content_async(
                             )
                         )
                         self.transform_handler.adapt_responses_api(
-                            llm_request,
                             model_response,
                             aggregated_llm_response_with_tool_call,
                             stream=True,
@@ -226,7 +220,6 @@ async def generate_content_async(
                             )
                         )
                         self.transform_handler.adapt_responses_api(
-                            llm_request,
                             model_response,
                             aggregated_llm_response,
                             stream=True,
diff --git a/veadk/models/ark_transform.py b/veadk/models/ark_transform.py
@@ -14,7 +14,6 @@
 
 # adapted from Google ADK models adk-python/blob/main/src/google/adk/models/lite_llm.py at f1f44675e4a86b75e72cfd838efd8a0399f23e24 · google/adk-python
 
-import json
 import uuid
 from typing import Any, Dict, Optional, cast, List, Generator, Tuple, Union
 
@@ -141,28 +140,26 @@ def ark_field_reorganization(request_data: dict) -> dict:
     return request_data
 
 
-def build_cache_metadata(agent_response_id: dict) -> CacheMetadata:
+def build_cache_metadata(response_id: str) -> CacheMetadata:
     """Create a new CacheMetadata instance for agent response tracking.
 
     Args:
-        agent_name: Name of the agent
         response_id: Response ID to track
 
     Returns:
         A new CacheMetadata instance with the agent-response mapping
     """
-    cache_name = json.dumps(agent_response_id)
     if "contents_count" in CacheMetadata.model_fields:  # adk >= 1.17
         cache_metadata = CacheMetadata(
-            cache_name=cache_name,
+            cache_name=response_id,
             expire_time=0,
             fingerprint="",
             invocations_used=0,
             contents_count=0,
         )
     else:  # 1.15 <= adk < 1.17
         cache_metadata = CacheMetadata(
-            cache_name=cache_name,
+            cache_name=response_id,
             expire_time=0,
             fingerprint="",
             invocations_used=0,
@@ -171,44 +168,6 @@ def build_cache_metadata(agent_response_id: dict) -> CacheMetadata:
     return cache_metadata
 
 
-def update_cache_metadata(
-    cache_metadata: CacheMetadata,
-    agent_name: str,
-    response_id: str,
-) -> CacheMetadata:
-    """Update cache metadata by creating a new instance with updated cache_name.
-
-    Since CacheMetadata is frozen, we cannot modify it directly. Instead,
-    we create a new instance with the updated cache_name field.
-    """
-    try:
-        agent_response_id = json.loads(cache_metadata.cache_name)
-        agent_response_id[agent_name] = response_id
-        updated_cache_name = agent_response_id
-
-        # Create a new CacheMetadata instance with updated cache_name
-        return build_cache_metadata(updated_cache_name)
-    except json.JSONDecodeError as e:
-        logger.warning(
-            f"Failed to update cache metadata. The cache_name is not a valid JSON string., {str(e)}"
-        )
-        return cache_metadata
-
-
-def get_previous_response_id(
-    cache_metadata: CacheMetadata,
-    agent_name: str,
-):
-    try:
-        agent_response_id = json.loads(cache_metadata.cache_name)
-        return agent_response_id.get(agent_name, None)
-    except json.JSONDecodeError as e:
-        logger.warning(
-            f"Failed to get previous response id. The cache_name is not a valid JSON string., {str(e)}"
-        )
-        return None
-
-
 class CompletionToResponsesAPIHandler:
     def __init__(self):
         self.litellm_handler = LiteLLMResponsesTransformationHandler()
@@ -316,7 +275,6 @@ def openai_response_to_generate_content_response(
             llm_response = _model_response_to_generate_content_response(model_response)
 
             llm_response = self.adapt_responses_api(
-                llm_request,
                 model_response,
                 llm_response,
             )
@@ -325,7 +283,6 @@ def openai_response_to_generate_content_response(
 
     def adapt_responses_api(
         self,
-        llm_request: LlmRequest,
         model_response: ModelResponse,
         llm_response: LlmResponse,
         stream: bool = False,
@@ -334,21 +291,10 @@ def adapt_responses_api(
         Adapt responses api.
         """
         if not model_response.id.startswith("chatcmpl"):
-            # if llm_response.custom_metadata is None:
-            #     llm_response.custom_metadata = {}
-            # llm_response.custom_metadata["response_id"] = model_response["id"]
             previous_response_id = model_response["id"]
-            if not llm_request.cache_metadata:
-                llm_response.cache_metadata = build_cache_metadata(
-                    {llm_request.config.labels["adk_agent_name"]: previous_response_id}
-                )
-            else:
-                llm_response.cache_metadata = update_cache_metadata(
-                    llm_request.cache_metadata,
-                    llm_request.config.labels["adk_agent_name"],
-                    previous_response_id,
-                )
-
+            llm_response.cache_metadata = build_cache_metadata(
+                previous_response_id,
+            )
         # add responses cache data
         if not stream:
             if model_response.get("usage", {}).get("prompt_tokens_details"):