option 1: send in stream chunk

narengogi · narengogi · commit ec4663b81f4d · 2025-11-03T18:44:51.000+05:30
diff --git a/src/handlers/handlerUtils.ts b/src/handlers/handlerUtils.ts
@@ -1189,6 +1189,7 @@ export async function recursiveAfterRequestHookHandler(
     responseJson: mappedResponseJson,
     originalResponseJson,
   } = await responseHandler(
+    c,
     response,
     isStreamingMode,
     providerOption,
@@ -1198,7 +1199,8 @@ export async function recursiveAfterRequestHookHandler(
     gatewayParams,
     strictOpenAiCompliance,
     c.req.url,
-    areSyncHooksAvailable
+    areSyncHooksAvailable,
+    hookSpanId
   );
 
   const arhResponse = await afterRequestHookHandler(
diff --git a/src/handlers/responseHandlers.ts b/src/handlers/responseHandlers.ts
@@ -18,6 +18,7 @@ import { HookSpan } from '../middlewares/hooks';
 import { env } from 'hono/adapter';
 import { OpenAIModelResponseJSONToStreamGenerator } from '../providers/open-ai-base/createModelResponse';
 import { anthropicMessagesJsonToStreamGenerator } from '../providers/anthropic-base/utils/streamGenerator';
+import { endpointStrings } from '../providers/types';
 
 /**
  * Handles various types of responses based on the specified parameters
@@ -35,6 +36,7 @@ import { anthropicMessagesJsonToStreamGenerator } from '../providers/anthropic-b
  * @returns {Promise<{response: Response, json?: any}>} - The mapped response.
  */
 export async function responseHandler(
+  c: Context,
   response: Response,
   streamingMode: boolean,
   providerOptions: Options,
@@ -44,7 +46,8 @@ export async function responseHandler(
   gatewayRequest: Params,
   strictOpenAiCompliance: boolean,
   gatewayRequestUrl: string,
-  areSyncHooksAvailable: boolean
+  areSyncHooksAvailable: boolean,
+  hookSpanId: string
 ): Promise<{
   response: Response;
   responseJson: Record<string, any> | null;
@@ -110,14 +113,19 @@ export async function responseHandler(
     return { response: streamingResponse, responseJson: null };
   }
   if (streamingMode && isSuccessStatusCode) {
+    const hooksManager = c.get('hooksManager');
+    const span = hooksManager.getSpan(hookSpanId) as HookSpan;
+    const hooksResult = span.getHooksResult();
     return {
       response: handleStreamingMode(
         response,
         provider,
         responseTransformerFunction,
         requestURL,
         strictOpenAiCompliance,
-        gatewayRequest
+        gatewayRequest,
+        responseTransformer as endpointStrings,
+        hooksResult
       ),
       responseJson: null,
     };
diff --git a/src/handlers/services/responseService.ts b/src/handlers/services/responseService.ts
@@ -81,6 +81,7 @@ export class ResponseService {
   }> {
     const url = this.context.requestURL;
     return await responseHandler(
+      this.context.honoContext,
       response,
       this.context.isStreaming,
       this.context.providerOption,
@@ -90,7 +91,8 @@ export class ResponseService {
       this.context.params,
       this.context.strictOpenAiCompliance,
       this.context.honoContext.req.url,
-      this.hooksService.areSyncHooksAvailable
+      this.hooksService.areSyncHooksAvailable,
+      this.hooksService.hookSpan?.id as string
     );
   }
 
diff --git a/src/handlers/streamHandler.ts b/src/handlers/streamHandler.ts
@@ -8,9 +8,11 @@ import {
   PRECONDITION_CHECK_FAILED_STATUS_CODE,
   GOOGLE_VERTEX_AI,
 } from '../globals';
+import { HookSpan } from '../middlewares/hooks';
 import { VertexLlamaChatCompleteStreamChunkTransform } from '../providers/google-vertex-ai/chatComplete';
 import { OpenAIChatCompleteResponse } from '../providers/openai/chatComplete';
 import { OpenAICompleteResponse } from '../providers/openai/complete';
+import { endpointStrings } from '../providers/types';
 import { Params } from '../types/requestBody';
 import { getStreamModeSplitPattern, type SplitPatternType } from '../utils';
 
@@ -292,7 +294,9 @@ export function handleStreamingMode(
   responseTransformer: Function | undefined,
   requestURL: string,
   strictOpenAiCompliance: boolean,
-  gatewayRequest: Params
+  gatewayRequest: Params,
+  fn: endpointStrings,
+  hooksResult: HookSpan['hooksResult']
 ): Response {
   const splitPattern = getStreamModeSplitPattern(proxyProvider, requestURL);
   // If the provider doesn't supply completion id,
@@ -311,6 +315,12 @@ export function handleStreamingMode(
   if (proxyProvider === BEDROCK) {
     (async () => {
       try {
+        if (!strictOpenAiCompliance) {
+          const hookResultChunk = constructHookResultChunk(hooksResult, fn);
+          if (hookResultChunk) {
+            await writer.write(encoder.encode(hookResultChunk));
+          }
+        }
         for await (const chunk of readAWSStream(
           reader,
           responseTransformer,
@@ -337,6 +347,12 @@ export function handleStreamingMode(
   } else {
     (async () => {
       try {
+        if (!strictOpenAiCompliance) {
+          const hookResultChunk = constructHookResultChunk(hooksResult, fn);
+          if (hookResultChunk) {
+            await writer.write(encoder.encode(hookResultChunk));
+          }
+        }
         for await (const chunk of readStream(
           reader,
           splitPattern,
@@ -434,3 +450,23 @@ export async function handleJSONToStreamResponse(
     statusText: response.statusText,
   });
 }
+
+const constructHookResultChunk = (
+  hooksResult: HookSpan['hooksResult'],
+  fn: endpointStrings
+) => {
+  if (fn === 'chatComplete' || fn === 'complete' || fn === 'embed') {
+    return `data: ${JSON.stringify({
+      hook_results: {
+        before_request_hooks: hooksResult.beforeRequestHooksResult,
+      },
+    })}\n\n`;
+  } else if (fn === 'messages') {
+    return `event: hook_results\ndata: ${JSON.stringify({
+      hook_results: {
+        before_request_hooks: hooksResult.beforeRequestHooksResult,
+      },
+    })}\n\n`;
+  }
+  return null;
+};