feat: make markdown example work

zerob13 · zerob13 · commit 4bc2a54d7c50 · 2025-06-01T14:02:22.000+08:00
diff --git a/src/controllers/openaiController.ts b/src/controllers/openaiController.ts
@@ -55,12 +55,15 @@ export function handleChatCompletions(req: Request, res: Response) {
 
     // 流式响应
     if (request.stream) {
-      res.setHeader('Content-Type', 'text/plain');
+      res.setHeader('Content-Type', 'text/event-stream');
       res.setHeader('Cache-Control', 'no-cache');
       res.setHeader('Connection', 'keep-alive');
       res.setHeader('Access-Control-Allow-Origin', '*');
       res.setHeader('Access-Control-Allow-Headers', '*');
       
+      // 刷新头部，确保客户端立即收到头部信息
+      res.flushHeaders();
+      
       const streamGenerator = createChatCompletionStream(request);
       
       for (const chunk of streamGenerator) {
diff --git a/src/data/mockData.ts b/src/data/mockData.ts
@@ -282,7 +282,7 @@ $$
 
 通过以上示例，您可以全面了解 Markdown 的基本语法和样式应用。实际使用中可根据需要组合不同元素，创建结构清晰、格式美观的文档内容。`,
     streamChunks: [
-      "你是一个复读机，把我给你的内容打印出来，内容是\n\n\n# Markdown 样式全功能演示\n\n",
+      "# Markdown 样式全功能演示\n\n",
       "本文档全面展示 Markdown 的所有基础语法，涵盖标题、段落、列表、链接、图片、代码块、表格、引用等常见元素，",
       "并包含特殊符号和扩展功能的使用示例。\n\n---\n\n## 1. 标题层级（1-6级）\n\n",
       "# 一级标题（H1）\n## 二级标题（H2）\n### 三级标题（H3）\n#### 四级标题（H4）\n",
diff --git a/src/services/openaiService.ts b/src/services/openaiService.ts
@@ -104,7 +104,7 @@ export function* createChatCompletionStream(request: ChatCompletionRequest): Gen
   // 验证模型
   const model = findModelById(request.model);
   if (!model) {
-    const errorChunk = `data: ${JSON.stringify(formatErrorResponse(`模型 '${request.model}' 不存在`))}\\n\\n`;
+    const errorChunk = `data: ${JSON.stringify(formatErrorResponse(`模型 '${request.model}' 不存在`))}\n\n`;
     yield errorChunk;
     return;
   }
@@ -116,7 +116,7 @@ export function* createChatCompletionStream(request: ChatCompletionRequest): Gen
     .find(msg => msg.role === 'user');
 
   if (!lastUserMessage) {
-    const errorChunk = `data: ${JSON.stringify(formatErrorResponse('未找到用户消息'))}\\n\\n`;
+    const errorChunk = `data: ${JSON.stringify(formatErrorResponse('未找到用户消息'))}\n\n`;
     yield errorChunk;
     return;
   }
@@ -126,21 +126,31 @@ export function* createChatCompletionStream(request: ChatCompletionRequest): Gen
   
   const id = generateChatCompletionId();
   const timestamp = getCurrentTimestamp();
+  const systemFingerprint = `fp_${Math.random().toString(36).substr(2, 10)}_mock`;
 
-  // 发送开始chunk
+  // 发送第一个chunk - role 和空 content
   const startChunk: ChatCompletionStreamChunk = {
     id,
     object: 'chat.completion.chunk',
     created: timestamp,
     model: request.model,
+    system_fingerprint: systemFingerprint,
     choices: [{
       index: 0,
-      delta: { role: 'assistant' },
-      finish_reason: undefined
-    }]
+      delta: { 
+        role: 'assistant', 
+        content: '' 
+      },
+      logprobs: null,
+      finish_reason: null
+    }],
+    usage: null
   };
   
-  yield `data: ${JSON.stringify(startChunk)}\\n\\n`;
+  yield `data: ${JSON.stringify(startChunk)}\n\n`;
+
+  let totalTokens = 0;
+  let completionTokens = 0;
 
   // 如果有预定义的流式chunk，使用它们
   if (testCase.streamChunks && testCase.streamChunks.length > 0) {
@@ -150,34 +160,42 @@ export function* createChatCompletionStream(request: ChatCompletionRequest): Gen
         object: 'chat.completion.chunk',
         created: timestamp,
         model: request.model,
+        system_fingerprint: systemFingerprint,
         choices: [{
           index: 0,
           delta: { content: chunkContent },
-          finish_reason: undefined
-        }]
+          logprobs: null,
+          finish_reason: null
+        }],
+        usage: null
       };
       
-      yield `data: ${JSON.stringify(chunk)}\\n\\n`;
+      completionTokens += calculateTokens(chunkContent);
+      yield `data: ${JSON.stringify(chunk)}\n\n`;
     }
   } else {
     // 否则将完整响应分割成chunks
     const words = testCase.response.split(' ');
-    for (let i = 0; i < words.length; i += 3) {
-      const chunkContent = words.slice(i, i + 3).join(' ') + (i + 3 < words.length ? ' ' : '');
+    for (let i = 0; i < words.length; i += 1) {
+      const chunkContent = words[i] + (i < words.length - 1 ? ' ' : '');
       
       const chunk: ChatCompletionStreamChunk = {
         id,
         object: 'chat.completion.chunk',
         created: timestamp,
         model: request.model,
+        system_fingerprint: systemFingerprint,
         choices: [{
           index: 0,
           delta: { content: chunkContent },
-          finish_reason: undefined
-        }]
+          logprobs: null,
+          finish_reason: null
+        }],
+        usage: null
       };
       
-      yield `data: ${JSON.stringify(chunk)}\\n\\n`;
+      completionTokens += calculateTokens(chunkContent);
+      yield `data: ${JSON.stringify(chunk)}\n\n`;
     }
   }
 
@@ -188,6 +206,7 @@ export function* createChatCompletionStream(request: ChatCompletionRequest): Gen
       object: 'chat.completion.chunk',
       created: timestamp,
       model: request.model,
+      system_fingerprint: systemFingerprint,
       choices: [{
         index: 0,
         delta: {
@@ -196,28 +215,46 @@ export function* createChatCompletionStream(request: ChatCompletionRequest): Gen
             arguments: JSON.stringify(testCase.functionCall.arguments)
           }
         },
-        finish_reason: undefined
-      }]
+        logprobs: null,
+        finish_reason: null
+      }],
+      usage: null
     };
     
-    yield `data: ${JSON.stringify(functionChunk)}\\n\\n`;
+    yield `data: ${JSON.stringify(functionChunk)}\n\n`;
   }
 
-  // 发送结束chunk
+  // 计算 token 使用量
+  const promptTokens = calculateTokens(lastUserMessage.content);
+  totalTokens = promptTokens + completionTokens;
+
+  // 发送最后一个chunk - 包含 finish_reason 和 usage
   const endChunk: ChatCompletionStreamChunk = {
     id,
     object: 'chat.completion.chunk',
     created: timestamp,
     model: request.model,
+    system_fingerprint: systemFingerprint,
     choices: [{
       index: 0,
-      delta: {},
+      delta: { content: '' },
+      logprobs: null,
       finish_reason: model.type === 'function' && testCase.functionCall ? 'function_call' : 'stop'
-    }]
+    }],
+    usage: {
+      prompt_tokens: promptTokens,
+      completion_tokens: completionTokens,
+      total_tokens: totalTokens,
+      prompt_tokens_details: {
+        cached_tokens: 0
+      },
+      prompt_cache_hit_tokens: 0,
+      prompt_cache_miss_tokens: promptTokens
+    }
   };
   
-  yield `data: ${JSON.stringify(endChunk)}\\n\\n`;
-  yield 'data: [DONE]\\n\\n';
+  yield `data: ${JSON.stringify(endChunk)}\n\n`;
+  yield `data: [DONE]\n\n`;
 }
 
 /**
diff --git a/src/types/index.ts b/src/types/index.ts
@@ -65,6 +65,7 @@ export interface ChatCompletionStreamChunk {
   object: string;
   created: number;
   model: string;
+  system_fingerprint?: string;
   choices: Array<{
     index: number;
     delta: {
@@ -75,8 +76,19 @@ export interface ChatCompletionStreamChunk {
         arguments?: string;
       };
     };
-    finish_reason?: string;
+    logprobs?: null;
+    finish_reason?: string | null;
   }>;
+  usage?: {
+    prompt_tokens: number;
+    completion_tokens: number;
+    total_tokens: number;
+    prompt_tokens_details?: {
+      cached_tokens: number;
+    };
+    prompt_cache_hit_tokens?: number;
+    prompt_cache_miss_tokens?: number;
+  } | null;
 }
 
 export interface ImageGenerationRequest {
diff --git a/test-sse-client.html b/test-sse-client.html