show citation file names

Veikkosuhonen · Veikkosuhonen · commit 76fa7e5a2c9e · 2025-05-30T14:11:48.000+03:00
diff --git a/src/client/components/ChatV2/ChatV2.tsx b/src/client/components/ChatV2/ChatV2.tsx
@@ -6,7 +6,7 @@ import useLocalStorageState from '../../hooks/useLocalStorageState'
 import { DEFAULT_MODEL } from '../../../config'
 import useInfoTexts from '../../hooks/useInfoTexts'
 import { Message } from '../../types'
-import { ResponseStreamValue } from '../../../shared/types'
+import { FileCitation, ResponseStreamEventData } from '../../../shared/types'
 import useRetryTimeout from '../../hooks/useRetryTimeout'
 import { useTranslation } from 'react-i18next'
 import { handleCompletionStreamError } from './error'
@@ -21,6 +21,7 @@ import { Close, Settings } from '@mui/icons-material'
 import { SettingsModal } from './SettingsModal'
 import { Link } from 'react-router-dom'
 import { useScrollToBottom } from './useScrollToBottom'
+import { set } from 'lodash'
 
 export const ChatV2 = () => {
   const { courseId } = useParams()
@@ -46,6 +47,7 @@ export const ChatV2 = () => {
   const [activePromptId, setActivePromptId] = useState('')
   const [fileName, setFileName] = useState<string>('')
   const [completion, setCompletion] = useState('')
+  const [citations, setCitations] = useState<FileCitation[]>([])
   const [streamController, setStreamController] = useState<AbortController>()
   const [alertOpen, setAlertOpen] = useState(false)
   const [disallowedFileType, setDisallowedFileType] = useState('')
@@ -69,6 +71,7 @@ export const ChatV2 = () => {
       const reader = stream.getReader()
 
       let content = ''
+      const citations: FileCitation[] = []
 
       while (true) {
         const { value, done } = await reader.read()
@@ -79,15 +82,22 @@ export const ChatV2 = () => {
         for (const chunk of data.split('\n')) {
           if (!chunk || chunk.trim().length === 0) continue
 
-          const parsedChunk: ResponseStreamValue = JSON.parse(chunk)
+          const parsedChunk: ResponseStreamEventData = JSON.parse(chunk)
 
-          switch (parsedChunk.status) {
+          switch (parsedChunk.type) {
             case 'writing':
               setCompletion((prev) => prev + parsedChunk.text)
               content += parsedChunk.text
               break
 
+            case 'annotation':
+              console.log('Received annotation:', parsedChunk.annotation)
+              setCitations((prev) => [...prev, parsedChunk.annotation])
+              citations.push(parsedChunk.annotation)
+              break
+
             case 'complete':
+              console.log('Stream completed with response ID:', parsedChunk)
               setPrevResponse({ id: parsedChunk.prevResponseId })
               break
 
@@ -101,7 +111,7 @@ export const ChatV2 = () => {
         }
       }
 
-      setMessages((prev: Message[]) => prev.concat({ role: 'assistant', content }))
+      setMessages((prev: Message[]) => prev.concat({ role: 'assistant', content, citations }))
     } catch (err: any) {
       handleCompletionStreamError(err, fileName)
     } finally {
@@ -120,6 +130,7 @@ export const ChatV2 = () => {
     setMessage({ content: '' })
     setPrevResponse({ id: '' })
     setCompletion('')
+    setCitations([])
     setStreamController(new AbortController())
     setRetryTimeout(() => {
       if (streamController) {
@@ -193,7 +204,7 @@ export const ChatV2 = () => {
         {courseId ? <Link to={'/v2'}>CurreChat</Link> : <Link to={'/v2/sandbox'}>Ohtu Sandbox</Link>}
       </Box>
       <Box ref={chatContainerRef}>
-        <Conversation messages={messages} completion={completion} />
+        <Conversation messages={messages} completion={completion} citations={citations} />
         <ChatBox
           disabled={false}
           onSubmit={(message) => {
diff --git a/src/client/components/ChatV2/Conversation.tsx b/src/client/components/ChatV2/Conversation.tsx
@@ -3,6 +3,7 @@ import { Message } from '../../types'
 import ReactMarkdown from 'react-markdown'
 import remarkGfm from 'remark-gfm'
 import { Assistant } from '@mui/icons-material'
+import { FileCitation } from '../../../shared/types'
 
 const MessageItem = ({ message }: { message: Message }) => (
   <Paper
@@ -17,6 +18,16 @@ const MessageItem = ({ message }: { message: Message }) => (
     }}
   >
     <ReactMarkdown remarkPlugins={[remarkGfm]}>{message.content}</ReactMarkdown>
+    {message.citations && message.citations.length > 0 && (
+      <Box sx={{ mt: 1, fontSize: '0.875rem', color: 'gray' }}>
+        Citations:
+        {message.citations.map((citation, index) => (
+          <Box key={index} sx={{ display: 'block' }}>
+            {citation.filename}
+          </Box>
+        ))}
+      </Box>
+    )}
   </Paper>
 )
 
@@ -41,12 +52,12 @@ const PöhinäLogo = () => (
   </Box>
 )
 
-export const Conversation = ({ messages, completion }: { messages: Message[]; completion: string }) => (
+export const Conversation = ({ messages, completion, citations }: { messages: Message[]; completion: string; citations: FileCitation[] }) => (
   <Box sx={{ flex: 1, overflowY: 'auto', gap: 2 }}>
     {messages.map((message, idx) => (
       <MessageItem key={idx} message={message} />
     ))}
-    {completion && <MessageItem message={{ role: 'assistant', content: completion }} />}
+    {completion && <MessageItem message={{ role: 'assistant', content: completion, citations }} />}
     {messages.length === 0 && <PöhinäLogo />}
   </Box>
 )
diff --git a/src/client/types.ts b/src/client/types.ts
@@ -1,10 +1,13 @@
+import { FileCitation } from "../shared/types"
+
 export type SetState<T> = React.Dispatch<React.SetStateAction<T>>
 
 export type Role = 'system' | 'assistant' | 'user'
 
 export interface Message {
   role: Role
   content: string
+  citations?: FileCitation[]
 }
 
 interface Term {
diff --git a/src/server/routes/openai.ts b/src/server/routes/openai.ts
@@ -45,9 +45,8 @@ const fileParsing = async (options: any, req: any) => {
   return options.messages
 }
 
-openaiRouter.post('/stream/:version?', upload.single('file'), async (r, res) => {
+openaiRouter.post('/stream/v2', upload.single('file'), async (r, res) => {
   const req = r as RequestWithUser
-  const { version } = r.params
   const { options, courseId } = JSON.parse(req.body.data)
   const { model, userConsent } = options
   const { user } = req
@@ -105,31 +104,134 @@ openaiRouter.post('/stream/:version?', upload.single('file'), async (r, res) =>
     model,
   })
 
-  let events
-  if (version === 'v2') {
-    const latestMessage = options.messages[options.messages.length - 1] // Adhoc to input only the latest message
-    events = await responsesClient.createResponse({ input: [latestMessage], prevResponseId: options.prevResponseId })
-  } else {
-    events = await getCompletionEvents(options)
-  }
+  const latestMessage = options.messages[options.messages.length - 1] // Adhoc to input only the latest message
+  const events = await responsesClient.createResponse({ input: [latestMessage], prevResponseId: options.prevResponseId })
+
   if (isError(events)) {
     res.status(424)
     return
   }
 
   res.setHeader('content-type', 'text/event-stream')
 
-  let completion
-  if (version === 'v2') {
-    completion = await responsesClient.handleResponse({
-      events,
-      encoding,
-      res,
+  const completion = await responsesClient.handleResponse({
+    events,
+    encoding,
+    res,
+  })
+
+  tokenCount += completion.tokenCount
+
+  let userToCharge = user
+  if (inProduction && req.hijackedBy) {
+    userToCharge = req.hijackedBy
+  }
+
+  if (courseId) {
+    await incrementCourseUsage(userToCharge, courseId, tokenCount)
+  } else if (model !== FREE_MODEL) {
+    await incrementUsage(userToCharge, tokenCount)
+  }
+
+  logger.info(`Stream ended. Total tokens: ${tokenCount}`, {
+    tokenCount,
+    model,
+    user: user.username,
+    courseId,
+  })
+
+  const course =
+    courseId &&
+    (await ChatInstance.findOne({
+      where: { courseId },
+    }))
+
+  const consentToSave = courseId && course.saveDiscussions && options.saveConsent
+
+  console.log('consentToSave', options.saveConsent, user.username)
+
+  if (consentToSave) {
+    const discussion = {
+      userId: user.id,
+      courseId,
+      response: completion.response,
+      metadata: options,
+    }
+    await Discussion.create(discussion)
+  }
+
+  encoding.free()
+
+  res.end()
+  return
+})
+
+openaiRouter.post('/stream', upload.single('file'), async (r, res) => {
+  const req = r as RequestWithUser
+  const { options, courseId } = JSON.parse(req.body.data)
+  const { model, userConsent } = options
+  const { user } = req
+
+  options.options = { temperature: options.modelTemperature }
+
+  if (!user.id) {
+    res.status(401).send('Unauthorized')
+    return
+  }
+
+  const usageAllowed = courseId ? await checkCourseUsage(user, courseId) : model === FREE_MODEL || (await checkUsage(user, model))
+
+  if (!usageAllowed) {
+    res.status(403).send('Usage limit reached')
+    return
+  }
+
+  let optionsMessagesWithFile = null
+
+  try {
+    if (req.file) {
+      optionsMessagesWithFile = await fileParsing(options, req)
+    }
+  } catch (error) {
+    logger.error('Error parsing file', { error })
+    res.status(400).send('Error parsing file')
+    return
+  }
+
+  options.messages = getMessageContext(optionsMessagesWithFile || options.messages)
+  options.stream = true
+
+  const encoding = getEncoding(model)
+  let tokenCount = calculateUsage(options, encoding)
+  const tokenUsagePercentage = Math.round((tokenCount / DEFAULT_TOKEN_LIMIT) * 100)
+
+  if (model !== FREE_MODEL && tokenCount > 0.1 * DEFAULT_TOKEN_LIMIT && !userConsent) {
+    res.status(201).json({
+      tokenConsumtionWarning: true,
+      message: `You are about to use ${tokenUsagePercentage}% of your monthly CurreChat usage`,
     })
-  } else {
-    completion = await streamCompletion(events, options, encoding, res)
+    return
   }
 
+  const contextLimit = getModelContextLimit(model)
+
+  if (tokenCount > contextLimit) {
+    logger.info('Maximum context reached')
+    res.status(403).send('Model maximum context reached')
+    return
+  }
+
+  const events = await getCompletionEvents(options)
+
+  if (isError(events)) {
+    res.status(424)
+    return
+  }
+
+  res.setHeader('content-type', 'text/event-stream')
+
+  const completion = await streamCompletion(events, options, encoding, res)
+
   tokenCount += completion.tokenCount
 
   let userToCharge = user
diff --git a/src/server/util/azure/ResponsesAPI.ts b/src/server/util/azure/ResponsesAPI.ts
@@ -11,12 +11,12 @@ import { AzureOpenAI } from 'openai'
 
 // import { EventStream } from '@azure/openai'
 import { Stream } from 'openai/streaming'
-import { FileSearchTool, FunctionTool, ResponseInput, ResponseInputItem, ResponseStreamEvent } from 'openai/resources/responses/responses'
+import { FileSearchTool, FunctionTool, ResponseInput, ResponseInputItem, ResponseStreamEvent, ResponseTextAnnotationDeltaEvent } from 'openai/resources/responses/responses'
 
 import { courseAssistants, type CourseAssistant } from './courseAssistants'
 import { createFileSearchTool } from './util'
 
-import type { ResponseStreamValue } from '../../../shared/types'
+import type { FileCitation, ResponseStreamEventData } from '../../../shared/types'
 
 const endpoint = `https://${AZURE_RESOURCE}.openai.azure.com/`
 
@@ -92,9 +92,8 @@ export class ResponsesClient {
         case 'response.output_text.delta':
           await this.write(
             {
-              status: 'writing',
+              type: 'writing',
               text: event.delta,
-              prevResponseId: null,
             },
             res,
           )
@@ -112,14 +111,19 @@ export class ResponsesClient {
           break
 
         case 'response.output_text.annotation.added':
-          console.log('ANNOTATIONS ADDED', JSON.stringify(event, null, 2))
+          this.write(
+            {
+              type: 'annotation',
+              annotation: event.annotation as FileCitation,
+            },
+            res,
+          )
           break
 
         case 'response.completed':
           await this.write(
             {
-              status: 'complete',
-              text: null,
+              type: 'complete',
               prevResponseId: event.response.id,
             },
             res,
@@ -134,16 +138,8 @@ export class ResponsesClient {
     }
   }
 
-  private async write({ status, text, prevResponseId }: ResponseStreamValue, res: Response) {
-    // if (!inProduction) logger.info(message)
-
+  private async write(data: ResponseStreamEventData, res: Response) {
     await new Promise((resolve) => {
-      const data: ResponseStreamValue = {
-        status,
-        text,
-        prevResponseId: prevResponseId,
-      }
-
       const success = res.write(JSON.stringify(data) + '\n', (err) => {
         if (err) {
           logger.error(err)
diff --git a/src/shared/types.ts b/src/shared/types.ts
@@ -3,8 +3,27 @@ export type RagIndexMetadata = {
   dim: number
 }
 
-export type ResponseStreamValue = {
-  status: 'writing' | 'complete' | 'error'
-  text: string | null
-  prevResponseId: string | null
+export type FileCitation = {
+  file_id: string
+  filename: string
+  index: number
+  type: 'file_citation'
 }
+
+export type ResponseStreamEventData =
+  | {
+      type: 'writing'
+      text: string
+    }
+  | {
+      type: 'complete'
+      prevResponseId: string
+    }
+  | {
+      type: 'error'
+      error: any
+    }
+  | {
+      type: 'annotation'
+      annotation: FileCitation
+    }