Include empty assistant message for chat

vmpuri · vmpuri · commit be0632b573e3 · 2024-10-04T17:07:08.000-07:00
diff --git a/torchchat/generate.py b/torchchat/generate.py
@@ -603,6 +603,7 @@ def generate(
         if len(prompt.shape) > 1:
             prompt = prompt.squeeze(0)
         prompt_length = prompt.size(0)
+        max_new_tokens = min(max_new_tokens, max_seq_length - start_pos - prompt_length)
         # set up caches only if first inference
         if start_pos == 0:
             model = model.to(device=device)
@@ -825,6 +826,12 @@ def _gen_model_input(
                         content=content,
                     )
                 )
+        messages.append(
+            Message(
+                role="assistant",
+                content="",
+            )
+        )
 
         transform = llama3_2_vision_transform(str(self.tokenizer_args.tokenizer_path))
 
@@ -849,7 +856,7 @@ def _gen_model_input(
                 seq_len = encoded.size(0)
                 batch = {}
 
-            total_response_length = max_seq_len + max_new_tokens
+            total_response_length = seq_len + max_new_tokens
             batch["causal_mask"] = torch.nn.functional.pad(
                 torch.tril(
                     torch.ones(
diff --git a/torchchat/usages/browser.py b/torchchat/usages/browser.py
@@ -10,6 +10,7 @@
 
 from openai import OpenAI
 
+st.set_page_config(page_title="torchchat", page_icon="🤖")
 st.title("torchchat")
 
 

Original file line number	Diff line number	Diff line change
`@@ -10,6 +10,7 @@`
`10`	`10`
`11`	`11`	`from openai import OpenAI`
`12`	`12`
	`13`	`+st.set_page_config(page_title="torchchat", page_icon="🤖")`
`13`	`14`	`st.title("torchchat")`
`14`	`15`
`15`	`16`