huggingface
diff --git a/‎README.md‎
Lines changed: 1 addition & 1 deletion b/‎README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎packages/inference/package.json‎
Lines changed: 1 addition & 1 deletion b/‎packages/inference/package.json‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎packages/inference/src/snippets/getInferenceSnippets.ts‎
Lines changed: 1 addition & 1 deletion b/‎packages/inference/src/snippets/getInferenceSnippets.ts‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎packages/inference/src/snippets/templates/js/openai/conversationalStream.jinja‎
Lines changed: 3 additions & 9 deletions b/‎packages/inference/src/snippets/templates/js/openai/conversationalStream.jinja‎
Lines changed: 3 additions & 9 deletions
diff --git a/‎packages/ollama-utils/package.json‎
Lines changed: 1 addition & 1 deletion b/‎packages/ollama-utils/package.json‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎packages/ollama-utils/src/chat-template-automap.ts‎
Lines changed: 24 additions & 7 deletions b/‎packages/ollama-utils/src/chat-template-automap.ts‎
Lines changed: 24 additions & 7 deletions
diff --git a/‎packages/ollama-utils/src/chat-template.ts‎
Lines changed: 10 additions & 0 deletions b/‎packages/ollama-utils/src/chat-template.ts‎
Lines changed: 10 additions & 0 deletions
diff --git a/‎packages/tasks-gen/snippets-fixtures/conversational-llm-non-stream/js/huggingface.js/0.hf-inference.js‎
Lines changed: 1 addition & 1 deletion b/‎packages/tasks-gen/snippets-fixtures/conversational-llm-non-stream/js/huggingface.js/0.hf-inference.js‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎packages/tasks-gen/snippets-fixtures/conversational-llm-non-stream/js/huggingface.js/0.together.js‎
Lines changed: 1 addition & 1 deletion b/‎packages/tasks-gen/snippets-fixtures/conversational-llm-non-stream/js/huggingface.js/0.together.js‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎packages/tasks-gen/snippets-fixtures/conversational-llm-non-stream/js/openai/0.hf-inference.js‎
Lines changed: 1 addition & 1 deletion b/‎packages/tasks-gen/snippets-fixtures/conversational-llm-non-stream/js/openai/0.hf-inference.js‎
Lines changed: 1 addition & 1 deletion
@@ -97,7 +97,7 @@ You can run our packages with vanilla JS, without any bundler, by using a CDN or
 
 ```html
 <script type="module">
-    import { InferenceClient } from 'https://cdn.jsdelivr.net/npm/@huggingface/[email protected].0/+esm';
+    import { InferenceClient } from 'https://cdn.jsdelivr.net/npm/@huggingface/[email protected].1/+esm';
     import { createRepo, commit, deleteRepo, listFiles } from "https://cdn.jsdelivr.net/npm/@huggingface/[email protected]/+esm";
 </script>
 ```
 
@@ -1,6 +1,6 @@
 {
 	"name": "@huggingface/inference",
-	"version": "3.7.0",
+	"version": "3.7.1",
 	"packageManager": "[email protected]",
 	"license": "MIT",
 	"author": "Hugging Face and Tim Mikeladze <[email protected]>",
 
@@ -254,7 +254,7 @@ const prepareConversationalInput = (
 	return {
 		messages: opts?.messages ?? getModelInputSnippet(model),
 		...(opts?.temperature ? { temperature: opts?.temperature } : undefined),
-		max_tokens: opts?.max_tokens ?? 500,
+		max_tokens: opts?.max_tokens ?? 512,
 		...(opts?.top_p ? { top_p: opts?.top_p } : undefined),
 	};
 };
 
@@ -5,18 +5,12 @@ const client = new OpenAI({
 	apiKey: "{{ accessToken }}",
 });
 
-let out = "";
-
 const stream = await client.chat.completions.create({
-    provider: "{{ provider }}",
-    model: "{{ model.id }}",
+    model: "{{ providerModelId }}",
 {{ inputs.asTsString }}
+    stream: true,
 });
 
 for await (const chunk of stream) {
-	if (chunk.choices && chunk.choices.length > 0) {
-		const newContent = chunk.choices[0].delta.content;
-		out += newContent;
-		console.log(newContent);
-	}  
+    process.stdout.write(chunk.choices[0]?.delta?.content || "");
 }
@@ -1,7 +1,7 @@
 {
 	"name": "@huggingface/ollama-utils",
 	"packageManager": "[email protected]",
-	"version": "0.0.7",
+	"version": "0.0.8",
 	"description": "Various utilities for maintaining Ollama compatibility with models on Hugging Face hub",
 	"repository": "https://github.com/huggingface/huggingface.js.git",
 	"publishConfig": {
 
@@ -81,6 +81,16 @@ const CUSTOM_TEMPLATE_MAPPING: ((ggufTmpl: string) => OllamaCustomMappedTemplate
 					stop: "<|END_OF_TURN_TOKEN|>",
 			  }
 			: undefined,
+	(ggufTmpl: string) =>
+		ggufTmpl.match(/Mistral Small 3/) && ggufTmpl.match(/2023-10-01/)
+			? {
+					// https://ollama.com/library/mistral-small
+					// (template is edited at some point, so we need manual map to make sure it works, ref commit: https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503/commit/4b8dd8aae705887db5295fcbff4aedbb92d682eb)
+					ollamaTmpl:
+						'{{- range $index, $_ := .Messages }}\n{{- if eq .Role "system" }}[SYSTEM_PROMPT]{{ .Content }}[/SYSTEM_PROMPT]\n{{- else if eq .Role "user" }}\n{{- if and (le (len (slice $.Messages $index)) 2) $.Tools }}[AVAILABLE_TOOLS]{{ $.Tools }}[/AVAILABLE_TOOLS]\n{{- end }}[INST]{{ .Content }}[/INST]\n{{- else if eq .Role "assistant" }}\n{{- if .Content }}{{ .Content }}\n{{- if not (eq (len (slice $.Messages $index)) 1) }}</s>\n{{- end }}\n{{- else if .ToolCalls }}[TOOL_CALLS][\n{{- range .ToolCalls }}{"name": "{{ .Function.Name }}", "arguments": {{ .Function.Arguments }}}\n{{- end }}]</s>\n{{- end }}\n{{- else if eq .Role "tool" }}[TOOL_RESULTS]{"content": {{ .Content }}}[/TOOL_RESULTS]\n{{- end }}\n{{- end }}',
+					stop: "[INST]",
+			  }
+			: undefined,
 ];
 
 export function convertGGUFTemplateToOllama(
 
@@ -11,7 +11,7 @@ const chatCompletion = await client.chatCompletion({
             content: "What is the capital of France?",
         },
     ],
-    max_tokens: 500,
+    max_tokens: 512,
 });
 
 console.log(chatCompletion.choices[0].message);
@@ -11,7 +11,7 @@ const chatCompletion = await client.chatCompletion({
             content: "What is the capital of France?",
         },
     ],
-    max_tokens: 500,
+    max_tokens: 512,
 });
 
 console.log(chatCompletion.choices[0].message);
@@ -13,7 +13,7 @@ const chatCompletion = await client.chat.completions.create({
             content: "What is the capital of France?",
         },
     ],
-    max_tokens: 500,
+    max_tokens: 512,
 });
 
 console.log(chatCompletion.choices[0].message);
Original file line number	Diff line number	Diff line change
`@@ -1,6 +1,6 @@`
`1`	`1`	`{`
`2`	`2`	`"name": "@huggingface/inference",`
`3`		`- "version": "3.7.0",`
	`3`	`+ "version": "3.7.1",`
`4`	`4`	`"packageManager": "[email protected]",`
`5`	`5`	`"license": "MIT",`
`6`	`6`	`"author": "Hugging Face and Tim Mikeladze <[email protected]>",`
Original file line number	Diff line number	Diff line change
`@@ -1,7 +1,7 @@`
`1`	`1`	`{`
`2`	`2`	`"name": "@huggingface/ollama-utils",`
`3`	`3`	`"packageManager": "[email protected]",`
`4`		`- "version": "0.0.7",`
	`4`	`+ "version": "0.0.8",`
`5`	`5`	`"description": "Various utilities for maintaining Ollama compatibility with models on Hugging Face hub",`
`6`	`6`	`"repository": "https://github.com/huggingface/huggingface.js.git",`
`7`	`7`	`"publishConfig": {`