huggingface
diff --git a/‎package-lock.json
Lines changed: 12 additions & 0 deletions b/‎package-lock.json
Lines changed: 12 additions & 0 deletions
diff --git a/‎package.json
Lines changed: 3 additions & 0 deletions b/‎package.json
Lines changed: 3 additions & 0 deletions
diff --git a/‎scripts/convert.py
Lines changed: 7 additions & 0 deletions b/‎scripts/convert.py
Lines changed: 7 additions & 0 deletions
diff --git a/‎scripts/extra/wav2vec2.py
Lines changed: 2 additions & 2 deletions b/‎scripts/extra/wav2vec2.py
Lines changed: 2 additions & 2 deletions
@@ -44,6 +44,9 @@
   "optionalDependencies": {
     "onnxruntime-node": "1.14.0"
   },
+  "peerDependencies": {
+    "@huggingface/jinja": "^0.1.0"
+  },
   "devDependencies": {
     "@types/jest": "^29.5.1",
     "catharsis": "github:xenova/catharsis",
 
@@ -283,6 +283,13 @@ def main():
         # Load tokenizer
         tokenizer = AutoTokenizer.from_pretrained(tokenizer_id)
 
+        # To avoid inserting all chat templates into tokenizers.js, we save the chat template
+        # to the tokenizer_config.json file, and load it when the tokenizer is loaded.
+        if getattr(tokenizer, 'chat_template', None) is None and \
+            getattr(tokenizer, 'use_default_system_prompt', False):
+            # No chat template specified, and we use the default
+            setattr(tokenizer, 'chat_template', tokenizer.default_chat_template)
+
     except KeyError:
         pass  # No Tokenizer
 
 
@@ -20,8 +20,8 @@ def generate_tokenizer_json(tokenizer):
                 "id": v,
                 "content": k,
                 "single_word": False,
-                "lstrip": False,
-                "rstrip": False,
+                "lstrip": True,
+                "rstrip": True,
                 "normalized": False,
                 "special": True
             }