fixing nanotron (#21)

NathanHB · thomwolf · web-flow · commit 59891e0c6520 · 2024-02-07T21:49:24.000+01:00
* fix

* Update src/lighteval/models/nanotron_model.py

Co-authored-by: Thomas Wolf &lt;thomwolf@users.noreply.github.com&gt;

---------

Co-authored-by: Thomas Wolf &lt;thomwolf@users.noreply.github.com&gt;
diff --git a/src/lighteval/main_nanotron.py b/src/lighteval/main_nanotron.py
@@ -99,7 +99,6 @@ def main(
             parallel_config=lighteval_config.parallelism,
             lighteval_config=lighteval_config,
             batch_size=lighteval_config.batch_size,
-            cache_dir=os.environ.get("HF_HOME", "/scratch"),
             debug_one_layer_model=False,
             model_class=model_cls,
             env_config=env_config,
diff --git a/src/lighteval/models/nanotron_model.py b/src/lighteval/models/nanotron_model.py
@@ -1116,7 +1116,7 @@ def greedy_until(
         # automatic (variable) batch size detection for vectorization
         # pull longest context sample from request
         for request in requests:
-            request.stop_sequence = request.stop_sequence + (self.tokenizer.eos_token,)
+            request.stop_sequence = list(request.stop_sequence) + [self.tokenizer.eos_token]
             request.tokenized_context = self.tok_encode(request.context)
 
         dataset = GenerativeTaskDatasetNanotron(requests=requests, dataset_splits=dataset_splits)