blockentropy · ManilShrestha · Jul 9, 2024 · Jul 9, 2024
diff --git a/llm_exl2_dynamic_gen.py b/llm_exl2_dynamic_gen.py
@@ -202,8 +202,6 @@ def get_stop_conditions(tokenizer):
     # get_stop_condition special case if model is llama3 
     if "llama3" in repo_str:
         return [tokenizer.single_id("<|eot_id|>"), tokenizer.eos_token_id]
-    # elif prompt_format == "granite":
-    #     return [tokenizer.eos_token_id, "\n\nQuestion:"]
     else:
         return [tokenizer.eos_token_id]
 
@@ -465,12 +463,12 @@ def process_prompts():
                         preferred_eos.append(stop_at)
 
                     gen_settings = ExLlamaV2Sampler.Settings()
-                    gen_settings.temperature = 1.0 if temperature>1 else temperature  # To make sure the temperature value does not exceed 1
+                    gen_settings.temperature = 2.0 if temperature>2 else temperature  # To make sure the temperature value does not exceed 2
 
                     job = ExLlamaV2DynamicJob(
                         input_ids = ids,
                         max_new_tokens = max_tokens,
-                        stop_conditions = preferred_eos if stop_at is None else [tokenizer.eos_token_id, stop_at],
+                        stop_conditions = preferred_eos,
                         gen_settings = gen_settings,
                         filters = filters,
                         token_healing = healing

diff --git a/llm_exl2_dynamic_gen_lora.py b/llm_exl2_dynamic_gen_lora.py
@@ -204,8 +204,6 @@ def get_stop_conditions(tokenizer):
     # get_stop_condition special case if model is llama3 
     if "llama3" in repo_str:
         return [tokenizer.single_id("<|eot_id|>"), tokenizer.eos_token_id]
-    # elif prompt_format == "granite":
-    #     return [tokenizer.eos_token_id, "\n\nQuestion:"]
     else:
         return [tokenizer.eos_token_id]
 
@@ -493,12 +491,12 @@ def process_prompts():
                         preferred_eos.append(stop_at)
 
                     gen_settings = ExLlamaV2Sampler.Settings()
-                    gen_settings.temperature = 1.0 if temperature>1 else temperature  # To make sure the temperature value does not exceed 1
+                    gen_settings.temperature = 2.0 if temperature>2 else temperature  # To make sure the temperature value does not exceed 2
 
                     job = ExLlamaV2DynamicJob(
                         input_ids = ids,
                         max_new_tokens = max_tokens,
-                        stop_conditions = preferred_eos if stop_at is None else [tokenizer.eos_token_id, stop_at],
+                        stop_conditions = preferred_eos,
                         gen_settings = gen_settings,
                         filters = filters,
                         token_healing = healing