Merge pull request #26 from Btlmd/main

ctlllll · web-flow · commit d690f7fab9ae · 2023-09-17T12:30:43.000-04:00
Add an option to override base model path
diff --git a/README.md b/README.md
@@ -99,7 +99,7 @@ You can use the following command for launching a CLI interface:
 ```bash
 CUDA_VISIBLE_DEVICES=0 python -m medusa.inference.cli --model [path of medusa model]
 ```
-You can also pass `--load-in-8bit` or `--load-in-4bit` to load the base model in quantized format.
+You can also pass `--load-in-8bit` or `--load-in-4bit` to load the base model in quantized format. If you download the base model elsewhere, you may override base model name or path with `--base-model  [path of base model]`.
 
 ### Training
 For training, please install:
diff --git a/medusa/inference/cli.py b/medusa/inference/cli.py
@@ -36,6 +36,7 @@ def main(args):
     try:
         model = MedusaModel.from_pretrained(
             args.model,
+            args.base_model,
             torch_dtype=torch.float16,
             low_cpu_mem_usage=True,
             device_map="auto",
@@ -185,6 +186,7 @@ def reload_conv(conv):
 if __name__ == "__main__":
     parser = argparse.ArgumentParser()
     parser.add_argument("--model", type=str, required=True, help="Model name or path.")
+    parser.add_argument("--base-model", type=str, default=None, help="Base model name or path.")
     parser.add_argument(
         "--load-in-8bit", action="store_true", help="Use 8-bit quantization"
     )
diff --git a/medusa/model/medusa_model.py b/medusa/model/medusa_model.py
@@ -125,6 +125,7 @@ def get_tokenizer(self):
     def from_pretrained(
         cls,
         medusa_head_name_or_path,
+        base_model=None,
         **kwargs,
     ):
         """
@@ -136,6 +137,10 @@ def from_pretrained(
             MedusaModel: A MedusaModel instance loaded from the given path.
         """
         medusa_config = MedusaConfig.from_pretrained(medusa_head_name_or_path)
+        if base_model:
+            print("Overriding base model as:", base_model)
+            medusa_config.base_model_name_or_path = base_model
+            
         base_model = KVLlamaForCausalLM.from_pretrained(
             medusa_config.base_model_name_or_path, **kwargs
         )
diff --git a/medusa/train/train.py b/medusa/train/train.py
@@ -392,6 +392,7 @@ def train():
         model,
         medusa_num_heads=training_args.medusa_num_heads,
         medusa_num_layers=training_args.medusa_num_layers,
+        base_model_name_or_path=model_args.model_name_or_path,
     )
 
     # Format output dir

Original file line number	Diff line number	Diff line change
`@@ -392,6 +392,7 @@ def train():`
`392`	`392`	`model,`
`393`	`393`	`medusa_num_heads=training_args.medusa_num_heads,`
`394`	`394`	`medusa_num_layers=training_args.medusa_num_layers,`
	`395`	`+ base_model_name_or_path=model_args.model_name_or_path,`
`395`	`396`	`)`
`396`	`397`
`397`	`398`	`# Format output dir`