ggml-org
diff --git a/‎common/arg.cpp‎
Lines changed: 221 additions & 221 deletions b/‎common/arg.cpp‎
Lines changed: 221 additions & 221 deletions
diff --git a/‎common/arg.h‎
Lines changed: 13 additions & 13 deletions b/‎common/arg.h‎
Lines changed: 13 additions & 13 deletions
diff --git a/‎common/common.cpp‎
Lines changed: 10 additions & 10 deletions b/‎common/common.cpp‎
Lines changed: 10 additions & 10 deletions
diff --git a/‎common/common.h‎
Lines changed: 24 additions & 24 deletions b/‎common/common.h‎
Lines changed: 24 additions & 24 deletions
@@ -18,29 +18,29 @@ struct common_arg {
     const char * env          = nullptr;
     std::string help;
     bool is_sparam = false; // is current arg a sampling param?
-    void (*handler_void)   (gpt_params & params) = nullptr;
-    void (*handler_string) (gpt_params & params, const std::string &) = nullptr;
-    void (*handler_str_str)(gpt_params & params, const std::string &, const std::string &) = nullptr;
-    void (*handler_int)    (gpt_params & params, int) = nullptr;
+    void (*handler_void)   (common_params & params) = nullptr;
+    void (*handler_string) (common_params & params, const std::string &) = nullptr;
+    void (*handler_str_str)(common_params & params, const std::string &, const std::string &) = nullptr;
+    void (*handler_int)    (common_params & params, int) = nullptr;
 
     common_arg(
         const std::initializer_list<const char *> & args,
         const char * value_hint,
         const std::string & help,
-        void (*handler)(gpt_params & params, const std::string &)
+        void (*handler)(common_params & params, const std::string &)
     ) : args(args), value_hint(value_hint), help(help), handler_string(handler) {}
 
     common_arg(
         const std::initializer_list<const char *> & args,
         const char * value_hint,
         const std::string & help,
-        void (*handler)(gpt_params & params, int)
+        void (*handler)(common_params & params, int)
     ) : args(args), value_hint(value_hint), help(help), handler_int(handler) {}
 
     common_arg(
         const std::initializer_list<const char *> & args,
         const std::string & help,
-        void (*handler)(gpt_params & params)
+        void (*handler)(common_params & params)
     ) : args(args), help(help), handler_void(handler) {}
 
     // support 2 values for arg
@@ -49,7 +49,7 @@ struct common_arg {
         const char * value_hint,
         const char * value_hint_2,
         const std::string & help,
-        void (*handler)(gpt_params & params, const std::string &, const std::string &)
+        void (*handler)(common_params & params, const std::string &, const std::string &)
     ) : args(args), value_hint(value_hint), value_hint_2(value_hint_2), help(help), handler_str_str(handler) {}
 
     common_arg & set_examples(std::initializer_list<enum llama_example> examples);
@@ -61,17 +61,17 @@ struct common_arg {
     std::string to_string();
 };
 
-struct gpt_params_context {
+struct common_params_context {
     enum llama_example ex = LLAMA_EXAMPLE_COMMON;
-    gpt_params & params;
+    common_params & params;
     std::vector<common_arg> options;
     void(*print_usage)(int, char **) = nullptr;
-    gpt_params_context(gpt_params & params) : params(params) {}
+    common_params_context(common_params & params) : params(params) {}
 };
 
 // parse input arguments from CLI
 // if one argument has invalid value, it will automatically display usage of the specific argument (and not the full usage message)
-bool gpt_params_parse(int argc, char ** argv, gpt_params & params, llama_example ex, void(*print_usage)(int, char **) = nullptr);
+bool common_params_parse(int argc, char ** argv, common_params & params, llama_example ex, void(*print_usage)(int, char **) = nullptr);
 
 // function to be used by test-arg-parser
-gpt_params_context gpt_params_parser_init(gpt_params & params, llama_example ex, void(*print_usage)(int, char **) = nullptr);
+common_params_context common_params_parser_init(common_params & params, llama_example ex, void(*print_usage)(int, char **) = nullptr);
@@ -362,10 +362,10 @@ bool parse_cpu_mask(const std::string & mask, bool (&boolmask)[GGML_MAX_N_THREAD
     return true;
 }
 
-void gpt_init() {
+void common_init() {
     llama_log_set([](ggml_log_level level, const char * text, void * /*user_data*/) {
-        if (LOG_DEFAULT_LLAMA <= gpt_log_verbosity_thold) {
-            gpt_log_add(gpt_log_main(), level, "%s", text);
+        if (LOG_DEFAULT_LLAMA <= common_log_verbosity_thold) {
+            common_log_add(common_log_main(), level, "%s", text);
         }
     }, NULL);
 
@@ -378,7 +378,7 @@ void gpt_init() {
     LOG_INF("build: %d (%s) with %s for %s%s\n", LLAMA_BUILD_NUMBER, LLAMA_COMMIT, LLAMA_COMPILER, LLAMA_BUILD_TARGET, build_type);
 }
 
-std::string gpt_params_get_system_info(const gpt_params & params) {
+std::string common_params_get_system_info(const common_params & params) {
     std::ostringstream os;
 
     os << "system_info: n_threads = " << params.cpuparams.n_threads;
@@ -819,9 +819,9 @@ std::string fs_get_cache_file(const std::string & filename) {
 //
 // Model utils
 //
-struct common_init_result llama_init_from_gpt_params(gpt_params & params) {
+struct common_init_result common_init_from_common_params(common_params & params) {
     common_init_result iparams;
-    auto mparams = common_model_params_from_gpt_params(params);
+    auto mparams = common_model_params_from_common_params(params);
 
     llama_model * model = nullptr;
 
@@ -863,7 +863,7 @@ struct common_init_result llama_init_from_gpt_params(gpt_params & params) {
         }
     }
 
-    auto cparams = common_context_params_from_gpt_params(params);
+    auto cparams = common_context_params_from_common_params(params);
 
     llama_context * lctx = llama_new_context_with_model(model, cparams);
     if (lctx == NULL) {
@@ -970,7 +970,7 @@ void common_lora_adapters_apply(struct llama_context * ctx, std::vector<common_l
     }
 }
 
-struct llama_model_params common_model_params_from_gpt_params(const gpt_params & params) {
+struct llama_model_params common_model_params_from_common_params(const common_params & params) {
     auto mparams = llama_model_default_params();
 
     if (params.n_gpu_layers != -1) {
@@ -1022,7 +1022,7 @@ static ggml_type kv_cache_type_from_str(const std::string & s) {
     throw std::runtime_error("Invalid cache type: " + s);
 }
 
-struct llama_context_params common_context_params_from_gpt_params(const gpt_params & params) {
+struct llama_context_params common_context_params_from_common_params(const common_params & params) {
     auto cparams = llama_context_default_params();
 
     cparams.n_ctx             = params.n_ctx;
@@ -1946,7 +1946,7 @@ void yaml_dump_string_multiline(FILE * stream, const char * prop_name, const cha
     }
 }
 
-void yaml_dump_non_result_info(FILE * stream, const gpt_params & params, const llama_context * lctx,
+void yaml_dump_non_result_info(FILE * stream, const common_params & params, const llama_context * lctx,
                                const std::string & timestamp, const std::vector<int> & prompt_tokens, const char * model_desc) {
     const auto & sparams = params.sparams;
 
 
@@ -82,14 +82,14 @@ enum llama_example {
     LLAMA_EXAMPLE_COUNT,
 };
 
-enum gpt_sampler_type {
-    GPT_SAMPLER_TYPE_NONE        = 0,
-    GPT_SAMPLER_TYPE_TOP_K       = 1,
-    GPT_SAMPLER_TYPE_TOP_P       = 2,
-    GPT_SAMPLER_TYPE_MIN_P       = 3,
-    GPT_SAMPLER_TYPE_TFS_Z       = 4,
-    GPT_SAMPLER_TYPE_TYPICAL_P   = 5,
-    GPT_SAMPLER_TYPE_TEMPERATURE = 6,
+enum common_sampler_type {
+    COMMON_SAMPLER_TYPE_NONE        = 0,
+    COMMON_SAMPLER_TYPE_TOP_K       = 1,
+    COMMON_SAMPLER_TYPE_TOP_P       = 2,
+    COMMON_SAMPLER_TYPE_MIN_P       = 3,
+    COMMON_SAMPLER_TYPE_TFS_Z       = 4,
+    COMMON_SAMPLER_TYPE_TYPICAL_P   = 5,
+    COMMON_SAMPLER_TYPE_TEMPERATURE = 6,
 };
 
 // dimensionality reduction methods, used by cvector-generator
@@ -99,7 +99,7 @@ enum dimre_method {
 };
 
 // sampler parameters
-struct gpt_sampler_params {
+struct common_sampler_params {
     uint32_t seed = LLAMA_DEFAULT_SEED; // the seed used to initialize llama_sampler
 
     int32_t n_prev            = 64;    // number of previous tokens to remember
@@ -124,13 +124,13 @@ struct gpt_sampler_params {
     bool    ignore_eos        = false;
     bool    no_perf           = false; // disable performance metrics
 
-    std::vector<enum gpt_sampler_type> samplers = {
-        GPT_SAMPLER_TYPE_TOP_K,
-        GPT_SAMPLER_TYPE_TFS_Z,
-        GPT_SAMPLER_TYPE_TYPICAL_P,
-        GPT_SAMPLER_TYPE_TOP_P,
-        GPT_SAMPLER_TYPE_MIN_P,
-        GPT_SAMPLER_TYPE_TEMPERATURE
+    std::vector<enum common_sampler_type> samplers = {
+        COMMON_SAMPLER_TYPE_TOP_K,
+        COMMON_SAMPLER_TYPE_TFS_Z,
+        COMMON_SAMPLER_TYPE_TYPICAL_P,
+        COMMON_SAMPLER_TYPE_TOP_P,
+        COMMON_SAMPLER_TYPE_MIN_P,
+        COMMON_SAMPLER_TYPE_TEMPERATURE
     };
 
     std::string grammar; // optional BNF-like grammar to constrain sampling
@@ -141,7 +141,7 @@ struct gpt_sampler_params {
     std::string print() const;
 };
 
-struct gpt_params {
+struct common_params {
     int32_t n_predict             =    -1; // new tokens to predict
     int32_t n_ctx                 =     0; // context size
     int32_t n_batch               =  2048; // logical batch size for prompt processing (must be >=32 to use BLAS)
@@ -183,7 +183,7 @@ struct gpt_params {
     enum llama_pooling_type      pooling_type      = LLAMA_POOLING_TYPE_UNSPECIFIED; // pooling type for embeddings
     enum llama_attention_type    attention_type    = LLAMA_ATTENTION_TYPE_UNSPECIFIED; // attention type for embeddings
 
-    struct gpt_sampler_params sparams;
+    struct common_sampler_params sparams;
 
     std::string model                = ""; // model path                                                    // NOLINT
     std::string model_draft          = ""; // draft model for speculative decoding                          // NOLINT
@@ -348,9 +348,9 @@ struct gpt_params {
 
 // call once at the start of a program if it uses libcommon
 // initializes the logging system and prints info about the build
-void gpt_init();
+void common_init();
 
-std::string gpt_params_get_system_info(const gpt_params & params);
+std::string common_params_get_system_info(const common_params & params);
 
 bool parse_cpu_range(const std::string& range, bool(&boolmask)[GGML_MAX_N_THREADS]);
 bool parse_cpu_mask(const std::string& mask, bool(&boolmask)[GGML_MAX_N_THREADS]);
@@ -410,10 +410,10 @@ struct common_init_result {
     std::vector<common_lora_adapter_container> lora_adapters;
 };
 
-struct common_init_result    llama_init_from_gpt_params(gpt_params & params);
+struct common_init_result     common_init_from_common_params(common_params & params);
 
-struct llama_model_params     common_model_params_from_gpt_params    (const gpt_params & params);
-struct llama_context_params   common_context_params_from_gpt_params  (const gpt_params & params);
+struct llama_model_params     common_model_params_from_common_params  (const common_params & params);
+struct llama_context_params   common_context_params_from_common_params(const common_params & params);
 struct ggml_threadpool_params ggml_threadpool_params_from_cpu_params(const cpu_params & params);
 
 struct llama_model * common_load_model_from_url(const char * model_url, const char * path_model, const char * hf_token, const struct llama_model_params & params);
@@ -554,5 +554,5 @@ void yaml_dump_vector_int      (FILE * stream, const char * prop_name, const std
 void yaml_dump_string_multiline(FILE * stream, const char * prop_name, const char * data);
 
 void yaml_dump_non_result_info(
-    FILE * stream, const gpt_params & params, const llama_context * lctx,
+    FILE * stream, const common_params & params, const llama_context * lctx,
     const std::string & timestamp, const std::vector<int> & prompt_tokens, const char * model_desc);
Original file line number	Diff line number	Diff line change
`@@ -362,10 +362,10 @@ bool parse_cpu_mask(const std::string & mask, bool (&boolmask)[GGML_MAX_N_THREAD`
`362`	`362`	`return true;`
`363`	`363`	`}`
`364`	`364`
`365`		`-void gpt_init() {`
	`365`	`+void common_init() {`
`366`	`366`	`llama_log_set([](ggml_log_level level, const char * text, void * /user_data/) {`
`367`		`- if (LOG_DEFAULT_LLAMA <= gpt_log_verbosity_thold) {`
`368`		`- gpt_log_add(gpt_log_main(), level, "%s", text);`
	`367`	`+ if (LOG_DEFAULT_LLAMA <= common_log_verbosity_thold) {`
	`368`	`+ common_log_add(common_log_main(), level, "%s", text);`
`369`	`369`	`}`
`370`	`370`	`}, NULL);`
`371`	`371`
`@@ -378,7 +378,7 @@ void gpt_init() {`
`378`	`378`	`LOG_INF("build: %d (%s) with %s for %s%s\n", LLAMA_BUILD_NUMBER, LLAMA_COMMIT, LLAMA_COMPILER, LLAMA_BUILD_TARGET, build_type);`
`379`	`379`	`}`
`380`	`380`
`381`		`-std::string gpt_params_get_system_info(const gpt_params & params) {`
	`381`	`+std::string common_params_get_system_info(const common_params & params) {`
`382`	`382`	`std::ostringstream os;`
`383`	`383`
`384`	`384`	`os << "system_info: n_threads = " << params.cpuparams.n_threads;`
`@@ -819,9 +819,9 @@ std::string fs_get_cache_file(const std::string & filename) {`
`819`	`819`	`//`
`820`	`820`	`// Model utils`
`821`	`821`	`//`
`822`		`-struct common_init_result llama_init_from_gpt_params(gpt_params & params) {`
	`822`	`+struct common_init_result common_init_from_common_params(common_params & params) {`
`823`	`823`	`common_init_result iparams;`
`824`		`- auto mparams = common_model_params_from_gpt_params(params);`
	`824`	`+ auto mparams = common_model_params_from_common_params(params);`
`825`	`825`
`826`	`826`	`llama_model * model = nullptr;`
`827`	`827`
`@@ -863,7 +863,7 @@ struct common_init_result llama_init_from_gpt_params(gpt_params & params) {`
`863`	`863`	`}`
`864`	`864`	`}`
`865`	`865`
`866`		`- auto cparams = common_context_params_from_gpt_params(params);`
	`866`	`+ auto cparams = common_context_params_from_common_params(params);`
`867`	`867`
`868`	`868`	`llama_context * lctx = llama_new_context_with_model(model, cparams);`
`869`	`869`	`if (lctx == NULL) {`
`@@ -970,7 +970,7 @@ void common_lora_adapters_apply(struct llama_context * ctx, std::vector<common_l`
`970`	`970`	`}`
`971`	`971`	`}`
`972`	`972`
`973`		`-struct llama_model_params common_model_params_from_gpt_params(const gpt_params & params) {`
	`973`	`+struct llama_model_params common_model_params_from_common_params(const common_params & params) {`
`974`	`974`	`auto mparams = llama_model_default_params();`
`975`	`975`
`976`	`976`	`if (params.n_gpu_layers != -1) {`
`@@ -1022,7 +1022,7 @@ static ggml_type kv_cache_type_from_str(const std::string & s) {`
`1022`	`1022`	`throw std::runtime_error("Invalid cache type: " + s);`
`1023`	`1023`	`}`
`1024`	`1024`
`1025`		`-struct llama_context_params common_context_params_from_gpt_params(const gpt_params & params) {`
	`1025`	`+struct llama_context_params common_context_params_from_common_params(const common_params & params) {`
`1026`	`1026`	`auto cparams = llama_context_default_params();`
`1027`	`1027`
`1028`	`1028`	`cparams.n_ctx = params.n_ctx;`
`@@ -1946,7 +1946,7 @@ void yaml_dump_string_multiline(FILE * stream, const char * prop_name, const cha`
`1946`	`1946`	`}`
`1947`	`1947`	`}`
`1948`	`1948`
`1949`		`-void yaml_dump_non_result_info(FILE * stream, const gpt_params & params, const llama_context * lctx,`
	`1949`	`+void yaml_dump_non_result_info(FILE * stream, const common_params & params, const llama_context * lctx,`
`1950`	`1950`	`const std::string & timestamp, const std::vector<int> & prompt_tokens, const char * model_desc) {`
`1951`	`1951`	`const auto & sparams = params.sparams;`
`1952`	`1952`