ottenbreit-data-science
diff --git a/‎.github/workflows/build_wheels.yml‎
Lines changed: 4 additions & 8 deletions b/‎.github/workflows/build_wheels.yml‎
Lines changed: 4 additions & 8 deletions
diff --git a/‎API_REFERENCE_FOR_CLASSIFICATION.md‎
Lines changed: 6 additions & 1 deletion b/‎API_REFERENCE_FOR_CLASSIFICATION.md‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎API_REFERENCE_FOR_REGRESSION.md‎
Lines changed: 5 additions & 0 deletions b/‎API_REFERENCE_FOR_REGRESSION.md‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎README.md‎
Lines changed: 1 addition & 1 deletion b/‎README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎aplr/aplr.py‎
Lines changed: 6 additions & 0 deletions b/‎aplr/aplr.py‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎cpp/APLRClassifier.h‎
Lines changed: 23 additions & 1 deletion b/‎cpp/APLRClassifier.h‎
Lines changed: 23 additions & 1 deletion
diff --git a/‎cpp/APLRRegressor.h‎
Lines changed: 62 additions & 11 deletions b/‎cpp/APLRRegressor.h‎
Lines changed: 62 additions & 11 deletions
@@ -1,23 +1,19 @@
-name: Build_for_Linux_and_Windows
-
+name: Build_wheels
 on: [workflow_dispatch]
-
 jobs:
   build_wheels:
     name: Build wheels on ${{ matrix.os }}
     runs-on: ${{ matrix.os }}
     strategy:
       matrix:
-        os: [ubuntu-20.04, windows-2019]
-
+        os: [ubuntu-latest, windows-latest, macos-13, macos-14]
     steps:
       - uses: actions/checkout@v4
-
       - name: Build wheels
-        uses: pypa/cibuildwheel@v2.16.5
+        uses: pypa/cibuildwheel@v2.18.1
         env:
           CIBW_SKIP: "*musllinux*"
-
+          CIBW_ENVIRONMENT: MACOSX_DEPLOYMENT_TARGET=10.14
       - uses: actions/upload-artifact@v4
         with:
           name: cibw-wheels-${{ matrix.os }}-${{ strategy.job-index }}
 
@@ -165,4 +165,9 @@ A string specifying the label of the category.
 
 ## Method: get_unique_term_affiliations()
 
-***Returns a list of strings containing unique predictor affiliations for terms.***
+***Returns a list of strings containing unique predictor affiliations for terms.***
+
+
+## Method: get_base_predictors_in_each_unique_term_affiliation()
+
+***Returns a list of integer lists. The first list contains indexes for the unique base predictors used in the first unique term affiliation. The second list contains indexes for the unique base predictors used in the second unique term affiliation, and so on.***
@@ -277,6 +277,11 @@ A numpy matrix with predictor values.
 ***Returns a list of strings containing unique predictor affiliations for terms.***
 
 
+## Method: get_base_predictors_in_each_unique_term_affiliation()
+
+***Returns a list of integer lists. The first list contains indexes for the unique base predictors used in the first unique term affiliation. The second list contains indexes for the unique base predictors used in the second unique term affiliation, and so on.***
+
+
 ## Method: get_term_coefficients()
 
 ***Returns a numpy vector containing term regression coefficients.***
 
@@ -8,7 +8,7 @@ Build predictive and interpretable parametric regression or classification machi
 ***pip install aplr***
 
 # Availability
-Currently available for Windows and most Linux distributions.
+Available for Windows, most Linux distributions and MacOS.
 
 # How to use
 Please see the two example Python scripts [here](https://github.com/ottenbreit-data-science/aplr/tree/main/examples). They cover common use cases, but not all of the functionality in this package.
 
@@ -256,6 +256,9 @@ def get_term_affiliations(self) -> List[str]:
     def get_unique_term_affiliations(self) -> List[str]:
         return self.APLRRegressor.get_unique_term_affiliations()
 
+    def get_base_predictors_in_each_unique_term_affiliation(self) -> List[str]:
+        return self.APLRRegressor.get_base_predictors_in_each_unique_term_affiliation()
+
     def get_term_coefficients(self) -> npt.ArrayLike:
         return self.APLRRegressor.get_term_coefficients()
 
@@ -477,6 +480,9 @@ def get_feature_importance(self) -> npt.ArrayLike:
 
     def get_unique_term_affiliations(self) -> List[str]:
         return self.APLRClassifier.get_unique_term_affiliations()
+    
+    def get_base_predictors_in_each_unique_term_affiliation(self) -> List[str]:
+        return self.APLRClassifier.get_base_predictors_in_each_unique_term_affiliation()
 
     # For sklearn
     def get_params(self, deep=True):
 
@@ -52,6 +52,7 @@ class APLRClassifier
     size_t max_terms;
     std::vector<std::string> unique_term_affiliations;
     std::map<std::string, size_t> unique_term_affiliation_map;
+    std::vector<std::vector<size_t>> base_predictors_in_each_unique_term_affiliation;
 
     APLRClassifier(size_t m = 3000, double v = 0.1, uint_fast32_t random_state = std::numeric_limits<uint_fast32_t>::lowest(), size_t n_jobs = 0,
                    size_t cv_folds = 5, size_t reserved_terms_times_num_x = 100, size_t bins = 300, size_t verbosity = 0, size_t max_interaction_level = 1,
@@ -76,6 +77,7 @@ class APLRClassifier
     double get_cv_error();
     VectorXd get_feature_importance();
     std::vector<std::string> get_unique_term_affiliations();
+    std::vector<std::vector<size_t>> get_base_predictors_in_each_unique_term_affiliation();
 };
 
 APLRClassifier::APLRClassifier(size_t m, double v, uint_fast32_t random_state, size_t n_jobs, size_t cv_folds,
@@ -109,7 +111,8 @@ APLRClassifier::APLRClassifier(const APLRClassifier &other)
       num_first_steps_with_linear_effects_only{other.num_first_steps_with_linear_effects_only},
       penalty_for_non_linearity{other.penalty_for_non_linearity}, penalty_for_interactions{other.penalty_for_interactions},
       max_terms{other.max_terms}, unique_term_affiliations{other.unique_term_affiliations},
-      unique_term_affiliation_map{other.unique_term_affiliation_map}
+      unique_term_affiliation_map{other.unique_term_affiliation_map},
+      base_predictors_in_each_unique_term_affiliation{other.base_predictors_in_each_unique_term_affiliation}
 {
 }
 
@@ -256,6 +259,20 @@ void APLRClassifier::calculate_unique_term_affiliations()
     {
         unique_term_affiliation_map[unique_term_affiliations[i]] = i;
     }
+    base_predictors_in_each_unique_term_affiliation.resize(unique_term_affiliation_map.size());
+    std::vector<std::set<size_t>> base_predictors_in_each_unique_term_affiliation_set(unique_term_affiliation_map.size());
+    for (std::string &category : categories)
+    {
+        for (auto &term : logit_models[category].terms)
+        {
+            std::vector<size_t> unique_base_terms_for_this_term{term.get_unique_base_terms_used_in_this_term()};
+            base_predictors_in_each_unique_term_affiliation_set[unique_term_affiliation_map[term.predictor_affiliation]].insert(unique_base_terms_for_this_term.begin(), unique_base_terms_for_this_term.end());
+        }
+    }
+    for (size_t i = 0; i < base_predictors_in_each_unique_term_affiliation_set.size(); ++i)
+    {
+        base_predictors_in_each_unique_term_affiliation[i] = std::vector<size_t>(base_predictors_in_each_unique_term_affiliation_set[i].begin(), base_predictors_in_each_unique_term_affiliation_set[i].end());
+    }
 }
 
 void APLRClassifier::calculate_validation_metrics()
@@ -374,4 +391,9 @@ VectorXd APLRClassifier::get_feature_importance()
 std::vector<std::string> APLRClassifier::get_unique_term_affiliations()
 {
     return unique_term_affiliations;
+}
+
+std::vector<std::vector<size_t>> APLRClassifier::get_base_predictors_in_each_unique_term_affiliation()
+{
+    return base_predictors_in_each_unique_term_affiliation;
 }
@@ -4,7 +4,7 @@
 #include <future>
 #include <random>
 #include <vector>
-#include <omp.h>
+#include <thread>
 #include "../dependencies/eigen-3.4.0/Eigen/Dense"
 #include "functions.h"
 #include "term.h"
@@ -79,6 +79,7 @@ class APLRRegressor
     bool max_terms_reached;
     bool round_robin_update_of_existing_terms;
     size_t term_to_update_in_this_boosting_step;
+    size_t cores_to_use;
 
     void validate_input_to_fit(const MatrixXd &X, const VectorXd &y, const VectorXd &sample_weight, const std::vector<std::string> &X_names,
                                const MatrixXi &cv_observations, const std::vector<size_t> &prioritized_predictors_indexes,
@@ -215,6 +216,7 @@ class APLRRegressor
     size_t number_of_unique_term_affiliations;
     std::vector<std::string> unique_term_affiliations;
     std::map<std::string, size_t> unique_term_affiliation_map;
+    std::vector<std::vector<size_t>> base_predictors_in_each_unique_term_affiliation;
     VectorXd feature_importance;
     VectorXd term_importance;
     double dispersion_parameter;
@@ -276,6 +278,7 @@ class APLRRegressor
     std::vector<std::string> get_term_names();
     std::vector<std::string> get_term_affiliations();
     std::vector<std::string> get_unique_term_affiliations();
+    std::vector<std::vector<size_t>> get_base_predictors_in_each_unique_term_affiliation();
     VectorXd get_term_coefficients();
     MatrixXd get_validation_error_steps();
     VectorXd get_feature_importance();
@@ -351,7 +354,8 @@ APLRRegressor::APLRRegressor(const APLRRegressor &other)
       penalty_for_non_linearity{other.penalty_for_non_linearity}, penalty_for_interactions{other.penalty_for_interactions},
       max_terms{other.max_terms}, min_predictor_values_in_training{other.min_predictor_values_in_training},
       max_predictor_values_in_training{other.max_predictor_values_in_training}, unique_term_affiliations{other.unique_term_affiliations},
-      unique_term_affiliation_map{other.unique_term_affiliation_map}
+      unique_term_affiliation_map{other.unique_term_affiliation_map},
+      base_predictors_in_each_unique_term_affiliation{other.base_predictors_in_each_unique_term_affiliation}
 {
 }
 
@@ -410,12 +414,10 @@ void APLRRegressor::preprocess_prioritized_predictors_and_interaction_constraint
 void APLRRegressor::initialize_multithreading()
 {
     size_t available_cores{static_cast<size_t>(std::thread::hardware_concurrency())};
-    size_t cores_to_use;
     if (n_jobs == 0)
         cores_to_use = available_cores;
     else
         cores_to_use = std::min(n_jobs, available_cores);
-    omp_set_num_threads(cores_to_use);
 }
 
 void APLRRegressor::preprocess_penalties()
@@ -1299,14 +1301,47 @@ std::vector<size_t> APLRRegressor::find_terms_eligible_current_indexes_for_a_bas
 void APLRRegressor::estimate_split_point_for_each_term(std::vector<Term> &terms, std::vector<size_t> &terms_indexes)
 {
     bool multithreading{n_jobs != 1 && terms_indexes.size() > 1};
-#pragma omp parallel for schedule(guided) if (multithreading)
-    for (size_t i = 0; i < terms_indexes.size(); ++i)
+
+    if (multithreading)
     {
-        terms[terms_indexes[i]].estimate_split_point(X_train, neg_gradient_current, sample_weight_train, bins,
-                                                     predictor_learning_rates[terms[terms_indexes[i]].base_term],
-                                                     min_observations_in_split, linear_effects_only_in_this_boosting_step,
-                                                     predictor_penalties_for_non_linearity[terms[terms_indexes[i]].base_term],
-                                                     predictor_penalties_for_interactions[terms[terms_indexes[i]].base_term]);
+        size_t num_threads{std::min(cores_to_use, terms_indexes.size())};
+        std::vector<std::thread> threads;
+        size_t chunk_size{(terms_indexes.size() + num_threads - 1) / num_threads};
+
+        for (size_t t = 0; t < num_threads; ++t)
+        {
+            threads.emplace_back([&, t]()
+                                 {
+                size_t start = t * chunk_size;
+                size_t end = std::min(start + chunk_size, terms_indexes.size());
+                for (size_t i = start; i < end; ++i)
+                {
+                    terms[terms_indexes[i]].estimate_split_point(X_train, neg_gradient_current, sample_weight_train, bins,
+                                                                 predictor_learning_rates[terms[terms_indexes[i]].base_term],
+                                                                 min_observations_in_split, linear_effects_only_in_this_boosting_step,
+                                                                 predictor_penalties_for_non_linearity[terms[terms_indexes[i]].base_term],
+                                                                 predictor_penalties_for_interactions[terms[terms_indexes[i]].base_term]);
+                } });
+        }
+
+        for (auto &thread : threads)
+        {
+            if (thread.joinable())
+            {
+                thread.join();
+            }
+        }
+    }
+    else
+    {
+        for (size_t i = 0; i < terms_indexes.size(); ++i)
+        {
+            terms[terms_indexes[i]].estimate_split_point(X_train, neg_gradient_current, sample_weight_train, bins,
+                                                         predictor_learning_rates[terms[terms_indexes[i]].base_term],
+                                                         min_observations_in_split, linear_effects_only_in_this_boosting_step,
+                                                         predictor_penalties_for_non_linearity[terms[terms_indexes[i]].base_term],
+                                                         predictor_penalties_for_interactions[terms[terms_indexes[i]].base_term]);
+        }
     }
 }
 
@@ -2282,6 +2317,17 @@ void APLRRegressor::correct_term_names_coefficients_and_affiliations()
     {
         unique_term_affiliation_map[unique_term_affiliations[i]] = i;
     }
+    base_predictors_in_each_unique_term_affiliation.resize(unique_term_affiliation_map.size());
+    std::vector<std::set<size_t>> base_predictors_in_each_unique_term_affiliation_set(unique_term_affiliation_map.size());
+    for (auto &term : terms)
+    {
+        std::vector<size_t> unique_base_terms_for_this_term{term.get_unique_base_terms_used_in_this_term()};
+        base_predictors_in_each_unique_term_affiliation_set[unique_term_affiliation_map[term.predictor_affiliation]].insert(unique_base_terms_for_this_term.begin(), unique_base_terms_for_this_term.end());
+    }
+    for (size_t i = 0; i < base_predictors_in_each_unique_term_affiliation_set.size(); ++i)
+    {
+        base_predictors_in_each_unique_term_affiliation[i] = std::vector<size_t>(base_predictors_in_each_unique_term_affiliation_set[i].begin(), base_predictors_in_each_unique_term_affiliation_set[i].end());
+    }
 }
 
 void APLRRegressor::additional_cleanup_after_creating_final_model()
@@ -2402,6 +2448,11 @@ std::vector<std::string> APLRRegressor::get_unique_term_affiliations()
     return unique_term_affiliations;
 }
 
+std::vector<std::vector<size_t>> APLRRegressor::get_base_predictors_in_each_unique_term_affiliation()
+{
+    return base_predictors_in_each_unique_term_affiliation;
+}
+
 VectorXd APLRRegressor::get_term_coefficients()
 {
     return term_coefficients;