Fixing compile errors. Oneapi tests passed

dmitry.razdoburdin · dmitry.razdoburdin · commit ffb7996f8403 · 2023-01-11T23:55:15.000-08:00
diff --git a/plugin/updater_oneapi/updater_quantile_hist_oneapi.cc b/plugin/updater_oneapi/updater_quantile_hist_oneapi.cc
@@ -73,8 +73,7 @@ void GPUQuantileHistMakerOneAPI::Configure(const Args& args) {
   if (param.device_id != GenericParameter::kDefaultId) {
     qu_ = sycl::queue(devices[param.device_id]);
   } else {
-    sycl::default_selector selector;
-    qu_ = sycl::queue(selector);
+    qu_ = sycl::queue(sycl::default_selector_v);
   }
 
   // initialize pruner
@@ -107,9 +106,10 @@ template<typename GradientSumT>
 void GPUQuantileHistMakerOneAPI::CallBuilderUpdate(const std::unique_ptr<Builder<GradientSumT>>& builder,
                                                    HostDeviceVector<GradientPair> *gpair,
                                                    DMatrix *dmat,
+                                                   common::Span<HostDeviceVector<bst_node_t>> out_position,
                                                    const std::vector<RegTree *> &trees) {
   for (auto tree : trees) {
-    builder->Update(gmat_, gpair, dmat, tree);
+    builder->Update(gmat_, gpair, dmat, out_position, tree);
   }
 }
 void GPUQuantileHistMakerOneAPI::Update(HostDeviceVector<GradientPair> *gpair,
@@ -136,12 +136,12 @@ void GPUQuantileHistMakerOneAPI::Update(HostDeviceVector<GradientPair> *gpair,
     if (!float_builder_) {
       SetBuilder(&float_builder_, dmat);
     }
-    CallBuilderUpdate(float_builder_, gpair, dmat, trees);
+    CallBuilderUpdate(float_builder_, gpair, dmat, out_position, trees);
   } else {
     if (!double_builder_) {
       SetBuilder(&double_builder_, dmat);
     }
-    CallBuilderUpdate(double_builder_, gpair, dmat, trees);
+    CallBuilderUpdate(double_builder_, gpair, dmat, out_position, trees);
   }
 
   param_.learning_rate = lr;
@@ -245,7 +245,9 @@ void GPUQuantileHistMakerOneAPI::Builder<GradientSumT>::ReduceHists(std::vector<
     const GradientPairT* psrc = reinterpret_cast<const GradientPairT*>(this_hist.DataConst());
     std::copy(psrc, psrc + nbins, reduce_buffer.begin() + i * nbins);
   }
-  collective::Allreduce<collective::Operation::kSum>(reduce_buffer.data(), nbins * sync_ids.size());
+  collective::Allreduce<collective::Operation::kSum>(
+    reinterpret_cast<GradientSumT*>(reduce_buffer.data()),
+    2 * nbins * sync_ids.size());
   // histred_.Allreduce(reduce_buffer.data(), nbins * sync_ids.size());
   for (size_t i = 0; i < sync_ids.size(); i++) {
     auto this_hist = hist_[sync_ids[i]];
@@ -604,6 +606,7 @@ void GPUQuantileHistMakerOneAPI::Builder<GradientSumT>::Update(
     const GHistIndexMatrixOneAPI &gmat,
     HostDeviceVector<GradientPair> *gpair,
     DMatrix *p_fmat,
+    common::Span<HostDeviceVector<bst_node_t>> out_position,
     RegTree *p_tree) {
   builder_monitor_.Start("Update");
 
@@ -626,7 +629,7 @@ void GPUQuantileHistMakerOneAPI::Builder<GradientSumT>::Update(
     p_tree->Stat(nid).base_weight = snode_[nid].weight;
     p_tree->Stat(nid).sum_hess = static_cast<float>(snode_[nid].stats.GetHess());
   }
-  pruner_->Update(gpair, p_fmat, std::vector<RegTree*>{p_tree});
+  pruner_->Update(gpair, p_fmat, out_position, std::vector<RegTree*>{p_tree});
 
   builder_monitor_.Stop("Update");
 }
@@ -852,15 +855,9 @@ void GPUQuantileHistMakerOneAPI::Builder<GradientSumT>::InitData(const GHistInde
   }
   // store a pointer to the tree
   p_last_tree_ = &tree;
-  if (data_layout_ == kDenseDataOneBased) {
-    column_sampler_.Init(info.num_col_, info.feature_weights.ConstHostVector(),
-                         param_.colsample_bynode, param_.colsample_bylevel,
-                         param_.colsample_bytree, true);
-  } else {
-    column_sampler_.Init(info.num_col_, info.feature_weights.ConstHostVector(),
-                         param_.colsample_bynode, param_.colsample_bylevel,
-                         param_.colsample_bytree, false);
-  }
+  column_sampler_.Init(info.num_col_, info.feature_weights.ConstHostVector(),
+                       param_.colsample_bynode, param_.colsample_bylevel,
+                       param_.colsample_bytree);
   if (data_layout_ == kDenseDataZeroBased || data_layout_ == kDenseDataOneBased) {
     /* specialized code for dense data:
        choose the column that has a least positive number of discrete bins.
@@ -1352,7 +1349,7 @@ void GPUQuantileHistMakerOneAPI::Builder<GradientSumT>::InitNewNode(int nid,
           grad_stat.Add(gpair[*it].GetGrad(), gpair[*it].GetHess());
         }
       }
-      collective::Allreduce<collective::Operation::kSum>(&grad_stat, 1);
+      collective::Allreduce<collective::Operation::kSum>(reinterpret_cast<GradientSumT*>(&grad_stat), 2);
       // histred_.Allreduce(&grad_stat, 1);
       snode_[nid].stats = GradStatsOneAPI<GradientSumT>(grad_stat.GetGrad(), grad_stat.GetHess());
     } else {
diff --git a/plugin/updater_oneapi/updater_quantile_hist_oneapi.h b/plugin/updater_oneapi/updater_quantile_hist_oneapi.h
@@ -254,6 +254,7 @@ class GPUQuantileHistMakerOneAPI: public TreeUpdater {
     virtual void Update(const GHistIndexMatrixOneAPI& gmat,
                         HostDeviceVector<GradientPair>* gpair,
                         DMatrix* p_fmat,
+                        common::Span<HostDeviceVector<bst_node_t>> out_position,
                         RegTree* p_tree);
 
     inline void BuildHist(const std::vector<GradientPair>& gpair,
@@ -507,6 +508,7 @@ class GPUQuantileHistMakerOneAPI: public TreeUpdater {
   void CallBuilderUpdate(const std::unique_ptr<Builder<GradientSumT>>& builder,
                          HostDeviceVector<GradientPair> *gpair,
                          DMatrix *dmat,
+                         common::Span<HostDeviceVector<bst_node_t>> out_position,
                          const std::vector<RegTree *> &trees);
 
  protected:
diff --git a/tests/python-oneapi/test_oneapi_prediction.py b/tests/python-oneapi/test_oneapi_prediction.py
@@ -0,0 +1,153 @@
+import sys
+import unittest
+import pytest
+
+import numpy as np
+import xgboost as xgb
+from hypothesis import given, strategies, assume, settings, note
+
+sys.path.append("tests/python")
+import testing as tm
+
+rng = np.random.RandomState(1994)
+
+shap_parameter_strategy = strategies.fixed_dictionaries({
+    'max_depth': strategies.integers(1, 11),
+    'max_leaves': strategies.integers(0, 256),
+    'num_parallel_tree': strategies.sampled_from([1, 10]),
+}).filter(lambda x: x['max_depth'] > 0 or x['max_leaves'] > 0)
+
+
+class TestOneAPIPredict(unittest.TestCase):
+    def test_predict(self):
+        iterations = 10
+        np.random.seed(1)
+        test_num_rows = [10, 1000, 5000]
+        test_num_cols = [10, 50, 500]
+        for num_rows in test_num_rows:
+            for num_cols in test_num_cols:
+                dtrain = xgb.DMatrix(np.random.randn(num_rows, num_cols),
+                                     label=[0, 1] * int(num_rows / 2))
+                dval = xgb.DMatrix(np.random.randn(num_rows, num_cols),
+                                   label=[0, 1] * int(num_rows / 2))
+                dtest = xgb.DMatrix(np.random.randn(num_rows, num_cols),
+                                    label=[0, 1] * int(num_rows / 2))
+                watchlist = [(dtrain, 'train'), (dval, 'validation')]
+                res = {}
+                param = {
+                    "objective": "binary:logistic_oneapi",
+                    "predictor": "oneapi_predictor",
+                    'eval_metric': 'logloss',
+                    'tree_method': 'hist',
+                    'updater': 'grow_quantile_histmaker_oneapi',
+                    'max_depth': 1
+                }
+                bst = xgb.train(param, dtrain, iterations, evals=watchlist,
+                                evals_result=res)
+                assert self.non_increasing(res["train"]["logloss"])
+                oneapi_pred_train = bst.predict(dtrain, output_margin=True)
+                oneapi_pred_test = bst.predict(dtest, output_margin=True)
+                oneapi_pred_val = bst.predict(dval, output_margin=True)
+
+                param["predictor"] = "cpu_predictor"
+                bst_cpu = xgb.train(param, dtrain, iterations, evals=watchlist)
+                cpu_pred_train = bst_cpu.predict(dtrain, output_margin=True)
+                cpu_pred_test = bst_cpu.predict(dtest, output_margin=True)
+                cpu_pred_val = bst_cpu.predict(dval, output_margin=True)
+
+                np.testing.assert_allclose(cpu_pred_train, oneapi_pred_train,
+                                           rtol=1e-6)
+                np.testing.assert_allclose(cpu_pred_val, oneapi_pred_val,
+                                           rtol=1e-6)
+                np.testing.assert_allclose(cpu_pred_test, oneapi_pred_test,
+                                           rtol=1e-6)
+
+    def non_increasing(self, L):
+        return all((y - x) < 0.001 for x, y in zip(L, L[1:]))
+
+    @pytest.mark.skipif(**tm.no_sklearn())
+    def test_multi_predict(self):
+        from sklearn.datasets import make_regression
+        from sklearn.model_selection import train_test_split
+
+        n = 1000
+        X, y = make_regression(n, random_state=rng)
+        X_train, X_test, y_train, y_test = train_test_split(X, y,
+                                                            random_state=123)
+        dtrain = xgb.DMatrix(X_train, label=y_train)
+        dtest = xgb.DMatrix(X_test)
+
+        params = {}
+        params["tree_method"] = "hist"
+        params["updater"] = "grow_quantile_histmaker_oneapi"
+
+        params['predictor'] = "oneapi_predictor"
+        bst_oneapi_predict = xgb.train(params, dtrain)
+
+        params['predictor'] = "cpu_predictor"
+        bst_cpu_predict = xgb.train(params, dtrain)
+
+        predict0 = bst_oneapi_predict.predict(dtest)
+        predict1 = bst_oneapi_predict.predict(dtest)
+        cpu_predict = bst_cpu_predict.predict(dtest)
+
+        assert np.allclose(predict0, predict1)
+        assert np.allclose(predict0, cpu_predict)
+
+    @pytest.mark.skipif(**tm.no_sklearn())
+    def test_sklearn(self):
+        m, n = 15000, 14
+        tr_size = 2500
+        X = np.random.rand(m, n)
+        y = 200 * np.matmul(X, np.arange(-3, -3 + n))
+        X_train, y_train = X[:tr_size, :], y[:tr_size]
+        X_test, y_test = X[tr_size:, :], y[tr_size:]
+
+        # First with cpu_predictor
+        params = {'tree_method': 'hist',
+                  'predictor': 'cpu_predictor',
+                  'n_jobs': -1,
+                  'seed': 123}
+        m = xgb.XGBRegressor(**params).fit(X_train, y_train)
+        cpu_train_score = m.score(X_train, y_train)
+        cpu_test_score = m.score(X_test, y_test)
+
+        # Now with oneapi_predictor
+        params['predictor'] = 'oneapi_predictor'
+
+        m = xgb.XGBRegressor(**params).fit(X_train, y_train)
+        oneapi_train_score = m.score(X_train, y_train)
+        m = xgb.XGBRegressor(**params).fit(X_train, y_train)
+        oneapi_test_score = m.score(X_test, y_test)
+
+        assert np.allclose(cpu_train_score, oneapi_train_score)
+        assert np.allclose(cpu_test_score, oneapi_test_score)
+
+    @given(strategies.integers(1, 10),
+           tm.dataset_strategy.filter(lambda x: x.name != "empty"), shap_parameter_strategy)
+    @settings(deadline=None)
+    def test_shap(self, num_rounds, dataset, param):
+        param.update({"predictor": "oneapi_predictor"})
+        param = dataset.set_params(param)
+        dmat = dataset.get_dmat()
+        bst = xgb.train(param, dmat, num_rounds)
+        test_dmat = xgb.DMatrix(dataset.X, dataset.y, dataset.w, dataset.margin)
+        shap = bst.predict(test_dmat, pred_contribs=True)
+        margin = bst.predict(test_dmat, output_margin=True)
+        assume(len(dataset.y) > 0)
+        assert np.allclose(np.sum(shap, axis=len(shap.shape) - 1), margin, 1e-3, 1e-3)
+
+    @given(strategies.integers(1, 10),
+           tm.dataset_strategy.filter(lambda x: x.name != "empty"), shap_parameter_strategy)
+    @settings(deadline=None, max_examples=20)
+    def test_shap_interactions(self, num_rounds, dataset, param):
+        param.update({"predictor": "oneapi_predictor"})
+        param = dataset.set_params(param)
+        dmat = dataset.get_dmat()
+        bst = xgb.train(param, dmat, num_rounds)
+        test_dmat = xgb.DMatrix(dataset.X, dataset.y, dataset.w, dataset.margin)
+        shap = bst.predict(test_dmat, pred_interactions=True)
+        margin = bst.predict(test_dmat, output_margin=True)
+        assume(len(dataset.y) > 0)
+        assert np.allclose(np.sum(shap, axis=(len(shap.shape) - 1, len(shap.shape) - 2)), margin,
+                           1e-3, 1e-3)
diff --git a/tests/python-oneapi/test_oneapi_training_continuation.py b/tests/python-oneapi/test_oneapi_training_continuation.py
@@ -0,0 +1,56 @@
+import numpy as np
+import xgboost as xgb
+import json
+
+rng = np.random.RandomState(1994)
+
+
+class TestOneAPITrainingContinuation:
+    def run_training_continuation(self, use_json):
+        kRows = 64
+        kCols = 32
+        X = np.random.randn(kRows, kCols)
+        y = np.random.randn(kRows)
+        dtrain = xgb.DMatrix(X, y)
+        params = {'updater': 'grow_quantile_histmaker_oneapi', 'max_depth': '2',
+                  'gamma': '0.1', 'alpha': '0.01',
+                  'enable_experimental_json_serialization': use_json}
+        bst_0 = xgb.train(params, dtrain, num_boost_round=64)
+        dump_0 = bst_0.get_dump(dump_format='json')
+
+        bst_1 = xgb.train(params, dtrain, num_boost_round=32)
+        bst_1 = xgb.train(params, dtrain, num_boost_round=32, xgb_model=bst_1)
+        dump_1 = bst_1.get_dump(dump_format='json')
+
+        def recursive_compare(obj_0, obj_1):
+            if isinstance(obj_0, float):
+                assert np.isclose(obj_0, obj_1, atol=1e-6)
+            elif isinstance(obj_0, str):
+                assert obj_0 == obj_1
+            elif isinstance(obj_0, int):
+                assert obj_0 == obj_1
+            elif isinstance(obj_0, dict):
+                keys_0 = list(obj_0.keys())
+                keys_1 = list(obj_1.keys())
+                values_0 = list(obj_0.values())
+                values_1 = list(obj_1.values())
+                for i in range(len(obj_0.items())):
+                    assert keys_0[i] == keys_1[i]
+                    if list(obj_0.keys())[i] != 'missing':
+                        recursive_compare(values_0[i],
+                                          values_1[i])
+            else:
+                for i in range(len(obj_0)):
+                    recursive_compare(obj_0[i], obj_1[i])
+
+        assert len(dump_0) == len(dump_1)
+        for i in range(len(dump_0)):
+            obj_0 = json.loads(dump_0[i])
+            obj_1 = json.loads(dump_1[i])
+            recursive_compare(obj_0, obj_1)
+
+    def test_oneapi_training_continuation_binary(self):
+        self.run_training_continuation(False)
+
+    def test_oneapi_training_continuation_json(self):
+        self.run_training_continuation(True)
diff --git a/tests/python-oneapi/test_oneapi_updaters.py b/tests/python-oneapi/test_oneapi_updaters.py
@@ -0,0 +1,51 @@
+import numpy as np
+import gc
+import pytest
+import xgboost as xgb
+from hypothesis import given, strategies, assume, settings, note
+
+import sys
+sys.path.append("tests/python")
+import testing as tm
+
+parameter_strategy = strategies.fixed_dictionaries({
+    'max_depth': strategies.integers(0, 11),
+    'max_leaves': strategies.integers(0, 256),
+    'max_bin': strategies.integers(2, 1024),
+    'grow_policy': strategies.sampled_from(['lossguide', 'depthwise']),
+    'single_precision_histogram': strategies.booleans(),
+    'min_child_weight': strategies.floats(0.5, 2.0),
+    'seed': strategies.integers(0, 10),
+    # We cannot enable subsampling as the training loss can increase
+    # 'subsample': strategies.floats(0.5, 1.0),
+    'colsample_bytree': strategies.floats(0.5, 1.0),
+    'colsample_bylevel': strategies.floats(0.5, 1.0),
+}).filter(lambda x: (x['max_depth'] > 0 or x['max_leaves'] > 0) and (
+    x['max_depth'] > 0 or x['grow_policy'] == 'lossguide'))
+
+
+def train_result(param, dmat, num_rounds):
+    result = {}
+    xgb.train(param, dmat, num_rounds, [(dmat, 'train')], verbose_eval=False,
+              evals_result=result)
+    return result
+
+
+class TestOneAPIUpdaters:
+    @given(parameter_strategy, strategies.integers(1, 5),
+           tm.dataset_strategy.filter(lambda x: x.name != "empty"))
+    @settings(deadline=None)
+    def test_oneapi_hist(self, param, num_rounds, dataset):
+        param['updater'] = 'grow_quantile_histmaker_oneapi'
+        param = dataset.set_params(param)
+        result = train_result(param, dataset.get_dmat(), num_rounds)
+        note(result)
+        assert tm.non_increasing(result['train'][dataset.metric])
+
+    @given(tm.dataset_strategy.filter(lambda x: x.name != "empty"), strategies.integers(0, 1))
+    @settings(deadline=None)
+    def test_specified_device_id_oneapi_update(self, dataset, device_id):
+        param = {'updater': 'grow_quantile_histmaker_oneapi', 'device_id': device_id}
+        param = dataset.set_params(param)
+        result = train_result(param, dataset.get_dmat(), 10)
+        assert tm.non_increasing(result['train'][dataset.metric])
diff --git a/tests/python-oneapi/test_oneapi_with_sklearn.py b/tests/python-oneapi/test_oneapi_with_sklearn.py