MNT less warnings in logreg test (#227)

mathurinm · web-flow · commit 32147a25f195 · 2022-04-07T14:12:14.000+02:00
diff --git a/celer/dropin_sklearn.py b/celer/dropin_sklearn.py
@@ -658,10 +658,12 @@ def fit(self, X, y):
             self.coef_ = coefs.T  # must be [1, n_features]
             self.intercept_ = 0
         else:
-            self.coef_ = np.empty([n_classes, X.shape[1]])
             self.intercept_ = 0.
             multiclass = OneVsRestClassifier(self).fit(X, y)
-            self.coef_ = multiclass.coef_
+            self.coef_ = np.array(
+                [clf.coef_[0] for clf in multiclass.estimators_])
+            # self.n_iter_ = max(clf.n_iter_ for clf in multiclass.estimators_)
+            # TODO implement n_iter for logreg?
 
         return self
 
diff --git a/celer/tests/test_logreg.py b/celer/tests/test_logreg.py
@@ -26,7 +26,7 @@ def test_celer_path_logreg(solver):
     tol = 1e-11
     coefs, Cs, n_iters = _logistic_regression_path(
         X, y, Cs=1. / alphas, fit_intercept=False, penalty='l1',
-        solver='liblinear', tol=tol)
+        solver='liblinear', tol=tol, max_iter=1000, random_state=0)
 
     _, coefs_c, gaps = celer_path(
         X, y, "logreg", alphas=alphas, tol=tol, verbose=0,
@@ -38,7 +38,7 @@ def test_celer_path_logreg(solver):
 
 
 @pytest.mark.parametrize("sparse_X", [True, False])
-def test_LogisticRegression(sparse_X):
+def test_binary(sparse_X):
     np.random.seed(1409)
     X, y = build_dataset(
         n_samples=30, n_features=60, sparse_X=sparse_X)
@@ -49,28 +49,34 @@ def test_LogisticRegression(sparse_X):
     clf = LogisticRegression(C=-1)
     np.testing.assert_raises(ValueError, clf.fit, X, y)
     tol = 1e-8
-    clf1 = LogisticRegression(C=C, tol=tol, verbose=0)
-    clf1.fit(X, y)
+    clf = LogisticRegression(C=C, tol=tol, verbose=0)
+    clf.fit(X, y)
 
-    clf2 = sklearn_Logreg(
+    clf_sk = sklearn_Logreg(
         C=C, penalty='l1', solver='liblinear', fit_intercept=False, tol=tol)
-    clf2.fit(X, y)
-    assert_allclose(clf1.coef_, clf2.coef_, rtol=1e-3, atol=1e-5)
+    clf_sk.fit(X, y)
+    assert_allclose(clf.coef_, clf_sk.coef_, rtol=1e-3, atol=1e-5)
 
-    # this uses float32 so we increase the tol else there are precision issues
-    clf1.tol = 1e-4
-    check_estimator(clf1)
 
-    # multinomial test, need to have a slightly lower tol
-    # for results to be comparable
+@pytest.mark.parametrize("sparse_X", [True, False])
+def test_multinomial(sparse_X):
+    np.random.seed(1409)
+    X, y = build_dataset(
+        n_samples=30, n_features=60, sparse_X=sparse_X)
     y = np.random.choice(4, len(y))
-    clf3 = LogisticRegression(C=C, tol=tol, verbose=0)
-    clf3.fit(X, y)
+    tol = 1e-8
+    clf = LogisticRegression(C=1, tol=tol, verbose=0)
+    clf.fit(X, y)
+
+    clf_sk = sklearn_Logreg(
+        C=1, penalty='l1', solver='liblinear', fit_intercept=False, tol=tol)
+    clf_sk.fit(X, y)
+    assert_allclose(clf.coef_, clf_sk.coef_, rtol=1e-3, atol=1e-3)
 
-    clf4 = sklearn_Logreg(
-        C=C, penalty='l1', solver='liblinear', fit_intercept=False, tol=tol)
-    clf4.fit(X, y)
-    assert_allclose(clf3.coef_, clf4.coef_, rtol=1e-3, atol=1e-3)
 
-    clf3.tol = 1e-3
-    check_estimator(clf3)
+@pytest.mark.parametrize("solver", ["celer-pn"])
+def test_check_estimator(solver):
+    # sklearn fits on unnormalized data for which there are convergence issues
+    # fix with increased tolerance:
+    clf = LogisticRegression(C=1, solver=solver, tol=0.1)
+    check_estimator(clf)