IntelPython
diff --git a/‎Makefile
Lines changed: 2 additions & 4 deletions b/‎Makefile
Lines changed: 2 additions & 4 deletions
diff --git a/‎daal4py/bench.py
Lines changed: 82 additions & 13 deletions b/‎daal4py/bench.py
Lines changed: 82 additions & 13 deletions
diff --git a/‎daal4py/df_clsf.py
Lines changed: 8 additions & 4 deletions b/‎daal4py/df_clsf.py
Lines changed: 8 additions & 4 deletions
diff --git a/‎daal4py/df_regr.py
Lines changed: 8 additions & 2 deletions b/‎daal4py/df_regr.py
Lines changed: 8 additions & 2 deletions
diff --git a/‎daal4py/distances.py
Lines changed: 4 additions & 1 deletion b/‎daal4py/distances.py
Lines changed: 4 additions & 1 deletion
diff --git a/‎daal4py/kmeans.py
Lines changed: 11 additions & 6 deletions b/‎daal4py/kmeans.py
Lines changed: 11 additions & 6 deletions
diff --git a/‎daal4py/linear.py
Lines changed: 8 additions & 2 deletions b/‎daal4py/linear.py
Lines changed: 8 additions & 2 deletions
diff --git a/‎daal4py/log_reg.py
Lines changed: 8 additions & 3 deletions b/‎daal4py/log_reg.py
Lines changed: 8 additions & 3 deletions
diff --git a/‎daal4py/pca.py
Lines changed: 8 additions & 2 deletions b/‎daal4py/pca.py
Lines changed: 8 additions & 2 deletions
diff --git a/‎daal4py/ridge.py
Lines changed: 8 additions & 2 deletions b/‎daal4py/ridge.py
Lines changed: 8 additions & 2 deletions
@@ -77,8 +77,7 @@ ARGS_NATIVE_pca_full = 	--num-threads "$(NUM_THREADS)" --header \
 ARGS_NATIVE_kmeans = 	--num-threads "$(NUM_THREADS)" --header \
 			--data-multiplier "$(MULTIPLIER)" \
 			--filex data/kmeans_$(KMEANS_SIZE).npy \
-			--filei data/kmeans_$(KMEANS_SIZE).init.npy \
-			--filet data/kmeans_$(KMEANS_SIZE).tol.npy 
+			--filei data/kmeans_$(KMEANS_SIZE).init.npy
 ARGS_NATIVE_svm2 =	--fileX data/two/X-$(SVM_SIZE).npy \
 			--fileY data/two/y-$(SVM_SIZE).npy \
 			--num-threads $(SVM_NUM_THREADS) --header
@@ -159,8 +158,7 @@ ARGS_DAAL4PY_pca_daal = --size "$(REGRESSION_SIZE)" --svd-solver daal
 ARGS_DAAL4PY_pca_full = --size "$(REGRESSION_SIZE)" --svd-solver full
 ARGS_DAAL4PY_kmeans = 	--data-multiplier "$(MULTIPLIER)" \
 			--filex data/kmeans_$(KMEANS_SIZE).npy \
-			--filei data/kmeans_$(KMEANS_SIZE).init.npy \
-			--filet data/kmeans_$(KMEANS_SIZE).tol.npy
+			--filei data/kmeans_$(KMEANS_SIZE).init.npy
 ARGS_DAAL4PY_svm2 =	--fileX data/two/X-$(SVM_SIZE).npy \
 			--fileY data/two/y-$(SVM_SIZE).npy
 ARGS_DAAL4PY_svm5 = 	--fileX data/multi/X-$(SVM_SIZE).npy \
 
@@ -93,12 +93,23 @@ def parse_args(parser, size=None, dtypes=None, loop_types=(),
         else:
             loop_dash = loop_for = ''
 
-        parser.add_argument(f'--{loop_dash}inner-loops', default=3, type=int,
-                            help=f'Number of inner loop iterations {loop_for}'
+        parser.add_argument(f'--{loop_dash}inner-loops', default=100, type=int,
+                            help=f'Maximum inner loop iterations {loop_for}'
                                  f'(we take the mean over inner iterations)')
-        parser.add_argument(f'--{loop_dash}outer-loops', default=1, type=int,
-                            help=f'Number of outer loop iterations {loop_for}'
+        parser.add_argument(f'--{loop_dash}outer-loops', default=100, type=int,
+                            help=f'Maximum outer loop iterations {loop_for}'
                                  f'(we take the min over outer iterations)')
+        parser.add_argument(f'--{loop_dash}time-limit', default=10.,
+                            type=float,
+                            help=f'Target time to spend to benchmark '
+                                 f'{loop_for}')
+        parser.add_argument(f'--{loop_dash}goal-outer-loops', default=10,
+                            type=int,
+                            dest=f'{loop_dash.replace("-", "_")}goal',
+                            help=f'Number of outer loops to aim {loop_for} '
+                                 f'while automatically picking number of '
+                                 f'inner loops. If zero, do not automatically '
+                                 f'decide number of inner loops.')
 
     params = parser.parse_args()
 
@@ -186,7 +197,8 @@ def prepare_daal(num_threads=-1):
     return num_threads, daal_version
 
 
-def time_mean_min(func, *args, inner_loops=1, outer_loops=1, **kwargs):
+def time_mean_min(func, *args, inner_loops=1, outer_loops=1, time_limit=10.,
+                  goal_outer_loops=10, verbose=False, **kwargs):
     '''
     Time the given function (inner_loops * outer_loops) times, returning the
     min of the inner loop means.
@@ -196,9 +208,18 @@ def time_mean_min(func, *args, inner_loops=1, outer_loops=1, **kwargs):
     func : callable f(*args, **kwargs)
         The function to time.
     inner_loops : int
-        Number of inner loop iterations to take the mean over.
+        Maximum number of inner loop iterations to take the mean over.
     outer_loops : int
-        Number of outer loop iterations to take the min over.
+        Maximum number of outer loop iterations to take the min over.
+    time_limit : double
+        Number of seconds to aim for. If accumulated time exceeds time_limit
+        in outer loops, exit without running more outer loops. If zero,
+        disable time limit.
+    goal_outer_loops : int
+        Number of outer loop iterations to aim for by taking warmup rounds
+        and tuning inner_loops automatically.
+    verbose : boolean
+        If True, print outer loop timings and miscellaneous information.
 
     Returns
     -------
@@ -212,23 +233,71 @@ def time_mean_min(func, *args, inner_loops=1, outer_loops=1, **kwargs):
         'Must time the function at least once'
 
     times = np.zeros(outer_loops, dtype='f8')
+    total_time = 0.
 
-    for i in range(outer_loops):
-
-        t0 = timeit.default_timer()
+    # Warm-up iterations to determine optimal inner_loops
+    warmup = (goal_outer_loops > 0)
+    warmup_time = 0.
+    last_warmup = 0.
+    if warmup:
         for _ in range(inner_loops):
+            t0 = timeit.default_timer()
             val = func(*args, **kwargs)
-        t1 = timeit.default_timer()
-
-        times[i] = t1 - t0
+            t1 = timeit.default_timer()
+
+            last_warmup = t1 - t0
+            warmup_time += last_warmup
+            if warmup_time > time_limit / 10:
+                break
+
+        inner_loops = max(1, int(time_limit / last_warmup / goal_outer_loops))
+        logverbose(f'Optimal inner loops = {inner_loops}', verbose)
+
+    if last_warmup > time_limit:
+        # If we took too much time in warm-up, just use those numbers
+        logverbose(f'A single warmup iteration took {last_warmup:0.2f}s '
+                   f'> {time_limit:0.2f}s - not performing any more timings',
+                   verbose)
+        outer_loops = 1
+        inner_loops = 1
+        times[0] = last_warmup
+        times = times[:1]
+    else:
+        # Otherwise, actually take the timing
+        for i in range(outer_loops):
+
+            t0 = timeit.default_timer()
+            for _ in range(inner_loops):
+                val = func(*args, **kwargs)
+            t1 = timeit.default_timer()
+
+            times[i] = t1 - t0
+            total_time += times[i]
+
+            if time_limit > 0 and total_time > time_limit:
+                logverbose(f'TT={total_time:0.2f}s exceeding {time_limit}s '
+                           f'after iteration {i+1}', verbose)
+                outer_loops = i + 1
+                times = times[:outer_loops]
+                break
 
     # We take the mean of inner loop times
     times /= inner_loops
+    logverbose('Mean times [s]', verbose)
+    logverbose(f'{times}', verbose)
 
     # We take the min of outer loop times
     return np.min(times), val
 
 
+def logverbose(msg, verbose):
+    '''
+    Print msg as a verbose logging message only if verbose is True
+    '''
+    if verbose:
+        print('@', msg)
+
+
 def accuracy_score(y, yp):
     return np.mean(y == yp)
 
 
@@ -103,16 +103,20 @@ def df_clsf_predict(X, training_result, n_classes, verbose=False):
                                   seed=params.seed,
                                   n_features_per_node=params.max_features,
                                   max_depth=params.max_depth,
-                                  verbose=params.verbose,
                                   outer_loops=params.fit_outer_loops,
-                                  inner_loops=params.fit_inner_loops)
+                                  inner_loops=params.fit_inner_loops,
+                                  goal_outer_loops=params.fit_goal,
+                                  time_limit=params.fit_time_limit,
+                                  verbose=params.verbose)
     print_row(columns, params, function='df_clsf.fit', time=fit_time)
 
     predict_time, yp = time_mean_min(df_clsf_predict, X, res,
                                      params.n_classes,
-                                     verbose=params.verbose,
                                      outer_loops=params.predict_outer_loops,
-                                     inner_loops=params.predict_inner_loops)
+                                     inner_loops=params.predict_inner_loops,
+                                     goal_outer_loops=params.predict_goal,
+                                     time_limit=params.predict_time_limit,
+                                     verbose=params.verbose)
     acc = 100 * accuracy_score(yp, y)
     print_row(columns, params, function='df_clsf.predict', time=predict_time,
               accuracy=acc)
@@ -99,10 +99,16 @@ def df_regr_predict(X, training_result):
                                   n_features_per_node=params.max_features,
                                   max_depth=params.max_depth,
                                   outer_loops=params.fit_outer_loops,
-                                  inner_loops=params.fit_inner_loops)
+                                  inner_loops=params.fit_inner_loops,
+                                  goal_outer_loops=params.fit_goal,
+                                  time_limit=params.fit_time_limit,
+                                  verbose=params.verbose)
     print_row(columns, params, function='df_regr.fit', time=fit_time)
 
     predict_time, yp = time_mean_min(df_regr_predict, X, res,
                                      outer_loops=params.predict_outer_loops,
-                                     inner_loops=params.predict_inner_loops)
+                                     inner_loops=params.predict_inner_loops,
+                                     goal_outer_loops=params.predict_goal,
+                                     time_limit=params.predict_time_limit,
+                                     verbose=params.verbose)
     print_row(columns, params, function='df_regr.predict', time=predict_time)
@@ -32,5 +32,8 @@ def test_distances(pairwise_distances, X):
 
     time, _ = time_mean_min(test_distances, pairwise_distances, X,
                             outer_loops=params.outer_loops,
-                            inner_loops=params.inner_loops)
+                            inner_loops=params.inner_loops,
+                            goal_outer_loops=params.goal,
+                            time_limit=params.time_limit,
+                            verbose=params.verbose)
     print_row(columns, params, function=metric.capitalize(), time=time)
@@ -14,8 +14,8 @@
                     type=str, help='Points to cluster')
 parser.add_argument('-i', '--filei', '--fileI', '--init', required=True,
                     type=str, help='Initial clusters')
-parser.add_argument('-t', '--filet', '--fileT', '--tol', required=True,
-                    type=str, help='Absolute threshold')
+parser.add_argument('-t', '--tol', default=0., type=float,
+                    help='Absolute threshold')
 parser.add_argument('-m', '--data-multiplier', default=100,
                     type=int, help='Data multiplier')
 parser.add_argument('--maxiter', type=int, default=100,
@@ -26,7 +26,6 @@
 X = np.load(params.filex)
 X_init = np.load(params.filei)
 X_mult = np.vstack((X,) * params.data_multiplier)
-tol = np.load(params.filet)
 
 params.size = size_str(X.shape)
 params.n_clusters = X_init.shape[0]
@@ -40,7 +39,7 @@ def test_fit(X, X_init):
         nClusters=params.n_clusters,
         maxIterations=params.maxiter,
         assignFlag=True,
-        accuracyThreshold=tol
+        accuracyThreshold=params.tol
     )
     return algorithm.compute(X, X_init)
 
@@ -63,11 +62,17 @@ def test_predict(X, X_init):
 # Time fit
 fit_time, _ = time_mean_min(test_fit, X, X_init,
                             outer_loops=params.fit_outer_loops,
-                            inner_loops=params.fit_inner_loops)
+                            inner_loops=params.fit_inner_loops,
+                            goal_outer_loops=params.fit_goal,
+                            time_limit=params.fit_time_limit,
+                            verbose=params.verbose)
 print_row(columns, params, function='KMeans.fit', time=fit_time)
 
 # Time predict
 predict_time, _ = time_mean_min(test_predict, X, X_init,
                                 outer_loops=params.predict_outer_loops,
-                                inner_loops=params.predict_inner_loops)
+                                inner_loops=params.predict_inner_loops,
+                                goal_outer_loops=params.predict_goal,
+                                time_limit=params.predict_time_limit,
+                                verbose=params.verbose)
 print_row(columns, params, function='KMeans.predict', time=predict_time)
@@ -47,11 +47,17 @@ def test_predict(Xp, model):
 # Time fit
 fit_time, res = time_mean_min(test_fit, X, y,
                               outer_loops=params.fit_outer_loops,
-                              inner_loops=params.fit_inner_loops)
+                              inner_loops=params.fit_inner_loops,
+                              goal_outer_loops=params.fit_goal,
+                              time_limit=params.fit_time_limit,
+                              verbose=params.verbose)
 print_row(columns, params, function='Linear.fit', time=fit_time)
 
 # Time predict
 predict_time, yp = time_mean_min(test_predict, Xp, res.model,
                                  outer_loops=params.predict_outer_loops,
-                                 inner_loops=params.predict_inner_loops)
+                                 inner_loops=params.predict_inner_loops,
+                                 goal_outer_loops=params.predict_goal,
+                                 time_limit=params.predict_time_limit,
+                                 verbose=params.verbose)
 print_row(columns, params, function='Linear.predict', time=predict_time)
@@ -222,13 +222,15 @@ def test_predict(X, beta, intercept=0, multi_class='ovr'):
 
     # Time fit and predict
     fit_time, res = time_mean_min(test_fit, X, y, penalty='l2', C=params.C,
-                                  verbose=params.verbose,
                                   fit_intercept=params.fit_intercept,
                                   tol=params.tol,
                                   max_iter=params.maxiter,
                                   solver=params.solver,
                                   outer_loops=params.fit_outer_loops,
-                                  inner_loops=params.fit_inner_loops)
+                                  inner_loops=params.fit_inner_loops,
+                                  goal_outer_loops=params.fit_goal,
+                                  time_limit=params.fit_time_limit,
+                                  verbose=params.verbose)
 
     beta, intercept, solver_result, params.multiclass = res
     print_row(columns, params, function='LogReg.fit', time=fit_time)
@@ -237,7 +239,10 @@ def test_predict(X, beta, intercept=0, multi_class='ovr'):
                                      intercept=intercept,
                                      multi_class=params.multiclass,
                                      outer_loops=params.predict_outer_loops,
-                                     inner_loops=params.predict_inner_loops)
+                                     inner_loops=params.predict_inner_loops,
+                                     goal_outer_loops=params.predict_goal,
+                                     time_limit=params.predict_time_limit,
+                                     verbose=params.verbose)
     y_pred = np.argmax(yp, axis=1)
     acc = 100 * accuracy_score(y_pred, y)
     print_row(columns, params, function='LogReg.predict', time=predict_time,
 
@@ -123,13 +123,19 @@ def test_transform(Xp, pca_result, eigenvalues, eigenvectors):
 # Time fit
 fit_time, res = time_mean_min(test_fit, X,
                               outer_loops=params.fit_outer_loops,
-                              inner_loops=params.fit_inner_loops)
+                              inner_loops=params.fit_inner_loops,
+                              goal_outer_loops=params.fit_goal,
+                              time_limit=params.fit_time_limit,
+                              verbose=params.verbose)
 print_row(columns, params, function='PCA.fit', time=fit_time)
 
 # Time transform
 transform_time, tr = time_mean_min(test_transform, Xp, *res[:3],
                                    outer_loops=params.transform_outer_loops,
-                                   inner_loops=params.transform_inner_loops)
+                                   inner_loops=params.transform_inner_loops,
+                                   goal_outer_loops=params.transform_goal,
+                                   time_limit=params.transform_time_limit,
+                                   verbose=params.verbose)
 print_row(columns, params, function='PCA.transform', time=transform_time)
 
 if params.write_results:
 
@@ -41,11 +41,17 @@ def test_predict(Xp, model):
 # Time fit
 fit_time, res = time_mean_min(test_fit, X, y,
                               outer_loops=params.fit_outer_loops,
-                              inner_loops=params.fit_inner_loops)
+                              inner_loops=params.fit_inner_loops,
+                              goal_outer_loops=params.fit_goal,
+                              time_limit=params.fit_time_limit,
+                              verbose=params.verbose)
 print_row(columns, params, function='Ridge.fit', time=fit_time)
 
 # Time predict
 predict_time, yp = time_mean_min(test_predict, Xp, res.model,
                                  outer_loops=params.predict_outer_loops,
-                                 inner_loops=params.predict_inner_loops)
+                                 inner_loops=params.predict_inner_loops,
+                                 goal_outer_loops=params.predict_goal,
+                                 time_limit=params.predict_time_limit,
+                                 verbose=params.verbose)
 print_row(columns, params, function='Ridge.predict', time=predict_time)