Merge remote-tracking branch 'remotes/theislab/dev' into dev

Hoeze · Hoeze · commit 1af08a00cb87 · 2018-11-21T11:23:44.000+01:00
diff --git a/README.md b/README.md
@@ -17,9 +17,9 @@ You can install [tensorflow](https://www.tensorflow.org/install/) via pip or via
 
 #### pip
 - CPU-only: <br/>
-  `pip install tf-nightly`
+  `pip install tensorflow`
 - GPU: <br/>
-  `pip install tf-nightly-gpu`
+  `pip install tensorflow-gpu`
   
 ### Hardware-optimized tensorflow installation (compiling from source)
 Please refer to https://www.tensorflow.org/install/.
diff --git a/batchglm/train/tf/nb_glm/estimator.py b/batchglm/train/tf/nb_glm/estimator.py
@@ -585,104 +585,72 @@ class TrainingStrategy(Enum):
         AUTO = None
         DEFAULT = [
             {
-                "learning_rate": 0.1,
-                "convergence_criteria": "t_test",
-                "stopping_criteria": 0.05,
-                "loss_window_size": 100,
-                "use_batching": True,
+                "learning_rate": 0.5,
+                "convergence_criteria": "scaled_moving_average",
+                "stopping_criteria": 1e-5,
+                "loss_window_size": 10,
+                "use_batching": False,
                 "optim_algo": "ADAM",
             },
             {
-                "learning_rate": 0.05,
-                "convergence_criteria": "t_test",
-                "stopping_criteria": 0.05,
+                "convergence_criteria": "scaled_moving_average",
+                "stopping_criteria": 1e-10,
                 "loss_window_size": 10,
                 "use_batching": False,
-                "optim_algo": "ADAM",
+                "optim_algo": "newton",
             },
         ]
         EXACT = [
             {
-                "learning_rate": 0.1,
-                "convergence_criteria": "t_test",
-                "stopping_criteria": 0.05,
-                "loss_window_size": 100,
-                "use_batching": True,
-                "optim_algo": "ADAM",
-            },
-            {
-                "learning_rate": 0.05,
-                "convergence_criteria": "t_test",
-                "stopping_criteria": 0.05,
-                "loss_window_size": 100,
-                "use_batching": True,
-                "optim_algo": "ADAM",
-            },
-            {
-                "learning_rate": 0.005,
-                "convergence_criteria": "t_test",
-                "stopping_criteria": 0.25,
+                "learning_rate": 0.5,
+                "convergence_criteria": "scaled_moving_average",
+                "stopping_criteria": 1e-5,
                 "loss_window_size": 10,
                 "use_batching": False,
-                "optim_algo": "Newton-Raphson",
-            },
-        ]
-        QUICK = [
-            {
-                "learning_rate": 0.1,
-                "convergence_criteria": "t_test",
-                "stopping_criteria": 0.05,
-                "loss_window_size": 100,
-                "use_batching": True,
                 "optim_algo": "ADAM",
             },
-        ]
-        PRE_INITIALIZED = [
             {
-                "learning_rate": 0.01,
-                "convergence_criteria": "t_test",
-                "stopping_criteria": 0.25,
+                "convergence_criteria": "scaled_moving_average",
+                "stopping_criteria": 1e-10,
                 "loss_window_size": 10,
                 "use_batching": False,
-                "optim_algo": "ADAM",
+                "optim_algo": "newton",
             },
         ]
-        NEWTON_EXACT = [
+        QUICK = [
             {
-                "learning_rate": 1,
+                "learning_rate": 0.5,
                 "convergence_criteria": "scaled_moving_average",
                 "stopping_criteria": 1e-8,
-                "loss_window_size": 5,
+                "loss_window_size": 10,
                 "use_batching": False,
-                "optim_algo": "newton-raphson",
+                "optim_algo": "ADAM",
             },
         ]
-        NEWTON_BATCHED = [
+        PRE_INITIALIZED = [
             {
-                "learning_rate": 1,
                 "convergence_criteria": "scaled_moving_average",
-                "stopping_criteria": 1e-8,
-                "loss_window_size": 20,
-                "use_batching": True,
-                "optim_algo": "newton-raphson",
+                "stopping_criteria": 1e-10,
+                "loss_window_size": 10,
+                "use_batching": False,
+                "optim_algo": "newton",
             },
         ]
-        NEWTON_SERIES = [
+        CONTINUOUS = [
             {
-                "learning_rate": 1,
+                "learning_rate": 0.5,
                 "convergence_criteria": "scaled_moving_average",
-                "stopping_criteria": 1e-8,
-                "loss_window_size": 8,
-                "use_batching": True,
-                "optim_algo": "newton-raphson",
+                "stopping_criteria": 1e-5,
+                "loss_window_size": 10,
+                "use_batching": False,
+                "optim_algo": "ADAM",
             },
             {
-                "learning_rate": 1,
                 "convergence_criteria": "scaled_moving_average",
-                "stopping_criteria": 1e-8,
-                "loss_window_size": 4,
+                "stopping_criteria": 1e-10,
+                "loss_window_size": 10,
                 "use_batching": False,
-                "optim_algo": "newton-raphson",
+                "optim_algo": "newton",
             },
         ]
 
@@ -935,11 +903,8 @@ def __init__(
                     my_loc_names = set(input_data.design_loc_names.values)
                     my_loc_names = my_loc_names.intersection(init_model.input_data.design_loc_names.values)
 
-                    init_loc = np.random.uniform(
-                        low=np.nextafter(0, 1, dtype=input_data.X.dtype),
-                        high=np.sqrt(np.nextafter(0, 1, dtype=input_data.X.dtype)),
-                        size=(input_data.num_design_loc_params, input_data.num_features)
-                    )
+                    # Initialize new parameters to zero:
+                    init_loc = np.zeros(shape=(input_data.num_design_loc_params, input_data.num_features))
                     for parm in my_loc_names:
                         init_idx = np.where(init_model.input_data.design_loc_names == parm)
                         my_idx = np.where(input_data.design_loc_names == parm)
@@ -952,11 +917,8 @@ def __init__(
                     my_scale_names = set(input_data.design_scale_names.values)
                     my_scale_names = my_scale_names.intersection(init_model.input_data.design_scale_names.values)
 
-                    init_scale = np.random.uniform(
-                        low=np.nextafter(0, 1, dtype=input_data.X.dtype),
-                        high=np.sqrt(np.nextafter(0, 1, dtype=input_data.X.dtype)),
-                        size=(input_data.num_design_scale_params, input_data.num_features)
-                    )
+                    # Initialize new parameters to zero:
+                    init_scale = np.zeros(shape=(input_data.num_design_scale_params, input_data.num_features))
                     for parm in my_scale_names:
                         init_idx = np.where(init_model.input_data.design_scale_names == parm)
                         my_idx = np.where(input_data.design_scale_names == parm)
diff --git a/setup.py b/setup.py
@@ -2,11 +2,19 @@
 import versioneer
 
 author = 'Florian R. Hölzlwimmer, David S. Fischer'
+author_email='batchglm@frhoelzlwimmer.de, david.fischer@helmholtz-muenchen.de'
+description="Fast and scalable fitting of over-determined generalized-linear models (GLMs)"
+
+with open("README.md", "r") as fh:
+    long_description = fh.read()
 
 setup(
     name='batchglm',
     author=author,
-    author_email='florian.hoelzlwimmer@helmholtz-muenchen.de',
+    author_email=author_email,
+    description=description,
+    long_description=long_description,
+    long_description_content_type="text/markdown",
     packages=find_packages(),
     install_requires=[
         'tensorflow>=1.10.0',