Merge branch 'prefix'

ragrawal · ragrawal · commit 5eb2805ab1b4 · 2020-07-09T06:43:56.000-07:00
diff --git a/sklearn_pandas/__init__.py b/sklearn_pandas/__init__.py
@@ -1,4 +1,4 @@
-__version__ = '1.8.1'
+__version__ = '1.8.2'
 
 from .dataframe_mapper import DataFrameMapper  # NOQA
 from .cross_validation import cross_val_score, GridSearchCV, RandomizedSearchCV  # NOQA
diff --git a/sklearn_pandas/dataframe_mapper.py b/sklearn_pandas/dataframe_mapper.py
@@ -229,7 +229,8 @@ def fit(self, X, y=None):
                 _call_fit(self.built_default.fit, Xt, y)
         return self
 
-    def get_names(self, columns, transformer, x, alias=None):
+    def get_names(self, columns, transformer, x, alias=None, prefix='',
+                  suffix=''):
         """
         Return verbose names for the transformed columns.
 
@@ -245,6 +246,9 @@ def get_names(self, columns, transformer, x, alias=None):
         else:
             name = columns
         num_cols = x.shape[1] if len(x.shape) > 1 else 1
+
+        output = []
+
         if num_cols > 1:
             # If there are as many columns as classes in the transformer,
             # infer column names from classes names.
@@ -261,12 +265,17 @@ def get_names(self, columns, transformer, x, alias=None):
             else:
                 names = _get_feature_names(transformer)
             if names is not None and len(names) == num_cols:
-                return ['%s_%s' % (name, o) for o in names]
+                output = ['%s_%s' % (name, o) for o in names]
             # otherwise, return name concatenated with '_1', '_2', etc.
             else:
-                return [name + '_' + str(o) for o in range(num_cols)]
+                output = [name + '_' + str(o) for o in range(num_cols)]
         else:
-            return [name]
+            output = [name]
+
+        prefix = prefix or ''
+        suffix = suffix or ''
+        return ['{}_{}_{}'.format(prefix, n, suffix) for x in output]
+
 
     def get_dtypes(self, extracted):
         dtypes_features = [self.get_dtype(ex) for ex in extracted]
@@ -313,8 +322,10 @@ def _transform(self, X, y=None, do_fit=False):
             extracted.append(_handle_feature(Xt))
 
             alias = options.get('alias')
+            prefix = options.get('prefix')
+            suffix = options.get('suffix')
             self.transformed_names_ += self.get_names(
-                columns, transformers, Xt, alias)
+                columns, transformers, Xt, alias, prefix, suffix)
 
         # handle features not explicitly selected
         if self.built_default is not False:
diff --git a/sklearn_pandas/features_generator.py b/sklearn_pandas/features_generator.py
@@ -1,4 +1,4 @@
-def gen_features(columns, classes=None):
+def gen_features(columns, classes=None, arguments={}):
     """Generates a feature definition list which can be passed
     into DataFrameMapper
 
@@ -25,6 +25,9 @@ def gen_features(columns, classes=None):
 
                 If None value selected, then each feature left as is.
 
+    arguments   a dictionary of additional values such as {'prefix': 'x',
+                'suffix': 'na'}
+
     """
     if classes is None:
         return [(column, None) for column in columns]
@@ -50,6 +53,6 @@ def gen_features(columns, classes=None):
             if not feature_transformers:
                 feature_transformers = None
 
-            feature_defs.append((column, feature_transformers))
+            feature_defs.append((column, feature_transformers, arguments))
 
     return feature_defs

Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-__version__ = '1.8.1'`
	`1`	`+__version__ = '1.8.2'`
`2`	`2`
`3`	`3`	`from .dataframe_mapper import DataFrameMapper # NOQA`
`4`	`4`	`from .cross_validation import cross_val_score, GridSearchCV, RandomizedSearchCV # NOQA`