sassoftware
diff --git a/‎swat/cas/table.py‎
Lines changed: 14 additions & 9 deletions b/‎swat/cas/table.py‎
Lines changed: 14 additions & 9 deletions
diff --git a/‎swat/dataframe.py‎
Lines changed: 24 additions & 26 deletions b/‎swat/dataframe.py‎
Lines changed: 24 additions & 26 deletions
diff --git a/‎swat/tests/cas/test_bygroups.py‎
Lines changed: 26 additions & 20 deletions b/‎swat/tests/cas/test_bygroups.py‎
Lines changed: 26 additions & 20 deletions
@@ -3822,9 +3822,14 @@ def _percentiles(self, percentiles=None, format_labels=True):
         out = out.unstack()
 
         if len(out.index.names) > 1:
-            out = out.set_index(pd.MultiIndex(levels=out.index.levels,
-                                              labels=out.index.labels,
-                                              names=out.index.names[:-1] + [None]))
+            if pd_version >= (1, 0, 0):
+                out = out.set_index(pd.MultiIndex(levels=out.index.levels,
+                                                  codes=out.index.codes,
+                                                  names=out.index.names[:-1] + [None]))
+            else:
+                out = out.set_index(pd.MultiIndex(levels=out.index.levels,
+                                                  labels=out.index.labels,
+                                                  names=out.index.names[:-1] + [None]))
         else:
             out.index.name = None
 
@@ -4266,7 +4271,7 @@ def _topk_values(self, stats=None, axis=None, skipna=True, level=None,
             else:
                 minmax.rename(columns=dict(CharVar='value', Column='column'),
                               inplace=True)
-            minmax = minmax.loc[:, groups + ['stat', 'column', 'value']]
+            minmax = minmax.reindex(columns=groups + ['stat', 'column', 'value'])
             if skipna:
                 minmax.dropna(inplace=True)
             if 'min' not in stats:
@@ -4275,12 +4280,12 @@ def _topk_values(self, stats=None, axis=None, skipna=True, level=None,
                 minmax = minmax.set_index('stat').drop('max').reset_index()
             minmax.set_index(groups + ['stat', 'column'], inplace=True)
             if groups:
-                minmax.drop(groups, level=-1, inplace=True)
+                minmax.drop(groups, level=-1, inplace=True, errors='ignore')
             minmax = minmax.unstack()
             minmax.index.name = None
             minmax.columns.names = [None] * len(minmax.columns.names)
             minmax.columns = minmax.columns.droplevel()
-            minmax = minmax.loc[:, columns]
+            minmax = minmax.reindex(columns=columns)
 
         # Unique
         unique = None
@@ -4291,17 +4296,17 @@ def _topk_values(self, stats=None, axis=None, skipna=True, level=None,
             unique = pd.concat(unique)
             unique.loc[:, 'unique'] = 'unique'
             unique.rename(columns=dict(N='value', Column='column'), inplace=True)
-            unique = unique.loc[:, groups + ['unique', 'column', 'value']]
+            unique = unique.reindex(columns=groups + ['unique', 'column', 'value'])
             if skipna:
                 unique.dropna(inplace=True)
             unique.set_index(groups + ['unique', 'column'], inplace=True)
             if groups:
-                unique.drop(groups, level=-1, inplace=True)
+                unique.drop(groups, level=-1, inplace=True, errors='ignore')
             unique = unique.unstack()
             unique.index.name = None
             unique.columns.names = [None] * len(unique.columns.names)
             unique.columns = unique.columns.droplevel()
-            unique = unique.loc[:, columns]
+            unique = unique.reindex(columns=columns)
 
         out = pd.concat(x for x in [unique, minmax] if x is not None)
         out = out.sort_index(ascending=([True] * len(groups)) + [False])
 
@@ -830,21 +830,19 @@ def reshape_bygroups(self, bygroup_columns='formatted',
         if not self.attrs.get('ByVar1'):
             return dframe
 
-        attrs = dframe.attrs
-
         # 'attributes', 'index', or 'columns'
-        attrs.setdefault('ByGroupMode', 'attributes')
+        dframe.attrs.setdefault('ByGroupMode', 'attributes')
 
         # 'none', 'raw', 'formatted', or 'both'
-        attrs.setdefault('ByGroupColumns', 'none')
+        dframe.attrs.setdefault('ByGroupColumns', 'none')
 
         # Short circuit if possible
-        if bygroup_columns == attrs['ByGroupColumns']:
-            if attrs['ByGroupMode'] == 'attributes':
+        if bygroup_columns == dframe.attrs['ByGroupColumns']:
+            if dframe.attrs['ByGroupMode'] == 'attributes':
                 return dframe
-            if bygroup_as_index and attrs['ByGroupMode'] == 'index':
+            if bygroup_as_index and dframe.attrs['ByGroupMode'] == 'index':
                 return dframe
-            if not bygroup_as_index and attrs['ByGroupMode'] == 'columns':
+            if not bygroup_as_index and dframe.attrs['ByGroupMode'] == 'columns':
                 return dframe
 
         # Get the names of all of the By variables
@@ -856,49 +854,49 @@ def reshape_bygroups(self, bygroup_columns='formatted',
         while True:
             byvar = 'ByVar%d' % i
 
-            if byvar not in attrs:
+            if byvar not in dframe.attrs:
                 break
 
-            byvars.append(attrs[byvar])
-            byvals.append(attrs[byvar + 'Value'])
-            byvalsfmt.append(attrs[byvar + 'ValueFormatted'])
+            byvars.append(dframe.attrs[byvar])
+            byvals.append(dframe.attrs[byvar + 'Value'])
+            byvalsfmt.append(dframe.attrs[byvar + 'ValueFormatted'])
 
-            attrs.pop(byvar + 'Formatted', None)
+            dframe.attrs.pop(byvar + 'Formatted', None)
 
             numbycols = numbycols + 1
-            if attrs['ByGroupColumns'] == 'both':
+            if dframe.attrs['ByGroupColumns'] == 'both':
                 numbycols = numbycols + 1
 
             i = i + 1
 
         # Drop existing indexes
-        if attrs['ByGroupMode'] == 'index':
+        if dframe.attrs['ByGroupMode'] == 'index':
             dframe = dframe.reset_index(level=list(range(numbycols)), drop=True)
 
         # Drop existing columns
-        elif attrs['ByGroupMode'] == 'columns':
+        elif dframe.attrs['ByGroupMode'] == 'columns':
             dframe = dframe.iloc[:, :numbycols]
 
-        # Bail out of we are doing attributes
+        # Bail out if we are doing attributes
         if bygroup_columns == 'none':
-            attrs['ByGroupMode'] = 'attributes'
-            attrs['ByGroupColumns'] = 'none'
+            dframe.attrs['ByGroupMode'] = 'attributes'
+            dframe.attrs['ByGroupColumns'] = 'none'
             return dframe
 
         # Construct By group columns
-        attrs['ByGroupColumns'] = bygroup_columns
+        dframe.attrs['ByGroupColumns'] = bygroup_columns
 
         if bygroup_as_index:
-            attrs['ByGroupMode'] = 'index'
+            dframe.attrs['ByGroupMode'] = 'index'
             nlevels = len([x for x in dframe.index.names if x])
             appendlevels = nlevels > 0
             bylevels = 0
 
             i = 1
             for byname, byval, byvalfmt in zip(byvars, byvals, byvalsfmt):
                 bykey = 'ByVar%d' % i
-                bylabel = attrs.get(bykey + 'Label')
-                sasfmt = attrs.get(bykey + 'Format')
+                bylabel = dframe.attrs.get(bykey + 'Label')
+                sasfmt = dframe.attrs.get(bykey + 'Format')
                 sasfmtwidth = split_format(sasfmt).width
                 if bygroup_columns in ['both', 'raw']:
                     dframe = dframe.set_index(pd.Series(data=[byval] * len(dframe),
@@ -930,15 +928,15 @@ def reshape_bygroups(self, bygroup_columns='formatted',
                                                + list(range(nlevels)))
 
         else:
-            attrs['ByGroupMode'] = 'columns'
+            dframe.attrs['ByGroupMode'] = 'columns'
             allcolnames = list(dframe.columns)
             bycols = []
 
             i = 1
             for byname, byval, byvalfmt in zip(byvars, byvals, byvalsfmt):
                 bykey = 'ByVar%d' % i
-                bylabel = attrs.get(bykey + 'Label')
-                sasfmt = attrs.get(bykey + 'Format')
+                bylabel = dframe.attrs.get(bykey + 'Label')
+                sasfmt = dframe.attrs.get(bykey + 'Format')
                 sasfmtwidth = split_format(sasfmt).width
                 if bygroup_columns in ['both', 'raw']:
                     if byname in allcolnames:
 
@@ -26,6 +26,7 @@
 import numpy as np
 import os
 import pandas as pd
+import re
 import six
 import swat
 import swat.utils.testing as tm
@@ -36,6 +37,9 @@
 
 patch_pandas_sort()
 
+pd_version = tuple([int(x) for x in re.match(r'^(\d+)\.(\d+)\.(\d+)',
+                                             pd.__version__).groups()])
+
 # Pick sort keys that will match across SAS and Pandas sorting orders
 SORT_KEYS = ['Origin', 'MSRP', 'Horsepower', 'Model']
 
@@ -178,7 +182,7 @@ def test_groupby_get_group(self):
         self.assertEqual(dfgrp.get_group(('Acura', 22)).to_csv(index=False),
                          tblgrp.get_group(('Acura', 22)).to_csv(index=False))
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) <= 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version[:2] <= (0, 16), 'Need newer version of Pandas')
     def test_column_nlargest(self):
         df = self.get_cars_df()
         tbl = self.table
@@ -210,7 +214,7 @@ def test_column_nlargest(self):
         # self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         # self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) <= 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version[:2] <= (0, 16), 'Need newer version of Pandas')
     def test_nlargest(self):
         df = self.get_cars_df()
         tbl = self.table
@@ -242,7 +246,7 @@ def test_nlargest(self):
         # self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         # self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) <= 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version[:2] <= (0, 16), 'Need newer version of Pandas')
     def test_column_nsmallest(self):
         df = self.get_cars_df()
         tbl = self.table
@@ -273,7 +277,7 @@ def test_column_nsmallest(self):
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) <= 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version[:2] <= (0, 16), 'Need newer version of Pandas')
     def test_nsmallest(self):
         df = self.get_cars_df()
         tbl = self.table
@@ -304,7 +308,7 @@ def test_nsmallest(self):
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_column_head(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -357,7 +361,7 @@ def test_head(self):
                                                 'Weight', 'Wheelbase', 'Length'])
         self.assertEqual(len(tblgrp), 30)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_column_tail(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -386,7 +390,7 @@ def test_tail(self):
         tblgrp = tbl.groupby('Origin').tail(10)
         self.assertTablesEqual(dfgrp, tblgrp, sortby=None)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_slice(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -418,7 +422,7 @@ def test_slice(self):
                                                 'Wheelbase', 'Length'])
         self.assertEqual(len(tblgrp), 12)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_column_slice(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -445,7 +449,7 @@ def test_column_slice(self):
         self.assertEqual(list(tblgrp.columns), ['Origin', 'MSRP'])
         self.assertEqual(len(tblgrp), 12)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_column_nth(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -596,7 +600,7 @@ def test_nunique(self):
         with self.assertRaises(AttributeError):
             tbl.groupby('Origin').nunique()
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) <= 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version[:2] <= (0, 16), 'Need newer version of Pandas')
     def test_column_value_counts(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -666,7 +670,8 @@ def test_column_max(self):
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=['Origin', 'EngineSize'])
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version >= (1, 0, 0), 'Raises AssertionError in Pandas 1')
     def test_max(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -725,7 +730,8 @@ def test_column_min(self):
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=['Origin', 'EngineSize'])
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version >= (1, 0, 0), 'Raises AssertionError in Pandas 1')
     def test_min(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -854,7 +860,7 @@ def test_median(self):
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         self.assertTablesEqual(dfgrp, tblgrp, sortby=None)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_column_mode(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -880,7 +886,7 @@ def test_column_mode(self):
         tblgrp = tbl['EngineSize'].query('Origin ^= "USA"').groupby('Origin', as_index=False).mode()
         self.assertTablesEqual(dfgrp.reset_index(level=0), tblgrp, sortby=None)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_mode(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -1438,7 +1444,7 @@ def test_probt(self):
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         self.assertEqual(len(tblgrp), 3)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_column_describe(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -1464,7 +1470,7 @@ def test_column_describe(self):
 #       tblgrp = tblgrp.drop('Origin', axis=1)
 #       self.assertTablesEqual(dfgrp, tblgrp, sortby=False, decimals=5)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_describe(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
         tbl = self.table.sort_values(SORT_KEYS)
@@ -1481,7 +1487,7 @@ def test_describe(self):
         tblgrp = tblgrp.drop('Origin', axis=1)
         self.assertTablesEqual(dfgrp, tblgrp, sortby=None, decimals=5)
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_column_to_frame(self):
         tbl = self.table.sort_values(SORT_KEYS)
 
@@ -1497,7 +1503,7 @@ def test_column_to_frame(self):
         self.assertEqual(len(tblgrp), 428)
         self.assertEqual(tblgrp.index.names, [None])
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_to_frame(self):
         tbl = self.table.sort_values(SORT_KEYS)
 
@@ -1509,7 +1515,7 @@ def test_to_frame(self):
         self.assertEqual(len(tblgrp), 428)
         self.assertEqual(tblgrp.index.names, [None])
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_column_to_series(self):
         tbl = self.table.sort_values(SORT_KEYS)
 
@@ -1521,7 +1527,7 @@ def test_column_to_series(self):
         self.assertEqual(len(tblgrp), 428)
         self.assertEqual(tblgrp.index.names, ['Origin'])
 
-    @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
+    @unittest.skipIf(pd_version < (0, 16, 0), 'Need newer version of Pandas')
     def test_to_series(self):
         tbl = self.table.sort_values(SORT_KEYS)