Fix tests in mpp mode

Kevin D Smith · Kevin D Smith · commit 8409e33ab687 · 2018-07-25T09:52:51.000-04:00
diff --git a/swat/cas/table.py b/swat/cas/table.py
@@ -4963,7 +4963,7 @@ def _get_casout_slice(self, n, columns=None, ascending=True,
         try:
             casin = self.to_view()
 
-            out = self._retrieve('datastep.runcode', code=r'''
+            out = self._retrieve('datastep.runcode', single='yes', code=r'''
                  data %s;
                      %s
                      set %s;
@@ -6160,12 +6160,14 @@ def _apply_datastep(self, code, inplace=False, casout=None,
         if casout is None:
             casout = {}
 
+        default_caslib = self.getsessopt('caslib').caslib
+
         if casout.get('caslib'):
             caslib = casout['caslib']
         elif inplace and 'caslib' in self.params:
             caslib = self.params['caslib']
         else:
-            caslib = self.getsessopt('caslib').caslib
+            caslib = default_caslib
 
         if casout.get('name'):
             newname = casout['name']
@@ -6179,7 +6181,7 @@ def _apply_datastep(self, code, inplace=False, casout=None,
         dscode = []
         dscode.append('data %s(caslib=%s);' % (_quote(newname), _quote(caslib)))
         dscode.append('    set %s(caslib=%s);' % (_quote(self.params.name),
-                                                  _quote(caslib)))
+                                                  _quote(self.params.get('caslib', default_caslib))))
         if isinstance(code, items_types):
             dscode.extend(code)
         else:
diff --git a/swat/tests/cas/test_bygroups.py b/swat/tests/cas/test_bygroups.py
@@ -579,7 +579,7 @@ def test_column_nunique(self):
 
         tblgrp = tbl['MSRP'].groupby(['Origin', 'Cylinders'], as_index=False).nunique()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None)
+        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=['Origin', 'Cylinders', 'MSRP'])
 
     def test_nunique(self):
         tbl = self.table.sort_values(SORT_KEYS)
@@ -663,7 +663,7 @@ def test_column_max(self):
 
         tblgrp = tbl['EngineSize'].groupby('Origin', as_index=False).max()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None)
+        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=['Origin', 'EngineSize'])
 
     @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
     def test_max(self):
@@ -698,7 +698,7 @@ def test_max(self):
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         # Drop Model since they get sorted differently
         self.assertTablesEqual(dfgrp.drop('Model', axis=1), tblgrp.drop('Model', axis=1),
-                               sortby=None, include_index=True)
+                               sortby=['Origin', 'Make', 'Type', 'DriveTrain'])
 
     def test_column_min(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
@@ -722,7 +722,7 @@ def test_column_min(self):
 
         tblgrp = tbl['EngineSize'].groupby('Origin', as_index=False).min()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None)
+        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=['Origin', 'EngineSize'])
 
     @unittest.skipIf(int(pd.__version__.split('.')[1]) < 16, 'Need newer version of Pandas')
     def test_min(self):
@@ -757,7 +757,7 @@ def test_min(self):
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         # Drop Type since it gets sorted differently
         self.assertTablesEqual(dfgrp.drop('Type', axis=1), tblgrp.drop('Type', axis=1),
-                               sortby=None)
+                               sortby=['Origin', 'Make', 'Model'])
 
     def test_column_mean(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
@@ -781,7 +781,7 @@ def test_column_mean(self):
 
         tblgrp = tbl['EngineSize'].groupby('Origin', as_index=False).mean()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None, decimals=5)
+        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=['Origin', 'EngineSize'], decimals=5)
 
     @unittest.skipIf(sys.version_info.major < 3, 'Need newer version of Python')
     def test_mean(self):
@@ -804,7 +804,7 @@ def test_mean(self):
         dfgrp = df.groupby('Origin', as_index=False).mean()
         tblgrp = tbl.groupby('Origin', as_index=False).mean()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp, tblgrp, sortby=None, decimals=5)
+        self.assertTablesEqual(dfgrp, tblgrp, sortby=['Origin', 'MSRP', 'Invoice'], decimals=5)
 
     def test_column_median(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
@@ -978,7 +978,7 @@ def test_column_sum(self):
 
         tblgrp = tbl['EngineSize'].groupby('Origin', as_index=False).sum()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None, decimals=5)
+        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=['Origin', 'EngineSize'], decimals=5)
 
     def test_sum(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
@@ -1000,7 +1000,7 @@ def test_sum(self):
         dfgrp = df.groupby('Origin', as_index=False).sum()
         tblgrp = tbl.groupby('Origin', as_index=False).sum()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp, tblgrp, decimals=5, sortby=None)
+        self.assertTablesEqual(dfgrp, tblgrp, decimals=5, sortby=['Origin', 'MSRP', 'Invoice'])
 
     def test_column_std(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
@@ -1024,7 +1024,7 @@ def test_column_std(self):
 
         tblgrp = tbl['EngineSize'].groupby('Origin', as_index=False).std()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=None, decimals=5)
+        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, sortby=['Origin', 'EngineSize'], decimals=5)
 
     def test_std(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
@@ -1046,7 +1046,7 @@ def test_std(self):
         #dfgrp = df.groupby('Origin', as_index=False).std()
         tblgrp = tbl.groupby('Origin', as_index=False).std()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, decimals=5, sortby=None)
+        self.assertTablesEqual(dfgrp.reset_index(), tblgrp, decimals=5, sortby=['Origin', 'MSRP', 'Invoice'])
 
     def test_column_var(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
@@ -1074,7 +1074,7 @@ def test_column_var(self):
         # For some reason Pandas drops this column, but I think it should be there.
         tblgrp = tblgrp.drop('Origin', axis=1)
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp, tblgrp, decimals=5, sortby=None)
+        self.assertTablesEqual(dfgrp, tblgrp, decimals=5, sortby=['EngineSize'])
 
     def test_var(self):
         df = self.get_cars_df().sort_values(SORT_KEYS)
@@ -1096,7 +1096,7 @@ def test_var(self):
         dfgrp = df.groupby('Origin', as_index=False).var()
         tblgrp = tbl.groupby('Origin', as_index=False).var()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
-        self.assertTablesEqual(dfgrp, tblgrp, decimals=3, sortby=None)
+        self.assertTablesEqual(dfgrp, tblgrp, decimals=3, sortby=['Origin', 'MSRP', 'Invoice'])
 
     def test_column_nmiss(self):
         # TODO: Not supported by Pandas; need comparison values
@@ -1119,6 +1119,9 @@ def test_column_nmiss(self):
         self.assertEqual(len(tblgrp), 3)
 
         # Test character missing values
+        swat.options.cas.trace_actions = True
+        swat.options.cas.trace_ui_actions = True
+        swat.options.cas.print_messages = True
         tbl = self.table.replace({'Make': {'Buick': ''}})
 
         tblgrp = tbl.groupby('Origin')['Make'].nmiss()
@@ -1138,12 +1141,10 @@ def test_column_nmiss(self):
         #
         swat.options.cas.dataset.bygroup_casout_threshold = 2
 
-        swat.options.cas.print_messages = True
         tblgrp = tbl['Cylinders'].groupby('Origin').nmiss()
         self.assertEqual(tblgrp.__class__.__name__, 'CASTable')
         self.assertEqual(len(tblgrp), 3)
         tblgrp = tblgrp.to_frame().set_index('Origin')['Cylinders']
-        print(tblgrp)
         self.assertEqual(tblgrp.loc['Asia'], 2)
         self.assertEqual(tblgrp.loc['Europe'], 0)
         self.assertEqual(tblgrp.loc['USA'], 0)
diff --git a/swat/tests/cas/test_datamsg.py b/swat/tests/cas/test_datamsg.py
@@ -458,13 +458,13 @@ def test_dbapi(self):
         self.assertEqual(colinfo['Column'].tolist(),
                          'Make,Model,Type,Origin,DriveTrain,MSRP,Invoice,EngineSize,Cylinders,Horsepower,MPG_City,MPG_Highway,Weight,Wheelbase,Length'.split(','))
                          
-        self.assertEqual(list(tbl.head().itertuples(index=False)),
-            [('Dodge', 'Viper SRT-10 convertible 2dr', 'Sports', 'USA', 'Rear', 81795.0,
+        self.assertEqual(sorted(tuple(x) for x in tbl.head().itertuples(index=False)),
+            sorted([('Dodge', 'Viper SRT-10 convertible 2dr', 'Sports', 'USA', 'Rear', 81795.0,
               74451.0, '8.3', 10.0, 500.0, 12.0, 20.0, 3410.0, 99.0, 176.0), 
              ('Mercedes-Benz', 'CL600 2dr', 'Sedan', 'Europe', 'Rear', 128420.0, 119600.0,
               '5.5', 12.0, 493.0, 13.0, 19.0, 4473.0, 114.0, 196.0),
              ('Mercedes-Benz', 'SL600 convertible 2dr', 'Sports', 'Europe', 'Rear',
-              126670.0, 117854.0, '5.5', 12.0, 493.0, 13.0, 19.0, 4429.0, 101.0, 179.0)])
+              126670.0, 117854.0, '5.5', 12.0, 493.0, 13.0, 19.0, 4429.0, 101.0, 179.0)]))
 
         try: 
             os.remove(tmpf)
diff --git a/swat/tests/cas/test_table.py b/swat/tests/cas/test_table.py