Merge pull request #2152 from ekouts/test/latency

Vasileios Karakasis · web-flow · commit 6a6d1e46d365 · 2021-08-31T01:32:57.000+02:00
[test] Modernize latency test
diff --git a/cscs-checks/microbenchmarks/cpu/latency/latency.py b/cscs-checks/microbenchmarks/cpu/latency/latency.py
@@ -9,89 +9,96 @@
 
 @rfm.simple_test
 class CPULatencyTest(rfm.RegressionTest):
-    def __init__(self):
-        self.sourcepath = 'latency.cpp'
-        self.build_system = 'SingleSource'
-        self.valid_systems = ['daint:gpu', 'daint:mc', 'dom:gpu', 'dom:mc',
-                              'ault:intel', 'ault:amdvega', 'tave:compute']
-        self.valid_prog_environs = ['PrgEnv-gnu']
-        self.num_tasks = 0
-        self.num_tasks_per_node = 1
-
-        self.build_system.cxxflags = ['-O3']
-
-        self.executable_opts = ['16000', '128000', '8000000', '500000000']
+    sourcepath = 'latency.cpp'
+    build_system = 'SingleSource'
+    valid_systems = ['daint:gpu', 'daint:mc', 'dom:gpu', 'dom:mc',
+                     'ault:intel', 'ault:amdvega', 'tave:compute']
+    valid_prog_environs = ['PrgEnv-gnu']
+    num_tasks = 0
+    num_tasks_per_node = 1
+    executable_opts = ['16000', '128000', '8000000', '500000000']
+    reference = {
+        'dom:mc': {
+            'latencyL1':  (1.21, -0.01, 0.26, 'ns'),
+            'latencyL2':  (3.65, -0.01, 0.26, 'ns'),
+            'latencyL3':  (18.83, -0.01, 0.05, 'ns'),
+            'latencyMem': (76.6, -0.01, 0.05, 'ns')
+        },
+        'dom:gpu': {
+            'latencyL1':  (1.14, -0.01, 0.26, 'ns'),
+            'latencyL2':  (3.44, -0.01, 0.26, 'ns'),
+            'latencyL3':  (15.65, -0.01, 0.05, 'ns'),
+            'latencyMem': (71.7, -0.01, 0.05, 'ns')
+        },
+        'daint:mc': {
+            'latencyL1':  (1.21, -0.01, 0.26, 'ns'),
+            'latencyL2':  (3.65, -0.01, 0.26, 'ns'),
+            'latencyL3':  (18.83, -0.01, 0.05, 'ns'),
+            'latencyMem': (76.6, -0.01, 0.05, 'ns')
+        },
+        'daint:gpu': {
+            'latencyL1':  (1.14, -0.01, 0.26, 'ns'),
+            'latencyL2':  (3.44, -0.01, 0.26, 'ns'),
+            'latencyL3':  (15.65, -0.01, 0.05, 'ns'),
+            'latencyMem': (71.7, -0.01, 0.05, 'ns')
+        },
+        'ault:intel': {
+            'latencyL1':  (1.08, -0.01, 0.26, 'ns'),
+            'latencyL2':  (3.8, -0.01, 0.26, 'ns'),
+            'latencyL3':  (21.5, -0.01, 0.05, 'ns'),
+            'latencyMem': (86.5, -0.01, 0.05, 'ns')
+        },
+        'ault:amdvega': {
+            'latencyL1':  (1.32, -0.01, 0.26, 'ns'),
+            'latencyL2':  (4.02, -0.01, 0.26, 'ns'),
+            'latencyL3':  (14.4, -0.01, 0.26, 'ns'),
+            'latencyMem': (90.0, -0.01, 0.05, 'ns')
+        },
+        'tave:compute': {
+            'latencyL1':  (2.86, -0.01, 0.05, 'ns'),
+            'latencyL2':  (12.15, -0.01, 0.05, 'ns'),
+            'latencyL3':  (137, -0.01, 0.05, 'ns'),
+            'latencyMem': (150, -0.05, 0.05, 'ns')
+        },
+    }
+    maintainers = ['SK']
+    tags = {'benchmark', 'diagnostic'}
 
+    @run_after('init')
+    def set_modules(self):
         if self.current_system.name in {'daint', 'dom'}:
             self.modules = ['craype-hugepages1G']
         if self.current_system.name in {'tave'}:
             self.modules = ['craype-hugepages512M']
 
-        self.sanity_patterns = sn.assert_eq(
+    @run_before('compile')
+    def set_flags(self):
+        self.build_system.cxxflags = ['-O3']
+
+    @sanity_function
+    def assert_success(self):
+        return sn.assert_eq(
             sn.count(sn.findall(r'latency', self.stdout)),
-            self.num_tasks_assigned * len(self.executable_opts))
+            self.num_tasks * len(self.executable_opts)
+        )
 
-        def lat_pattern(index):
-            return sn.extractsingle(
-                r'latency \(ns\) for input size %s: (?P<bw>\S+) clocks' %
-                self.executable_opts[index], self.stdout, 'bw', float)
+    def lat_pattern(self, index):
+        return sn.extractsingle(
+            r'latency \(ns\) for input size %s: (?P<bw>\S+) clocks' %
+            self.executable_opts[index], self.stdout, 'bw', float)
 
-        self.perf_patterns = {
-            'latencyL1': lat_pattern(0),
-            'latencyL2': lat_pattern(1),
-            'latencyL3': lat_pattern(2),
-            'latencyMem': lat_pattern(3),
-        }
+    @performance_function('ns')
+    def latencyL1(self):
+        return self.lat_pattern(0)
 
-        self.reference = {
-            'dom:mc': {
-                'latencyL1':  (1.21, -0.01, 0.26, 'ns'),
-                'latencyL2':  (3.65, -0.01, 0.26, 'ns'),
-                'latencyL3':  (18.83, -0.01, 0.05, 'ns'),
-                'latencyMem': (76.6, -0.01, 0.05, 'ns')
-            },
-            'dom:gpu': {
-                'latencyL1':  (1.14, -0.01, 0.26, 'ns'),
-                'latencyL2':  (3.44, -0.01, 0.26, 'ns'),
-                'latencyL3':  (15.65, -0.01, 0.05, 'ns'),
-                'latencyMem': (71.7, -0.01, 0.05, 'ns')
-            },
-            'daint:mc': {
-                'latencyL1':  (1.21, -0.01, 0.26, 'ns'),
-                'latencyL2':  (3.65, -0.01, 0.26, 'ns'),
-                'latencyL3':  (18.83, -0.01, 0.05, 'ns'),
-                'latencyMem': (76.6, -0.01, 0.05, 'ns')
-            },
-            'daint:gpu': {
-                'latencyL1':  (1.14, -0.01, 0.26, 'ns'),
-                'latencyL2':  (3.44, -0.01, 0.26, 'ns'),
-                'latencyL3':  (15.65, -0.01, 0.05, 'ns'),
-                'latencyMem': (71.7, -0.01, 0.05, 'ns')
-            },
-            'ault:intel': {
-                'latencyL1':  (1.08, -0.01, 0.26, 'ns'),
-                'latencyL2':  (3.8, -0.01, 0.26, 'ns'),
-                'latencyL3':  (21.5, -0.01, 0.05, 'ns'),
-                'latencyMem': (86.5, -0.01, 0.05, 'ns')
-            },
-            'ault:amdvega': {
-                'latencyL1':  (1.32, -0.01, 0.26, 'ns'),
-                'latencyL2':  (4.02, -0.01, 0.26, 'ns'),
-                'latencyL3':  (14.4, -0.01, 0.26, 'ns'),
-                'latencyMem': (90.0, -0.01, 0.05, 'ns')
-            },
-            'tave:compute': {
-                'latencyL1':  (2.86, -0.01, 0.05, 'ns'),
-                'latencyL2':  (12.15, -0.01, 0.05, 'ns'),
-                'latencyL3':  (137, -0.01, 0.05, 'ns'),
-                'latencyMem': (150, -0.05, 0.05, 'ns')
-            },
-        }
+    @performance_function('ns')
+    def latencyL2(self):
+        return self.lat_pattern(1)
 
-        self.maintainers = ['SK']
-        self.tags = {'benchmark', 'diagnostic'}
+    @performance_function('ns')
+    def latencyL3(self):
+        return self.lat_pattern(2)
 
-    @property
-    @sn.sanity_function
-    def num_tasks_assigned(self):
-        return self.job.num_tasks
+    @performance_function('ns')
+    def latencyMem(self):
+        return self.lat_pattern(3)