Added test for RegisterObserver, added clause in case of mocktest

fjwillemsen · fjwillemsen · commit 943b3c470c72 · 2024-02-08T17:24:36.000+01:00
diff --git a/kernel_tuner/backends/pycuda.py b/kernel_tuner/backends/pycuda.py
@@ -218,7 +218,8 @@ def compile(self, kernel_instance):
             )
 
             self.func = self.current_module.get_function(kernel_name)
-            self.num_regs = self.func.num_regs
+            if not isinstance(self.func, str):
+                self.num_regs = self.func.num_regs
             return self.func
         except drv.CompileError as e:
             if "uses too much shared data" in e.stderr:
diff --git a/test/test_observers.py b/test/test_observers.py
@@ -2,9 +2,10 @@
 
 import kernel_tuner
 from kernel_tuner.observers.nvml import NVMLObserver
+from kernel_tuner.observers.register import RegisterObserver
 from kernel_tuner.observers.observer import BenchmarkObserver
 
-from .context import skip_if_no_pycuda, skip_if_no_pynvml
+from .context import skip_if_no_pycuda, skip_if_no_pynvml, skip_if_no_cupy, skip_if_no_cuda
 from .test_runners import env  # noqa: F401
 
 
@@ -20,6 +21,29 @@ def test_nvml_observer(env):
     assert "temperature" in result[0]
     assert result[0]["temperature"] > 0
 
+@skip_if_no_pycuda
+def test_register_observer_pycuda(env):
+    registerobserver = RegisterObserver()
+    env[-1]["block_size_x"] = [128]
+    result, _ = kernel_tuner.tune_kernel(*env, observers=[registerobserver], lang='CUDA')
+    assert "num_regs" in result[0]
+    assert result[0]["num_regs"] > 0
+
+@skip_if_no_cupy
+def test_register_observer_cupy(env):
+    registerobserver = RegisterObserver()
+    env[-1]["block_size_x"] = [128]
+    result, _ = kernel_tuner.tune_kernel(*env, observers=[registerobserver], lang='CuPy')
+    assert "num_regs" in result[0]
+    assert result[0]["num_regs"] > 0
+
+@skip_if_no_cuda
+def test_register_observer_nvcuda(env):
+    registerobserver = RegisterObserver()
+    env[-1]["block_size_x"] = [128]
+    result, _ = kernel_tuner.tune_kernel(*env, observers=[registerobserver], lang='NVCUDA')
+    assert "num_regs" in result[0]
+    assert result[0]["num_regs"] > 0
 
 @skip_if_no_pycuda
 def test_custom_observer(env):

Original file line number	Diff line number	Diff line change
`@@ -218,7 +218,8 @@ def compile(self, kernel_instance):`
`218`	`218`	`)`
`219`	`219`
`220`	`220`	`self.func = self.current_module.get_function(kernel_name)`
`221`		`- self.num_regs = self.func.num_regs`
	`221`	`+ if not isinstance(self.func, str):`
	`222`	`+ self.num_regs = self.func.num_regs`
`222`	`223`	`return self.func`
`223`	`224`	`except drv.CompileError as e:`
`224`	`225`	`if "uses too much shared data" in e.stderr:`