Use active driver benchmarker for do_bench measurements (#537)

bremerm31 · facebook-github-bot · commit c410c510b304 · 2025-10-10T21:15:18.000-07:00
Summary:

Sometimes the triton backend may set a profiler to be different from the standard `do_bench` implmentation. For cuda this has no functional change, i.e. `triton.runtime.driver.active.get_benchmarker()` still points at `do_bench`.

Reviewed By: xuzhao9

Differential Revision: D84215437
diff --git a/tritonbench/components/do_bench/run.py b/tritonbench/components/do_bench/run.py
@@ -475,7 +475,7 @@ def do_bench_wrapper(
                 if latency_measure_mode == "profiler"
                 else _do_bench_inductor
                 if latency_measure_mode == "inductor_benchmarker"
-                else triton.testing.do_bench
+                else triton.runtime.driver.active.get_benchmarker()
             )
 
             return Latency(

Original file line number	Diff line number	Diff line change
`@@ -475,7 +475,7 @@ def do_bench_wrapper(`
`475`	`475`	`if latency_measure_mode == "profiler"`
`476`	`476`	`else _do_bench_inductor`
`477`	`477`	`if latency_measure_mode == "inductor_benchmarker"`
`478`		`- else triton.testing.do_bench`
	`478`	`+ else triton.runtime.driver.active.get_benchmarker()`
`479`	`479`	`)`
`480`	`480`
`481`	`481`	`return Latency(`