fix launch latency

xuzhao9 · xuzhao9 · commit 34c0c4698115 · 2025-07-18T18:08:27.000-04:00
diff --git a/benchmarks/nightly/autogen.yaml b/benchmarks/nightly/autogen.yaml
@@ -140,3 +140,6 @@ rope_bwd:
 swiglu_bwd:
   op: swiglu
   args: --op swiglu --baseline torch_swiglu --metrics speedup --bwd --only liger_swiglu,torch_swiglu
+launch_latency:
+  op: launch_latency
+  args: --op launch_latency --metrics walltime
diff --git a/benchmarks/nightly/gen.py b/benchmarks/nightly/gen.py
@@ -76,6 +76,8 @@ def process_manual_options(
         run_configs[benchmark]["disabled"] = True
     for benchmark in extra_args:
         run_configs[benchmark]["args"] = extra_args[benchmark]["args"]
+    for benchmark, benchmark_config in options.get("enabled", {}).items():
+        run_configs[benchmark] = benchmark_config.copy()
     return run_configs
 
 
diff --git a/benchmarks/nightly/manual.yaml b/benchmarks/nightly/manual.yaml
@@ -7,6 +7,10 @@ disabled:
   - fp8_gemm_fwd
   - fp8_gemm_rowwise_fwd
   - fp8_gemm_rowwise_grouped_fwd
+enabled:
+  launch_latency:
+    op: launch_latency
+    args: --op launch_latency --metrics walltime
 extra_args:
   # triton_tutorial_flash_v2_opt does not work on Triton main branch
   bf16_flash_attention_fwd: