ROCm
diff --git a/‎.github/workflows/amd_perf_kernel_Integration_tests.yml‎
Lines changed: 2 additions & 1 deletion b/‎.github/workflows/amd_perf_kernel_Integration_tests.yml‎
Lines changed: 2 additions & 1 deletion
@@ -126,6 +126,7 @@ jobs:
         run: |
           python ./python/perf-kernels/flash-attention.py
           python ./python/perf-kernels/softmax.py
-          python ./python/perf-kernels/rmsnorm.py
+          python ./python/perf-kernels/rmsnorm.py --mode fwd
+          python ./python/perf-kernels/rmsnorm.py --mode bwd
           python ./python/perf-kernels/layernorm.py
           python ./python/perf-kernels/multreduce_matmul_kernel.py bench