PaddlePaddle
diff --git a/‎csrc/README.md‎
Lines changed: 4 additions & 2 deletions b/‎csrc/README.md‎
Lines changed: 4 additions & 2 deletions
diff --git a/‎csrc/gpu/cutlass_kernels/fp8_gemm_fused/dispatch_dual_gemm_scale_bias_swiglu.h‎
Lines changed: 0 additions & 31 deletions b/‎csrc/gpu/cutlass_kernels/fp8_gemm_fused/dispatch_dual_gemm_scale_bias_swiglu.h‎
Lines changed: 0 additions & 31 deletions
diff --git a/‎csrc/gpu/cutlass_kernels/fp8_gemm_fused/dual_gemm_scale_bias_swiglu_16_32_64_stages3.h‎
Lines changed: 0 additions & 185 deletions b/‎csrc/gpu/cutlass_kernels/fp8_gemm_fused/dual_gemm_scale_bias_swiglu_16_32_64_stages3.h‎
Lines changed: 0 additions & 185 deletions
@@ -10,9 +10,11 @@ pip install -r requirements.txt
 
 ## 编译 Cuda 算子
 
-生成 FP8的 cutlass 算子(编译耗时较长)
+生成 FP8的 cutlass 算子
 ```shell
-python generate_code_gemm_fused_kernels.py
+python utils/auto_gen_fp8_fp8_gemm_fused_kernels.py
+
+python utils/auto_gen_fp8_fp8_dual_gemm_fused_kernels.py
 ```
 
 编译