Update README.md

DefTruth · web-flow · commit 58bfa8732b4f · 2025-04-26T12:08:09.000+08:00
diff --git a/README.md b/README.md
@@ -450,7 +450,7 @@ The kernels listed here will guide you through a step-by-step progression, rangi
 
 💡NOTE: 🤖[ffpa-attn-mma](https://github.com/xlite-dev/ffpa-attn-mma): 📚FFPA - Yet another Faster Flash Prefill Attention with O(1)🎉SRAM complexity for headdim > 256, **1.8x~3x**🎉faster than SDPA EA: [📈L20 ~1.9x↑🎉](https://github.com/xlite-dev/ffpa-attn-mma?tab=readme-ov-file#L1-bench-l20), [📈 A30 ~1.8x↑🎉](https://github.com/xlite-dev/ffpa-attn-mma?tab=readme-ov-file#L1-bench-a30), [📈3080 ~2.9x↑🎉](https://github.com/xlite-dev/ffpa-attn-mma?tab=readme-ov-file#L1-bench-3080), [📈4090 ~2.1x↑🎉](https://github.com/xlite-dev/ffpa-attn-mma?tab=readme-ov-file#L1-bench-4090).  
 
-### 📚 Triton Kernel (OpenAI Triton) ⭐️⭐️⭐️ (©️back👆🏻)
+### 📚 Triton Kernel (OpenAI Triton) ([©️back👆🏻](#cuda-kernel)) 
 
 <div id="triton-kernel"></div>  
 
@@ -460,7 +460,7 @@ The kernels listed here will guide you through a step-by-step progression, rangi
 | ✔️ [triton_merge_attn_states_kernel(w/ CUDA)](./kernels/openai-triton/merge-attn-states/)|f16/bf16/f32|f32|[link](./kernels/openai-triton/merge-attn-states/)|⭐️⭐️⭐️| 
 
 
-### 📚 CUTLASS/CuTe Kernel ⭐️⭐️⭐️ (©️back👆🏻)
+### 📚 CUTLASS/CuTe Kernel ⭐️⭐️⭐️ ([©️back👆🏻](#cuda-kernel)) 
 
 <div id="cutlass-kernel"></div>