[BACKEND] Prevent combinatory explosion when checking tmem_load uses (#8477)

ThomasRaoux · web-flow · commit a4ab31d0bbc7 · 2025-10-18T04:11:50.000Z
diff --git a/lib/Dialect/TritonNvidiaGPU/Transforms/OptimizeTMemLayouts.cpp b/lib/Dialect/TritonNvidiaGPU/Transforms/OptimizeTMemLayouts.cpp
@@ -363,8 +363,11 @@ class TMemToSharedMemPattern : public OpRewritePattern<TMEMLoadOp> {
     SmallVector<std::pair<Value, Attribute>> uses;
     uses.push_back({tmemLoadOp.getResult(), newEncoding});
     bool foundImprovedStore = false;
+    llvm::DenseSet<std::pair<Value, Attribute>> visited;
     while (!uses.empty()) {
       auto [v, encoding] = uses.pop_back_val();
+      if (!visited.insert({v, encoding}).second)
+        continue;
       for (auto user : v.getUsers()) {
         if (auto localStore = dyn_cast<gpu::LocalStoreOp>(user)) {
           // Check if the store benefits from the new layout.