Fixing implementation of DPP subgroup reduce

Muzammiluddin-Syed-ECE · Muzammiluddin-Syed-ECE · commit 848c6baa2aad · 2025-04-22T10:40:47.000-05:00
Signed-off-by: Muzammiluddin Syed &lt;muzasyed@amd.com&gt;
diff --git a/mlir/lib/Dialect/GPU/Transforms/SubgroupReduceLowering.cpp b/mlir/lib/Dialect/GPU/Transforms/SubgroupReduceLowering.cpp
@@ -368,7 +368,7 @@ struct VectorSubgroupReduceToShuffles final
 };
 
 FailureOr<Value>
-createSubgroupDPPReduction(PatternRewriter &rewriter, gpu::SubgroupReduceOp &op,
+createSubgroupDPPReduction(PatternRewriter &rewriter, gpu::SubgroupReduceOp op,
                            Value input, gpu::AllReduceOperation mode,
                            const ClusterInfo &ci, amdgpu::Chipset chipset) {
   Location loc = op.getLoc();
@@ -435,7 +435,7 @@ createSubgroupDPPReduction(PatternRewriter &rewriter, gpu::SubgroupReduceOp &op,
       if (ci.subgroupSize == 32) {
         Value lane0 = rewriter.create<arith::ConstantOp>(
             loc, rewriter.getI32Type(), rewriter.getI32IntegerAttr(0));
-        dpp =
+        res =
             rewriter.create<ROCDL::ReadlaneOp>(loc, res.getType(), res, lane0);
       }
     } else {