iree-org
diff --git a/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_for_iree_ops.mlir‎
Lines changed: 2 additions & 2 deletions b/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_for_iree_ops.mlir‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx1100.mlir‎
Lines changed: 1 addition & 2 deletions b/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx1100.mlir‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx908.mlir‎
Lines changed: 1 addition & 2 deletions b/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx908.mlir‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx90a.mlir‎
Lines changed: 2 additions & 4 deletions b/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx90a.mlir‎
Lines changed: 2 additions & 4 deletions
diff --git a/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx942.mlir‎
Lines changed: 56 additions & 58 deletions b/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx942.mlir‎
Lines changed: 56 additions & 58 deletions
diff --git a/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx950.mlir‎
Lines changed: 15 additions & 15 deletions b/‎compiler/src/iree/compiler/Codegen/Common/test/materialize_encoding_gfx950.mlir‎
Lines changed: 15 additions & 15 deletions
@@ -316,14 +316,14 @@ func.func @matmul_lowering_f32f32f32_gfx942() attributes {
 //   CHECK-DAG:   %[[TILED_M:.+]] = affine.apply #[[$MAP0]]()[%[[M]]]
 //   CHECK-DAG:   %[[TILED_K:.+]] = affine.apply #[[$MAP1]]()[%[[K]]]
 //       CHECK:   %[[LHS_BINDING:.+]] = hal.interface.binding.subspan layout({{.+}}) binding(0)
-//  CHECK-SAME:       !iree_tensor_ext.dispatch.tensor<readonly:tensor<?x?x8x4x4x4x4xf32>>{%[[TILED_M]], %[[TILED_K]]}
+//  CHECK-SAME:       !iree_tensor_ext.dispatch.tensor<readonly:tensor<?x?x8x4x16x4xf32>>{%[[TILED_M]], %[[TILED_K]]}
 //       CHECK:   %[[TILED_N:.+]] = affine.apply #[[$MAP0]]()[%[[N]]]
 //       CHECK:   %[[RHS_BINDING:.+]] = hal.interface.binding.subspan layout({{.+}}) binding(1)
 //  CHECK-SAME:       !iree_tensor_ext.dispatch.tensor<readonly:tensor<?x?x4x2x4x16x4xf32>>{%[[TILED_N]], %[[TILED_K]]}
 //       CHECK:   %[[OUTS_BINDING:.+]] = hal.interface.binding.subspan layout({{.+}}) binding(2)
 //  CHECK-SAME:       !iree_tensor_ext.dispatch.tensor<readwrite:tensor<?x?x4x8x2x4x16x4xf32>>{%[[TILED_M]], %[[TILED_N]]}
 //       CHECK:   %[[LHS:.+]] = iree_tensor_ext.dispatch.tensor.load %[[LHS_BINDING]]
-//  CHECK-SAME:       offsets = [0, 0, 0, 0, 0, 0, 0], sizes = [%[[TILED_M]], %[[TILED_K]], 8, 4, 4, 4, 4], strides = [1, 1, 1, 1, 1, 1, 1]
+//  CHECK-SAME:       offsets = [0, 0, 0, 0, 0, 0], sizes = [%[[TILED_M]], %[[TILED_K]], 8, 4, 16, 4], strides = [1, 1, 1, 1, 1, 1]
 //       CHECK:   %[[RHS:.+]] = iree_tensor_ext.dispatch.tensor.load %[[RHS_BINDING]]
 //  CHECK-SAME:       offsets = [0, 0, 0, 0, 0, 0, 0], sizes = [%[[TILED_N]], %[[TILED_K]], 4, 2, 4, 16, 4], strides = [1, 1, 1, 1, 1, 1, 1]
 //       CHECK:   %[[OUTS:.+]] = iree_tensor_ext.dispatch.tensor.load %[[OUTS_BINDING]]
 
@@ -23,8 +23,7 @@ func.func @matmul_lowering_WMMAR3_F32_16x16x16_F16(
 // CHECK-DAG: #[[MAP1:.+]] = affine_map<(d0, d1, d2) -> (d1, d2)>
 // CHECK-DAG: #[[MAP2:.+]] = affine_map<(d0, d1, d2) -> (d0, d1)>
 // CHECK:     func.func @matmul_lowering_WMMAR3_F32_16x16x16_F16(
-// CHECK-SAME:   %[[LHS:.+]]: tensor<?x?x4x1x8x2x16xf16>
-// CHECK-SAME:   %[[RHS:.+]]: tensor<?x?x4x1x16x16xf16>
+// CHECK-SAME:   %[[LHS:.+]]: tensor<?x?x4x1x16x16xf16>, %[[RHS:.+]]: tensor<?x?x4x1x16x16xf16>
 // CHECK-SAME:   %[[ACC:.+]]: tensor<?x?x4x4x8x2x16xf32>
 // CHECK-SAME: ) -> tensor<?x?x4x4x8x2x16xf32>
 // CHECK:       %[[MMA:.+]] = iree_codegen.inner_tiled ins(%[[LHS]], %[[RHS]]) outs(%[[ACC]])
 
@@ -24,8 +24,7 @@ func.func @matmul_lowering_MFMA_i32_16x16x16_i8(
 // CHECK-DAG: #[[MAP1:.+]] = affine_map<(d0, d1, d2) -> (d1, d2)>
 // CHECK-DAG: #[[MAP2:.+]] = affine_map<(d0, d1, d2) -> (d0, d1)>
 // CHECK:     func.func @matmul_lowering_MFMA_i32_16x16x16_i8
-// CHECK-SAME:   %[[LHS:.+]]: tensor<?x?x4x4x4x4x4x4xi8>
-// CHECK-SAME:   %[[RHS:.+]]: tensor<?x?x4x2x4x16x4x4xi8>
+// CHECK-SAME:   %[[LHS:.+]]: tensor<?x?x4x4x16x4x4xi8>, %[[RHS:.+]]: tensor<?x?x4x2x4x16x4x4xi8>
 // CHECK-SAME:   %[[ACC:.+]]: tensor<?x?x4x4x2x4x16x4xi32>
 // CHECK:       %[[MMA:.+]] = iree_codegen.inner_tiled ins(%[[LHS]], %[[RHS]]) outs(%[[ACC]])
 // CHECK-SAME:    indexing_maps = [#[[MAP0]], #[[MAP1]], #[[MAP2]]],
 
@@ -24,8 +24,7 @@ func.func @matmul_lowering_MFMA_f32_16x16x8_bf16(
 // CHECK-DAG: #[[MAP1:.+]] = affine_map<(d0, d1, d2) -> (d1, d2)>
 // CHECK-DAG: #[[MAP2:.+]] = affine_map<(d0, d1, d2) -> (d0, d1)>
 // CHECK:     func.func @matmul_lowering_MFMA_f32_16x16x8_bf16(
-// CHECK-SAME:   %[[LHS:.+]]: tensor<?x?x4x4x4x4x4x2xbf16>
-// CHECK-SAME:   %[[RHS:.+]]: tensor<?x?x4x2x4x16x4x2xbf16>
+// CHECK-SAME:   %[[LHS:.+]]: tensor<?x?x4x4x16x4x2xbf16>, %[[RHS:.+]]: tensor<?x?x4x2x4x16x4x2xbf16>
 // CHECK-SAME:   %[[ACC:.+]]: tensor<?x?x4x4x2x4x16x4xf32>
 // CHECK-SAME: ) -> tensor<?x?x4x4x2x4x16x4xf32>
 // CHECK:       %[[MMA:.+]] = iree_codegen.inner_tiled ins(%[[LHS]], %[[RHS]]) outs(%[[ACC]])
@@ -58,8 +57,7 @@ func.func @matmul_lowering_MFMA_f64_16x16x4_f64(
 // CHECK-DAG: #[[MAP1:.+]] = affine_map<(d0, d1, d2) -> (d1, d2)>
 // CHECK-DAG: #[[MAP2:.+]] = affine_map<(d0, d1, d2) -> (d0, d1)>
 // CHECK:     func.func @matmul_lowering_MFMA_f64_16x16x4_f64(
-// CHECK-SAME:     %[[LHS:.+]]: tensor<?x?x4x4x4x4x2xf64>
-// CHECK-SAME:     %[[RHS:.+]]: tensor<?x?x4x4x16x2xf64>
+// CHECK-SAME:     %[[LHS:.+]]: tensor<?x?x4x4x16x2xf64>, %[[RHS:.+]]: tensor<?x?x4x4x16x2xf64>
 // CHECK-SAME:     %[[ACC:.+]]: tensor<?x?x4x4x4x4x16xf64>
 // CHECK-SAME:   ) -> tensor<?x?x4x4x4x4x16xf64>
 // CHECK:       %[[MMA:.+]] = iree_codegen.inner_tiled ins(%[[LHS]], %[[RHS]]) outs(%[[ACC]])
 
@@ -28,9 +28,9 @@ func.func @set_encoding_LHS_unroll8x8x2_MFMA_I32_16x16x64_I8(
 // CHECK:         %[[EXPAND:.*]] = tensor.expand_shape %[[PACK]]
 // CHECK-SAME       : tensor<2x9x128x64xi8> into tensor<2x9x4x8x4x4x16xi8>
 // CHECK:         %[[TRANSPOSE:.*]] = linalg.transpose
-// CHECK-SAME:       ins(%[[EXPAND]] : tensor<2x9x4x8x4x4x16xi8>)
-// CHECK-SAME:       outs({{.*}} : tensor<2x9x8x4x4x4x16xi8>)
-// CHECK-SAME:       permutation = [0, 1, 3, 5, 2, 4, 6]
+// CHECK-SAME:       ins(%[[EXPAND]] : tensor<2x9x8x16x4x16xi8>)
+// CHECK-SAME:       outs({{.*}} : tensor<2x9x8x4x16x16xi8>)
+// CHECK-SAME:       permutation = [0, 1, 2, 4, 3, 5]
 // CHECK:         return %[[TRANSPOSE]]
 
 // -----
@@ -53,11 +53,11 @@ func.func @set_encoding_RHS_unroll8x8x2_MFMA_I32_16x16x64_I8(
 // CHECK-SAME:      inner_tiles = [128, 64]
 // CHECK-SAME:      : tensor<255x513xi8> -> tensor<5x4x128x64xi8>
 // CHECK:         %[[EXPAND:.*]] = tensor.expand_shape %[[PACK]]
-// CHECK-SAME:      : tensor<5x4x128x64xi8> into tensor<5x4x4x16x2x4x16xi8>
+// CHECK-SAME:      : tensor<5x4x128x64xi8> into tensor<5x4x4x2x16x4x16xi8>
 // CHECK:         %[[TRANSPOSE:.*]] = linalg.transpose
-// CHECK-SAME:      ins(%[[EXPAND]] : tensor<5x4x4x16x2x4x16xi8>)
+// CHECK-SAME:      ins(%[[EXPAND]] : tensor<5x4x4x2x16x4x16xi8>)
 // CHECK-SAME:      outs({{.*}} : tensor<5x4x4x2x4x16x16xi8>)
-// CHECK-SAME:      permutation = [0, 1, 2, 4, 5, 3, 6]
+// CHECK-SAME:      permutation = [0, 1, 2, 3, 5, 4, 6]
 // CHECK:         return %[[TRANSPOSE]]
 
 // -----
@@ -80,11 +80,11 @@ func.func @set_encoding_ACC_unroll8x8x2_MFMA_I32_16x16x64_I8(
 // CHECK-SAME:      inner_tiles = [128, 128]
 // CHECK-SAME:      : tensor<255x513xi32> -> tensor<2x5x128x128xi32>
 // CHECK:         %[[EXPAND:.*]] = tensor.expand_shape %[[PACK]]
-// CHECK-SAME:      : tensor<2x5x128x128xi32> into tensor<2x5x4x8x4x4x16x2xi32>
+// CHECK-SAME:      : tensor<2x5x128x128xi32> into tensor<2x5x8x4x4x4x2x16xi32>
 // CHECK:         %[[TRANSPOSE:.*]] = linalg.transpose
-// CHECK-SAME:      ins(%[[EXPAND]] : tensor<2x5x4x8x4x4x16x2xi32>)
+// CHECK-SAME:      ins(%[[EXPAND]] : tensor<2x5x8x4x4x4x2x16xi32>)
 // CHECK-SAME:      outs({{.*}} : tensor<2x5x4x8x2x4x16x4xi32>)
-// CHECK-SAME:      permutation = [0, 1, 5, 3, 7, 2, 6, 4]
+// CHECK-SAME:      permutation = [0, 1, 5, 2, 6, 3, 7, 4]
 // CHECK:         return %[[TRANSPOSE]]
 
 // -----
@@ -103,10 +103,10 @@ func.func @unset_encoding_ACC_unroll8x8x2_MFMA_I32_16x16x64_I8(
 // CHECK-SAME:    %[[ARG0:[a-zA-Z0-9]+]]
 // CHECK:         %[[TRANSPOSE:.*]] = linalg.transpose
 // CHECK-SAME:       ins(%[[ARG0]] : tensor<2x5x4x8x2x4x16x4xi32>)
-// CHECK-SAME:       outs({{.*}} : tensor<2x5x4x8x4x4x16x2xi32>)
-// CHECK-SAME:       permutation = [0, 1, 5, 3, 7, 2, 6, 4]
+// CHECK-SAME:       outs({{.*}} : tensor<2x5x8x4x4x4x2x16xi32>)
+// CHECK-SAME:       permutation = [0, 1, 3, 5, 7, 2, 4, 6]
 // CHECK:         %[[COLLAPSE:.*]] = tensor.collapse_shape %[[TRANSPOSE]]
-// CHECK-SAME:      : tensor<2x5x4x8x4x4x16x2xi32> into tensor<2x5x128x128xi32>
+// CHECK-SAME:      : tensor<2x5x8x4x4x4x2x16xi32> into tensor<2x5x128x128xi32>
 // CHECK:         %[[UNPACK:.*]] = linalg.unpack %[[COLLAPSE]]
 // CHECK-SAME:      outer_dims_perm = [0, 1]
 // CHECK-SAME:      inner_dims_pos = [0, 1]
@@ -139,7 +139,7 @@ func.func @matmul_lowering_MFMA_I32_16x16x64_I8(
 // CHECK-DAG: #[[MAP1:.+]] = affine_map<(d0, d1, d2) -> (d1, d2)>
 // CHECK-DAG: #[[MAP2:.+]] = affine_map<(d0, d1, d2) -> (d0, d1)>
 // CHECK:     func.func @matmul_lowering_MFMA_I32_16x16x64_I8(
-// CHECK-SAME:    %[[ARG0:[a-zA-Z0-9]+]]: tensor<?x?x8x4x4x4x16xi8>
+// CHECK-SAME:    %[[ARG0:[a-zA-Z0-9]+]]: tensor<?x?x8x4x16x16xi8>
 // CHECK-SAME:    %[[ARG1:[a-zA-Z0-9]+]]: tensor<?x?x4x2x4x16x16xi8>
 // CHECK-SAME:    %[[ARG2:[a-zA-Z0-9]+]]: tensor<?x?x4x8x2x4x16x4xi32>
 // CHECK-SAME:   ) -> tensor<?x?x4x8x2x4x16x4xi32>
@@ -178,7 +178,7 @@ func.func @batch_matmul_lowering_MFMA_F32_16x16x128_F8E4M3FN(
 // CHECK-DAG: #[[MAP1:.+]] = affine_map<(d0, d1, d2, d3) -> (d0, d2, d3)>
 // CHECK-DAG: #[[MAP2:.+]] = affine_map<(d0, d1, d2, d3) -> (d0, d1, d2)>
 // CHECK:     func.func @batch_matmul_lowering_MFMA_F32_16x16x128_F8E4M3FN(
-// CHECK-SAME:    %[[ARG0:[a-zA-Z0-9]+]]: tensor<?x?x?x8x4x4x4x32xf8E4M3FN>
+// CHECK-SAME:    %[[ARG0:[a-zA-Z0-9]+]]: tensor<?x?x?x8x4x16x32xf8E4M3FN>
 // CHECK-SAME:    %[[ARG1:[a-zA-Z0-9]+]]: tensor<?x?x?x4x2x4x16x32xf8E4M3FN>
 // CHECK-SAME:    %[[ARG2:[a-zA-Z0-9]+]]: tensor<?x?x?x4x8x2x4x16x4xf32>
 // CHECK-SAME:   ) -> tensor<?x?x?x4x8x2x4x16x4xf32>
@@ -213,7 +213,7 @@ func.func @batch_matmul_lowering_MFMA_F32_16x16x32_BF16(
 // CHECK-DAG: #[[MAP1:.+]] = affine_map<(d0, d1, d2, d3) -> (d0, d2, d3)>
 // CHECK-DAG: #[[MAP2:.+]] = affine_map<(d0, d1, d2, d3) -> (d0, d1, d2)>
 // CHECK:     func.func @batch_matmul_lowering_MFMA_F32_16x16x32_BF16(
-// CHECK-SAME:    %[[ARG0:[a-zA-Z0-9]+]]: tensor<?x?x?x8x4x4x4x8xbf16>
+// CHECK-SAME:    %[[ARG0:[a-zA-Z0-9]+]]: tensor<?x?x?x8x4x16x8xbf16>
 // CHECK-SAME:    %[[ARG1:[a-zA-Z0-9]+]]: tensor<?x?x?x4x2x4x16x8xbf16>
 // CHECK-SAME:    %[[ARG2:[a-zA-Z0-9]+]]: tensor<?x?x?x4x8x2x4x16x4xf32>
 // CHECK-SAME:   ) -> tensor<?x?x?x4x8x2x4x16x4xf32>