@@ -731,10 +731,10 @@ define amdgpu_kernel void @test_mfma_f64_4x4x4f64(ptr addrspace(1) %arg, double
731731; GFX90A-VGPR-NEXT: s_nop 1
732732; GFX90A-VGPR-NEXT: v_mfma_f64_4x4x4f64 v[0:1], v[2:3], v[4:5], 0
733733; GFX90A-VGPR-NEXT: s_nop 3
734- ; GFX90A-VGPR-NEXT: v_mfma_f64_4x4x4f64 v[0:1 ], v[2:3], v[4:5], v[0:1] cbsz:1 abid:2 blgp:3
735- ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v2 , 0
734+ ; GFX90A-VGPR-NEXT: v_mfma_f64_4x4x4f64 v[2:3 ], v[2:3], v[4:5], v[0:1] cbsz:1 abid:2 blgp:3
735+ ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v4 , 0
736736; GFX90A-VGPR-NEXT: s_nop 7
737- ; GFX90A-VGPR-NEXT: global_store_dwordx2 v2 , v[0:1 ], s[0:1]
737+ ; GFX90A-VGPR-NEXT: global_store_dwordx2 v4 , v[2:3 ], s[0:1]
738738; GFX90A-VGPR-NEXT: s_endpgm
739739;
740740; GFX942-VGPR-LABEL: test_mfma_f64_4x4x4f64:
@@ -747,10 +747,10 @@ define amdgpu_kernel void @test_mfma_f64_4x4x4f64(ptr addrspace(1) %arg, double
747747; GFX942-VGPR-NEXT: s_nop 1
748748; GFX942-VGPR-NEXT: v_mfma_f64_4x4x4_4b_f64 v[0:1], v[2:3], v[4:5], 0
749749; GFX942-VGPR-NEXT: s_nop 3
750- ; GFX942-VGPR-NEXT: v_mfma_f64_4x4x4_4b_f64 v[0:1 ], v[2:3], v[4:5], v[0:1] cbsz:1 abid:2 neg:[1,1,0]
751- ; GFX942-VGPR-NEXT: v_mov_b32_e32 v2 , 0
750+ ; GFX942-VGPR-NEXT: v_mfma_f64_4x4x4_4b_f64 v[2:3 ], v[2:3], v[4:5], v[0:1] cbsz:1 abid:2 neg:[1,1,0]
751+ ; GFX942-VGPR-NEXT: v_mov_b32_e32 v4 , 0
752752; GFX942-VGPR-NEXT: s_nop 7
753- ; GFX942-VGPR-NEXT: global_store_dwordx2 v2 , v[0:1 ], s[0:1]
753+ ; GFX942-VGPR-NEXT: global_store_dwordx2 v4 , v[2:3 ], s[0:1]
754754; GFX942-VGPR-NEXT: s_endpgm
755755bb:
756756 %mai.1 = tail call double @llvm.amdgcn.mfma.f64.4x4x4f64 (double %a , double %b , double 0 .0 , i32 0 , i32 0 , i32 0 )
@@ -1629,20 +1629,20 @@ define amdgpu_kernel void @test_mfma_f64_16x16x4f64_imm(ptr addrspace(1) %arg, d
16291629; GFX90A-VGPR-NEXT: v_mov_b32_e32 v7, 0x3ff00000
16301630; GFX90A-VGPR-NEXT: v_mov_b32_e32 v6, v0
16311631; GFX90A-VGPR-NEXT: s_waitcnt lgkmcnt(0)
1632- ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v10, s2
1633- ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v11, s3
1632+ ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v16, s2
1633+ ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v17, s3
1634+ ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v1, v0
1635+ ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v2, v0
16341636; GFX90A-VGPR-NEXT: v_mov_b32_e32 v3, v0
16351637; GFX90A-VGPR-NEXT: v_mov_b32_e32 v4, v0
16361638; GFX90A-VGPR-NEXT: v_mov_b32_e32 v5, v0
1637- ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v6, v0
1638- ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v1, v0
1639- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[8:9], v[6:7], v[6:7] op_sel:[0,1]
1640- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[12:13], s[6:7], s[6:7] op_sel:[0,1]
1641- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[6:7], v[4:5], v[4:5] op_sel:[0,1]
1642- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[4:5], v[2:3], v[2:3] op_sel:[0,1]
1643- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[2:3], v[0:1], v[0:1] op_sel:[0,1]
1639+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[14:15], v[6:7], v[6:7] op_sel:[0,1]
1640+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[18:19], s[6:7], s[6:7] op_sel:[0,1]
1641+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[12:13], v[4:5], v[4:5] op_sel:[0,1]
1642+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[10:11], v[2:3], v[2:3] op_sel:[0,1]
1643+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[8:9], v[0:1], v[0:1] op_sel:[0,1]
16441644; GFX90A-VGPR-NEXT: s_nop 1
1645- ; GFX90A-VGPR-NEXT: v_mfma_f64_16x16x4f64 v[2:9 ], v[10:11 ], v[12:13 ], v[2:9 ]
1645+ ; GFX90A-VGPR-NEXT: v_mfma_f64_16x16x4f64 v[8:15 ], v[16:17 ], v[18:19 ], v[8:15 ]
16461646; GFX90A-VGPR-NEXT: s_nop 15
16471647; GFX90A-VGPR-NEXT: s_nop 1
16481648; GFX90A-VGPR-NEXT: global_store_dwordx4 v0, v[12:15], s[0:1] offset:16
@@ -1657,20 +1657,20 @@ define amdgpu_kernel void @test_mfma_f64_16x16x4f64_imm(ptr addrspace(1) %arg, d
16571657; GFX942-VGPR-NEXT: v_mov_b32_e32 v7, 0x3ff00000
16581658; GFX942-VGPR-NEXT: v_mov_b32_e32 v6, v0
16591659; GFX942-VGPR-NEXT: s_waitcnt lgkmcnt(0)
1660- ; GFX942-VGPR-NEXT: v_mov_b32_e32 v10, s2
1661- ; GFX942-VGPR-NEXT: v_mov_b32_e32 v11, s3
1660+ ; GFX942-VGPR-NEXT: v_mov_b32_e32 v16, s2
1661+ ; GFX942-VGPR-NEXT: v_mov_b32_e32 v17, s3
1662+ ; GFX942-VGPR-NEXT: v_mov_b32_e32 v1, v0
1663+ ; GFX942-VGPR-NEXT: v_mov_b32_e32 v2, v0
16621664; GFX942-VGPR-NEXT: v_mov_b32_e32 v3, v0
16631665; GFX942-VGPR-NEXT: v_mov_b32_e32 v4, v0
16641666; GFX942-VGPR-NEXT: v_mov_b32_e32 v5, v0
1665- ; GFX942-VGPR-NEXT: v_mov_b32_e32 v6, v0
1666- ; GFX942-VGPR-NEXT: v_mov_b32_e32 v1, v0
1667- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[8:9], v[6:7]
1668- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[12:13], s[6:7]
1669- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[6:7], v[4:5]
1670- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[4:5], v[2:3]
1671- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[2:3], v[0:1]
1667+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[14:15], v[6:7]
1668+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[18:19], s[6:7]
1669+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[12:13], v[4:5]
1670+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[10:11], v[2:3]
1671+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[8:9], v[0:1]
16721672; GFX942-VGPR-NEXT: s_nop 1
1673- ; GFX942-VGPR-NEXT: v_mfma_f64_16x16x4_f64 v[2:9 ], v[10:11 ], v[12:13 ], v[2:9 ]
1673+ ; GFX942-VGPR-NEXT: v_mfma_f64_16x16x4_f64 v[8:15 ], v[16:17 ], v[18:19 ], v[8:15 ]
16741674; GFX942-VGPR-NEXT: s_nop 15
16751675; GFX942-VGPR-NEXT: s_nop 1
16761676; GFX942-VGPR-NEXT: global_store_dwordx4 v0, v[12:15], s[0:1] offset:16
@@ -1743,20 +1743,20 @@ define amdgpu_kernel void @test_mfma_f64_16x16x4f64_splat_lit(ptr addrspace(1) %
17431743; GFX90A-VGPR-NEXT: v_mov_b32_e32 v1, 0x405ec000
17441744; GFX90A-VGPR-NEXT: v_mov_b32_e32 v6, v0
17451745; GFX90A-VGPR-NEXT: s_waitcnt lgkmcnt(0)
1746- ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v10, s2
1747- ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v11, s3
1746+ ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v16, s2
1747+ ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v17, s3
1748+ ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v7, v1
1749+ ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v2, v0
17481750; GFX90A-VGPR-NEXT: v_mov_b32_e32 v3, v1
17491751; GFX90A-VGPR-NEXT: v_mov_b32_e32 v4, v0
17501752; GFX90A-VGPR-NEXT: v_mov_b32_e32 v5, v1
1751- ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v6, v0
1752- ; GFX90A-VGPR-NEXT: v_mov_b32_e32 v7, v1
1753- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[8:9], v[6:7], v[6:7] op_sel:[0,1]
1754- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[12:13], s[6:7], s[6:7] op_sel:[0,1]
1755- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[6:7], v[4:5], v[4:5] op_sel:[0,1]
1756- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[4:5], v[2:3], v[2:3] op_sel:[0,1]
1757- ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[2:3], v[0:1], v[0:1] op_sel:[0,1]
1753+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[14:15], v[6:7], v[6:7] op_sel:[0,1]
1754+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[18:19], s[6:7], s[6:7] op_sel:[0,1]
1755+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[12:13], v[4:5], v[4:5] op_sel:[0,1]
1756+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[10:11], v[2:3], v[2:3] op_sel:[0,1]
1757+ ; GFX90A-VGPR-NEXT: v_pk_mov_b32 v[8:9], v[0:1], v[0:1] op_sel:[0,1]
17581758; GFX90A-VGPR-NEXT: s_nop 1
1759- ; GFX90A-VGPR-NEXT: v_mfma_f64_16x16x4f64 v[2:9 ], v[10:11 ], v[12:13 ], v[2:9 ]
1759+ ; GFX90A-VGPR-NEXT: v_mfma_f64_16x16x4f64 v[8:15 ], v[16:17 ], v[18:19 ], v[8:15 ]
17601760; GFX90A-VGPR-NEXT: s_nop 15
17611761; GFX90A-VGPR-NEXT: s_nop 1
17621762; GFX90A-VGPR-NEXT: global_store_dwordx4 v0, v[12:15], s[0:1] offset:16
@@ -1771,20 +1771,20 @@ define amdgpu_kernel void @test_mfma_f64_16x16x4f64_splat_lit(ptr addrspace(1) %
17711771; GFX942-VGPR-NEXT: v_mov_b32_e32 v1, 0x405ec000
17721772; GFX942-VGPR-NEXT: v_mov_b32_e32 v6, v0
17731773; GFX942-VGPR-NEXT: s_waitcnt lgkmcnt(0)
1774- ; GFX942-VGPR-NEXT: v_mov_b32_e32 v10, s2
1775- ; GFX942-VGPR-NEXT: v_mov_b32_e32 v11, s3
1774+ ; GFX942-VGPR-NEXT: v_mov_b32_e32 v16, s2
1775+ ; GFX942-VGPR-NEXT: v_mov_b32_e32 v17, s3
1776+ ; GFX942-VGPR-NEXT: v_mov_b32_e32 v7, v1
1777+ ; GFX942-VGPR-NEXT: v_mov_b32_e32 v2, v0
17761778; GFX942-VGPR-NEXT: v_mov_b32_e32 v3, v1
17771779; GFX942-VGPR-NEXT: v_mov_b32_e32 v4, v0
17781780; GFX942-VGPR-NEXT: v_mov_b32_e32 v5, v1
1779- ; GFX942-VGPR-NEXT: v_mov_b32_e32 v6, v0
1780- ; GFX942-VGPR-NEXT: v_mov_b32_e32 v7, v1
1781- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[8:9], v[6:7]
1782- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[12:13], s[6:7]
1783- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[6:7], v[4:5]
1784- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[4:5], v[2:3]
1785- ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[2:3], v[0:1]
1781+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[14:15], v[6:7]
1782+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[18:19], s[6:7]
1783+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[12:13], v[4:5]
1784+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[10:11], v[2:3]
1785+ ; GFX942-VGPR-NEXT: v_mov_b64_e32 v[8:9], v[0:1]
17861786; GFX942-VGPR-NEXT: s_nop 1
1787- ; GFX942-VGPR-NEXT: v_mfma_f64_16x16x4_f64 v[2:9 ], v[10:11 ], v[12:13 ], v[2:9 ]
1787+ ; GFX942-VGPR-NEXT: v_mfma_f64_16x16x4_f64 v[8:15 ], v[16:17 ], v[18:19 ], v[8:15 ]
17881788; GFX942-VGPR-NEXT: s_nop 15
17891789; GFX942-VGPR-NEXT: s_nop 1
17901790; GFX942-VGPR-NEXT: global_store_dwordx4 v0, v[12:15], s[0:1] offset:16
0 commit comments