[NVPTX] fix type propagation when expanding Store[V4 -> V8] #151576

Prince781 · 2025-07-31T18:56:30Z

This was an edge case we missed. Propagate the correct type when expanding a StoreV4 x <2 x float> to StoreV8 x float.

llvmbot · 2025-07-31T18:56:53Z

@llvm/pr-subscribers-backend-nvptx

Author: Princeton Ferro (Prince781)

Changes

This was an edge case we missed. Propagate the correct type when expanding a StoreV4 x <2 x float> to StoreV8 x float.

Full diff: https://github.com/llvm/llvm-project/pull/151576.diff

2 Files Affected:

(modified) llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp (+4-8)
(added) llvm/test/CodeGen/NVPTX/fold-movs.ll (+38)

diff --git a/llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp b/llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp
index 4fd362303b6e5..65d1be3a3847d 100644
--- a/llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp
+++ b/llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp
@@ -4917,7 +4917,6 @@ combineUnpackingMovIntoLoad(SDNode *N, TargetLowering::DAGCombinerInfo &DCI) {
     return SDValue();
 
   auto *LD = cast<MemSDNode>(N);
-  EVT MemVT = LD->getMemoryVT();
   SDLoc DL(LD);
 
   // the new opcode after we double the number of operands
@@ -4958,9 +4957,9 @@ combineUnpackingMovIntoLoad(SDNode *N, TargetLowering::DAGCombinerInfo &DCI) {
   NewVTs.append(LD->value_begin() + OldNumOutputs, LD->value_end());
 
   // Create the new load
-  SDValue NewLoad =
-      DCI.DAG.getMemIntrinsicNode(Opcode, DL, DCI.DAG.getVTList(NewVTs),
-                                  Operands, MemVT, LD->getMemOperand());
+  SDValue NewLoad = DCI.DAG.getMemIntrinsicNode(
+      Opcode, DL, DCI.DAG.getVTList(NewVTs), Operands, LD->getMemoryVT(),
+      LD->getMemOperand());
 
   // Now we use a combination of BUILD_VECTORs and a MERGE_VALUES node to keep
   // the outputs the same. These nodes will be optimized away in later
@@ -5002,7 +5001,6 @@ static SDValue combinePackingMovIntoStore(SDNode *N,
     return SDValue();
 
   auto *ST = cast<MemSDNode>(N);
-  EVT MemVT = ElementVT.getVectorElementType();
 
   // The new opcode after we double the number of operands.
   NVPTXISD::NodeType Opcode;
@@ -5011,11 +5009,9 @@ static SDValue combinePackingMovIntoStore(SDNode *N,
     // Any packed type is legal, so the legalizer will not have lowered
     // ISD::STORE -> NVPTXISD::Store (unless it's under-aligned). We have to do
     // it here.
-    MemVT = ST->getMemoryVT();
     Opcode = NVPTXISD::StoreV2;
     break;
   case NVPTXISD::StoreV2:
-    MemVT = ST->getMemoryVT();
     Opcode = NVPTXISD::StoreV4;
     break;
   case NVPTXISD::StoreV4:
@@ -5066,7 +5062,7 @@ static SDValue combinePackingMovIntoStore(SDNode *N,
 
   // Now we replace the store
   return DCI.DAG.getMemIntrinsicNode(Opcode, SDLoc(N), N->getVTList(), Operands,
-                                     MemVT, ST->getMemOperand());
+                                     ST->getMemoryVT(), ST->getMemOperand());
 }
 
 static SDValue PerformStoreCombine(SDNode *N,
diff --git a/llvm/test/CodeGen/NVPTX/fold-movs.ll b/llvm/test/CodeGen/NVPTX/fold-movs.ll
new file mode 100644
index 0000000000000..b5f62c0c97e4c
--- /dev/null
+++ b/llvm/test/CodeGen/NVPTX/fold-movs.ll
@@ -0,0 +1,38 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
+; RUN: llc < %s -mcpu=sm_100 -mattr=+ptx88 -O3 -disable-post-ra               \
+; RUN: -frame-pointer=all -verify-machineinstrs                               \
+; RUN: | FileCheck --check-prefixes=CHECK-F32X2
+; RUN: %if ptxas-12.7 %{                                                      \
+; RUN:  llc < %s -mcpu=sm_100 -mattr=+ptx88 -O3 -disable-post-ra              \
+; RUN:  -frame-pointer=all -verify-machineinstrs | %ptxas-verify -arch=sm_100 \
+; RUN: %}
+target triple = "nvptx64-nvidia-cuda"
+
+; Since fdiv doesn't support f32x2, this will create BUILD_VECTORs that will be
+; folded into the store, turning it into st.global.v8.b32.
+define void @writevec(<8 x float> %v1, <8 x float> %v2, ptr addrspace(1) %p) {
+; CHECK-F32X2-LABEL: writevec(
+; CHECK-F32X2:       {
+; CHECK-F32X2-NEXT:    .reg .b32 %r<25>;
+; CHECK-F32X2-NEXT:    .reg .b64 %rd<2>;
+; CHECK-F32X2-EMPTY:
+; CHECK-F32X2-NEXT:  // %bb.0:
+; CHECK-F32X2-NEXT:    ld.param.v4.b32 {%r1, %r2, %r3, %r4}, [writevec_param_0];
+; CHECK-F32X2-NEXT:    ld.param.v4.b32 {%r5, %r6, %r7, %r8}, [writevec_param_0+16];
+; CHECK-F32X2-NEXT:    ld.param.v4.b32 {%r9, %r10, %r11, %r12}, [writevec_param_1+16];
+; CHECK-F32X2-NEXT:    div.rn.f32 %r13, %r8, %r12;
+; CHECK-F32X2-NEXT:    div.rn.f32 %r14, %r7, %r11;
+; CHECK-F32X2-NEXT:    div.rn.f32 %r15, %r6, %r10;
+; CHECK-F32X2-NEXT:    div.rn.f32 %r16, %r5, %r9;
+; CHECK-F32X2-NEXT:    ld.param.v4.b32 {%r17, %r18, %r19, %r20}, [writevec_param_1];
+; CHECK-F32X2-NEXT:    div.rn.f32 %r21, %r4, %r20;
+; CHECK-F32X2-NEXT:    div.rn.f32 %r22, %r3, %r19;
+; CHECK-F32X2-NEXT:    div.rn.f32 %r23, %r2, %r18;
+; CHECK-F32X2-NEXT:    div.rn.f32 %r24, %r1, %r17;
+; CHECK-F32X2-NEXT:    ld.param.b64 %rd1, [writevec_param_2];
+; CHECK-F32X2-NEXT:    st.global.v8.b32 [%rd1], {%r24, %r23, %r22, %r21, %r16, %r15, %r14, %r13};
+; CHECK-F32X2-NEXT:    ret;
+  %v = fdiv <8 x float> %v1, %v2
+  store <8 x float> %v, ptr addrspace(1) %p, align 32
+  ret void
+}

AlexMaclean

Looks reasonable to me.

Propagate the correct type when expanding a StoreV4 x <2 x float> to StoreV8 x float.

llvm-ci · 2025-08-01T00:11:44Z

LLVM Buildbot has detected a new failure on builder fuchsia-x86_64-linux running on fuchsia-debian-64-us-central1-a-1 while building llvm at step 4 "annotate".

Full details are available at: https://lab.llvm.org/buildbot/#/builders/11/builds/20836

Here is the relevant piece of the build log for the reference

Step 4 (annotate) failure: 'python ../llvm-zorg/zorg/buildbot/builders/annotated/fuchsia-linux.py ...' (failure)
...
[678/1396] Building CXX object unittests/ADT/CMakeFiles/ADTTests.dir/EquivalenceClassesTest.cpp.o
[679/1396] Building CXX object unittests/ADT/CMakeFiles/ADTTests.dir/ImmutableListTest.cpp.o
[680/1396] Linking CXX executable bin/yaml2obj
[680/1396] Running lld test suite
llvm-lit: /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/llvm/utils/lit/lit/llvm/config.py:520: note: using ld.lld: /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/ld.lld
llvm-lit: /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/llvm/utils/lit/lit/llvm/config.py:520: note: using lld-link: /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/lld-link
llvm-lit: /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/llvm/utils/lit/lit/llvm/config.py:520: note: using ld64.lld: /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/ld64.lld
llvm-lit: /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/llvm/utils/lit/lit/llvm/config.py:520: note: using wasm-ld: /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/wasm-ld
-- Testing: 3128 tests, 60 workers --
Testing:  0..
FAIL: lld :: COFF/import_weak_alias.test (269 of 3128)
******************** TEST 'lld :: COFF/import_weak_alias.test' FAILED ********************
Exit Code: 139

Command Output (stderr):
--
split-file /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/lld/test/COFF/import_weak_alias.test /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir # RUN: at line 3
+ split-file /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/lld/test/COFF/import_weak_alias.test /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir
/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/llvm-mc --filetype=obj -triple=x86_64-windows-msvc /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir/foo.s -o /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj # RUN: at line 4
+ /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/llvm-mc --filetype=obj -triple=x86_64-windows-msvc /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir/foo.s -o /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj
/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/llvm-mc --filetype=obj -triple=x86_64-windows-msvc /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir/qux.s -o /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj # RUN: at line 5
+ /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/llvm-mc --filetype=obj -triple=x86_64-windows-msvc /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir/qux.s -o /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj
/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/lld-link /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj -out:/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dll -dll # RUN: at line 6
+ /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/lld-link /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj -out:/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dll -dll
/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.script: line 4: 851141 Segmentation fault      (core dumped) /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/lld-link /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj -out:/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dll -dll

--

********************
Testing:  0.. 10.. 20.. 30.. 40.. 50.. 60.. 70.. 80.. 90.. 
********************
Failed Tests (1):
  lld :: COFF/import_weak_alias.test


Testing Time: 24.97s

Total Discovered Tests: 3128
  Unsupported:  567 (18.13%)
  Passed     : 2560 (81.84%)
  Failed     :    1 (0.03%)
[826/1396] Building CXX object unittests/CodeGen/CMakeFiles/CodeGenTests.dir/TypeTraitsTest.cpp.o
FAILED: tools/lld/test/CMakeFiles/check-lld /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/CMakeFiles/check-lld 
cd /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test && /usr/bin/python3.10 /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/./bin/llvm-lit -sv /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test
[828/1396] Building CXX object unittests/DebugInfo/CodeView/CMakeFiles/DebugInfoCodeViewTests.dir/TypeHashingTest.cpp.o
[829/1396] Building CXX object unittests/CodeGen/CGPluginTest/CMakeFiles/CGPluginTest.dir/Plugin/CodeGenTestPass.cpp.o
[830/1396] Building CXX object unittests/CodeGen/CMakeFiles/CodeGenTests.dir/GCMetadata.cpp.o
[831/1396] Building CXX object unittests/ADT/CMakeFiles/ADTTests.dir/STLExtrasTest.cpp.o
[832/1396] Building CXX object unittests/ADT/CMakeFiles/ADTTests.dir/APFloatTest.cpp.o
Step 7 (check) failure: check (failure)
...
[678/1396] Building CXX object unittests/ADT/CMakeFiles/ADTTests.dir/EquivalenceClassesTest.cpp.o
[679/1396] Building CXX object unittests/ADT/CMakeFiles/ADTTests.dir/ImmutableListTest.cpp.o
[680/1396] Linking CXX executable bin/yaml2obj
[680/1396] Running lld test suite
llvm-lit: /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/llvm/utils/lit/lit/llvm/config.py:520: note: using ld.lld: /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/ld.lld
llvm-lit: /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/llvm/utils/lit/lit/llvm/config.py:520: note: using lld-link: /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/lld-link
llvm-lit: /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/llvm/utils/lit/lit/llvm/config.py:520: note: using ld64.lld: /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/ld64.lld
llvm-lit: /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/llvm/utils/lit/lit/llvm/config.py:520: note: using wasm-ld: /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/wasm-ld
-- Testing: 3128 tests, 60 workers --
Testing:  0..
FAIL: lld :: COFF/import_weak_alias.test (269 of 3128)
******************** TEST 'lld :: COFF/import_weak_alias.test' FAILED ********************
Exit Code: 139

Command Output (stderr):
--
split-file /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/lld/test/COFF/import_weak_alias.test /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir # RUN: at line 3
+ split-file /var/lib/buildbot/fuchsia-x86_64-linux/llvm-project/lld/test/COFF/import_weak_alias.test /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir
/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/llvm-mc --filetype=obj -triple=x86_64-windows-msvc /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir/foo.s -o /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj # RUN: at line 4
+ /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/llvm-mc --filetype=obj -triple=x86_64-windows-msvc /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir/foo.s -o /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj
/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/llvm-mc --filetype=obj -triple=x86_64-windows-msvc /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir/qux.s -o /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj # RUN: at line 5
+ /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/llvm-mc --filetype=obj -triple=x86_64-windows-msvc /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dir/qux.s -o /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj
/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/lld-link /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj -out:/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dll -dll # RUN: at line 6
+ /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/lld-link /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj -out:/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dll -dll
/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.script: line 4: 851141 Segmentation fault      (core dumped) /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/bin/lld-link /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.qux.obj /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.foo.obj -out:/var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/COFF/Output/import_weak_alias.test.tmp.dll -dll

--

********************
Testing:  0.. 10.. 20.. 30.. 40.. 50.. 60.. 70.. 80.. 90.. 
********************
Failed Tests (1):
  lld :: COFF/import_weak_alias.test


Testing Time: 24.97s

Total Discovered Tests: 3128
  Unsupported:  567 (18.13%)
  Passed     : 2560 (81.84%)
  Failed     :    1 (0.03%)
[826/1396] Building CXX object unittests/CodeGen/CMakeFiles/CodeGenTests.dir/TypeTraitsTest.cpp.o
FAILED: tools/lld/test/CMakeFiles/check-lld /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test/CMakeFiles/check-lld 
cd /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test && /usr/bin/python3.10 /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/./bin/llvm-lit -sv /var/lib/buildbot/fuchsia-x86_64-linux/build/llvm-build-s0y78244/tools/lld/test
[828/1396] Building CXX object unittests/DebugInfo/CodeView/CMakeFiles/DebugInfoCodeViewTests.dir/TypeHashingTest.cpp.o
[829/1396] Building CXX object unittests/CodeGen/CGPluginTest/CMakeFiles/CGPluginTest.dir/Plugin/CodeGenTestPass.cpp.o
[830/1396] Building CXX object unittests/CodeGen/CMakeFiles/CodeGenTests.dir/GCMetadata.cpp.o
[831/1396] Building CXX object unittests/ADT/CMakeFiles/ADTTests.dir/STLExtrasTest.cpp.o
[832/1396] Building CXX object unittests/ADT/CMakeFiles/ADTTests.dir/APFloatTest.cpp.o

Prince781 requested review from AlexMaclean and Artem-B July 31, 2025 18:56

Prince781 self-assigned this Jul 31, 2025

Prince781 added the backend:NVPTX label Jul 31, 2025

AlexMaclean approved these changes Jul 31, 2025

View reviewed changes

Artem-B approved these changes Jul 31, 2025

View reviewed changes

Prince781 force-pushed the dev/pferro/fix-nvptx-mov-opt branch from 35b58ca to 8946dab Compare July 31, 2025 21:11

[NVPTX] fix type propagation when expanding Store[V4 -> V8]

78e222a

Propagate the correct type when expanding a StoreV4 x <2 x float> to StoreV8 x float.

Prince781 force-pushed the dev/pferro/fix-nvptx-mov-opt branch from 8946dab to 78e222a Compare July 31, 2025 21:36

Prince781 merged commit 92ca087 into llvm:main Jul 31, 2025
9 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[NVPTX] fix type propagation when expanding Store[V4 -> V8] #151576

[NVPTX] fix type propagation when expanding Store[V4 -> V8] #151576

Uh oh!

Prince781 commented Jul 31, 2025

Uh oh!

llvmbot commented Jul 31, 2025

Uh oh!

AlexMaclean left a comment

Uh oh!

Uh oh!

llvm-ci commented Aug 1, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants

[NVPTX] fix type propagation when expanding Store[V4 -> V8] #151576

[NVPTX] fix type propagation when expanding Store[V4 -> V8] #151576

Uh oh!

Conversation

Prince781 commented Jul 31, 2025

Uh oh!

llvmbot commented Jul 31, 2025

Uh oh!

AlexMaclean left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

llvm-ci commented Aug 1, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants