yxsamliu
diff --git a/‎llvm/lib/Target/AMDGPU/AMDGPUPassRegistry.def‎
Lines changed: 0 additions & 2 deletions b/‎llvm/lib/Target/AMDGPU/AMDGPUPassRegistry.def‎
Lines changed: 0 additions & 2 deletions
diff --git a/‎llvm/lib/Target/AMDGPU/AMDGPUTargetMachine.cpp‎
Lines changed: 0 additions & 9 deletions b/‎llvm/lib/Target/AMDGPU/AMDGPUTargetMachine.cpp‎
Lines changed: 0 additions & 9 deletions
@@ -69,8 +69,6 @@ FUNCTION_PASS("amdgpu-simplifylib", AMDGPUSimplifyLibCallsPass())
 FUNCTION_PASS("amdgpu-unify-divergent-exit-nodes",
               AMDGPUUnifyDivergentExitNodesPass())
 FUNCTION_PASS("amdgpu-usenative", AMDGPUUseNativeCallsPass())
-FUNCTION_PASS("amdgpu-vector-idiom",
-              AMDGPUVectorIdiomCombinePass(/*MaxBytes=*/32))
 FUNCTION_PASS("si-annotate-control-flow", SIAnnotateControlFlowPass(*static_cast<const GCNTargetMachine *>(this)))
 #undef FUNCTION_PASS
 
 
@@ -29,7 +29,6 @@
 #include "AMDGPUTargetObjectFile.h"
 #include "AMDGPUTargetTransformInfo.h"
 #include "AMDGPUUnifyDivergentExitNodes.h"
-#include "AMDGPUVectorIdiom.h"
 #include "AMDGPUWaitSGPRHazards.h"
 #include "GCNDPPCombine.h"
 #include "GCNIterativeScheduler.h"
@@ -850,12 +849,6 @@ void AMDGPUTargetMachine::registerPassBuilderCallbacks(PassBuilder &PB) {
             EnablePromoteKernelArguments)
           FPM.addPass(AMDGPUPromoteKernelArgumentsPass());
 
-        // Run vector-idiom canonicalization early (after inlining) and before
-        // infer-AS / SROA to maximize scalarization opportunities.
-        // Specify 32 bytes since the largest HIP vector types are double4 or
-        // long4.
-        FPM.addPass(AMDGPUVectorIdiomCombinePass(/*MaxBytes=*/32));
-
         // Add infer address spaces pass to the opt pipeline after inlining
         // but before SROA to increase SROA opportunities.
         FPM.addPass(InferAddressSpacesPass());
@@ -918,8 +911,6 @@ void AMDGPUTargetMachine::registerPassBuilderCallbacks(PassBuilder &PB) {
         if (EnableLowerModuleLDS)
           PM.addPass(AMDGPULowerModuleLDSPass(*this));
         if (Level != OptimizationLevel::O0) {
-          PM.addPass(createModuleToFunctionPassAdaptor(
-              AMDGPUVectorIdiomCombinePass(/*MaxBytes=*/32)));
           // Do we really need internalization in LTO?
           if (InternalizeSymbols) {
             PM.addPass(InternalizePass(mustPreserveGV));