ROCm
diff --git a/‎clang/include/clang/Driver/Options.td
Lines changed: 4 additions & 0 deletions b/‎clang/include/clang/Driver/Options.td
Lines changed: 4 additions & 0 deletions
diff --git a/‎clang/lib/Driver/Driver.cpp
Lines changed: 4 additions & 149 deletions b/‎clang/lib/Driver/Driver.cpp
Lines changed: 4 additions & 149 deletions
diff --git a/‎clang/lib/Driver/ToolChains/AMDGPU.cpp
Lines changed: 42 additions & 31 deletions b/‎clang/lib/Driver/ToolChains/AMDGPU.cpp
Lines changed: 42 additions & 31 deletions
diff --git a/‎clang/lib/Driver/ToolChains/AMDGPU.h
Lines changed: 39 additions & 0 deletions b/‎clang/lib/Driver/ToolChains/AMDGPU.h
Lines changed: 39 additions & 0 deletions
@@ -2957,6 +2957,10 @@ def offload_new_driver : Flag<["--"], "offload-new-driver">, Flags<[CC1Option]>,
   MarshallingInfoFlag<LangOpts<"OffloadingNewDriver">>, HelpText<"Use the new driver for offloading compilation.">;
 def no_offload_new_driver : Flag<["--"], "no-offload-new-driver">, Flags<[CC1Option]>, Group<f_Group>,
   HelpText<"Don't Use the new driver for offloading compilation.">;
+def opaque_offload_linker : Flag<["--"], "opaque-offload-linker">, Flags<[CC1Option]>, Group<f_Group>,
+  HelpText<"Build/link omp offload binary, construct opaque cmd list instead of single clang-linker-wrapper cmd.">;
+def no_opaque_offload_linker : Flag<["--"], "no-opaque-offload-linker">, Flags<[CC1Option]>, Group<f_Group>,
+  HelpText<"Build/link omp offload binary, using single clang-linker-wrapper cmd.">;
 def offload_device_only : Flag<["--"], "offload-device-only">, Flags<[FlangOption]>,
   HelpText<"Only compile for the offloading device.">;
 def offload_host_only : Flag<["--"], "offload-host-only">, Flags<[FlangOption]>,
 
@@ -965,151 +965,6 @@ void Driver::CreateOffloadingDeviceToolChains(Compilation &C,
                                                 *HostTC, OFK);
     assert(HIPTC && "Could not create offloading device tool chain.");
     C.addOffloadDeviceToolChain(HIPTC, OFK);
-  } else if (C.getInputArgs().hasFlag(options::OPT_offload_new_driver,
-                                      options::OPT_no_offload_new_driver,
-                                      false)) {
-    bool IsOpenMPOffloading =
-        C.getInputArgs().hasFlag(options::OPT_fopenmp, options::OPT_fopenmp_EQ,
-                                 options::OPT_fno_openmp, false) &&
-        (C.getInputArgs().hasArg(options::OPT_fopenmp_targets_EQ) ||
-         C.getInputArgs().hasArg(options::OPT_offload_arch_EQ));
-    if (IsOpenMPOffloading) {
-      // We expect that -fopenmp-targets is always used in conjunction with the
-      // option -fopenmp specifying a valid runtime with offloading support,
-      // i.e. libomp or libiomp.
-      OpenMPRuntimeKind RuntimeKind = getOpenMPRuntime(C.getInputArgs());
-      if (RuntimeKind != OMPRT_OMP && RuntimeKind != OMPRT_IOMP5) {
-        Diag(clang::diag::Err_drv_expecting_fopenmp_with_fopenmp_targets);
-        return;
-      }
-
-      llvm::StringMap<llvm::DenseSet<StringRef>> DerivedArchs;
-      llvm::StringMap<StringRef> FoundNormalizedTriples;
-      llvm::SmallVector<StringRef, 4> OpenMPTriples;
-
-      // If the user specified -fopenmp-targets= we create a toolchain for each
-      // valid triple. Otherwise, if only --offload-arch= was specified we
-      // instead attempt to derive the appropriate toolchains from the
-      // arguments.
-      if (Arg *OpenMPTargets =
-              C.getInputArgs().getLastArg(options::OPT_fopenmp_targets_EQ)) {
-        if (OpenMPTargets && !OpenMPTargets->getNumValues()) {
-          Diag(clang::diag::warn_drv_empty_joined_argument)
-              << OpenMPTargets->getAsString(C.getInputArgs());
-          return;
-        }
-        llvm::copy(OpenMPTargets->getValues(),
-                   std::back_inserter(OpenMPTriples));
-      } else if (C.getInputArgs().hasArg(options::OPT_offload_arch_EQ) &&
-                 !IsHIP && !IsCuda) {
-        const ToolChain *HostTC =
-            C.getSingleOffloadToolChain<Action::OFK_Host>();
-        auto AMDTriple = getHIPOffloadTargetTriple(*this, C.getInputArgs());
-        auto NVPTXTriple = getNVIDIAOffloadTargetTriple(*this, C.getInputArgs(),
-                                                        HostTC->getTriple());
-
-        // Attempt to deduce the offloading triple from the set of
-        // architectures. We can only correctly deduce NVPTX / AMDGPU triples
-        // currently. We need to temporarily create these toolchains so that we
-        // can access tools for inferring architectures.
-        llvm::DenseSet<StringRef> Archs;
-        if (NVPTXTriple) {
-          auto TempTC = std::make_unique<toolchains::CudaToolChain>(
-              *this, *NVPTXTriple, *HostTC, C.getInputArgs());
-          for (StringRef Arch : getOffloadArchs(
-                   C, C.getArgs(), Action::OFK_OpenMP, &*TempTC, true))
-            Archs.insert(Arch);
-        }
-        if (AMDTriple) {
-          auto TempTC = std::make_unique<toolchains::AMDGPUOpenMPToolChain>(
-              *this, *AMDTriple, *HostTC, C.getInputArgs(), Action::OFK_OpenMP);
-          for (StringRef Arch : getOffloadArchs(
-                   C, C.getArgs(), Action::OFK_OpenMP, &*TempTC, true))
-            Archs.insert(Arch);
-        }
-        if (!AMDTriple && !NVPTXTriple) {
-          for (StringRef Arch : getOffloadArchs(
-                   C, C.getArgs(), Action::OFK_OpenMP, nullptr, true))
-            Archs.insert(Arch);
-        }
-
-        for (StringRef Arch : Archs) {
-          if (NVPTXTriple &&
-              IsNVIDIAGpuArch(StringToCudaArch(
-                  getProcessorFromTargetID(*NVPTXTriple, Arch)))) {
-            DerivedArchs[NVPTXTriple->getTriple()].insert(Arch);
-          } else if (AMDTriple &&
-                     IsAMDGpuArch(StringToCudaArch(
-                         getProcessorFromTargetID(*AMDTriple, Arch)))) {
-            DerivedArchs[AMDTriple->getTriple()].insert(Arch);
-          } else {
-            Diag(clang::diag::err_drv_failed_to_deduce_target_from_arch)
-                << Arch;
-            return;
-          }
-        }
-
-        // If the set is empty then we failed to find a native architecture.
-        if (Archs.empty()) {
-          Diag(clang::diag::err_drv_failed_to_deduce_target_from_arch)
-              << "native";
-          return;
-        }
-
-        for (const auto &TripleAndArchs : DerivedArchs)
-          OpenMPTriples.push_back(TripleAndArchs.first());
-      }
-
-      for (StringRef Val : OpenMPTriples) {
-        llvm::Triple TT(ToolChain::getOpenMPTriple(Val));
-        std::string NormalizedName = TT.normalize();
-
-        // Make sure we don't have a duplicate triple.
-        auto Duplicate = FoundNormalizedTriples.find(NormalizedName);
-        if (Duplicate != FoundNormalizedTriples.end()) {
-          Diag(clang::diag::warn_drv_omp_offload_target_duplicate)
-              << Val << Duplicate->second;
-          continue;
-        }
-
-        // Store the current triple so that we can check for duplicates in the
-        // following iterations.
-        FoundNormalizedTriples[NormalizedName] = Val;
-
-        // If the specified target is invalid, emit a diagnostic.
-        if (TT.getArch() == llvm::Triple::UnknownArch)
-          Diag(clang::diag::err_drv_invalid_omp_target) << Val;
-        else {
-          const ToolChain *TC;
-          // Device toolchains have to be selected differently. They pair host
-          // and device in their implementation.
-          if (TT.isNVPTX() || TT.isAMDGCN()) {
-            const ToolChain *HostTC =
-                C.getSingleOffloadToolChain<Action::OFK_Host>();
-            assert(HostTC && "Host toolchain should be always defined.");
-            auto &DeviceTC =
-                ToolChains[TT.str() + "/" + HostTC->getTriple().normalize()];
-            if (!DeviceTC) {
-              if (TT.isNVPTX())
-                DeviceTC = std::make_unique<toolchains::CudaToolChain>(
-                    *this, TT, *HostTC, C.getInputArgs());
-              else if (TT.isAMDGCN())
-                DeviceTC = std::make_unique<toolchains::AMDGPUOpenMPToolChain>(
-                    *this, TT, *HostTC, C.getInputArgs(), Action::OFK_OpenMP);
-              else
-                assert(DeviceTC && "Device toolchain not defined.");
-            }
-
-            TC = DeviceTC.get();
-          } else
-            TC = &getToolChain(C.getInputArgs(), TT);
-          C.addOffloadDeviceToolChain(TC, Action::OFK_OpenMP);
-          if (DerivedArchs.find(TT.getTriple()) != DerivedArchs.end())
-            KnownArchs[TC] = DerivedArchs[TT.getTriple()];
-        }
-      }
-    }
-
   } else {
     //
     // OpenMP
@@ -1167,7 +1022,7 @@ void Driver::CreateOffloadingDeviceToolChains(Compilation &C,
       bool IsHostOffloading =
           (OpenMPTargets->getNumValues() == 1) &&
           StringRef(OpenMPTargets->getValue())
-              .startswith_insensitive(
+              .starts_with_insensitive(
                   C.getSingleOffloadToolChain<Action::OFK_Host>()
                       ->getTriple()
                       .getArchName());
@@ -4676,9 +4531,9 @@ void Driver::BuildActions(Compilation &C, DerivedArgList &Args,
 
   handleArguments(C, Args, Inputs, Actions);
 
-  bool UseNewOffloadingDriver =
-      Args.hasFlag(options::OPT_offload_new_driver,
-                   options::OPT_no_offload_new_driver, false);
+  bool UseNewOffloadingDriver = Args.hasFlag(
+      options::OPT_offload_new_driver, options::OPT_no_offload_new_driver,
+      C.isOffloadingHostKind(Action::OFK_OpenMP));
 
   // Builder to be used to build offloading actions.
   std::unique_ptr<OffloadingActionBuilder> OffloadBuilder =
 
@@ -671,6 +671,44 @@ void amdgpu::getAMDGPUTargetFeatures(const Driver &D,
                             options::OPT_m_amdgpu_Features_Group);
 }
 
+llvm::SmallVector<std::string, 12> amdgpu::dlr::getCommonDeviceLibNames(
+    const llvm::opt::ArgList &DriverArgs, const Driver &D,
+    const std::string &GPUArch, bool isOpenMP,
+    const RocmInstallationDetector &RocmInstallation) {
+  auto Kind = llvm::AMDGPU::parseArchAMDGCN(GPUArch);
+  const StringRef CanonArch = llvm::AMDGPU::getArchNameAMDGCN(Kind);
+
+  StringRef LibDeviceFile = RocmInstallation.getLibDeviceFile(CanonArch);
+  auto ABIVer = DeviceLibABIVersion::fromCodeObjectVersion(
+      getAMDGPUCodeObjectVersion(D, DriverArgs));
+  if (!RocmInstallation.checkCommonBitcodeLibs(CanonArch, LibDeviceFile,
+                                               ABIVer))
+    return {};
+
+  // If --hip-device-lib is not set, add the default bitcode libraries.
+  // TODO: There are way too many flags that change this. Do we need to check
+  // them all?
+  bool DAZ = DriverArgs.hasFlag(
+      options::OPT_fgpu_flush_denormals_to_zero,
+      options::OPT_fno_gpu_flush_denormals_to_zero,
+      toolchains::AMDGPUToolChain::getDefaultDenormsAreZeroForTarget(Kind));
+  bool FiniteOnly = DriverArgs.hasFlag(
+      options::OPT_ffinite_math_only, options::OPT_fno_finite_math_only, false);
+  bool UnsafeMathOpt =
+      DriverArgs.hasFlag(options::OPT_funsafe_math_optimizations,
+                         options::OPT_fno_unsafe_math_optimizations, false);
+  bool FastRelaxedMath = DriverArgs.hasFlag(options::OPT_ffast_math,
+                                            options::OPT_fno_fast_math, false);
+  bool CorrectSqrt = DriverArgs.hasFlag(
+      options::OPT_fhip_fp32_correctly_rounded_divide_sqrt,
+      options::OPT_fno_hip_fp32_correctly_rounded_divide_sqrt, true);
+  bool Wave64 = toolchains::AMDGPUToolChain::isWave64(DriverArgs, Kind);
+
+  return RocmInstallation.getCommonBitcodeLibs(
+      DriverArgs, LibDeviceFile, Wave64, DAZ, FiniteOnly, UnsafeMathOpt,
+      FastRelaxedMath, CorrectSqrt, ABIVer, isOpenMP);
+}
+
 /// AMDGPU Toolchain
 AMDGPUToolChain::AMDGPUToolChain(const Driver &D, const llvm::Triple &Triple,
                                  const ArgList &Args)
@@ -1031,35 +1069,8 @@ llvm::SmallVector<std::string, 12>
 ROCMToolChain::getCommonDeviceLibNames(const llvm::opt::ArgList &DriverArgs,
                                        const std::string &GPUArch,
                                        bool isOpenMP) const {
-  auto Kind = llvm::AMDGPU::parseArchAMDGCN(GPUArch);
-  const StringRef CanonArch = llvm::AMDGPU::getArchNameAMDGCN(Kind);
-
-  StringRef LibDeviceFile = RocmInstallation->getLibDeviceFile(CanonArch);
-  auto ABIVer = DeviceLibABIVersion::fromCodeObjectVersion(
-      getAMDGPUCodeObjectVersion(getDriver(), DriverArgs));
-  if (!RocmInstallation->checkCommonBitcodeLibs(CanonArch, LibDeviceFile,
-                                                ABIVer))
-    return {};
-
-  // If --hip-device-lib is not set, add the default bitcode libraries.
-  // TODO: There are way too many flags that change this. Do we need to check
-  // them all?
-  bool DAZ = DriverArgs.hasFlag(options::OPT_fgpu_flush_denormals_to_zero,
-                                options::OPT_fno_gpu_flush_denormals_to_zero,
-                                getDefaultDenormsAreZeroForTarget(Kind));
-  bool FiniteOnly = DriverArgs.hasFlag(
-      options::OPT_ffinite_math_only, options::OPT_fno_finite_math_only, false);
-  bool UnsafeMathOpt =
-      DriverArgs.hasFlag(options::OPT_funsafe_math_optimizations,
-                         options::OPT_fno_unsafe_math_optimizations, false);
-  bool FastRelaxedMath = DriverArgs.hasFlag(options::OPT_ffast_math,
-                                            options::OPT_fno_fast_math, false);
-  bool CorrectSqrt = DriverArgs.hasFlag(
-      options::OPT_fhip_fp32_correctly_rounded_divide_sqrt,
-      options::OPT_fno_hip_fp32_correctly_rounded_divide_sqrt, true);
-  bool Wave64 = isWave64(DriverArgs, Kind);
-
-  return RocmInstallation->getCommonBitcodeLibs(
-      DriverArgs, LibDeviceFile, Wave64, DAZ, FiniteOnly, UnsafeMathOpt,
-      FastRelaxedMath, CorrectSqrt, ABIVer, isOpenMP);
+  RocmInstallationDetector RocmInstallation(getDriver(), getTriple(),
+                                            DriverArgs, true, true);
+  return amdgpu::dlr::getCommonDeviceLibNames(DriverArgs, getDriver(), GPUArch,
+                                              isOpenMP, RocmInstallation);
 }
@@ -42,6 +42,45 @@ void getAMDGPUTargetFeatures(const Driver &D, const llvm::Triple &Triple,
                              std::vector<StringRef> &Features,
                              StringRef TcTargetID = StringRef());
 
+namespace dlr {
+llvm::SmallVector<std::string, 12>
+getCommonDeviceLibNames(const llvm::opt::ArgList &DriverArgs, const Driver &D,
+                        const std::string &GPUArch, bool isOpenMP,
+                        const RocmInstallationDetector &RocmInstallation);
+
+const char *
+getCbslCommandArgs(Compilation &C, const llvm::opt::ArgList &Args,
+                   llvm::opt::ArgStringList &CbslArgs,
+                   const SmallVectorImpl<std::string> &InputFileNames,
+                   llvm::StringRef OutputFilePrefix);
+
+const char *
+getLinkCommandArgs(Compilation &C, const llvm::opt::ArgList &Args,
+                   llvm::opt::ArgStringList &LastLinkArgs, const ToolChain &TC,
+                   const llvm::Triple &Triple, llvm::StringRef TargetID,
+                   llvm::StringRef OutputFilePrefix, const char *InputFileName,
+                   const RocmInstallationDetector &RocmInstallation);
+
+const char *getOptCommandArgs(Compilation &C, const llvm::opt::ArgList &Args,
+                              llvm::opt::ArgStringList &OptArgs,
+                              const llvm::Triple &Triple,
+                              llvm::StringRef TargetID,
+                              llvm::StringRef OutputFilePrefix,
+                              const char *InputFileName);
+
+const char *
+getLlcCommandArgs(Compilation &C, const llvm::opt::ArgList &Args,
+                  llvm::opt::ArgStringList &LlcArgs, const llvm::Triple &Triple,
+                  llvm::StringRef TargetID, llvm::StringRef OutputFilePrefix,
+                  const char *InputFileName, bool OutputIsAsm = false);
+
+const char *getLldCommandArgs(
+    Compilation &C, const InputInfo &Output, const llvm::opt::ArgList &Args,
+    llvm::opt::ArgStringList &LldArgs, const llvm::Triple &Triple,
+    llvm::StringRef TargetID, const char *InputFileName,
+    const std::optional<std::string> OutputFilePrefix = std::nullopt);
+} // end namespace dlr
+
 } // end namespace amdgpu
 } // end namespace tools