Addressed review comments.

zahiraam · zahiraam · commit ff2b3d99df21 · 2024-11-04T07:37:20.000-08:00
diff --git a/clang/include/clang/Basic/FPOptions.def b/clang/include/clang/Basic/FPOptions.def
@@ -30,6 +30,6 @@ OPTION(BFloat16ExcessPrecision, LangOptions::ExcessPrecisionKind, 2, Float16Exce
 OPTION(FPAccuracy, LangOptions::FPAccuracyKind, 3, BFloat16ExcessPrecision)
 OPTION(MathErrno, bool, 1, FPAccuracy)
 OPTION(ComplexRange, LangOptions::ComplexRangeKind, 2, MathErrno)
-OPTION(OffloadFp32PrecDiv, bool, 1, ComplexRange)
-OPTION(OffloadFp32PrecSqrt, bool, 1, OffloadFp32PrecDiv)
+OPTION(OffloadFP32PrecDi, bool, 1, ComplexRange)
+OPTION(OffloadFP32PrecSqrt, bool, 1, OffloadFP32PrecDi)
 #undef OPTION
diff --git a/clang/include/clang/Basic/LangOptions.def b/clang/include/clang/Basic/LangOptions.def
@@ -372,8 +372,8 @@ BENIGN_ENUM_LANGOPT(FPEvalMethod, FPEvalMethodKind, 2, FEM_UnsetOnCommandLine, "
 ENUM_LANGOPT(Float16ExcessPrecision, ExcessPrecisionKind, 2, FPP_Standard, "Intermediate truncation behavior for Float16 arithmetic")
 ENUM_LANGOPT(BFloat16ExcessPrecision, ExcessPrecisionKind, 2, FPP_Standard, "Intermediate truncation behavior for BFloat16 arithmetic")
 BENIGN_ENUM_LANGOPT(FPAccuracy, FPAccuracyKind, 3, FPA_Default, "Accuracy for floating point operations and library functions")
-LANGOPT(OffloadFp32PrecDiv, 1, 1, "Return correctly rounded results of fdiv")
-LANGOPT(OffloadFp32PrecSqrt, 1, 1, "Return correctly rounded results of sqrt")
+LANGOPT(OffloadFP32PrecDiv, 1, 1, "Return correctly rounded results of fdiv")
+LANGOPT(OffloadFP32PrecSqrt, 1, 1, "Return correctly rounded results of sqrt")
 LANGOPT(NoBitFieldTypeAlign , 1, 0, "bit-field type alignment")
 LANGOPT(HexagonQdsp6Compat , 1, 0, "hexagon-qdsp6 backward compatibility")
 LANGOPT(ObjCAutoRefCount , 1, 0, "Objective-C automated reference counting")
diff --git a/clang/include/clang/Driver/Options.td b/clang/include/clang/Driver/Options.td
@@ -1158,15 +1158,15 @@ defm cx_fortran_rules: BoolOptionWithoutMarshalling<"f", "cx-fortran-rules",
   "for complex arithmetic operations">>;
 
  defm offload_fp32_prec_div: BoolOption<"f", "offload-fp32-prec-div",
-   LangOpts<"OffloadFp32PrecDiv">, DefaultTrue,
+   LangOpts<"OffloadFP32PrecDiv">, DefaultTrue,
    PosFlag<SetTrue, [], [ClangOption, CC1Option], "fdiv operations in offload device "
    "code are required to return correctly rounded results.">,
    NegFlag<SetFalse, [], [ClangOption, CC1Option], "fdiv operations in offload device "
    "code are not required to return correctly rounded results.">>,
    Group<f_Group>;
 
  defm offload_fp32_prec_sqrt: BoolOption<"f", "offload-fp32-prec-sqrt",
-   LangOpts<"OffloadFp32PrecSqrt">, DefaultTrue,
+   LangOpts<"OffloadFP32PrecSqrt">, DefaultTrue,
    PosFlag<SetTrue, [], [ClangOption, CC1Option], "sqrt operations in offload device "
    "code are required to return correctly rounded results.">,
    NegFlag<SetFalse, [], [ClangOption, CC1Option], "sqrt operations in offload device "
diff --git a/clang/lib/CodeGen/CGBuiltin.cpp b/clang/lib/CodeGen/CGBuiltin.cpp
@@ -521,13 +521,6 @@ static Function *getIntrinsic(CodeGenFunction &CGF, llvm::Value *Src0,
              : CGF.CGM.getIntrinsic(IntrinsicID, Src0->getType());
 }
 
-static bool hasAccuracyRequirement(CodeGenFunction &CGF, StringRef Name) {
-  if (!CGF.getLangOpts().FPAccuracyVal.empty())
-    return true;
-  auto FuncMapIt = CGF.getLangOpts().FPAccuracyFuncMap.find(Name.str());
-  return FuncMapIt != CGF.getLangOpts().FPAccuracyFuncMap.end();
-}
-
 static Function *emitMaybeIntrinsic(CodeGenFunction &CGF, const CallExpr *E,
                                     unsigned FPAccuracyIntrinsicID,
                                     unsigned IntrinsicID, llvm::Value *Src0,
@@ -546,7 +539,7 @@ static Function *emitMaybeIntrinsic(CodeGenFunction &CGF, const CallExpr *E,
             CGF.CGM.getContext().BuiltinInfo.getName(CGF.getCurrentBuiltinID());
         // Use fpbuiltin intrinsic only when needed.
         Func = getIntrinsic(CGF, Src0, FPAccuracyIntrinsicID, IntrinsicID,
-                            hasAccuracyRequirement(CGF, Name));
+                            CGF.hasAccuracyRequirement(Name));
       }
     }
   }
@@ -24201,8 +24194,8 @@ llvm::CallInst *CodeGenFunction::MaybeEmitFPBuiltinofFD(
   // a TU fp-accuracy requested.
   const LangOptions &LangOpts = getLangOpts();
   if (hasFuncNameRequestedFPAccuracy(Name, LangOpts) ||
-      !LangOpts.FPAccuracyVal.empty() || !LangOpts.OffloadFp32PrecDiv ||
-      !LangOpts.OffloadFp32PrecSqrt) {
+      !LangOpts.FPAccuracyVal.empty() || !LangOpts.OffloadFP32PrecDiv ||
+      !LangOpts.OffloadFP32PrecSqrt) {
     llvm::Function *Func =
         CGM.getIntrinsic(FPAccuracyIntrinsicID, IRArgs[0]->getType());
     return CreateBuiltinCallWithAttr(*this, Name, Func, ArrayRef(IRArgs),
diff --git a/clang/lib/CodeGen/CGCall.cpp b/clang/lib/CodeGen/CGCall.cpp
@@ -1879,9 +1879,10 @@ void CodeGenModule::getDefaultFunctionFPAccuracyAttributes(
   // the 'FPAccuracyFuncMap'; if no accuracy is mapped to Name (FuncAttrs
   // is empty), then set its accuracy from the TU's accuracy value.
   if (!getLangOpts().FPAccuracyFuncMap.empty()) {
+    StringRef FPAccuracyVal;
     auto FuncMapIt = getLangOpts().FPAccuracyFuncMap.find(Name.str());
     if (FuncMapIt != getLangOpts().FPAccuracyFuncMap.end()) {
-      StringRef FPAccuracyVal = llvm::fp::getAccuracyForFPBuiltin(
+      FPAccuracyVal = llvm::fp::getAccuracyForFPBuiltin(
           ID, FuncType, convertFPAccuracy(FuncMapIt->second));
       assert(!FPAccuracyVal.empty() && "A valid accuracy value is expected");
       FuncAttrs.addAttribute("fpbuiltin-max-error", FPAccuracyVal);
@@ -1899,9 +1900,9 @@ void CodeGenModule::getDefaultFunctionFPAccuracyAttributes(
       MD = llvm::ConstantAsMetadata::get(llvm::ConstantInt::get(
           Int32Ty, convertFPAccuracyToAspect(getLangOpts().FPAccuracyVal)));
     }
-    if (Name == "sqrt" && !getLangOpts().OffloadFp32PrecSqrt)
+    if (Name == "sqrt" && !getLangOpts().OffloadFP32PrecSqrt)
       FPAccuracyVal = "3.0";
-    if (Name == "fdiv" && !getLangOpts().OffloadFp32PrecDiv)
+    if (Name == "fdiv" && !getLangOpts().OffloadFP32PrecDiv)
       FPAccuracyVal = "2.5";
     if (!FPAccuracyVal.empty())
       FuncAttrs.addAttribute("fpbuiltin-max-error", FPAccuracyVal);
@@ -5802,13 +5803,13 @@ RValue CodeGenFunction::EmitCall(const CGFunctionInfo &CallInfo,
     if (FD && FD->getNameInfo().getName().isIdentifier()) {
       StringRef FuncName = FD->getName();
       const bool IsFloat32Type = FD->getReturnType()->isFloat32Type();
-      bool hasFPAccuracyFuncMap = !getLangOpts().FPAccuracyFuncMap.empty();
+      bool hasFPAccuracyFuncMap = hasAccuracyRequirement(FuncName);
       bool hasFPAccuracyVal = !getLangOpts().FPAccuracyVal.empty();
       bool isFp32SqrtFunction =
-          (FuncName == "sqrt" && !getLangOpts().OffloadFp32PrecSqrt &&
+          (FuncName == "sqrt" && !getLangOpts().OffloadFP32PrecSqrt &&
            IsFloat32Type);
       bool isFP32FdivFunction =
-          (FuncName == "fdiv" && !getLangOpts().OffloadFp32PrecDiv &&
+          (FuncName == "fdiv" && !getLangOpts().OffloadFP32PrecDiv &&
            IsFloat32Type);
       if (hasFPAccuracyFuncMap || hasFPAccuracyVal || isFp32SqrtFunction ||
           isFP32FdivFunction) {
diff --git a/clang/lib/CodeGen/CodeGenFunction.cpp b/clang/lib/CodeGen/CodeGenFunction.cpp
@@ -122,6 +122,13 @@ clang::ToConstrainedExceptMD(LangOptions::FPExceptionModeKind Kind) {
   }
 }
 
+bool CodeGenFunction::hasAccuracyRequirement(StringRef Name) {
+  if (!getLangOpts().FPAccuracyVal.empty())
+    return true;
+  auto FuncMapIt = getLangOpts().FPAccuracyFuncMap.find(Name.str());
+  return FuncMapIt != getLangOpts().FPAccuracyFuncMap.end();
+}
+
 void CodeGenFunction::SetFastMathFlags(FPOptions FPFeatures) {
   llvm::FastMathFlags FMF;
   FMF.setAllowReassoc(FPFeatures.getAllowFPReassociate());
diff --git a/clang/lib/CodeGen/CodeGenFunction.h b/clang/lib/CodeGen/CodeGenFunction.h
@@ -5213,6 +5213,8 @@ class CodeGenFunction : public CodeGenTypeCache {
   /// CodeGenOpts.
   void SetDivFPAccuracy(llvm::Value *Val);
 
+  bool hasAccuracyRequirement(StringRef Name);
+
   /// Set the codegen fast-math flags.
   void SetFastMathFlags(FPOptions FPFeatures);
 
diff --git a/clang/lib/Driver/ToolChains/Clang.cpp b/clang/lib/Driver/ToolChains/Clang.cpp
@@ -1781,6 +1781,7 @@ void Clang::RenderTargetOptions(const llvm::Triple &EffectiveTriple,
   switch (TC.getArch()) {
   default:
     break;
+
   case llvm::Triple::arm:
   case llvm::Triple::armeb:
   case llvm::Triple::thumb:
@@ -3006,8 +3007,8 @@ static void RenderFloatingPointOptions(const ToolChain &TC, const Driver &D,
   LangOptions::ComplexRangeKind Range = LangOptions::ComplexRangeKind::CX_None;
   std::string ComplexRangeStr = "";
   std::string GccRangeComplexOption = "";
-  bool NoOffloadFp32PrecDiv = false;
-  bool NoOffloadFp32PrecSqrt = false;
+  bool NoOffloadFP32PrecDiv = false;
+  bool NoOffloadFP32PrecSqrt = false;
   bool IsDeviceOffloading = JA.isDeviceOffloading(Action::OFK_SYCL);
 
   // Lambda to set fast-math options. This is also used by -ffp-model=fast
@@ -3041,8 +3042,8 @@ static void RenderFloatingPointOptions(const ToolChain &TC, const Driver &D,
     if (IsDeviceOffloading) {
       // when fp-model=fast is used the default precision for division and
       // sqrt is not precise.
-      NoOffloadFp32PrecDiv = true;
-      NoOffloadFp32PrecSqrt = true;
+      NoOffloadFP32PrecDiv = true;
+      NoOffloadFP32PrecSqrt = true;
     }
   };
 
@@ -3072,33 +3073,37 @@ static void RenderFloatingPointOptions(const ToolChain &TC, const Driver &D,
     CmdArgs.push_back(A->getValue());
   }
 
-  auto toggleNoOffloadFp32PrecSqrt = [&]() {
-    if (NoOffloadFp32PrecSqrt)
-      NoOffloadFp32PrecSqrt = false;
-    else
-      NoOffloadFp32PrecSqrt = true;
-  };
-
-  auto toggleNoOffloadFp32PrecDiv = [&]() {
-    if (NoOffloadFp32PrecDiv)
-      NoOffloadFp32PrecDiv = false;
-    else
-      NoOffloadFp32PrecDiv = true;
-  };
-
   auto addSPIRVArgs = [&](StringRef SPIRVArg) {
     if (IsDeviceOffloading) {
       if (!FPAccuracy.empty())
         EmitAccuracyDiag(D, JA, FPAccuracy, SPIRVArg);
 
       if (SPIRVArg == "-fno-offload-fp32-prec-div")
-        NoOffloadFp32PrecDiv = true;
+        NoOffloadFP32PrecDiv = true;
       else if (SPIRVArg == "-fno-offload-fp32-prec-sqrt")
-        NoOffloadFp32PrecSqrt = true;
+        NoOffloadFP32PrecSqrt = true;
       else if (SPIRVArg == "-foffload-fp32-prec-sqrt")
-        toggleNoOffloadFp32PrecSqrt();
+        NoOffloadFP32PrecSqrt = false;
       else if (SPIRVArg == "-foffload-fp32-prec-div")
-        toggleNoOffloadFp32PrecDiv();
+        NoOffloadFP32PrecDiv = false;
+    }
+  };
+
+  auto ParseFPAccOption = [&](StringRef Val, bool &NoOffloadFlag) {
+    SmallVector<StringRef, 8> ValuesArr;
+    Val.split(ValuesArr, ":");
+    if (ValuesArr.size() == 1)
+      NoOffloadFlag = false;
+    if (ValuesArr.size() > 1) {
+      StringRef x = ValuesArr[1];
+      SmallVector<StringRef, 8> FuncsArr;
+      x.split(FuncsArr, ",");
+      for (const auto &V : FuncsArr) {
+        if (V == "fdiv")
+          NoOffloadFlag = false;
+        else if (V == "sqrt")
+          NoOffloadFlag = false;
+      }
     }
   };
 
@@ -3203,10 +3208,14 @@ static void RenderFloatingPointOptions(const ToolChain &TC, const Driver &D,
     case options::OPT_ffp_accuracy_EQ: {
       StringRef Val = A->getValue();
       FPAccuracy = Val;
-      if (NoOffloadFp32PrecDiv)
+      if (NoOffloadFP32PrecDiv) {
         EmitAccuracyDiag(D, JA, FPAccuracy, "-fno-offload-fp32-prec-div");
-      if (NoOffloadFp32PrecSqrt)
+        ParseFPAccOption(Val, NoOffloadFP32PrecDiv);
+      }
+      if (NoOffloadFP32PrecSqrt) {
         EmitAccuracyDiag(D, JA, FPAccuracy, "-fno-offload-fp32-prec-sqrt");
+        ParseFPAccOption(Val, NoOffloadFP32PrecSqrt);
+      }
       break;
     }
     case options::OPT_ffp_model_EQ: {
@@ -3621,9 +3630,9 @@ static void RenderFloatingPointOptions(const ToolChain &TC, const Driver &D,
   if (Args.hasArg(options::OPT_fno_cx_fortran_rules))
     CmdArgs.push_back("-fno-cx-fortran-rules");
   if (IsDeviceOffloading) {
-    if (NoOffloadFp32PrecDiv)
+    if (NoOffloadFP32PrecDiv)
       CmdArgs.push_back("-fno-offload-fp32-prec-div");
-    if (NoOffloadFp32PrecSqrt)
+    if (NoOffloadFP32PrecSqrt)
       CmdArgs.push_back("-fno-offload-fp32-prec-sqrt");
   }
 }
diff --git a/clang/lib/Driver/ToolChains/Clang.h b/clang/lib/Driver/ToolChains/Clang.h
@@ -55,9 +55,6 @@ class LLVM_LIBRARY_VISIBILITY Clang : public Tool {
                         const llvm::opt::ArgList &Args,
                         llvm::opt::ArgStringList &CmdArgs,
                         bool KernelOrKext) const;
-  void AddSPIRTargetArgs(const llvm::opt::ArgList &Args,
-                         llvm::opt::ArgStringList &CmdArgs, const JobAction &JA,
-                         const Driver &D) const;
   void AddARM64TargetArgs(const llvm::opt::ArgList &Args,
                           llvm::opt::ArgStringList &CmdArgs) const;
   void AddLoongArchTargetArgs(const llvm::opt::ArgList &Args,
diff --git a/clang/test/CodeGenSYCL/offload-fp32-div-sqrt.cpp b/clang/test/CodeGenSYCL/offload-fp32-div-sqrt.cpp

Original file line number	Diff line number	Diff line change
`@@ -122,6 +122,13 @@ clang::ToConstrainedExceptMD(LangOptions::FPExceptionModeKind Kind) {`
`122`	`122`	`}`
`123`	`123`	`}`
`124`	`124`
	`125`	`+bool CodeGenFunction::hasAccuracyRequirement(StringRef Name) {`
	`126`	`+ if (!getLangOpts().FPAccuracyVal.empty())`
	`127`	`+ return true;`
	`128`	`+ auto FuncMapIt = getLangOpts().FPAccuracyFuncMap.find(Name.str());`
	`129`	`+ return FuncMapIt != getLangOpts().FPAccuracyFuncMap.end();`
	`130`	`+}`
	`131`	`+`
`125`	`132`	`void CodeGenFunction::SetFastMathFlags(FPOptions FPFeatures) {`
`126`	`133`	`llvm::FastMathFlags FMF;`
`127`	`134`	`FMF.setAllowReassoc(FPFeatures.getAllowFPReassociate());`