add fixed-precision wrappers of compat algorithms

jaja360 · jaja360 · commit 89bc58bd7f13 · 2025-05-10T16:04:04.000-04:00
diff --git a/benchmarks/algorithms.h b/benchmarks/algorithms.h
@@ -47,17 +47,24 @@
 template<arithmetic_float T>
 struct BenchArgs {
   using Type = T;
-  using BenchFn = std::function<int(T, std::span<char>&, size_t fixed_size)>;
+  using BenchFn = std::function<int(T, std::span<char>&)>;
 
-  BenchArgs(const std::string& name = {}, BenchFn func = {}, bool used = true,
-            size_t testRepeat = 100, size_t fixedSize = 9)
-      : name(name), func(func), used(used), testRepeat(testRepeat), fixedSize(fixedSize) {}
+  BenchArgs(const std::string& name = {}, BenchFn func = {}, bool used = true, size_t testRepeat = 100)
+      : name(name), func(func), used(used), testRepeat(testRepeat) {}
 
   std::string name{};
   BenchFn func{};
   bool used{};
   size_t testRepeat{100};
-  size_t fixedSize{9};
+
+  static void initFixedSize(size_t size) {
+    fixedSize = size;
+    snprintf(formatStr, sizeof(formatStr), "%%.%zug", fixedSize);
+    formatStrStr = fmt::format("{{:.{}g}}", fixedSize);
+  }
+  static inline size_t fixedSize;
+  static inline char formatStr[10];
+  static inline std::string formatStrStr;
 };
 
 namespace BenchmarkShortest {
@@ -72,32 +79,6 @@ int dragon4(T d, std::span<char>& buffer) {
                         PrintFloatFormat_Positional, -1);
 }
 
-// No errol3 implementation optimized for float instead of double ?
-template<arithmetic_float T>
-int errol3(T d, std::span<char>& buffer) {
-#if ERROL_SUPPORTED
-  errol3_dtoa(d, buffer.data());  // returns the exponent
-  return std::strlen(buffer.data());
-#else
-  std::cerr << "errol3 not supported" << std::endl;
-  std::abort();
-#endif
-}
-
-template<arithmetic_float T>
-int to_string(T d, std::span<char>& buffer) {
-  const std::string s = std::to_string(d);
-  std::copy(s.begin(), s.end(), buffer.begin());
-  return s.size();
-}
-
-template<arithmetic_float T>
-int fmt_format(T d, std::span<char>& buffer) {
-  const std::string s = fmt::format("{}", d);
-  std::copy(s.begin(), s.end(), buffer.begin());
-  return s.size();
-}
-
 // There's no "ftoa", only "dtoa", so not optimized for float.
 template<arithmetic_float T>
 int netlib(T d, std::span<char>& buffer) {
@@ -137,7 +118,7 @@ int netlib(T d, std::span<char>& buffer) {
       } else {
           buffer[i++] = '0' + value;
       }
-  };
+    };
     // Fractional part (if any remaining digits)
     const int remaining_digits = rve - (result + std::max(0, decpt));
     if (remaining_digits > 0) {
@@ -167,6 +148,31 @@ int netlib(T d, std::span<char>& buffer) {
 #endif
 }
 
+// No errol3 implementation optimized for float instead of double ?
+template<arithmetic_float T>
+int errol3(T d, std::span<char>& buffer) {
+#if ERROL_SUPPORTED
+  errol3_dtoa(d, buffer.data());  // returns the exponent
+  return std::strlen(buffer.data());
+#else
+  std::cerr << "errol3 not supported" << std::endl;
+  std::abort();
+#endif
+}
+
+template<arithmetic_float T>
+int to_string(T d, std::span<char>& buffer) {
+  const std::string s = std::to_string(d);
+  std::copy(s.begin(), s.end(), buffer.begin());
+  return s.size();
+}
+
+template<arithmetic_float T>
+int fmt_format(T d, std::span<char>& buffer) {
+  const auto it = fmt::format_to(buffer.data(), "{}", d);
+  return std::distance(buffer.data(), it);
+}
+
 // grisu2 is hardcoded for double.
 template<arithmetic_float T>
 int grisu2(T d, std::span<char>& buffer) {
@@ -218,13 +224,15 @@ int teju_jagua(T d, std::span<char>& buffer) {
 
 template<arithmetic_float T>
 int double_conversion(T d, std::span<char>& buffer) {
-  const static double_conversion::DoubleToStringConverter converter(
-      double_conversion::DoubleToStringConverter::NO_FLAGS, "inf", "nan", 'e',
-      -4, 6, 0, 0);
+  using namespace double_conversion;
+  const static DoubleToStringConverter conv(
+      DoubleToStringConverter::EMIT_POSITIVE_EXPONENT_SIGN | DoubleToStringConverter::UNIQUE_ZERO,
+      "inf", "nan", 'e', -4, 6, 0, 0);
+
   double_conversion::StringBuilder builder(buffer.data(), buffer.size());
   const bool valid = std::is_same_v<T, float>
-                         ? converter.ToShortestSingle(d, &builder)
-                         : converter.ToShortest(d, &builder);
+                         ? conv.ToShortestSingle(d, &builder)
+                         : conv.ToShortest(d, &builder);
   if (!valid) {
     std::cerr << "problem with " << d << std::endl;
     std::abort();
@@ -277,53 +285,110 @@ int std_to_chars(T d, std::span<char>& buffer) {
 namespace BenchmarkFixedSize {
 
 template<arithmetic_float T>
-int abseil(T d, std::span<char>& buffer, size_t fixed_size) {
+int dragon4(T d, std::span<char>& buffer) {
+  if constexpr (std::is_same_v<T, float>)
+    return PrintFloat32(buffer.data(), buffer.size(), d,
+                        PrintFloatFormat_Positional, BenchArgs<T>::fixedSize);
+  else
+    return PrintFloat64(buffer.data(), buffer.size(), d,
+                        PrintFloatFormat_Positional, BenchArgs<T>::fixedSize);
+}
+
+template<arithmetic_float T>
+int netlib(T d, std::span<char>& buffer) {
+#if NETLIB_SUPPORTED
+  char* res;
+  if constexpr (std::is_same_v<T, float>)
+    res = g_ffmt(buffer.data(), &d, BenchArgs<T>::fixedSize, buffer.size());
+  else
+    res = g_dfmt(buffer.data(), &d, BenchArgs<T>::fixedSize, buffer.size());
+  *res = '\0';
+  return res - buffer.data() + 1;
+#else
+  std::cerr << "netlib not supported" << std::endl;
+  std::abort();
+#endif
+}
+
+template<arithmetic_float T>
+int abseil(T d, std::span<char>& buffer) {
   // StrAppend is faster but only outputs 6 digits after the decimal point
   // std::string s;
   // absl::StrAppend(&s, d);
   // std::copy(s.begin(), s.end(), buffer.begin());
   // return size(s);
-  if constexpr (std::is_same_v<T, float>)
-    return absl::SNPrintF(buffer.data(), buffer.size(), "%.9g", d);
-  else
-    return absl::SNPrintF(buffer.data(), buffer.size(), "%.17g", d);
+  return absl::SNPrintF(buffer.data(), buffer.size(),
+                        BenchArgs<T>::formatStr, d);
 }
 
 template<arithmetic_float T>
-int snprintf(T d, std::span<char>& buffer, size_t fixed_size) {
-  if constexpr (std::is_same_v<T, float>)
-    return std::snprintf(buffer.data(), buffer.size(), "%.9g", d);
-  else
-    return std::snprintf(buffer.data(), buffer.size(), "%.17g", d);
+int snprintf(T d, std::span<char>& buffer) {
+  return std::snprintf(buffer.data(), buffer.size(),
+                       BenchArgs<T>::formatStr, d);
 }
 
-}  // namespace BenchmarksShortest
+template<arithmetic_float T>
+int fmt_format(T d, std::span<char>& buffer) {
+  const auto it = fmt::format_to(buffer.begin(),
+                                 fmt::runtime(BenchArgs<T>::formatStrStr), d);
+  return std::distance(buffer.begin(), it);
+}
 
-template <typename T>
-auto make_shortest_adapter(int (*fn)(T, std::span<char>&)) {
-  return [fn](T v, std::span<char>& buf, size_t /*fixed_size*/) -> int {
-    return fn(v, buf);
-  };
+template<arithmetic_float T>
+int ryu(T d, std::span<char>& buffer) {
+  return d2fixed_buffered_n(d, BenchArgs<T>::fixedSize, buffer.data());
 }
 
+template<arithmetic_float T>
+int double_conversion(T d, std::span<char>& buffer) {
+  const static double_conversion::DoubleToStringConverter conv(
+      double_conversion::DoubleToStringConverter::NO_FLAGS, "inf", "nan", 'e',
+      -6, 21, BenchArgs<T>::fixedSize, BenchArgs<T>::fixedSize);
+
+  double_conversion::StringBuilder builder(buffer.data(), buffer.size());
+  if (!conv.ToPrecision(d, BenchArgs<T>::fixedSize, &builder)) {
+    std::cerr << "problem with " << d << std::endl;
+    std::abort();
+  }
+  return strlen(builder.Finalize());
+}
+
+template<arithmetic_float T>
+int std_to_chars(T d, std::span<char>& buffer) {
+#if TO_CHARS_SUPPORTED
+  const auto [p, ec]
+      = std::to_chars(buffer.data(), buffer.data() + buffer.size(), d,
+                      std::chars_format::general, BenchArgs<T>::fixedSize);
+  if (ec != std::errc()) {
+    std::cerr << "problem with " << d << std::endl;
+    std::abort();
+  }
+  return p - buffer.data();
+#else
+  std::cerr << "std::to_chars not supported" << std::endl;
+  std::abort();
+#endif
+}
+
+}  // namespace BenchmarksShortest
+
 template <typename T>
-auto make_fixed_adapter(int (*fn)(T, std::span<char>&, size_t)) {
-  return [fn](T v, std::span<char>& buf, size_t fixed_size) -> int {
-    return fn(v, buf, fixed_size);
+auto wrap(int (*fn)(T, std::span<char>&)) {
+  return [fn](T v, std::span<char>& buf) -> int {
+    return fn(v, buf);
   };
 }
 
 template <arithmetic_float T>
 std::vector<BenchArgs<T>> initArgs(bool use_errol = false, size_t repeat = 0, size_t fixed_size = 0) {
   std::vector<BenchArgs<T>> args;
   if (fixed_size == 0) {  // shortest-length representation
-    auto&& wrap = make_shortest_adapter<T>;
     namespace s = BenchmarkShortest;
     args.emplace_back("dragon4"           , wrap(s::dragon4<T>)           , true                                           , 10);
     args.emplace_back("netlib"            , wrap(s::netlib<T>)            , NETLIB_SUPPORTED && std::is_same_v<T, double>  , 10);
     args.emplace_back("errol3"            , wrap(s::errol3<T>)            , ERROL_SUPPORTED && use_errol);
     args.emplace_back("fmt_format"        , wrap(s::fmt_format<T>)        , true);
-    args.emplace_back("grisu2"            , wrap(s::grisu2<T>)            , std::is_same_v<T, double>);
+    // args.emplace_back("grisu2"            , wrap(s::grisu2<T>)            , std::is_same_v<T, double>);
     args.emplace_back("grisu3"            , wrap(s::grisu3<T>)            , std::is_same_v<T, double>);
     args.emplace_back("grisu_exact"       , wrap(s::grisu_exact<T>)       , true);
     args.emplace_back("schubfach"         , wrap(s::schubfach<T>)         , true);
@@ -334,26 +399,27 @@ std::vector<BenchArgs<T>> initArgs(bool use_errol = false, size_t repeat = 0, si
     args.emplace_back("swiftDtoa"         , wrap(s::swiftDtoa<T>)         , SWIFT_LIB_SUPPORTED);
     args.emplace_back("yy_double"         , wrap(s::yy_double<T>)         , YY_DOUBLE_SUPPORTED && std::is_same_v<T, double>);
     args.emplace_back("std::to_chars"     , wrap(s::std_to_chars<T>)      , TO_CHARS_SUPPORTED);
-
     // to_string, snprintf and abseil do not support shortest-length representation
+    // grisu2 does not round-trip correctly
   } else {  // fixed-length representation
-    auto&& wrap = make_fixed_adapter<T>;
-    namespace f = BenchmarkFixedSize;
-    args.emplace_back("snprintf" , wrap(f::snprintf<T>) , true);
-    args.emplace_back("abseil"   , wrap(f::abseil<T>)   , ABSEIL_SUPPORTED);
-
-    // to_string is hard-coded for 6 digits after the decimal point
-    // args.emplace_back("to_string", BenchmarkFixedSize::to_string<T>, true);
-
     fmt::println("# testing fixed-size output to {} digits", fixed_size);
-    for (auto &arg : args)
-      arg.fixedSize = fixed_size;
+    BenchArgs<T>::initFixedSize(fixed_size);
+
+    namespace f = BenchmarkFixedSize;
+    args.emplace_back("dragon4"           , wrap(f::dragon4<T>)           , true                 , 10);
+    args.emplace_back("netlib"            , wrap(f::netlib<T>)            , NETLIB_SUPPORTED     , 10);
+    args.emplace_back("abseil"            , wrap(f::abseil<T>)            , ABSEIL_SUPPORTED);
+    args.emplace_back("snprintf"          , wrap(f::snprintf<T>)          , true);
+    args.emplace_back("fmt_format"        , wrap(f::fmt_format<T>)        , true);
+    args.emplace_back("ryu"               , wrap(f::ryu<T>)               , std::is_same_v<T, double>);
+    args.emplace_back("double_conversion" , wrap(f::double_conversion<T>) , true);
+    args.emplace_back("std::to_chars"     , wrap(f::std_to_chars<T>)      , TO_CHARS_SUPPORTED);
   }
 
   if (repeat > 0) {
-      fmt::println("# forcing repeat count to {}", repeat);
-      for (auto &arg : args)
-          arg.testRepeat = repeat;
+    fmt::println("# forcing repeat count to {}", repeat);
+    for (auto &arg : args)
+      arg.testRepeat = repeat;
   }
 
   return args;
diff --git a/benchmarks/benchmark.cpp b/benchmarks/benchmark.cpp
@@ -93,7 +93,7 @@ void process(const std::vector<TestCase<T>> &lines,
       char buf[100];
       std::span<char> bufspan(buf, sizeof(buf));
       for (const auto d : lines)
-        volume += algo.func(d.value, bufspan, algo.fixedSize);
+        volume += algo.func(d.value, bufspan);
       return volume;
     }, algo.testRepeat);
   }
diff --git a/benchmarks/benchutil.h b/benchmarks/benchutil.h
@@ -101,7 +101,7 @@ void evaluate_properties_helper(Range&& cases,
       // representation using the fewest significant digits.
       // So we use dragonbox, which serves as the reference implementation.
       const size_t vRef  = BenchmarkShortest::dragonbox(d, bufRef);
-      const size_t vAlgo = algo.func(d, bufAlgo, algo.fixedSize);
+      const size_t vAlgo = algo.func(d, bufAlgo);
 
       std::string_view svRef{bufRef.data(), vRef},
                        svAlgo{bufAlgo.data(), vAlgo};

Original file line number	Diff line number	Diff line change
`@@ -93,7 +93,7 @@ void process(const std::vector<TestCase<T>> &lines,`
`93`	`93`	`char buf[100];`
`94`	`94`	`std::span<char> bufspan(buf, sizeof(buf));`
`95`	`95`	`for (const auto d : lines)`
`96`		`- volume += algo.func(d.value, bufspan, algo.fixedSize);`
	`96`	`+ volume += algo.func(d.value, bufspan);`
`97`	`97`	`return volume;`
`98`	`98`	`}, algo.testRepeat);`
`99`	`99`	`}`