More tweaks

kunitoki · kunitoki · commit 140471017e95 · 2025-08-07T13:09:48.000+02:00
diff --git a/modules/yup_audio_basics/buffers/yup_FloatVectorOperations.cpp b/modules/yup_audio_basics/buffers/yup_FloatVectorOperations.cpp
@@ -1341,24 +1341,48 @@ double findMaximum (const double* src, Size num) noexcept
 template <typename Size>
 void convertFixedToFloat (float* dest, const int* src, float multiplier, Size num) noexcept
 {
-#if YUP_USE_ARM_NEON
+#if YUP_USE_VDSP_FRAMEWORK
+    vDSP_vflt32 (reinterpret_cast<const int*> (src), 1, dest, 1, (vDSP_Length) num);
+    vDSP_vsmul (dest, 1, &multiplier, dest, 1, (vDSP_Length) num);
+#elif YUP_USE_ARM_NEON
     YUP_PERFORM_VEC_OP_SRC_DEST (dest[i] = (float) src[i] * multiplier,
                                  vmulq_n_f32 (vcvtq_f32_s32 (vld1q_s32 (src)), multiplier),
                                  YUP_LOAD_NONE,
                                  YUP_INCREMENT_SRC_DEST, )
-#else
+#elif YUP_USE_SSE_INTRINSICS
     YUP_PERFORM_VEC_OP_SRC_DEST (dest[i] = (float) src[i] * multiplier,
                                  Mode::mul (mult, _mm_cvtepi32_ps (_mm_loadu_si128 (reinterpret_cast<const __m128i*> (src)))),
                                  YUP_LOAD_NONE,
                                  YUP_INCREMENT_SRC_DEST,
                                  const Mode::ParallelType mult = Mode::load1 (multiplier);)
+#else
+    for (Size i = 0; i < num; ++i)
+        dest[i] = (float) src[i] * multiplier;
 #endif
 }
 
 template <typename Size>
 void convertFloatToFixed (int* dest, const float* src, float multiplier, Size num) noexcept
 {
-#if YUP_USE_ARM_NEON
+#if YUP_USE_VDSP_FRAMEWORK
+    constexpr Size kStackBufferSize = 256;
+    float stackBuffer[kStackBufferSize];
+
+    if (num <= kStackBufferSize)
+    {
+        vDSP_vsmul (src, 1, &multiplier, stackBuffer, 1, (vDSP_Length) num);
+        vDSP_vfix32 (stackBuffer, 1, reinterpret_cast<int*> (dest), 1, (vDSP_Length) num);
+    }
+    else
+    {
+        for (Size i = 0; i < num; i += kStackBufferSize)
+        {
+            const Size currentChunk = jmin (kStackBufferSize, num - i);
+            vDSP_vsmul (src + i, 1, &multiplier, stackBuffer, 1, (vDSP_Length) currentChunk);
+            vDSP_vfix32 (stackBuffer, 1, reinterpret_cast<int*> (dest + i), 1, (vDSP_Length) currentChunk);
+        }
+    }
+#elif YUP_USE_ARM_NEON
     const auto numLongs = num & ~3;
 
     if (numLongs != 0)
@@ -1374,7 +1398,6 @@ void convertFloatToFixed (int* dest, const float* src, float multiplier, Size nu
 
     for (Size i = numLongs; i < num; ++i)
         dest[i] = (int) (src[i] * multiplier);
-
 #elif YUP_USE_SSE_INTRINSICS
     const auto numLongs = num & ~3;
     const __m128 mult = _mm_set1_ps (multiplier);
@@ -1392,7 +1415,115 @@ void convertFloatToFixed (int* dest, const float* src, float multiplier, Size nu
 
     for (Size i = numLongs; i < num; ++i)
         dest[i] = (int) (src[i] * multiplier);
+#else
+    for (Size i = 0; i < num; ++i)
+        dest[i] = (int) (src[i] * multiplier);
+#endif
+}
+
+template <typename Size>
+void convertFixedToFloat (double* dest, const int* src, double multiplier, Size num) noexcept
+{
+#if YUP_USE_VDSP_FRAMEWORK
+    vDSP_vflt32D (reinterpret_cast<const int*> (src), 1, dest, 1, (vDSP_Length) num);
+    vDSP_vsmulD (dest, 1, &multiplier, dest, 1, (vDSP_Length) num);
+#elif YUP_USE_ARM_NEON
+    const auto numLongs = num & ~1;
+
+    if (numLongs != 0)
+    {
+        for (Size i = 0; i < numLongs; i += 2)
+        {
+            int32x2_t intVec = vld1_s32 (src + i);
+            int val0 = vget_lane_s32 (intVec, 0);
+            int val1 = vget_lane_s32 (intVec, 1);
+            dest[i] = (double) val0 * multiplier;
+            dest[i + 1] = (double) val1 * multiplier;
+        }
+    }
+
+    for (Size i = numLongs; i < num; ++i)
+        dest[i] = (double) src[i] * multiplier;
+#elif YUP_USE_SSE_INTRINSICS
+    const auto numLongs = num & ~1;
+
+    if (numLongs != 0)
+    {
+        for (Size i = 0; i < numLongs; i += 2)
+        {
+            __m128i intVec = _mm_loadl_epi64 (reinterpret_cast<const __m128i*> (src + i));
+            int val0 = _mm_extract_epi32 (intVec, 0);
+            int val1 = _mm_extract_epi32 (intVec, 1);
+            dest[i] = (double) val0 * multiplier;
+            dest[i + 1] = (double) val1 * multiplier;
+        }
+    }
+
+    for (Size i = numLongs; i < num; ++i)
+        dest[i] = (double) src[i] * multiplier;
+#else
+    for (Size i = 0; i < num; ++i)
+        dest[i] = (double) src[i] * multiplier;
+
+#endif
+}
+
+template <typename Size>
+void convertFloatToFixed (int* dest, const double* src, double multiplier, Size num) noexcept
+{
+#if YUP_USE_VDSP_FRAMEWORK
+    constexpr Size kStackBufferSize = 256;
+    double stackBuffer[kStackBufferSize];
+
+    if (num <= kStackBufferSize)
+    {
+        vDSP_vsmulD (src, 1, &multiplier, stackBuffer, 1, (vDSP_Length) num);
+        vDSP_vfix32D (stackBuffer, 1, reinterpret_cast<int*> (dest), 1, (vDSP_Length) num);
+    }
+    else
+    {
+        for (Size i = 0; i < num; i += kStackBufferSize)
+        {
+            const Size currentChunk = jmin (kStackBufferSize, num - i);
+            vDSP_vsmulD (src + i, 1, &multiplier, stackBuffer, 1, (vDSP_Length) currentChunk);
+            vDSP_vfix32D (stackBuffer, 1, reinterpret_cast<int*> (dest + i), 1, (vDSP_Length) currentChunk);
+        }
+    }
+#elif YUP_USE_ARM_NEON
+    const auto numLongs = num & ~1;
+
+    if (numLongs != 0)
+    {
+        for (Size i = 0; i < numLongs; i += 2)
+        {
+            float64x2_t doubleVec = vld1q_f64 (src + i);
+            float64x2_t scaledVec = vmulq_n_f64 (doubleVec, multiplier);
+            double d0 = vgetq_lane_f64 (scaledVec, 0);
+            double d1 = vgetq_lane_f64 (scaledVec, 1);
+            dest[i] = (int) d0;
+            dest[i + 1] = (int) d1;
+        }
+    }
+
+    for (Size i = numLongs; i < num; ++i)
+        dest[i] = (int) (src[i] * multiplier);
+#elif YUP_USE_SSE_INTRINSICS
+    const auto numLongs = num & ~1;
+    const __m128d mult = _mm_set1_pd (multiplier);
+
+    if (numLongs != 0)
+    {
+        for (Size i = 0; i < numLongs; i += 2)
+        {
+            __m128d doubleVec = _mm_loadu_pd (src + i);
+            __m128d scaledVec = _mm_mul_pd (doubleVec, mult);
+            __m128i intVec = _mm_cvtpd_epi32 (scaledVec);
+            _mm_storel_epi64 (reinterpret_cast<__m128i*> (dest + i), intVec);
+        }
+    }
 
+    for (Size i = numLongs; i < num; ++i)
+        dest[i] = (int) (src[i] * multiplier);
 #else
     for (Size i = 0; i < num; ++i)
         dest[i] = (int) (src[i] * multiplier);
@@ -1639,30 +1770,32 @@ FloatType YUP_CALLTYPE FloatVectorOperationsBase<FloatType, CountType>::findMaxi
     return FloatVectorHelpers::findMaximum (src, numValues);
 }
 
-template struct FloatVectorOperationsBase<float, int>;
-template struct FloatVectorOperationsBase<float, size_t>;
-template struct FloatVectorOperationsBase<double, int>;
-template struct FloatVectorOperationsBase<double, size_t>;
-
-void YUP_CALLTYPE FloatVectorOperations::convertFixedToFloat (float* dest, const int* src, float multiplier, size_t num) noexcept
+template <typename FloatType, typename CountType>
+void YUP_CALLTYPE FloatVectorOperationsBase<FloatType, CountType>::convertFixedToFloat (FloatType* dest,
+                                                                                        const int* src,
+                                                                                        FloatType multiplier,
+                                                                                        CountType numValues) noexcept
 {
-    FloatVectorHelpers::convertFixedToFloat (dest, src, multiplier, num);
+    FloatVectorHelpers::convertFixedToFloat (dest, src, multiplier, numValues);
 }
 
-void YUP_CALLTYPE FloatVectorOperations::convertFixedToFloat (float* dest, const int* src, float multiplier, int num) noexcept
+template <typename FloatType, typename CountType>
+void YUP_CALLTYPE FloatVectorOperationsBase<FloatType, CountType>::convertFloatToFixed (int* dest,
+                                                                                        const FloatType* src,
+                                                                                        FloatType multiplier,
+                                                                                        CountType numValues) noexcept
 {
-    FloatVectorHelpers::convertFixedToFloat (dest, src, multiplier, num);
+    FloatVectorHelpers::convertFloatToFixed (dest, src, multiplier, numValues);
 }
 
-void YUP_CALLTYPE FloatVectorOperations::convertFloatToFixed (int* dest, const float* src, float multiplier, size_t num) noexcept
-{
-    FloatVectorHelpers::convertFloatToFixed (dest, src, multiplier, num);
-}
+//==============================================================================
 
-void YUP_CALLTYPE FloatVectorOperations::convertFloatToFixed (int* dest, const float* src, float multiplier, int num) noexcept
-{
-    FloatVectorHelpers::convertFloatToFixed (dest, src, multiplier, num);
-}
+template struct FloatVectorOperationsBase<float, int>;
+template struct FloatVectorOperationsBase<float, size_t>;
+template struct FloatVectorOperationsBase<double, int>;
+template struct FloatVectorOperationsBase<double, size_t>;
+
+//==============================================================================
 
 intptr_t YUP_CALLTYPE FloatVectorOperations::getFpStatusRegister() noexcept
 {
@@ -1770,6 +1903,8 @@ bool YUP_CALLTYPE FloatVectorOperations::areDenormalsDisabled() noexcept
 #endif
 }
 
+//==============================================================================
+
 ScopedNoDenormals::ScopedNoDenormals() noexcept
 {
 #if YUP_USE_SSE_INTRINSICS || (YUP_USE_ARM_NEON || (YUP_64BIT && YUP_ARM))
diff --git a/modules/yup_audio_basics/buffers/yup_FloatVectorOperations.h b/modules/yup_audio_basics/buffers/yup_FloatVectorOperations.h
@@ -155,6 +155,12 @@ struct FloatVectorOperationsBase
 
     /** Finds the maximum value in the given array. */
     static FloatType YUP_CALLTYPE findMaximum (const FloatType* src, CountType numValues) noexcept;
+    
+    /** Converts an array of fixed-point integers to floating point values. */
+    static void YUP_CALLTYPE convertFixedToFloat (FloatType* dest, const int* src, FloatType multiplier, CountType numValues) noexcept;
+    
+    /** Converts an array of floating point values to fixed-point integers. */
+    static void YUP_CALLTYPE convertFloatToFixed (int* dest, const FloatType* src, FloatType multiplier, CountType numValues) noexcept;
 };
 
 #if ! DOXYGEN
@@ -180,7 +186,9 @@ struct NameForwarder : public Bases...
         Bases::clip...,
         Bases::findMinAndMax...,
         Bases::findMinimum...,
-        Bases::findMaximum...;
+        Bases::findMaximum...,
+        Bases::convertFixedToFloat...,
+        Bases::convertFloatToFixed...;
 };
 
 } // namespace detail
@@ -199,13 +207,6 @@ struct NameForwarder : public Bases...
 class YUP_API FloatVectorOperations : public detail::NameForwarder<FloatVectorOperationsBase<float, int>, FloatVectorOperationsBase<float, size_t>, FloatVectorOperationsBase<double, int>, FloatVectorOperationsBase<double, size_t>>
 {
 public:
-    static void YUP_CALLTYPE convertFixedToFloat (float* dest, const int* src, float multiplier, int num) noexcept;
-
-    static void YUP_CALLTYPE convertFixedToFloat (float* dest, const int* src, float multiplier, size_t num) noexcept;
-
-    static void YUP_CALLTYPE convertFloatToFixed (int* dest, const float* src, float multiplier, int num) noexcept;
-
-    static void YUP_CALLTYPE convertFloatToFixed (int* dest, const float* src, float multiplier, size_t num) noexcept;
 
     /** This method enables or disables the SSE/NEON flush-to-zero mode. */
     static void YUP_CALLTYPE enableFlushToZeroMode (bool shouldEnable) noexcept;
diff --git a/tests/yup_audio_basics/yup_FloatVectorOperations.cpp b/tests/yup_audio_basics/yup_FloatVectorOperations.cpp