lsp-plugins
diff --git a/‎CHANGELOG
Lines changed: 1 addition & 0 deletions b/‎CHANGELOG
Lines changed: 1 addition & 0 deletions
diff --git a/‎include/private/dsp/arch/generic/pmath/abs_vv.h
Lines changed: 18 additions & 18 deletions b/‎include/private/dsp/arch/generic/pmath/abs_vv.h
Lines changed: 18 additions & 18 deletions
diff --git a/‎include/private/dsp/arch/x86/avx/pmath/fmop_kx.h
Lines changed: 5 additions & 5 deletions b/‎include/private/dsp/arch/x86/avx/pmath/fmop_kx.h
Lines changed: 5 additions & 5 deletions
diff --git a/‎include/private/dsp/arch/x86/avx/pmath/normalize.h
Lines changed: 1 addition & 1 deletion b/‎include/private/dsp/arch/x86/avx/pmath/normalize.h
Lines changed: 1 addition & 1 deletion
diff --git a/‎include/private/dsp/arch/x86/avx/pmath/ssqrt.h
Lines changed: 1 addition & 2 deletions b/‎include/private/dsp/arch/x86/avx/pmath/ssqrt.h
Lines changed: 1 addition & 2 deletions
diff --git a/‎include/private/dsp/arch/x86/avx2/pmath/log.h
Lines changed: 0 additions & 2 deletions b/‎include/private/dsp/arch/x86/avx2/pmath/log.h
Lines changed: 0 additions & 2 deletions
diff --git a/‎include/private/dsp/arch/x86/avx512/pmath.h
Lines changed: 10 additions & 0 deletions b/‎include/private/dsp/arch/x86/avx512/pmath.h
Lines changed: 10 additions & 0 deletions
@@ -7,6 +7,7 @@
 * Implemented SIMD-optimized gate functions.
 * Fixed bun in AVX-512 implementation of mid/side conversion functions.
 * AVX512 optimization of packed complex functions.
+* Additional optimizations of parallel mathematics functions with AVX-512 instruction set.
 
 === 1.0.18 ===
 * Fixed compilation regression for 32-bit Clang compiler.
 
@@ -1,6 +1,6 @@
 /*
- * Copyright (C) 2020 Linux Studio Plugins Project <https://lsp-plug.in/>
- *           (C) 2020 Vladimir Sadovnikov <[email protected]>
+ * Copyright (C) 2023 Linux Studio Plugins Project <https://lsp-plug.in/>
+ *           (C) 2023 Vladimir Sadovnikov <[email protected]>
  *
  * This file is part of lsp-dsp-lib
  * Created on: 31 мар. 2020 г.
@@ -33,87 +33,87 @@ namespace lsp
         void abs1(float *dst, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]      = fabs(dst[i]);
+                dst[i]      = fabsf(dst[i]);
         }
 
         void abs2(float *dst, const float *src, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]      = fabs(src[i]);
+                dst[i]      = fabsf(src[i]);
         }
 
         void abs_add2(float *dst, const float *src, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]     += fabs(src[i]);
+                dst[i]     += fabsf(src[i]);
         }
 
         void abs_sub2(float *dst, const float *src, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]     -= fabs(src[i]);
+                dst[i]     -= fabsf(src[i]);
         }
 
         void abs_rsub2(float *dst, const float *src, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]     = fabs(src[i]) - dst[i];
+                dst[i]     = fabsf(src[i]) - dst[i];
         }
 
         void abs_mul2(float *dst, const float *src, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]     *= fabs(src[i]);
+                dst[i]     *= fabsf(src[i]);
         }
 
         void abs_div2(float *dst, const float *src, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]     /= fabs(src[i]);
+                dst[i]     /= fabsf(src[i]);
         }
 
         void abs_rdiv2(float *dst, const float *src, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]      = fabs(src[i]) / dst[i];
+                dst[i]      = fabsf(src[i]) / dst[i];
         }
 
         void abs_add3(float *dst, const float *src1, const float *src2, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]      = src1[i] + fabs(src2[i]);
+                dst[i]      = src1[i] + fabsf(src2[i]);
         }
 
         void abs_sub3(float *dst, const float *src1, const float *src2, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]      = src1[i] - fabs(src2[i]);
+                dst[i]      = src1[i] - fabsf(src2[i]);
         }
 
         void abs_rsub3(float *dst, const float *src1, const float *src2, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]      = fabs(src2[i]) - src1[i];
+                dst[i]      = fabsf(src2[i]) - src1[i];
         }
 
         void abs_mul3(float *dst, const float *src1, const float *src2, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]      = src1[i] * fabs(src2[i]);
+                dst[i]      = src1[i] * fabsf(src2[i]);
         }
 
         void abs_div3(float *dst, const float *src1, const float *src2, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]      = src1[i] / fabs(src2[i]);
+                dst[i]      = src1[i] / fabsf(src2[i]);
         }
 
         void abs_rdiv3(float *dst, const float *src1, const float *src2, size_t count)
         {
             for (size_t i=0; i<count; ++i)
-                dst[i]      = fabs(src2[i]) / src1[i];
+                dst[i]      = fabsf(src2[i]) / src1[i];
         }
-    }
-}
+    } /* namespace generic */
+} /* namespace lsp */
 
 #endif /* PRIVATE_DSP_ARCH_GENERIC_PMATH_ABS_VV_H_ */
@@ -1,6 +1,6 @@
 /*
- * Copyright (C) 2020 Linux Studio Plugins Project <https://lsp-plug.in/>
- *           (C) 2020 Vladimir Sadovnikov <[email protected]>
+ * Copyright (C) 2023 Linux Studio Plugins Project <https://lsp-plug.in/>
+ *           (C) 2023 Vladimir Sadovnikov <[email protected]>
  *
  * This file is part of lsp-dsp-lib
  * Created on: 31 мар. 2020 г.
@@ -30,7 +30,7 @@ namespace lsp
 {
     namespace avx
     {
-    #define OP_DSEL(a, b)   a
+        #define OP_DSEL(a, b)   a
         #define OP_RSEL(a, b)   b
 
         #define FMADDSUB_K3_CORE(DST, SRC1, SRC2, OP) \
@@ -659,7 +659,7 @@ namespace lsp
 
         #undef OP_DSEL
         #undef OP_RSEL
-    }
-}
+    } /* namespace avx */
+} /* namespace lsp */
 
 #endif /* PRIVATE_DSP_ARCH_X86_AVX_PMATH_FMOP_KX_H_ */
@@ -32,7 +32,7 @@ namespace lsp
     {
 
         IF_ARCH_X86(
-            static const uint32_t normalize_const[] __lsp_aligned16 =
+            static const uint32_t normalize_const[] __lsp_aligned32 =
             {
                 LSP_DSP_VEC8(0x7fffffff),
                 LSP_DSP_VEC8(0x3f800000)    /* 1.0f */
 
@@ -63,9 +63,8 @@ namespace lsp
         __ASM_EMIT("vsqrtps     %%ymm1, %%ymm1") \
         __ASM_EMIT("vmovups     %%ymm0, 0x00(%[" DST "], %[off])") \
         __ASM_EMIT("vmovups     %%ymm1, 0x20(%[" DST "], %[off])") \
-        __ASM_EMIT("add         $0x40, %[off]") \
         __ASM_EMIT("sub         $16, %[count]") \
-        __ASM_EMIT("jae         1b") \
+        __ASM_EMIT("add         $0x40, %[off]") \
         __ASM_EMIT("4:") \
         /* 8x block */ \
         __ASM_EMIT("add         $8, %[count]") \
 
@@ -2358,7 +2358,6 @@ namespace lsp
                 __ASM_EMIT("vmovups         %%ymm0, 0x00(%[dst])")
                 __ASM_EMIT("add             $0x20, %[dst]")
                 __ASM_EMIT("sub             $8, %[count]")
-                __ASM_EMIT("jae             1b")
                 __ASM_EMIT("6:")
                 // x4 block
                 __ASM_EMIT("add             $4, %[count]")
@@ -2430,7 +2429,6 @@ namespace lsp
                 __ASM_EMIT("vmovups         %%ymm0, 0x00(%[dst])")
                 __ASM_EMIT("add             $0x20, %[dst]")
                 __ASM_EMIT("sub             $8, %[count]")
-                __ASM_EMIT("jae             1b")
                 __ASM_EMIT("4:")
                 // x4 block
                 __ASM_EMIT("add             $4, %[count]")
 
@@ -26,6 +26,16 @@
     #error "This header should not be included directly"
 #endif /* PRIVATE_DSP_ARCH_X86_AVX512_IMPL */
 
+#include <private/dsp/arch/x86/avx512/pmath/abs_vv.h>
+#include <private/dsp/arch/x86/avx512/pmath/exp.h>
+#include <private/dsp/arch/x86/avx512/pmath/fmop_kx.h>
+#include <private/dsp/arch/x86/avx512/pmath/fmop_vv.h>
+#include <private/dsp/arch/x86/avx512/pmath/log.h>
+#include <private/dsp/arch/x86/avx512/pmath/lramp.h>
+#include <private/dsp/arch/x86/avx512/pmath/minmax.h>
+#include <private/dsp/arch/x86/avx512/pmath/normalize.h>
+#include <private/dsp/arch/x86/avx512/pmath/op_kx.h>
+#include <private/dsp/arch/x86/avx512/pmath/op_vv.h>
 #include <private/dsp/arch/x86/avx512/pmath/sqr.h>
 #include <private/dsp/arch/x86/avx512/pmath/ssqrt.h>
Original file line number	Diff line number	Diff line change
`@@ -1,6 +1,6 @@`
`1`	`1`	`/*`
`2`		`- * Copyright (C) 2020 Linux Studio Plugins Project <https://lsp-plug.in/>`
`3`		`- * (C) 2020 Vladimir Sadovnikov <[email protected]>`
	`2`	`+ * Copyright (C) 2023 Linux Studio Plugins Project <https://lsp-plug.in/>`
	`3`	`+ * (C) 2023 Vladimir Sadovnikov <[email protected]>`
`4`	`4`	`*`
`5`	`5`	`* This file is part of lsp-dsp-lib`
`6`	`6`	`* Created on: 31 мар. 2020 г.`
`@@ -33,87 +33,87 @@ namespace lsp`
`33`	`33`	`void abs1(float *dst, size_t count)`
`34`	`34`	`{`
`35`	`35`	`for (size_t i=0; i<count; ++i)`
`36`		`- dst[i] = fabs(dst[i]);`
	`36`	`+ dst[i] = fabsf(dst[i]);`
`37`	`37`	`}`
`38`	`38`
`39`	`39`	`void abs2(float dst, const float src, size_t count)`
`40`	`40`	`{`
`41`	`41`	`for (size_t i=0; i<count; ++i)`
`42`		`- dst[i] = fabs(src[i]);`
	`42`	`+ dst[i] = fabsf(src[i]);`
`43`	`43`	`}`
`44`	`44`
`45`	`45`	`void abs_add2(float dst, const float src, size_t count)`
`46`	`46`	`{`
`47`	`47`	`for (size_t i=0; i<count; ++i)`
`48`		`- dst[i] += fabs(src[i]);`
	`48`	`+ dst[i] += fabsf(src[i]);`
`49`	`49`	`}`
`50`	`50`
`51`	`51`	`void abs_sub2(float dst, const float src, size_t count)`
`52`	`52`	`{`
`53`	`53`	`for (size_t i=0; i<count; ++i)`
`54`		`- dst[i] -= fabs(src[i]);`
	`54`	`+ dst[i] -= fabsf(src[i]);`
`55`	`55`	`}`
`56`	`56`
`57`	`57`	`void abs_rsub2(float dst, const float src, size_t count)`
`58`	`58`	`{`
`59`	`59`	`for (size_t i=0; i<count; ++i)`
`60`		`- dst[i] = fabs(src[i]) - dst[i];`
	`60`	`+ dst[i] = fabsf(src[i]) - dst[i];`
`61`	`61`	`}`
`62`	`62`
`63`	`63`	`void abs_mul2(float dst, const float src, size_t count)`
`64`	`64`	`{`
`65`	`65`	`for (size_t i=0; i<count; ++i)`
`66`		`- dst[i] *= fabs(src[i]);`
	`66`	`+ dst[i] *= fabsf(src[i]);`
`67`	`67`	`}`
`68`	`68`
`69`	`69`	`void abs_div2(float dst, const float src, size_t count)`
`70`	`70`	`{`
`71`	`71`	`for (size_t i=0; i<count; ++i)`
`72`		`- dst[i] /= fabs(src[i]);`
	`72`	`+ dst[i] /= fabsf(src[i]);`
`73`	`73`	`}`
`74`	`74`
`75`	`75`	`void abs_rdiv2(float dst, const float src, size_t count)`
`76`	`76`	`{`
`77`	`77`	`for (size_t i=0; i<count; ++i)`
`78`		`- dst[i] = fabs(src[i]) / dst[i];`
	`78`	`+ dst[i] = fabsf(src[i]) / dst[i];`
`79`	`79`	`}`
`80`	`80`
`81`	`81`	`void abs_add3(float dst, const float src1, const float *src2, size_t count)`
`82`	`82`	`{`
`83`	`83`	`for (size_t i=0; i<count; ++i)`
`84`		`- dst[i] = src1[i] + fabs(src2[i]);`
	`84`	`+ dst[i] = src1[i] + fabsf(src2[i]);`
`85`	`85`	`}`
`86`	`86`
`87`	`87`	`void abs_sub3(float dst, const float src1, const float *src2, size_t count)`
`88`	`88`	`{`
`89`	`89`	`for (size_t i=0; i<count; ++i)`
`90`		`- dst[i] = src1[i] - fabs(src2[i]);`
	`90`	`+ dst[i] = src1[i] - fabsf(src2[i]);`
`91`	`91`	`}`
`92`	`92`
`93`	`93`	`void abs_rsub3(float dst, const float src1, const float *src2, size_t count)`
`94`	`94`	`{`
`95`	`95`	`for (size_t i=0; i<count; ++i)`
`96`		`- dst[i] = fabs(src2[i]) - src1[i];`
	`96`	`+ dst[i] = fabsf(src2[i]) - src1[i];`
`97`	`97`	`}`
`98`	`98`
`99`	`99`	`void abs_mul3(float dst, const float src1, const float *src2, size_t count)`
`100`	`100`	`{`
`101`	`101`	`for (size_t i=0; i<count; ++i)`
`102`		`- dst[i] = src1[i] * fabs(src2[i]);`
	`102`	`+ dst[i] = src1[i] * fabsf(src2[i]);`
`103`	`103`	`}`
`104`	`104`
`105`	`105`	`void abs_div3(float dst, const float src1, const float *src2, size_t count)`
`106`	`106`	`{`
`107`	`107`	`for (size_t i=0; i<count; ++i)`
`108`		`- dst[i] = src1[i] / fabs(src2[i]);`
	`108`	`+ dst[i] = src1[i] / fabsf(src2[i]);`
`109`	`109`	`}`
`110`	`110`
`111`	`111`	`void abs_rdiv3(float dst, const float src1, const float *src2, size_t count)`
`112`	`112`	`{`
`113`	`113`	`for (size_t i=0; i<count; ++i)`
`114`		`- dst[i] = fabs(src2[i]) / src1[i];`
	`114`	`+ dst[i] = fabsf(src2[i]) / src1[i];`
`115`	`115`	`}`
`116`		`- }`
`117`		`-}`
	`116`	`+ } /* namespace generic */`
	`117`	`+} /* namespace lsp */`
`118`	`118`
`119`	`119`	`#endif /* PRIVATE_DSP_ARCH_GENERIC_PMATH_ABS_VV_H_ */`
Original file line number	Diff line number	Diff line change
`@@ -32,7 +32,7 @@ namespace lsp`
`32`	`32`	`{`
`33`	`33`
`34`	`34`	`IF_ARCH_X86(`
`35`		`- static const uint32_t normalize_const[] __lsp_aligned16 =`
	`35`	`+ static const uint32_t normalize_const[] __lsp_aligned32 =`
`36`	`36`	`{`
`37`	`37`	`LSP_DSP_VEC8(0x7fffffff),`
`38`	`38`	`LSP_DSP_VEC8(0x3f800000) /* 1.0f */`