add compress&expand in avx512vbmi2

junparser · serge-sans-paille · commit 83d884fa348f · 2025-04-03T08:45:18.000Z
diff --git a/include/xsimd/arch/xsimd_avx512vbmi2.hpp b/include/xsimd/arch/xsimd_avx512vbmi2.hpp
@@ -17,4 +17,57 @@
 
 #include "../types/xsimd_avx512vbmi2_register.hpp"
 
+namespace xsimd
+{
+
+    namespace kernel
+    {
+        using namespace types;
+
+        // compress
+        template <class A>
+        XSIMD_INLINE batch<int16_t, A> compress(batch<int16_t, A> const& self, batch_bool<int16_t, A> const& mask, requires_arch<avx512vbmi2>) noexcept
+        {
+            return _mm512_maskz_compress_epi16(mask.mask(), self);
+        }
+        template <class A>
+        XSIMD_INLINE batch<uint16_t, A> compress(batch<uint16_t, A> const& self, batch_bool<uint16_t, A> const& mask, requires_arch<avx512vbmi2>) noexcept
+        {
+            return _mm512_maskz_compress_epi16(mask.mask(), self);
+        }
+        template <class A>
+        XSIMD_INLINE batch<int8_t, A> compress(batch<int8_t, A> const& self, batch_bool<int8_t, A> const& mask, requires_arch<avx512vbmi2>) noexcept
+        {
+            return _mm512_maskz_compress_epi8(mask.mask(), self);
+        }
+        template <class A>
+        XSIMD_INLINE batch<uint8_t, A> compress(batch<uint8_t, A> const& self, batch_bool<uint8_t, A> const& mask, requires_arch<avx512vbmi2>) noexcept
+        {
+            return _mm512_maskz_compress_epi8(mask.mask(), self);
+        }
+
+        // expand
+        template <class A>
+        XSIMD_INLINE batch<int16_t, A> expand(batch<int16_t, A> const& self, batch_bool<int16_t, A> const& mask, requires_arch<avx512vbmi2>) noexcept
+        {
+            return _mm512_maskz_expand_epi16(mask.mask(), self);
+        }
+        template <class A>
+        XSIMD_INLINE batch<uint16_t, A> expand(batch<uint16_t, A> const& self, batch_bool<uint16_t, A> const& mask, requires_arch<avx512vbmi2>) noexcept
+        {
+            return _mm512_maskz_expand_epi16(mask.mask(), self);
+        }
+        template <class A>
+        XSIMD_INLINE batch<int8_t, A> expand(batch<int8_t, A> const& self, batch_bool<int8_t, A> const& mask, requires_arch<avx512vbmi2>) noexcept
+        {
+            return _mm512_maskz_expand_epi8(mask.mask(), self);
+        }
+        template <class A>
+        XSIMD_INLINE batch<uint8_t, A> expand(batch<uint8_t, A> const& self, batch_bool<uint8_t, A> const& mask, requires_arch<avx512vbmi2>) noexcept
+        {
+            return _mm512_maskz_expand_epi8(mask.mask(), self);
+        }
+    }
+}
+
 #endif
diff --git a/test/test_shuffle.cpp b/test/test_shuffle.cpp
@@ -347,7 +347,7 @@ struct compress_test
     }
 };
 
-TEST_CASE_TEMPLATE("[compress]", B, BATCH_FLOAT_TYPES, xsimd::batch<uint32_t>, xsimd::batch<int32_t>, xsimd::batch<uint64_t>, xsimd::batch<int64_t>)
+TEST_CASE_TEMPLATE("[compress]", B, BATCH_FLOAT_TYPES, xsimd::batch<uint8_t>, xsimd::batch<int8_t>, xsimd::batch<uint16_t>, xsimd::batch<int16_t>, xsimd::batch<uint32_t>, xsimd::batch<int32_t>, xsimd::batch<uint64_t>, xsimd::batch<int64_t>)
 {
     compress_test<B> Test;
     SUBCASE("empty")
@@ -443,7 +443,7 @@ struct expand_test
     }
 };
 
-TEST_CASE_TEMPLATE("[expand]", B, BATCH_FLOAT_TYPES, xsimd::batch<uint32_t>, xsimd::batch<int32_t>, xsimd::batch<uint64_t>, xsimd::batch<int64_t>)
+TEST_CASE_TEMPLATE("[expand]", B, BATCH_FLOAT_TYPES, xsimd::batch<uint8_t>, xsimd::batch<int8_t>, xsimd::batch<uint16_t>, xsimd::batch<int16_t>, xsimd::batch<uint32_t>, xsimd::batch<int32_t>, xsimd::batch<uint64_t>, xsimd::batch<int64_t>)
 {
     expand_test<B> Test;
     SUBCASE("empty")

Original file line number	Diff line number	Diff line change
`@@ -347,7 +347,7 @@ struct compress_test`
`347`	`347`	`}`
`348`	`348`	`};`
`349`	`349`
`350`		`-TEST_CASE_TEMPLATE("[compress]", B, BATCH_FLOAT_TYPES, xsimd::batch<uint32_t>, xsimd::batch<int32_t>, xsimd::batch<uint64_t>, xsimd::batch<int64_t>)`
	`350`	`+TEST_CASE_TEMPLATE("[compress]", B, BATCH_FLOAT_TYPES, xsimd::batch<uint8_t>, xsimd::batch<int8_t>, xsimd::batch<uint16_t>, xsimd::batch<int16_t>, xsimd::batch<uint32_t>, xsimd::batch<int32_t>, xsimd::batch<uint64_t>, xsimd::batch<int64_t>)`
`351`	`351`	`{`
`352`	`352`	`compress_test<B> Test;`
`353`	`353`	`SUBCASE("empty")`
`@@ -443,7 +443,7 @@ struct expand_test`
`443`	`443`	`}`
`444`	`444`	`};`
`445`	`445`
`446`		`-TEST_CASE_TEMPLATE("[expand]", B, BATCH_FLOAT_TYPES, xsimd::batch<uint32_t>, xsimd::batch<int32_t>, xsimd::batch<uint64_t>, xsimd::batch<int64_t>)`
	`446`	`+TEST_CASE_TEMPLATE("[expand]", B, BATCH_FLOAT_TYPES, xsimd::batch<uint8_t>, xsimd::batch<int8_t>, xsimd::batch<uint16_t>, xsimd::batch<int16_t>, xsimd::batch<uint32_t>, xsimd::batch<int32_t>, xsimd::batch<uint64_t>, xsimd::batch<int64_t>)`
`447`	`447`	`{`
`448`	`448`	`expand_test<B> Test;`
`449`	`449`	`SUBCASE("empty")`