WIP

serge-sans-paille · serge-sans-paille · commit 36cd50cdd57a · 2025-07-14T08:36:31.000+02:00
diff --git a/include/xsimd/arch/xsimd_altivec.hpp b/include/xsimd/arch/xsimd_altivec.hpp
@@ -78,7 +78,7 @@ namespace xsimd
         template <class A, class T, class = typename std::enable_if<std::is_scalar<T>::value, void>::type>
         XSIMD_INLINE batch<T, A> add(batch<T, A> const& self, batch<T, A> const& other, requires_arch<altivec>) noexcept
         {
-            return vec_add(self, other);
+            return vec_add(self.data, other.data);
         }
 
         // all
@@ -661,8 +661,7 @@ namespace xsimd
         {
             XSIMD_IF_CONSTEXPR(sizeof(T) == 4)
             {
-                // FIXME: fine an in-order approach
-                auto tmp0 = vec_reve(self); // v3, v2, v1, v0
+                auto tmp0 = vec_reve(self.data); // v3, v2, v1, v0
                 auto tmp1 = vec_add(self.data, tmp0); // v0 + v3, v1 + v2, v2 + v1, v3 + v0
                 auto tmp2 = vec_permi(tmp1, tmp1, 0x3); // v2 + v1, v3 + v0, v2 + v1, v3 + v0
                 auto tmp3 = vec_add(tmp1, tmp2);
@@ -673,6 +672,16 @@ namespace xsimd
                 return hadd(self, common {});
             }
         }
+        template <class A>
+        XSIMD_INLINE float reduce_add(batch<float, A> const& self, requires_arch<altivec>) noexcept
+        {
+            // FIXME: find an in-order approach
+            auto tmp0 = vec_reve(self.data); // v3, v2, v1, v0
+            auto tmp1 = vec_add(self.data, tmp0); // v0 + v3, v1 + v2, v2 + v1, v3 + v0
+            auto tmp2 = vec_permi(tmp1, tmp1, 0x3); // v2 + v1, v3 + v0, v2 + v1, v3 + v0
+            auto tmp3 = vec_add(tmp1, tmp2);
+            return vec_extract(tmp3, 0);
+        }
 
 #if 0
         // reduce_max

Original file line number	Diff line number	Diff line change
`@@ -78,7 +78,7 @@ namespace xsimd`
`78`	`78`	`template <class A, class T, class = typename std::enable_if<std::is_scalar<T>::value, void>::type>`
`79`	`79`	`XSIMD_INLINE batch<T, A> add(batch<T, A> const& self, batch<T, A> const& other, requires_arch<altivec>) noexcept`
`80`	`80`	`{`
`81`		`- return vec_add(self, other);`
	`81`	`+ return vec_add(self.data, other.data);`
`82`	`82`	`}`
`83`	`83`
`84`	`84`	`// all`
`@@ -661,8 +661,7 @@ namespace xsimd`
`661`	`661`	`{`
`662`	`662`	`XSIMD_IF_CONSTEXPR(sizeof(T) == 4)`
`663`	`663`	`{`
`664`		`- // FIXME: fine an in-order approach`
`665`		`- auto tmp0 = vec_reve(self); // v3, v2, v1, v0`
	`664`	`+ auto tmp0 = vec_reve(self.data); // v3, v2, v1, v0`
`666`	`665`	`auto tmp1 = vec_add(self.data, tmp0); // v0 + v3, v1 + v2, v2 + v1, v3 + v0`
`667`	`666`	`auto tmp2 = vec_permi(tmp1, tmp1, 0x3); // v2 + v1, v3 + v0, v2 + v1, v3 + v0`
`668`	`667`	`auto tmp3 = vec_add(tmp1, tmp2);`
`@@ -673,6 +672,16 @@ namespace xsimd`
`673`	`672`	`return hadd(self, common {});`
`674`	`673`	`}`
`675`	`674`	`}`
	`675`	`+ template <class A>`
	`676`	`+ XSIMD_INLINE float reduce_add(batch<float, A> const& self, requires_arch<altivec>) noexcept`
	`677`	`+ {`
	`678`	`+ // FIXME: find an in-order approach`
	`679`	`+ auto tmp0 = vec_reve(self.data); // v3, v2, v1, v0`
	`680`	`+ auto tmp1 = vec_add(self.data, tmp0); // v0 + v3, v1 + v2, v2 + v1, v3 + v0`
	`681`	`+ auto tmp2 = vec_permi(tmp1, tmp1, 0x3); // v2 + v1, v3 + v0, v2 + v1, v3 + v0`
	`682`	`+ auto tmp3 = vec_add(tmp1, tmp2);`
	`683`	`+ return vec_extract(tmp3, 0);`
	`684`	`+ }`
`676`	`685`
`677`	`686`	`#if 0`
`678`	`687`	`// reduce_max`