[Bug Fix] Fix CastKernel for low-precision to complex type conversions (PaddlePaddle#75930)

youge325 · web-flow · commit 70b14ac9a61f · 2025-10-24T16:00:01.000+08:00
这些新增的特化让 CPU 版本的 `CastKernel` 在把 `float8_e5m2`、`float8_e4m3fn`、`bfloat16`、`float16` 等低精度类型转换成复数类型 (`complex64`/`complex128`) 时能够直接工作。之前模板的默认实现只会走 `static_cast&lt;OutT&gt;(in)`，对这些自定义浮点类型来说没有直达的构造函数到复数类型，会在编译期或运行期失败。现在通过先把它们显式转换成 `float` 或 `double` 来构造复数，补齐了这些 cast 组合，修复了 cast op 在上面这些输入/输出类型上的缺口。
diff --git a/paddle/phi/kernels/cpu/cast_impl.h b/paddle/phi/kernels/cpu/cast_impl.h
@@ -25,6 +25,63 @@ struct CastOpTransformFunctor {
   HOSTDEVICE OutT operator()(InT in) const { return static_cast<OutT>(in); }
 };
 
+template <>
+struct CastOpTransformFunctor<::phi::dtype::float8_e5m2, ::phi::complex64> {
+  HOSTDEVICE ::phi::complex64 operator()(::phi::dtype::float8_e5m2 in) const {
+    return ::phi::complex64(static_cast<float>(in));
+  }
+};
+
+template <>
+struct CastOpTransformFunctor<::phi::dtype::float8_e5m2, ::phi::complex128> {
+  HOSTDEVICE ::phi::complex128 operator()(::phi::dtype::float8_e5m2 in) const {
+    return ::phi::complex128(static_cast<double>(in));
+  }
+};
+
+template <>
+struct CastOpTransformFunctor<::phi::dtype::float8_e4m3fn, ::phi::complex64> {
+  HOSTDEVICE ::phi::complex64 operator()(::phi::dtype::float8_e4m3fn in) const {
+    return ::phi::complex64(static_cast<float>(in));
+  }
+};
+
+template <>
+struct CastOpTransformFunctor<::phi::dtype::float8_e4m3fn, ::phi::complex128> {
+  HOSTDEVICE ::phi::complex128 operator()(
+      ::phi::dtype::float8_e4m3fn in) const {
+    return ::phi::complex128(static_cast<double>(in));
+  }
+};
+
+template <>
+struct CastOpTransformFunctor<::phi::dtype::bfloat16, ::phi::complex64> {
+  HOSTDEVICE ::phi::complex64 operator()(::phi::dtype::bfloat16 in) const {
+    return ::phi::complex64(static_cast<float>(in));
+  }
+};
+
+template <>
+struct CastOpTransformFunctor<::phi::dtype::bfloat16, ::phi::complex128> {
+  HOSTDEVICE ::phi::complex128 operator()(::phi::dtype::bfloat16 in) const {
+    return ::phi::complex128(static_cast<double>(in));
+  }
+};
+
+template <>
+struct CastOpTransformFunctor<::phi::dtype::float16, ::phi::complex64> {
+  HOSTDEVICE ::phi::complex64 operator()(::phi::dtype::float16 in) const {
+    return ::phi::complex64(static_cast<float>(in));
+  }
+};
+
+template <>
+struct CastOpTransformFunctor<::phi::dtype::float16, ::phi::complex128> {
+  HOSTDEVICE ::phi::complex128 operator()(::phi::dtype::float16 in) const {
+    return ::phi::complex128(static_cast<double>(in));
+  }
+};
+
 template <typename InT, typename OutT>
 void CastKernelImpl(const CPUContext& dev_ctx,
                     const DenseTensor& x,