Fix merge

Nexesenex · Nexesenex · commit c7c4d03e3e6c · 2025-07-25T13:14:46.000+02:00
diff --git a/ggml/src/ggml-cpu/vec.h b/ggml/src/ggml-cpu/vec.h
@@ -1425,19 +1425,19 @@ inline static void ggml_vec_geglu_erf_f32(const int n, float * y, const float *
 
 inline static void ggml_vec_geglu_erf_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {
     for (int i = 0; i < n; ++i) {
-        float xi = GGML_CPU_FP16_TO_FP32(x[i]);
-        float gi = GGML_CPU_FP16_TO_FP32(g[i]);
-        y[i] = GGML_CPU_FP32_TO_FP16(0.5f * xi * (1.0f + erff(xi*SQRT_2_INV)) * gi);
+        float xi = GGML_FP16_TO_FP32(x[i]);
+        float gi = GGML_FP16_TO_FP32(g[i]);
+        y[i] = GGML_FP32_TO_FP16(0.5f * xi * (1.0f + erff(xi*SQRT_2_INV)) * gi);
     }
 }
 
 #ifdef GGML_GELU_QUICK_FP16
 inline static void ggml_vec_geglu_quick_f32(const int n, float * y, const float * x, const float * g) {
     uint16_t t;
     for (int i = 0; i < n; ++i) {
-        ggml_fp16_t fp16 = GGML_CPU_FP32_TO_FP16(x[i]);
+        ggml_fp16_t fp16 = GGML_FP32_TO_FP16(x[i]);
         memcpy(&t, &fp16, sizeof(uint16_t));
-        y[i] = GGML_CPU_FP16_TO_FP32(ggml_table_gelu_quick_f16[t]) * g[i];
+        y[i] = GGML_FP16_TO_FP32(ggml_table_gelu_quick_f16[t]) * g[i];
     }
 }
 #else
@@ -1451,8 +1451,8 @@ inline static void ggml_vec_geglu_quick_f32(const int n, float * y, const float
 inline static void ggml_vec_geglu_quick_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {
     const uint16_t * i16 = (const uint16_t *) x;
     for (int i = 0; i < n; ++i) {
-        float v = GGML_CPU_FP16_TO_FP32(g[i]);
-        y[i] = GGML_CPU_FP32_TO_FP16(GGML_CPU_FP16_TO_FP32(ggml_table_gelu_quick_f16[i16[i]]) * v);
+        float v = GGML_FP16_TO_FP32(g[i]);
+        y[i] = GGML_FP32_TO_FP16(GGML_FP16_TO_FP32(ggml_table_gelu_quick_f16[i16[i]]) * v);
     }
 }
 

Original file line number	Diff line number	Diff line change
`@@ -1425,19 +1425,19 @@ inline static void ggml_vec_geglu_erf_f32(const int n, float * y, const float *`
`1425`	`1425`
`1426`	`1426`	`inline static void ggml_vec_geglu_erf_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {`
`1427`	`1427`	`for (int i = 0; i < n; ++i) {`
`1428`		`- float xi = GGML_CPU_FP16_TO_FP32(x[i]);`
`1429`		`- float gi = GGML_CPU_FP16_TO_FP32(g[i]);`
`1430`		`- y[i] = GGML_CPU_FP32_TO_FP16(0.5f * xi * (1.0f + erff(xiSQRT_2_INV)) gi);`
	`1428`	`+ float xi = GGML_FP16_TO_FP32(x[i]);`
	`1429`	`+ float gi = GGML_FP16_TO_FP32(g[i]);`
	`1430`	`+ y[i] = GGML_FP32_TO_FP16(0.5f * xi * (1.0f + erff(xiSQRT_2_INV)) gi);`
`1431`	`1431`	`}`
`1432`	`1432`	`}`
`1433`	`1433`
`1434`	`1434`	`#ifdef GGML_GELU_QUICK_FP16`
`1435`	`1435`	`inline static void ggml_vec_geglu_quick_f32(const int n, float * y, const float * x, const float * g) {`
`1436`	`1436`	`uint16_t t;`
`1437`	`1437`	`for (int i = 0; i < n; ++i) {`
`1438`		`- ggml_fp16_t fp16 = GGML_CPU_FP32_TO_FP16(x[i]);`
	`1438`	`+ ggml_fp16_t fp16 = GGML_FP32_TO_FP16(x[i]);`
`1439`	`1439`	`memcpy(&t, &fp16, sizeof(uint16_t));`
`1440`		`- y[i] = GGML_CPU_FP16_TO_FP32(ggml_table_gelu_quick_f16[t]) * g[i];`
	`1440`	`+ y[i] = GGML_FP16_TO_FP32(ggml_table_gelu_quick_f16[t]) * g[i];`
`1441`	`1441`	`}`
`1442`	`1442`	`}`
`1443`	`1443`	`#else`
`@@ -1451,8 +1451,8 @@ inline static void ggml_vec_geglu_quick_f32(const int n, float * y, const float`
`1451`	`1451`	`inline static void ggml_vec_geglu_quick_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {`
`1452`	`1452`	`const uint16_t * i16 = (const uint16_t *) x;`
`1453`	`1453`	`for (int i = 0; i < n; ++i) {`
`1454`		`- float v = GGML_CPU_FP16_TO_FP32(g[i]);`
`1455`		`- y[i] = GGML_CPU_FP32_TO_FP16(GGML_CPU_FP16_TO_FP32(ggml_table_gelu_quick_f16[i16[i]]) * v);`
	`1454`	`+ float v = GGML_FP16_TO_FP32(g[i]);`
	`1455`	`+ y[i] = GGML_FP32_TO_FP16(GGML_FP16_TO_FP32(ggml_table_gelu_quick_f16[i16[i]]) * v);`
`1456`	`1456`	`}`
`1457`	`1457`	`}`
`1458`	`1458`