Fix Merge

Nexesenex · Nexesenex · commit 2a93c7a13efc · 2025-07-04T16:40:48.000+02:00
diff --git a/ggml/src/ggml-cpu/vec.h b/ggml/src/ggml-cpu/vec.h
@@ -1386,19 +1386,19 @@ inline static void ggml_vec_geglu_erf_f32(const int n, float * y, const float *
 
 inline static void ggml_vec_geglu_erf_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {
     for (int i = 0; i < n; ++i) {
-        float xi = GGML_CPU_FP16_TO_FP32(x[i]);
-        float gi = GGML_CPU_FP16_TO_FP32(g[i]);
-        y[i] = GGML_CPU_FP32_TO_FP16(0.5f * xi * (1.0f + erff(xi*SQRT_2_INV)) * gi);
+        float xi = GGML_FP16_TO_FP32(x[i]);
+        float gi = GGML_FP16_TO_FP32(g[i]);
+        y[i] = GGML_FP32_TO_FP16(0.5f * xi * (1.0f + erff(xi*SQRT_2_INV)) * gi);
     }
 }
 
 #ifdef GGML_GELU_QUICK_FP16
 inline static void ggml_vec_geglu_quick_f32(const int n, float * y, const float * x, const float * g) {
     uint16_t t;
     for (int i = 0; i < n; ++i) {
-        ggml_fp16_t fp16 = GGML_CPU_FP32_TO_FP16(x[i]);
+        ggml_fp16_t fp16 = GGML_FP32_TO_FP16(x[i]);
         memcpy(&t, &fp16, sizeof(uint16_t));
-        y[i] = GGML_CPU_FP16_TO_FP32(ggml_table_gelu_quick_f16[t]) * g[i];
+        y[i] = GGML_FP16_TO_FP32(ggml_table_gelu_quick_f16[t]) * g[i];
     }
 }
 #else
@@ -1412,8 +1412,8 @@ inline static void ggml_vec_geglu_quick_f32(const int n, float * y, const float
 inline static void ggml_vec_geglu_quick_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {
     const uint16_t * i16 = (const uint16_t *) x;
     for (int i = 0; i < n; ++i) {
-        float v = GGML_CPU_FP16_TO_FP32(g[i]);
-        y[i] = GGML_CPU_FP32_TO_FP16(GGML_CPU_FP16_TO_FP32(ggml_table_gelu_quick_f16[i16[i]]) * v);
+        float v = GGML_FP16_TO_FP32(g[i]);
+        y[i] = GGML_FP32_TO_FP16(GGML_FP16_TO_FP32(ggml_table_gelu_quick_f16[i16[i]]) * v);
     }
 }
 

Original file line number	Diff line number	Diff line change
`@@ -1386,19 +1386,19 @@ inline static void ggml_vec_geglu_erf_f32(const int n, float * y, const float *`
`1386`	`1386`
`1387`	`1387`	`inline static void ggml_vec_geglu_erf_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {`
`1388`	`1388`	`for (int i = 0; i < n; ++i) {`
`1389`		`- float xi = GGML_CPU_FP16_TO_FP32(x[i]);`
`1390`		`- float gi = GGML_CPU_FP16_TO_FP32(g[i]);`
`1391`		`- y[i] = GGML_CPU_FP32_TO_FP16(0.5f * xi * (1.0f + erff(xiSQRT_2_INV)) gi);`
	`1389`	`+ float xi = GGML_FP16_TO_FP32(x[i]);`
	`1390`	`+ float gi = GGML_FP16_TO_FP32(g[i]);`
	`1391`	`+ y[i] = GGML_FP32_TO_FP16(0.5f * xi * (1.0f + erff(xiSQRT_2_INV)) gi);`
`1392`	`1392`	`}`
`1393`	`1393`	`}`
`1394`	`1394`
`1395`	`1395`	`#ifdef GGML_GELU_QUICK_FP16`
`1396`	`1396`	`inline static void ggml_vec_geglu_quick_f32(const int n, float * y, const float * x, const float * g) {`
`1397`	`1397`	`uint16_t t;`
`1398`	`1398`	`for (int i = 0; i < n; ++i) {`
`1399`		`- ggml_fp16_t fp16 = GGML_CPU_FP32_TO_FP16(x[i]);`
	`1399`	`+ ggml_fp16_t fp16 = GGML_FP32_TO_FP16(x[i]);`
`1400`	`1400`	`memcpy(&t, &fp16, sizeof(uint16_t));`
`1401`		`- y[i] = GGML_CPU_FP16_TO_FP32(ggml_table_gelu_quick_f16[t]) * g[i];`
	`1401`	`+ y[i] = GGML_FP16_TO_FP32(ggml_table_gelu_quick_f16[t]) * g[i];`
`1402`	`1402`	`}`
`1403`	`1403`	`}`
`1404`	`1404`	`#else`
`@@ -1412,8 +1412,8 @@ inline static void ggml_vec_geglu_quick_f32(const int n, float * y, const float`
`1412`	`1412`	`inline static void ggml_vec_geglu_quick_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x, const ggml_fp16_t * g) {`
`1413`	`1413`	`const uint16_t * i16 = (const uint16_t *) x;`
`1414`	`1414`	`for (int i = 0; i < n; ++i) {`
`1415`		`- float v = GGML_CPU_FP16_TO_FP32(g[i]);`
`1416`		`- y[i] = GGML_CPU_FP32_TO_FP16(GGML_CPU_FP16_TO_FP32(ggml_table_gelu_quick_f16[i16[i]]) * v);`
	`1415`	`+ float v = GGML_FP16_TO_FP32(g[i]);`
	`1416`	`+ y[i] = GGML_FP32_TO_FP16(GGML_FP16_TO_FP32(ggml_table_gelu_quick_f16[i16[i]]) * v);`
`1417`	`1417`	`}`
`1418`	`1418`	`}`
`1419`	`1419`