rename na --> erf

ngxson · ngxson · commit 65730bc8da08 · 2025-05-20T20:08:18.000+02:00
diff --git a/ggml/include/ggml.h b/ggml/include/ggml.h
@@ -536,7 +536,7 @@ extern "C" {
         GGML_UNARY_OP_HARDSWISH,
         GGML_UNARY_OP_HARDSIGMOID,
         GGML_UNARY_OP_EXP,
-        GGML_UNARY_OP_GELU_NA,
+        GGML_UNARY_OP_GELU_ERF,
 
         GGML_UNARY_OP_COUNT,
     };
@@ -1025,12 +1025,13 @@ extern "C" {
             struct ggml_context * ctx,
             struct ggml_tensor  * a);
 
-    // GELU without approximation (na = not approximated)
-    GGML_API struct ggml_tensor * ggml_gelu_na(
+    // GELU using erf (error function) when possible
+    // some backends may fallback to approximation based on Abramowitz and Stegun formula
+    GGML_API struct ggml_tensor * ggml_gelu_erf(
             struct ggml_context * ctx,
             struct ggml_tensor  * a);
 
-    GGML_API struct ggml_tensor * ggml_gelu_na_inplace(
+    GGML_API struct ggml_tensor * ggml_gelu_erf_inplace(
             struct ggml_context * ctx,
             struct ggml_tensor  * a);
 
diff --git a/ggml/src/ggml-cpu/ggml-cpu.c b/ggml/src/ggml-cpu/ggml-cpu.c
@@ -2197,7 +2197,7 @@ static int ggml_get_n_tasks(struct ggml_tensor * node, int n_threads) {
                 case GGML_UNARY_OP_HARDSWISH:
                 case GGML_UNARY_OP_HARDSIGMOID:
                 case GGML_UNARY_OP_EXP:
-                case GGML_UNARY_OP_GELU_NA:
+                case GGML_UNARY_OP_GELU_ERF:
                     {
                         n_tasks = 1;
                     } break;
diff --git a/ggml/src/ggml-cpu/ops.cpp b/ggml/src/ggml-cpu/ops.cpp
@@ -2691,9 +2691,9 @@ static void ggml_compute_forward_gelu(
     }
 }
 
-// ggml_compute_forward_gelu_na
+// ggml_compute_forward_gelu_erf
 
-static void ggml_compute_forward_gelu_na_f32(
+static void ggml_compute_forward_gelu_erf_f32(
         const ggml_compute_params * params,
         ggml_tensor * dst) {
 
@@ -2717,7 +2717,7 @@ static void ggml_compute_forward_gelu_na_f32(
     const int ir1 = MIN(ir0 + dr, nr);
 
     for (int i1 = ir0; i1 < ir1; i1++) {
-        ggml_vec_gelu_na_f32(nc,
+        ggml_vec_gelu_erf_f32(nc,
                 (float *) ((char *) dst->data  + i1*( dst->nb[1])),
                 (float *) ((char *) src0->data + i1*(src0->nb[1])));
 
@@ -2732,7 +2732,7 @@ static void ggml_compute_forward_gelu_na_f32(
     }
 }
 
-static void ggml_compute_forward_gelu_na_f16(
+static void ggml_compute_forward_gelu_erf_f16(
     const ggml_compute_params * params,
     ggml_tensor * dst) {
 
@@ -2756,7 +2756,7 @@ static void ggml_compute_forward_gelu_na_f16(
     const int ir1 = MIN(ir0 + dr, nr);
 
     for (int i1 = ir0; i1 < ir1; i1++) {
-        ggml_vec_gelu_na_f16(nc,
+        ggml_vec_gelu_erf_f16(nc,
                 (ggml_fp16_t *) ((char *) dst->data  + i1*( dst->nb[1])),
                 (ggml_fp16_t *) ((char *) src0->data + i1*(src0->nb[1])));
 
@@ -2772,7 +2772,7 @@ static void ggml_compute_forward_gelu_na_f16(
     }
 }
 
-static void ggml_compute_forward_gelu_na(
+static void ggml_compute_forward_gelu_erf(
         const ggml_compute_params * params,
         ggml_tensor * dst) {
 
@@ -2781,11 +2781,11 @@ static void ggml_compute_forward_gelu_na(
     switch (src0->type) {
         case GGML_TYPE_F32:
             {
-                ggml_compute_forward_gelu_na_f32(params, dst);
+                ggml_compute_forward_gelu_erf_f32(params, dst);
             } break;
         case GGML_TYPE_F16:
             {
-                ggml_compute_forward_gelu_na_f16(params, dst);
+                ggml_compute_forward_gelu_erf_f16(params, dst);
             } break;
         default:
             {
@@ -7852,9 +7852,9 @@ void ggml_compute_forward_unary(
             {
                 ggml_compute_forward_gelu(params, dst);
             } break;
-        case GGML_UNARY_OP_GELU_NA:
+        case GGML_UNARY_OP_GELU_ERF:
             {
-                ggml_compute_forward_gelu_na(params, dst);
+                ggml_compute_forward_gelu_erf(params, dst);
             } break;
         case GGML_UNARY_OP_GELU_QUICK:
             {
diff --git a/ggml/src/ggml-cpu/vec.h b/ggml/src/ggml-cpu/vec.h
@@ -441,7 +441,7 @@ inline static void ggml_vec_gelu_f16(const int n, ggml_fp16_t * y, const ggml_fp
     }
 }
 
-inline static void ggml_vec_gelu_na_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x) {
+inline static void ggml_vec_gelu_erf_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x) {
     for (int i = 0; i < n; ++i) {
         float xi = GGML_FP16_TO_FP32(x[i]);
         float res = 0.5f*xi*(1.0f + erff(xi*SQRT_2_INV));
@@ -472,7 +472,7 @@ inline static void ggml_vec_gelu_f32(const int n, float * y, const float * x) {
 }
 #endif
 
-inline static void ggml_vec_gelu_na_f32(const int n, float * y, const float * x) {
+inline static void ggml_vec_gelu_erf_f32(const int n, float * y, const float * x) {
     for (int i = 0; i < n; ++i) {
         float xi = x[i];
         y[i] = 0.5f*xi*(1.0f + erff(xi*SQRT_2_INV));
diff --git a/ggml/src/ggml-metal/ggml-metal.m b/ggml/src/ggml-metal/ggml-metal.m
@@ -149,8 +149,8 @@ static void ggml_backend_metal_device_rel(struct ggml_backend_metal_device_conte
     GGML_METAL_KERNEL_TYPE_SIGMOID,
     GGML_METAL_KERNEL_TYPE_GELU,
     GGML_METAL_KERNEL_TYPE_GELU_4,
-    GGML_METAL_KERNEL_TYPE_GELU_NA,
-    GGML_METAL_KERNEL_TYPE_GELU_NA_4,
+    GGML_METAL_KERNEL_TYPE_GELU_ERF,
+    GGML_METAL_KERNEL_TYPE_GELU_ERF_4,
     GGML_METAL_KERNEL_TYPE_GELU_QUICK,
     GGML_METAL_KERNEL_TYPE_GELU_QUICK_4,
     GGML_METAL_KERNEL_TYPE_SILU,
@@ -1105,8 +1105,8 @@ @implementation GGMLMetalClass
         GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_SIGMOID,                         sigmoid,                         true);
         GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_GELU,                            gelu,                            true);
         GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_GELU_4,                          gelu_4,                          true);
-        GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_GELU_NA,                         gelu_na,                            true);
-        GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_GELU_NA_4,                       gelu_na_4,                          true);
+        GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_GELU_ERF,                        gelu_erf,                        true);
+        GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_GELU_ERF_4,                      gelu_erf_4,                      true);
         GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_GELU_QUICK,                      gelu_quick,                      true);
         GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_GELU_QUICK_4,                    gelu_quick_4,                    true);
         GGML_METAL_ADD_KERNEL(GGML_METAL_KERNEL_TYPE_SILU,                            silu,                            true);
@@ -1617,7 +1617,7 @@ static bool ggml_metal_supports_op(const struct ggml_backend_metal_device_contex
                 case GGML_UNARY_OP_RELU:
                 case GGML_UNARY_OP_SIGMOID:
                 case GGML_UNARY_OP_GELU:
-                case GGML_UNARY_OP_GELU_NA:
+                case GGML_UNARY_OP_GELU_ERF:
                 case GGML_UNARY_OP_GELU_QUICK:
                 case GGML_UNARY_OP_SILU:
                 case GGML_UNARY_OP_ELU:
@@ -2256,17 +2256,17 @@ static bool ggml_metal_encode_node(
 
                     [encoder dispatchThreadgroups:MTLSizeMake(n, 1, 1) threadsPerThreadgroup:MTLSizeMake(1, 1, 1)];
                 } break;
-                case GGML_UNARY_OP_GELU_NA:
+                case GGML_UNARY_OP_GELU_ERF:
                 {
                     int64_t n = ggml_nelements(dst);
 
                     id<MTLComputePipelineState> pipeline = nil;
 
                     if (n % 4 == 0) {
-                        pipeline = ctx->kernels[GGML_METAL_KERNEL_TYPE_GELU_NA_4].pipeline;
+                        pipeline = ctx->kernels[GGML_METAL_KERNEL_TYPE_GELU_ERF_4].pipeline;
                         n /= 4;
                     } else {
-                        pipeline = ctx->kernels[GGML_METAL_KERNEL_TYPE_GELU_NA].pipeline;
+                        pipeline = ctx->kernels[GGML_METAL_KERNEL_TYPE_GELU_ERF].pipeline;
                     }
 
                     [encoder setComputePipelineState:pipeline];
diff --git a/ggml/src/ggml-metal/ggml-metal.metal b/ggml/src/ggml-metal/ggml-metal.metal
@@ -916,7 +916,7 @@ T erf_approx(T x) {
     return sign_x * y;
 }
 
-kernel void kernel_gelu_na(
+kernel void kernel_gelu_erf(
     device const float * src0,
     device       float * dst,
     uint tpig[[thread_position_in_grid]]) {
@@ -925,7 +925,7 @@ kernel void kernel_gelu_na(
     dst[tpig] = 0.5f*x*(1.0f+erf_approx<float>(x*SQRT_2_INV));
 }
 
-kernel void kernel_gelu_na_4(
+kernel void kernel_gelu_erf_4(
     device const float4 * src0,
     device       float4 * dst,
     uint tpig[[thread_position_in_grid]]) {
diff --git a/ggml/src/ggml.c b/ggml/src/ggml.c
@@ -1099,7 +1099,7 @@ static const char * GGML_UNARY_OP_NAME[GGML_UNARY_OP_COUNT] = {
     "HARDSWISH",
     "HARDSIGMOID",
     "EXP",
-    "GELU_NA",
+    "GELU_ERF",
 };
 
 static_assert(GGML_UNARY_OP_COUNT == 15, "GGML_UNARY_OP_COUNT != 15");
@@ -2502,18 +2502,18 @@ struct ggml_tensor * ggml_gelu_inplace(
     return ggml_unary_inplace(ctx, a, GGML_UNARY_OP_GELU);
 }
 
-// ggml_gelu_na
+// ggml_gelu_erf
 
-struct ggml_tensor * ggml_gelu_na(
+struct ggml_tensor * ggml_gelu_erf(
         struct ggml_context * ctx,
         struct ggml_tensor  * a) {
-    return ggml_unary(ctx, a, GGML_UNARY_OP_GELU_NA);
+    return ggml_unary(ctx, a, GGML_UNARY_OP_GELU_ERF);
 }
 
-struct ggml_tensor * ggml_gelu_na_inplace(
+struct ggml_tensor * ggml_gelu_erf_inplace(
         struct ggml_context * ctx,
         struct ggml_tensor  * a) {
-    return ggml_unary_inplace(ctx, a, GGML_UNARY_OP_GELU_NA);
+    return ggml_unary_inplace(ctx, a, GGML_UNARY_OP_GELU_ERF);
 }
 
 // ggml_gelu_quick

Original file line number	Diff line number	Diff line change
`@@ -2197,7 +2197,7 @@ static int ggml_get_n_tasks(struct ggml_tensor * node, int n_threads) {`
`2197`	`2197`	`case GGML_UNARY_OP_HARDSWISH:`
`2198`	`2198`	`case GGML_UNARY_OP_HARDSIGMOID:`
`2199`	`2199`	`case GGML_UNARY_OP_EXP:`
`2200`		`- case GGML_UNARY_OP_GELU_NA:`
	`2200`	`+ case GGML_UNARY_OP_GELU_ERF:`
`2201`	`2201`	`{`
`2202`	`2202`	`n_tasks = 1;`
`2203`	`2203`	`} break;`
Original file line number	Diff line number	Diff line change
`@@ -2691,9 +2691,9 @@ static void ggml_compute_forward_gelu(`
`2691`	`2691`	`}`
`2692`	`2692`	`}`
`2693`	`2693`
`2694`		`-// ggml_compute_forward_gelu_na`
	`2694`	`+// ggml_compute_forward_gelu_erf`
`2695`	`2695`
`2696`		`-static void ggml_compute_forward_gelu_na_f32(`
	`2696`	`+static void ggml_compute_forward_gelu_erf_f32(`
`2697`	`2697`	`const ggml_compute_params * params,`
`2698`	`2698`	`ggml_tensor * dst) {`
`2699`	`2699`
`@@ -2717,7 +2717,7 @@ static void ggml_compute_forward_gelu_na_f32(`
`2717`	`2717`	`const int ir1 = MIN(ir0 + dr, nr);`
`2718`	`2718`
`2719`	`2719`	`for (int i1 = ir0; i1 < ir1; i1++) {`
`2720`		`- ggml_vec_gelu_na_f32(nc,`
	`2720`	`+ ggml_vec_gelu_erf_f32(nc,`
`2721`	`2721`	`(float ) ((char ) dst->data + i1*( dst->nb[1])),`
`2722`	`2722`	`(float ) ((char ) src0->data + i1*(src0->nb[1])));`
`2723`	`2723`
`@@ -2732,7 +2732,7 @@ static void ggml_compute_forward_gelu_na_f32(`
`2732`	`2732`	`}`
`2733`	`2733`	`}`
`2734`	`2734`
`2735`		`-static void ggml_compute_forward_gelu_na_f16(`
	`2735`	`+static void ggml_compute_forward_gelu_erf_f16(`
`2736`	`2736`	`const ggml_compute_params * params,`
`2737`	`2737`	`ggml_tensor * dst) {`
`2738`	`2738`
`@@ -2756,7 +2756,7 @@ static void ggml_compute_forward_gelu_na_f16(`
`2756`	`2756`	`const int ir1 = MIN(ir0 + dr, nr);`
`2757`	`2757`
`2758`	`2758`	`for (int i1 = ir0; i1 < ir1; i1++) {`
`2759`		`- ggml_vec_gelu_na_f16(nc,`
	`2759`	`+ ggml_vec_gelu_erf_f16(nc,`
`2760`	`2760`	`(ggml_fp16_t ) ((char ) dst->data + i1*( dst->nb[1])),`
`2761`	`2761`	`(ggml_fp16_t ) ((char ) src0->data + i1*(src0->nb[1])));`
`2762`	`2762`
`@@ -2772,7 +2772,7 @@ static void ggml_compute_forward_gelu_na_f16(`
`2772`	`2772`	`}`
`2773`	`2773`	`}`
`2774`	`2774`
`2775`		`-static void ggml_compute_forward_gelu_na(`
	`2775`	`+static void ggml_compute_forward_gelu_erf(`
`2776`	`2776`	`const ggml_compute_params * params,`
`2777`	`2777`	`ggml_tensor * dst) {`
`2778`	`2778`
`@@ -2781,11 +2781,11 @@ static void ggml_compute_forward_gelu_na(`
`2781`	`2781`	`switch (src0->type) {`
`2782`	`2782`	`case GGML_TYPE_F32:`
`2783`	`2783`	`{`
`2784`		`- ggml_compute_forward_gelu_na_f32(params, dst);`
	`2784`	`+ ggml_compute_forward_gelu_erf_f32(params, dst);`
`2785`	`2785`	`} break;`
`2786`	`2786`	`case GGML_TYPE_F16:`
`2787`	`2787`	`{`
`2788`		`- ggml_compute_forward_gelu_na_f16(params, dst);`
	`2788`	`+ ggml_compute_forward_gelu_erf_f16(params, dst);`
`2789`	`2789`	`} break;`
`2790`	`2790`	`default:`
`2791`	`2791`	`{`
`@@ -7852,9 +7852,9 @@ void ggml_compute_forward_unary(`
`7852`	`7852`	`{`
`7853`	`7853`	`ggml_compute_forward_gelu(params, dst);`
`7854`	`7854`	`} break;`
`7855`		`- case GGML_UNARY_OP_GELU_NA:`
	`7855`	`+ case GGML_UNARY_OP_GELU_ERF:`
`7856`	`7856`	`{`
`7857`		`- ggml_compute_forward_gelu_na(params, dst);`
	`7857`	`+ ggml_compute_forward_gelu_erf(params, dst);`
`7858`	`7858`	`} break;`
`7859`	`7859`	`case GGML_UNARY_OP_GELU_QUICK:`
`7860`	`7860`	`{`
Original file line number	Diff line number	Diff line change
`@@ -441,7 +441,7 @@ inline static void ggml_vec_gelu_f16(const int n, ggml_fp16_t * y, const ggml_fp`
`441`	`441`	`}`
`442`	`442`	`}`
`443`	`443`
`444`		`-inline static void ggml_vec_gelu_na_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x) {`
	`444`	`+inline static void ggml_vec_gelu_erf_f16(const int n, ggml_fp16_t * y, const ggml_fp16_t * x) {`
`445`	`445`	`for (int i = 0; i < n; ++i) {`
`446`	`446`	`float xi = GGML_FP16_TO_FP32(x[i]);`
`447`	`447`	`float res = 0.5fxi(1.0f + erff(xi*SQRT_2_INV));`
`@@ -472,7 +472,7 @@ inline static void ggml_vec_gelu_f32(const int n, float * y, const float * x) {`
`472`	`472`	`}`
`473`	`473`	`#endif`
`474`	`474`
`475`		`-inline static void ggml_vec_gelu_na_f32(const int n, float * y, const float * x) {`
	`475`	`+inline static void ggml_vec_gelu_erf_f32(const int n, float * y, const float * x) {`
`476`	`476`	`for (int i = 0; i < n; ++i) {`
`477`	`477`	`float xi = x[i];`
`478`	`478`	`y[i] = 0.5fxi(1.0f + erff(xi*SQRT_2_INV));`