SNOW-1901483: function api coverage normal and random impl (#2968)

sfc-gh-aling · web-flow · commit 1ad799da59b3 · 2025-02-07T11:31:12.000-08:00
diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -1,5 +1,15 @@
 # Release History
 
+# 1.28.0 (TBD)
+
+### Snowpark Python API Updates
+
+#### New Features
+
+- Added support for the following functions in `functions.py`
+  - `normal`
+  - `randn`
+
 ## 1.27.0 (2025-02-03)
 
 ### Snowpark Python API Updates
diff --git a/docs/source/snowpark/functions.rst b/docs/source/snowpark/functions.rst
@@ -250,6 +250,7 @@ Functions
     months_between
     negate
     next_day
+    normal
     not_
     nth_value
     ntile
@@ -275,6 +276,7 @@ Functions
     previous_day
     quarter
     radians
+    randn
     random
     rank
     regexp_count
diff --git a/src/snowflake/snowpark/functions.py b/src/snowflake/snowpark/functions.py
@@ -11415,3 +11415,61 @@ def instr(str: ColumnOrName, substr: str, _emit_ast: bool = True):
     ast = build_function_expr("instr", [str, substr]) if _emit_ast else None
     s1 = _to_col_if_str(str, "instr")
     return position(lit(substr), s1, _emit_ast=False, _ast=ast)
+
+
+@publicapi
+def normal(
+    mean: Union[int, float],
+    stddev: Union[int, float],
+    gen: Union[ColumnOrName, int, float],
+    _emit_ast: bool = True,
+    _ast: Optional[proto.Expr] = None,
+):
+    """
+    Generates a normally-distributed pseudo-random floating point number with specified mean and stddev (standard deviation).
+
+    Example::
+        >>> df = session.create_dataframe([1,2,3], schema=["a"])
+        >>> df.select(normal(0, 1, "a").alias("normal")).collect()
+        [Row(NORMAL=-1.143416214223267), Row(NORMAL=-0.78469958830255), Row(NORMAL=-0.365971322006404)]
+    """
+    # SNOW-1906511: normal function does not support passing mean and stddev as column name in the following way:
+    # the following fails: SELECT normal("A", "A", 2) FROM ( SELECT $1 AS "A" FROM  VALUES (0 :: BIGINT))
+    # but it supports reading from a table, we don't do type validation on mean and stddev here so users can still
+    # use the functions on normal table
+    ast = build_function_expr("normal", [mean, stddev, gen]) if _emit_ast else _ast
+    mean = lit(mean, _emit_ast=False) if isinstance(mean, (int, float)) else mean
+    stddev = (
+        lit(stddev, _emit_ast=False) if isinstance(stddev, (int, float)) else stddev
+    )
+    gen = (
+        lit(gen, _emit_ast=False)
+        if isinstance(gen, (int, float))
+        else _to_col_if_str(gen, "normal")
+    )
+    return builtin("normal", _emit_ast=_emit_ast, _ast=ast)(mean, stddev, gen)
+
+
+@publicapi
+def randn(
+    seed: Optional[Union[ColumnOrName, int, float]] = None, _emit_ast: bool = True
+) -> Column:
+    """
+    Generates a column with independent and identically distributed (i.i.d.) samples from the standard normal distribution.
+
+    Example::
+        >>> df = session.create_dataframe([1,2,3], schema=["seed"])
+        >>> df.select(randn("seed").alias("randn")).collect()
+        [Row(RANDN=-1.143416214223267), Row(RANDN=-0.78469958830255), Row(RANDN=-0.365971322006404)]
+        >>> df.select(randn().alias("randn")).collect()  # doctest: +SKIP
+    """
+    ast = build_function_expr("randn", [seed]) if _emit_ast else None
+    if seed is None:
+        seed = random(_emit_ast=False)  # pragma: no cover
+    return normal(
+        lit(0, _emit_ast=False),
+        lit(1, _emit_ast=False),
+        seed,
+        _emit_ast=False,
+        _ast=ast,
+    )
diff --git a/tests/ast/data/functions2.test b/tests/ast/data/functions2.test
@@ -324,6 +324,10 @@ df315 = df.select(nth_value("A", 2), nth_value("A", 2, True), nth_value(col("B")
 
 df316 = df.select(bitshiftright_unsigned("A", 2), bitshiftright_unsigned("A", col("B")))
 
+df317 = df.select(normal(1, 2, "A"))
+
+df318 = df.select(randn(1))
+
 ## EXPECTED UNPARSER OUTPUT
 
 df = session.table("table1")
@@ -648,6 +652,10 @@ df315 = df.select(nth_value("A", 2, False), nth_value("A", 2, True), nth_value(c
 
 df316 = df.select(bitshiftright_unsigned("A", 2), bitshiftright_unsigned("A", col("B")))
 
+df317 = df.select(normal(1, 2, "A"))
+
+df318 = df.select(randn(1))
+
 ## EXPECTED ENCODED AST
 
 interned_value_table {
@@ -26419,6 +26427,158 @@ body {
     }
   }
 }
+body {
+  assign {
+    expr {
+      sp_dataframe_select__columns {
+        cols {
+          apply_expr {
+            fn {
+              builtin_fn {
+                name {
+                  name {
+                    sp_name_flat {
+                      name: "normal"
+                    }
+                  }
+                }
+              }
+            }
+            pos_args {
+              int64_val {
+                src {
+                  end_column: 43
+                  end_line: 349
+                  file: 2
+                  start_column: 26
+                  start_line: 349
+                }
+                v: 1
+              }
+            }
+            pos_args {
+              int64_val {
+                src {
+                  end_column: 43
+                  end_line: 349
+                  file: 2
+                  start_column: 26
+                  start_line: 349
+                }
+                v: 2
+              }
+            }
+            pos_args {
+              string_val {
+                src {
+                  end_column: 43
+                  end_line: 349
+                  file: 2
+                  start_column: 26
+                  start_line: 349
+                }
+                v: "A"
+              }
+            }
+            src {
+              end_column: 43
+              end_line: 349
+              file: 2
+              start_column: 26
+              start_line: 349
+            }
+          }
+        }
+        df {
+          sp_dataframe_ref {
+            id {
+              bitfield1: 1
+            }
+          }
+        }
+        src {
+          end_column: 44
+          end_line: 349
+          file: 2
+          start_column: 16
+          start_line: 349
+        }
+        variadic: true
+      }
+    }
+    symbol {
+      value: "df317"
+    }
+    uid: 162
+    var_id {
+      bitfield1: 162
+    }
+  }
+}
+body {
+  assign {
+    expr {
+      sp_dataframe_select__columns {
+        cols {
+          apply_expr {
+            fn {
+              builtin_fn {
+                name {
+                  name {
+                    sp_name_flat {
+                      name: "randn"
+                    }
+                  }
+                }
+              }
+            }
+            pos_args {
+              int64_val {
+                src {
+                  end_column: 34
+                  end_line: 351
+                  file: 2
+                  start_column: 26
+                  start_line: 351
+                }
+                v: 1
+              }
+            }
+            src {
+              end_column: 34
+              end_line: 351
+              file: 2
+              start_column: 26
+              start_line: 351
+            }
+          }
+        }
+        df {
+          sp_dataframe_ref {
+            id {
+              bitfield1: 1
+            }
+          }
+        }
+        src {
+          end_column: 35
+          end_line: 351
+          file: 2
+          start_column: 16
+          start_line: 351
+        }
+        variadic: true
+      }
+    }
+    symbol {
+      value: "df318"
+    }
+    uid: 163
+    var_id {
+      bitfield1: 163
+    }
+  }
+}
 client_ast_version: 1
 client_language {
   python_language {