SNOW-3244422: Fix dense_rank() failure with ValueError on NULL partition values (#4135)

sfc-gh-helmeleegy · web-flow · commit bc7b1e7d07d2 · 2026-03-25T15:30:03.000-07:00
diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -16,6 +16,12 @@
     - Reduced the size of queries generated by certain `DataFrame.join` operations.
     - Removed redundant aliases in generated queries (for example, `SELECT "A" AS "A"` is now always simplified to `SELECT "A"`).
 
+### Snowpark Local Testing Updates
+
+#### Bug Fixes
+
+- Fix a bug where `dense_rank()` would fail with `ValueError` on NULL partition values.
+
 ## 1.48.0 (2026-03-23)
 
 ### Snowpark Python API Updates
diff --git a/src/snowflake/snowpark/mock/_plan.py b/src/snowflake/snowpark/mock/_plan.py
@@ -2626,6 +2626,7 @@ def _match_pattern(row) -> bool:
                 keys,
                 sort=False,
                 as_index=False,
+                dropna=False,
             )
             res_index = []
             for r in res:
diff --git a/tests/mock/test_functions.py b/tests/mock/test_functions.py
@@ -23,6 +23,7 @@
     current_date,
     current_time,
     current_timestamp,
+    dense_rank,
     desc,
     get,
     is_null,
@@ -514,6 +515,133 @@ def test_rank(session):
     )
 
 
+def test_dense_rank(session):
+    df = session.create_dataframe(
+        [
+            ("A", 1),
+            ("A", 1),
+            ("A", 2),
+            ("A", 3),
+            ("B", 2),
+            ("B", 3),
+        ],
+        ["cat", "val"],
+    )
+    window_spec = Window.partition_by(col("cat")).order_by(col("val").asc())
+    result = df.with_column("dense_rank", dense_rank().over(window_spec))
+    Utils.check_answer(
+        result,
+        [
+            Row("A", 1, 1),
+            Row("A", 1, 1),
+            Row("A", 2, 2),
+            Row("A", 3, 3),
+            Row("B", 2, 1),
+            Row("B", 3, 2),
+        ],
+    )
+
+
+def test_dense_rank_null_partition(session):
+    """dense_rank() should handle NULL partition values (SNOW-3244422)."""
+    df = session.create_dataframe(
+        [
+            ("A", 1),
+            ("A", 2),
+            (None, 3),
+            (None, 1),
+            ("B", 5),
+        ],
+        ["cat", "val"],
+    )
+    window_spec = Window.partition_by(col("cat")).order_by(col("val").asc())
+    result = df.with_column("dense_rank", dense_rank().over(window_spec))
+    Utils.check_answer(
+        result,
+        [
+            Row("A", 1, 1),
+            Row("A", 2, 2),
+            Row("B", 5, 1),
+            Row(None, 1, 1),
+            Row(None, 3, 2),
+        ],
+    )
+
+
+def test_rank_null_partition(session):
+    """rank() should handle NULL partition values."""
+    df = session.create_dataframe(
+        [
+            ("A", 1),
+            ("A", 1),
+            (None, 2),
+            (None, 3),
+            (None, 3),
+        ],
+        ["cat", "val"],
+    )
+    window_spec = Window.partition_by(col("cat")).order_by(col("val").asc())
+    result = df.with_column("rank", rank().over(window_spec))
+    Utils.check_answer(
+        result,
+        [
+            Row("A", 1, 1),
+            Row("A", 1, 1),
+            Row(None, 2, 1),
+            Row(None, 3, 2),
+            Row(None, 3, 2),
+        ],
+    )
+
+
+def test_row_number_null_partition(session):
+    """row_number() should handle NULL partition values."""
+    df = session.create_dataframe(
+        [
+            ("A", 1),
+            ("A", 2),
+            (None, 3),
+            (None, 1),
+        ],
+        ["cat", "val"],
+    )
+    window_spec = Window.partition_by(col("cat")).order_by(col("val").asc())
+    result = df.with_column("row_num", row_number().over(window_spec))
+    Utils.check_answer(
+        result,
+        [
+            Row("A", 1, 1),
+            Row("A", 2, 2),
+            Row(None, 1, 1),
+            Row(None, 3, 2),
+        ],
+    )
+
+
+def test_window_agg_null_partition(session):
+    """Aggregate window functions should handle NULL partition values."""
+    df = session.create_dataframe(
+        [
+            ("A", 1),
+            ("A", 3),
+            (None, 2),
+            (None, 4),
+        ],
+        ["cat", "val"],
+    )
+    window_spec = Window.partition_by(col("cat"))
+    result = df.with_column("total", sum("val").over(window_spec))
+    Utils.check_answer(
+        result,
+        [
+            Row("A", 1, 4),
+            Row("A", 3, 4),
+            Row(None, 2, 6),
+            Row(None, 4, 6),
+        ],
+    )
+
+
 def test_window_indexing(session):
     df = session.create_dataframe(
         [

Original file line number	Diff line number	Diff line change
`@@ -2626,6 +2626,7 @@ def _match_pattern(row) -> bool:`
`2626`	`2626`	`keys,`
`2627`	`2627`	`sort=False,`
`2628`	`2628`	`as_index=False,`
	`2629`	`+ dropna=False,`
`2629`	`2630`	`)`
`2630`	`2631`	`res_index = []`
`2631`	`2632`	`for r in res:`