pyjanitor-devs
diff --git a/‎.pre-commit-config.yaml‎
Lines changed: 1 addition & 1 deletion b/‎.pre-commit-config.yaml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎janitor/functions/_conditional_join/_binary_search.py‎
Lines changed: 122 additions & 0 deletions b/‎janitor/functions/_conditional_join/_binary_search.py‎
Lines changed: 122 additions & 0 deletions
@@ -6,7 +6,7 @@ repos:
       - id: end-of-file-fixer
       - id: trailing-whitespace
       - id: check-added-large-files
-        args: ['--maxkb=1024']  # Limits files to 1MB
+        args: ['--maxkb=3000']  # Limits files to  ~ 3MB
   - repo: https://github.com/kynan/nbstripout
     rev: 0.6.1
     hooks:
 
@@ -0,0 +1,122 @@
+
+
+import numpy as np
+import janitor_rs
+
+
+
+
+def _binary_search_lt(
+    left: np.ndarray,
+    right: np.ndarray,
+    starts: np.ndarray,
+    ends: np.ndarray,
+) -> tuple:
+    """
+    Get starts for < joins
+    """
+    mapping = {
+        "int64": janitor_rs.binary_search_lt_int64,
+        "int32": janitor_rs.binary_search_lt_int32,
+        "int16": janitor_rs.binary_search_lt_int16,
+        "int8": janitor_rs.binary_search_lt_int8,
+        "uint64": janitor_rs.binary_search_lt_uint64,
+        "uint32": janitor_rs.binary_search_lt_uint32,
+        "uint16": janitor_rs.binary_search_lt_uint16,
+        "uint8": janitor_rs.binary_search_lt_uint8,
+        "float64": janitor_rs.binary_search_lt_float64,
+        "float32": janitor_rs.binary_search_lt_float32,
+    }
+    dtype_name = left.dtype.name
+    try:
+        func = mapping[dtype_name]
+    except KeyError:
+        raise KeyError(f"Unsupported data type -> {dtype_name}")
+    return func(left, right, starts, ends)
+
+
+def _binary_search_le(
+    left: np.ndarray,
+    right: np.ndarray,
+    starts: np.ndarray,
+    ends: np.ndarray,
+) -> tuple:
+    """
+    Get starts for <= joins
+    """
+    mapping = {
+        "int64": janitor_rs.binary_search_le_int64,
+        "int32": janitor_rs.binary_search_le_int32,
+        "int16": janitor_rs.binary_search_le_int16,
+        "int8": janitor_rs.binary_search_le_int8,
+        "uint64": janitor_rs.binary_search_le_uint64,
+        "uint32": janitor_rs.binary_search_le_uint32,
+        "uint16": janitor_rs.binary_search_le_uint16,
+        "uint8": janitor_rs.binary_search_le_uint8,
+        "float64": janitor_rs.binary_search_le_float64,
+        "float32": janitor_rs.binary_search_le_float32,
+    }
+    dtype_name = left.dtype.name
+    try:
+        func = mapping[dtype_name]
+    except KeyError:
+        raise KeyError(f"Unsupported data type -> {dtype_name}")
+    return func(left, right, starts, ends)
+
+
+def _binary_search_gt(
+    left: np.ndarray,
+    right: np.ndarray,
+    starts: np.ndarray,
+    ends: np.ndarray,
+) -> tuple:
+    """
+    Get ends for > joins
+    """
+    mapping = {
+        "int64": janitor_rs.binary_search_gt_int64,
+        "int32": janitor_rs.binary_search_gt_int32,
+        "int16": janitor_rs.binary_search_gt_int16,
+        "int8": janitor_rs.binary_search_gt_int8,
+        "uint64": janitor_rs.binary_search_gt_uint64,
+        "uint32": janitor_rs.binary_search_gt_uint32,
+        "uint16": janitor_rs.binary_search_gt_uint16,
+        "uint8": janitor_rs.binary_search_gt_uint8,
+        "float64": janitor_rs.binary_search_gt_float64,
+        "float32": janitor_rs.binary_search_gt_float32,
+    }
+    dtype_name = left.dtype.name
+    try:
+        func = mapping[dtype_name]
+    except KeyError:
+        raise KeyError(f"Unsupported data type -> {dtype_name}")
+    return func(left, right, starts, ends)
+
+
+def _binary_search_ge(
+    left: np.ndarray,
+    right: np.ndarray,
+    starts: np.ndarray,
+    ends: np.ndarray,
+) -> tuple:
+    """
+    Get ends for >= joins
+    """
+    mapping = {
+        "int64": janitor_rs.binary_search_ge_int64,
+        "int32": janitor_rs.binary_search_ge_int32,
+        "int16": janitor_rs.binary_search_ge_int16,
+        "int8": janitor_rs.binary_search_ge_int8,
+        "uint64": janitor_rs.binary_search_ge_uint64,
+        "uint32": janitor_rs.binary_search_ge_uint32,
+        "uint16": janitor_rs.binary_search_ge_uint16,
+        "uint8": janitor_rs.binary_search_ge_uint8,
+        "float64": janitor_rs.binary_search_ge_float64,
+        "float32": janitor_rs.binary_search_ge_float32,
+    }
+    dtype_name = left.dtype.name
+    try:
+        func = mapping[dtype_name]
+    except KeyError:
+        raise KeyError(f"Unsupported data type -> {dtype_name}")
+    return func(left, right, starts, ends)