parallel benchmark, merged legacy queries

radevgit · radevgit · commit 1e394cbb9c07 · 2025-10-29T12:29:37.000+02:00
diff --git a/Cargo.toml b/Cargo.toml
@@ -41,6 +41,10 @@ harness = false
 name = "profile_bench"
 harness = false
 
+[[bench]]
+name = "profile_parallel"
+harness = false
+
 [lints.rust]
 keyword_idents_2024 = "forbid"
 non_ascii_idents = "forbid"
diff --git a/benches/profile_bench.rs b/benches/profile_bench.rs
@@ -82,7 +82,6 @@ fn main() {
     let mut results = Vec::new();
     let query_start = Instant::now();
     for (min_x, min_y, max_x, max_y) in &test_queries_small {
-        results.clear();
         tree.query_intersecting(*min_x, *min_y, *max_x, *max_y, &mut results);
     }
     let small_query_time = query_start.elapsed();
@@ -94,10 +93,8 @@ fn main() {
     );
 
     // Large queries
-    results.clear();
     let query_start = Instant::now();
     for (min_x, min_y, max_x, max_y) in &test_queries_large {
-        results.clear();
         tree.query_intersecting(*min_x, *min_y, *max_x, *max_y, &mut results);
     }
     let large_query_time = query_start.elapsed();
@@ -120,7 +117,6 @@ fn main() {
 
         let query_start = Instant::now();
         for i in 0..num_queries {
-            results.clear();
             let x = coords[4 * i];
             let y = coords[4 * i + 1];
             tree.query_nearest_k(x, y, k, &mut results);
diff --git a/benches/profile_parallel.rs b/benches/profile_parallel.rs
@@ -0,0 +1,220 @@
+//! Parallel query benchmark to measure concurrent access performance
+//!
+//! This benchmark uses the SAME queries as profile_bench.rs so results are directly comparable.
+//! It demonstrates that the HilbertRTree is safe to share across threads without interior
+//! mutability, since queries only require &self (immutable borrow).
+
+use aabb::HilbertRTree;
+use rand::Rng;
+use rand::SeedableRng;
+use std::sync::Arc;
+use std::thread;
+use std::time::Instant;
+
+fn main() {
+    println!("AABB Parallel Query Benchmark (vs profile_bench.rs)");
+    println!("===================================================\n");
+
+    let num_items = 1_000_000;
+    let num_tests = 1_000;
+    let num_threads = 10;
+
+    // Create MT19937 RNG with fixed seed for reproducibility (SAME as profile_bench.rs)
+    let seed = 95756739_u64;
+    let mut rng = rand::rngs::StdRng::seed_from_u64(seed);
+
+    // Generate random boxes for indexing (coordinate space: 100x100)
+    let mut coords = Vec::new();
+    println!("Generating {} random boxes...", num_items);
+    let gen_start = Instant::now();
+    for _ in 0..num_items {
+        let min_x = rng.random_range(0.0..100.0);
+        let min_y = rng.random_range(0.0..100.0);
+        let max_x = (min_x + rng.random_range(0.0..1.0_f64)).min(100.0);
+        let max_y = (min_y + rng.random_range(0.0..1.0_f64)).min(100.0);
+
+        coords.push(min_x);
+        coords.push(min_y);
+        coords.push(max_x);
+        coords.push(max_y);
+    }
+    let gen_time = gen_start.elapsed();
+    println!("  Generated in {:.2}ms\n", gen_time.as_secs_f64() * 1000.0);
+
+    // Build index (SAME as profile_bench.rs)
+    println!("Building index...");
+    let build_start = Instant::now();
+    let mut tree = HilbertRTree::with_capacity(num_items);
+
+    for chunk in coords.chunks(4) {
+        if chunk.len() == 4 {
+            tree.add(chunk[0], chunk[1], chunk[2], chunk[3]);
+        }
+    }
+    tree.build();
+    let build_time = build_start.elapsed();
+    println!("  Index built in {:.2}ms\n", build_time.as_secs_f64() * 1000.0);
+
+    // Wrap tree in Arc for safe sharing across threads
+    let tree = Arc::new(tree);
+
+    // Generate test queries (SAME as profile_bench.rs)
+    let mut test_queries_small = Vec::new();
+    let mut test_queries_large = Vec::new();
+
+    for _ in 0..num_tests {
+        // Small query (0.01% coverage)
+        let min_x = rng.random_range(0.0..99.0);
+        let min_y = rng.random_range(0.0..99.0);
+        test_queries_small.push((min_x, min_y, min_x + 1.0, min_y + 1.0));
+
+        // Large query (10% coverage)
+        let min_x = rng.random_range(0.0..69.0);
+        let min_y = rng.random_range(0.0..69.0);
+        test_queries_large.push((min_x, min_y, min_x + 31.62, min_y + 31.62));
+    }
+
+    // Parallel benchmark: Small queries
+    println!("Profiling query_intersecting (parallel):");
+    println!("{}", "-".repeat(40));
+
+    let queries_small = Arc::new(test_queries_small);
+    let parallel_start = Instant::now();
+
+    let handles: Vec<_> = (0..num_threads)
+        .map(|_| {
+            let tree_clone = Arc::clone(&tree);
+            let queries_clone = Arc::clone(&queries_small);
+
+            thread::spawn(move || {
+                let mut results = Vec::new();
+                for (min_x, min_y, max_x, max_y) in queries_clone.iter() {
+                    tree_clone.query_intersecting(*min_x, *min_y, *max_x, *max_y, &mut results);
+                }
+            })
+        })
+        .collect();
+
+    for handle in handles {
+        handle.join().unwrap();
+    }
+
+    let parallel_elapsed = parallel_start.elapsed();
+    let total_queries = num_threads * num_tests;
+    println!(
+        "  {} small queries (parallel {}×{}):   {:.2}ms ({:.3}µs/query)",
+        total_queries,
+        num_threads,
+        num_tests,
+        parallel_elapsed.as_secs_f64() * 1000.0,
+        parallel_elapsed.as_secs_f64() * 1_000_000.0 / total_queries as f64
+    );
+
+    // Parallel benchmark: Large queries
+    let queries_large = Arc::new(test_queries_large);
+    let parallel_start = Instant::now();
+
+    let handles: Vec<_> = (0..num_threads)
+        .map(|_| {
+            let tree_clone = Arc::clone(&tree);
+            let queries_clone = Arc::clone(&queries_large);
+
+            thread::spawn(move || {
+                let mut results = Vec::new();
+                for (min_x, min_y, max_x, max_y) in queries_clone.iter() {
+                    tree_clone.query_intersecting(*min_x, *min_y, *max_x, *max_y, &mut results);
+                }
+            })
+        })
+        .collect();
+
+    for handle in handles {
+        handle.join().unwrap();
+    }
+
+    let parallel_elapsed = parallel_start.elapsed();
+    println!(
+        "  {} large queries (parallel {}×{}):   {:.2}ms ({:.3}µs/query)",
+        total_queries,
+        num_threads,
+        num_tests,
+        parallel_elapsed.as_secs_f64() * 1000.0,
+        parallel_elapsed.as_secs_f64() * 1_000_000.0 / total_queries as f64
+    );
+
+    // Parallel benchmark: query_nearest_k
+    println!("\nProfiling query_nearest_k (parallel):");
+    println!("{}", "-".repeat(40));
+
+    let k_values = vec![1, 10, 100, 1000];
+    let coords = Arc::new(coords);
+
+    for k in k_values {
+        let num_queries = if k == 1000 { 100 } else { num_tests };
+        let total_parallel_queries = num_threads * num_queries;
+
+        let parallel_start = Instant::now();
+
+        let handles: Vec<_> = (0..num_threads)
+            .map(|thread_id| {
+                let tree_clone = Arc::clone(&tree);
+                let coords_clone = Arc::clone(&coords);
+
+                thread::spawn(move || {
+                    let mut results = Vec::new();
+                    for i in 0..num_queries {
+                        let idx = (thread_id * num_queries + i) % (coords_clone.len() / 4);
+                        let x = coords_clone[4 * idx];
+                        let y = coords_clone[4 * idx + 1];
+                        tree_clone.query_nearest_k(x, y, k, &mut results);
+                    }
+                })
+            })
+            .collect();
+
+        for handle in handles {
+            handle.join().unwrap();
+        }
+
+        let parallel_elapsed = parallel_start.elapsed();
+        println!(
+            "  {} queries k={} (parallel {}×{}):      {:.2}ms ({:.3}µs/query)",
+            total_parallel_queries,
+            k,
+            num_threads,
+            num_queries,
+            parallel_elapsed.as_secs_f64() * 1000.0,
+            parallel_elapsed.as_secs_f64() * 1_000_000.0 / total_parallel_queries as f64
+        );
+    }
+
+    println!("\n{}", "=".repeat(40));
+    println!("Conclusion:");
+    println!("The HilbertRTree is safe to share across threads using Arc!");
+    println!("All queries use &self → lock-free parallel access.");
+}
+
+
+/*
+cargo bench --bench profile_parallel
+
+Generating 1000000 random boxes...
+  Generated in 26.95ms
+
+Building index...
+  Index built in 133.13ms
+
+Profiling query_intersecting (parallel):
+----------------------------------------
+  10000 small queries (parallel 10×1000):   6.82ms (0.682µs/query)
+  10000 large queries (parallel 10×1000):   4880.27ms (488.027µs/query)
+
+Profiling query_nearest_k (parallel):
+----------------------------------------
+  10000 queries k=1 (parallel 10×1000):      11.07ms (1.107µs/query)
+  10000 queries k=10 (parallel 10×1000):      11.86ms (1.186µs/query)
+  10000 queries k=100 (parallel 10×1000):      24.00ms (2.400µs/query)
+  1000 queries k=1000 (parallel 10×100):      15.13ms (15.128µs/query)
+
+
+*/
diff --git a/src/hilbert_rtree.rs b/src/hilbert_rtree.rs
@@ -387,8 +387,8 @@ impl HilbertRTree {
         k: usize,
         results: &mut Vec<usize>,
     ) {
+        results.clear();
         if self.num_items == 0 || self.level_bounds.is_empty() || k == 0 {
-            results.clear();
             return;
         }
 
@@ -624,11 +624,10 @@ impl HilbertRTree {
     /// // Results contain both box 0 and box 1 (point is inside both)
     /// ```
     pub fn query_point(&self, x: f64, y: f64, results: &mut Vec<usize>) {
+        results.clear();
         if self.num_items == 0 || self.level_bounds.is_empty() {
             return;
         }
-
-        results.clear();
         
         let mut queue = Vec::new();
         let mut node_index = self.total_nodes - 1;
@@ -691,11 +690,10 @@ impl HilbertRTree {
     /// // Results contain box 0 and box 1 (both contain the query rectangle)
     /// ```
     pub fn query_contain(&self, min_x: f64, min_y: f64, max_x: f64, max_y: f64, results: &mut Vec<usize>) {
+        results.clear();
         if self.num_items == 0 || self.level_bounds.is_empty() {
             return;
         }
-
-        results.clear();
         
         let mut queue = Vec::new();
         let mut node_index = self.total_nodes - 1;
@@ -757,11 +755,10 @@ impl HilbertRTree {
     /// // Results contain only box 1 (box 0 is too large, box 2 is outside)
     /// ```
     pub fn query_contained_within(&self, min_x: f64, min_y: f64, max_x: f64, max_y: f64, results: &mut Vec<usize>) {
+        results.clear();
         if self.num_items == 0 || self.level_bounds.is_empty() {
             return;
         }
-
-        results.clear();
         
         let mut queue = Vec::new();
         let mut node_index = self.total_nodes - 1;
@@ -996,12 +993,10 @@ impl HilbertRTree {
         distance: f64,
         results: &mut Vec<usize>,
     ) {
+        results.clear();
         if self.num_items == 0 || self.level_bounds.is_empty() || distance < 0.0 {
-            results.clear();
             return;
         }
-
-        results.clear();
         
         // Normalize direction vector
         let dir_len_sq = dir_x * dir_x + dir_y * dir_y;
diff --git a/src/hilbert_rtree_i32.rs b/src/hilbert_rtree_i32.rs
@@ -550,11 +550,10 @@ impl HilbertRTreeI32 {
     /// // Results contain both box 0 and box 1 (point is inside both)
     /// ```
     pub fn query_point(&self, x: i32, y: i32, results: &mut Vec<usize>) {
+        results.clear();
         if self.num_items == 0 || self.level_bounds.is_empty() {
             return;
         }
-
-        results.clear();
         
         let mut queue = Vec::new();
         let mut node_index = self.total_nodes - 1;
@@ -617,11 +616,10 @@ impl HilbertRTreeI32 {
     /// // Results contain box 0 and box 1 (both contain the query rectangle)
     /// ```
     pub fn query_contain(&self, min_x: i32, min_y: i32, max_x: i32, max_y: i32, results: &mut Vec<usize>) {
+        results.clear();
         if self.num_items == 0 || self.level_bounds.is_empty() {
             return;
         }
-
-        results.clear();
         
         let mut queue = Vec::new();
         let mut node_index = self.total_nodes - 1;
@@ -683,11 +681,10 @@ impl HilbertRTreeI32 {
     /// // Results contain only box 1 (box 0 is too large, box 2 is outside)
     /// ```
     pub fn query_contained_within(&self, min_x: i32, min_y: i32, max_x: i32, max_y: i32, results: &mut Vec<usize>) {
+        results.clear();
         if self.num_items == 0 || self.level_bounds.is_empty() {
             return;
         }
-
-        results.clear();
         
         let mut queue = Vec::new();
         let mut node_index = self.total_nodes - 1;
diff --git a/src/hilbert_rtree_leg.rs b/src/hilbert_rtree_leg.rs
diff --git a/src/queries.rs b/src/queries.rs