Clarify RecordBatch clone overhead: ~100 bytes/batch, not data size

tonyalaribe · tonyalaribe · commit 1ed53bee130b · 2025-12-29T00:29:53.000+01:00
diff --git a/src/mem_buffer.rs b/src/mem_buffer.rs
@@ -230,7 +230,9 @@ impl MemBuffer {
         {
             for bucket_entry in table.buckets.iter() {
                 if let Ok(batches) = bucket_entry.batches.read() {
-                    // RecordBatch uses Arc internally - clone is O(columns), not O(data)
+                    // RecordBatch clone is cheap: Arc<Schema> + Vec<Arc<Array>>
+                    // Only clones pointers (~100 bytes/batch), NOT the underlying data
+                    // A 4GB buffer query adds ~1MB overhead, not 4GB
                     results.extend(batches.iter().cloned());
                 }
             }
@@ -258,7 +260,7 @@ impl MemBuffer {
                     && let Ok(batches) = bucket.batches.read()
                     && !batches.is_empty()
                 {
-                    // RecordBatch uses Arc internally - clone is O(columns), not O(data)
+                    // RecordBatch clone is cheap (~100 bytes/batch), data is Arc-shared
                     partitions.push(batches.clone());
                 }
             }

Original file line number	Diff line number	Diff line change
`@@ -230,7 +230,9 @@ impl MemBuffer {`
`230`	`230`	`{`
`231`	`231`	`for bucket_entry in table.buckets.iter() {`
`232`	`232`	`if let Ok(batches) = bucket_entry.batches.read() {`
`233`		`- // RecordBatch uses Arc internally - clone is O(columns), not O(data)`
	`233`	`+ // RecordBatch clone is cheap: Arc<Schema> + Vec<Arc<Array>>`
	`234`	`+ // Only clones pointers (~100 bytes/batch), NOT the underlying data`
	`235`	`+ // A 4GB buffer query adds ~1MB overhead, not 4GB`
`234`	`236`	`results.extend(batches.iter().cloned());`
`235`	`237`	`}`
`236`	`238`	`}`
`@@ -258,7 +260,7 @@ impl MemBuffer {`
`258`	`260`	`&& let Ok(batches) = bucket.batches.read()`
`259`	`261`	`&& !batches.is_empty()`
`260`	`262`	`{`
`261`		`- // RecordBatch uses Arc internally - clone is O(columns), not O(data)`
	`263`	`+ // RecordBatch clone is cheap (~100 bytes/batch), data is Arc-shared`
`262`	`264`	`partitions.push(batches.clone());`
`263`	`265`	`}`
`264`	`266`	`}`