DiskBBQ track global competitiveness of scores between segments (#133005)

benwtrent · web-flow · commit ad8e490dd866 · 2025-08-26T15:12:36.000+02:00
This adds global minimum competitive score tracking to disk bbq queries.
After every posting list, the collector will sync its competitive score
with the global tracker. This allows for other segment collectors to see
competitive scores within their own search thread.

Right now, this doesn't do much, however, its required if we are to do
any early exiting or skipping logic for posting list scoring.

When testing this, there is no recall changes, and minimal performance
gains (we skip collecting more docs than usual, but right now we still
score them...which is the dominating cost).
diff --git a/server/src/main/java/org/elasticsearch/index/codec/vectors/IVFVectorsReader.java b/server/src/main/java/org/elasticsearch/index/codec/vectors/IVFVectorsReader.java
@@ -269,6 +269,9 @@ public final void search(String field, float[] target, KnnCollector knnCollector
             // is enough?
             expectedDocs += scorer.resetPostingsScorer(offsetAndLength.offset());
             actualDocs += scorer.visit(knnCollector);
+            if (knnCollector.getSearchStrategy() != null) {
+                knnCollector.getSearchStrategy().nextVectorsBlock();
+            }
         }
         if (acceptDocs != null) {
             float unfilteredRatioVisited = (float) expectedDocs / numVectors;
@@ -278,6 +281,9 @@ public final void search(String field, float[] target, KnnCollector knnCollector
                 CentroidOffsetAndLength offsetAndLength = centroidPrefetchingIterator.nextPostingListOffsetAndLength();
                 scorer.resetPostingsScorer(offsetAndLength.offset());
                 actualDocs += scorer.visit(knnCollector);
+                if (knnCollector.getSearchStrategy() != null) {
+                    knnCollector.getSearchStrategy().nextVectorsBlock();
+                }
             }
         }
     }
diff --git a/server/src/main/java/org/elasticsearch/index/codec/vectors/cluster/NeighborQueue.java b/server/src/main/java/org/elasticsearch/index/codec/vectors/cluster/NeighborQueue.java
@@ -25,7 +25,7 @@
 /**
  * Copied from and modified from Apache Lucene.
  */
-class NeighborQueue {
+public class NeighborQueue {
 
     private enum Order {
         MIN_HEAP {
@@ -49,7 +49,7 @@ long apply(long v) {
     private final LongHeap heap;
     private final Order order;
 
-    NeighborQueue(int initialSize, boolean maxHeap) {
+    public NeighborQueue(int initialSize, boolean maxHeap) {
         this.heap = new LongHeap(initialSize);
         this.order = maxHeap ? Order.MAX_HEAP : Order.MIN_HEAP;
     }
@@ -61,6 +61,10 @@ public int size() {
         return heap.size();
     }
 
+    public long peek() {
+        return heap.top();
+    }
+
     /**
      * Adds a new graph arc, extending the storage as needed.
      *
@@ -84,31 +88,43 @@ public boolean insertWithOverflow(int newNode, float newScore) {
         return heap.insertWithOverflow(encode(newNode, newScore));
     }
 
+    public boolean insertWithOverflow(long encoded) {
+        return heap.insertWithOverflow(encoded);
+    }
+
     /**
      * Encodes the node ID and its similarity score as long, preserving the Lucene tie-breaking rule
      * that when two scores are equal, the smaller node ID must win.
      * @param node the node ID
      * @param score the node score
      * @return the encoded score, node ID
      */
-    private long encode(int node, float score) {
-        return order.apply((((long) NumericUtils.floatToSortableInt(score)) << 32) | (0xFFFFFFFFL & ~node));
+    public long encode(int node, float score) {
+        return order.apply(encodeRaw(node, score));
     }
 
     /** Returns the top element's node id. */
-    int topNode() {
+    public int topNode() {
         return decodeNodeId(heap.top());
     }
 
+    public static long encodeRaw(int node, float score) {
+        return (((long) NumericUtils.floatToSortableInt(score)) << 32) | (0xFFFFFFFFL & ~node);
+    }
+
+    public static float decodeScoreRaw(long heapValue) {
+        return NumericUtils.sortableIntToFloat((int) (heapValue >> 32));
+    }
+
     /**
      * Returns the top element's node score. For the min heap this is the minimum score. For the max
      * heap this is the maximum score.
      */
-    float topScore() {
+    public float topScore() {
         return decodeScore(heap.top());
     }
 
-    private float decodeScore(long heapValue) {
+    public float decodeScore(long heapValue) {
         return NumericUtils.sortableIntToFloat((int) (order.apply(heapValue) >> 32));
     }
 
diff --git a/server/src/main/java/org/elasticsearch/search/vectors/AbstractIVFKnnVectorQuery.java b/server/src/main/java/org/elasticsearch/search/vectors/AbstractIVFKnnVectorQuery.java
@@ -21,7 +21,6 @@
 import org.apache.lucene.search.FieldExistsQuery;
 import org.apache.lucene.search.FilteredDocIdSetIterator;
 import org.apache.lucene.search.IndexSearcher;
-import org.apache.lucene.search.KnnCollector;
 import org.apache.lucene.search.MatchNoDocsQuery;
 import org.apache.lucene.search.Query;
 import org.apache.lucene.search.QueryVisitor;
@@ -31,7 +30,6 @@
 import org.apache.lucene.search.TaskExecutor;
 import org.apache.lucene.search.TopDocs;
 import org.apache.lucene.search.TopDocsCollector;
-import org.apache.lucene.search.TopKnnCollector;
 import org.apache.lucene.search.Weight;
 import org.apache.lucene.search.knn.KnnCollectorManager;
 import org.apache.lucene.search.knn.KnnSearchStrategy;
@@ -45,6 +43,9 @@
 import java.util.List;
 import java.util.Objects;
 import java.util.concurrent.Callable;
+import java.util.concurrent.atomic.LongAccumulator;
+
+import static org.elasticsearch.search.vectors.AbstractMaxScoreKnnCollector.LEAST_COMPETITIVE;
 
 abstract class AbstractIVFKnnVectorQuery extends Query implements QueryProfilerProvider {
 
@@ -120,7 +121,7 @@ public Query rewrite(IndexSearcher indexSearcher) throws IOException {
         // we need to ensure we are getting at least 2*k results to ensure we cover overspill duplicates
         // TODO move the logic for automatically adjusting percentages to the query, so we can only pass
         // 2k to the collector.
-        KnnCollectorManager knnCollectorManager = getKnnCollectorManager(Math.round(2f * k), indexSearcher);
+        IVFCollectorManager knnCollectorManager = getKnnCollectorManager(Math.round(2f * k), indexSearcher);
         TaskExecutor taskExecutor = indexSearcher.getTaskExecutor();
         List<LeafReaderContext> leafReaderContexts = reader.leaves();
 
@@ -160,7 +161,7 @@ public Query rewrite(IndexSearcher indexSearcher) throws IOException {
         return new KnnScoreDocQuery(topK.scoreDocs, reader);
     }
 
-    private TopDocs searchLeaf(LeafReaderContext ctx, Weight filterWeight, KnnCollectorManager knnCollectorManager, float visitRatio)
+    private TopDocs searchLeaf(LeafReaderContext ctx, Weight filterWeight, IVFCollectorManager knnCollectorManager, float visitRatio)
         throws IOException {
         TopDocs results = getLeafResults(ctx, filterWeight, knnCollectorManager, visitRatio);
         IntHashSet dedup = new IntHashSet(results.scoreDocs.length * 4 / 3);
@@ -182,7 +183,7 @@ private TopDocs searchLeaf(LeafReaderContext ctx, Weight filterWeight, KnnCollec
         return new TopDocs(results.totalHits, deduplicatedScoreDocs);
     }
 
-    TopDocs getLeafResults(LeafReaderContext ctx, Weight filterWeight, KnnCollectorManager knnCollectorManager, float visitRatio)
+    TopDocs getLeafResults(LeafReaderContext ctx, Weight filterWeight, IVFCollectorManager knnCollectorManager, float visitRatio)
         throws IOException {
         final LeafReader reader = ctx.reader();
         final Bits liveDocs = reader.getLiveDocs();
@@ -205,12 +206,12 @@ abstract TopDocs approximateSearch(
         LeafReaderContext context,
         Bits acceptDocs,
         int visitedLimit,
-        KnnCollectorManager knnCollectorManager,
+        IVFCollectorManager knnCollectorManager,
         float visitRatio
     ) throws IOException;
 
-    protected KnnCollectorManager getKnnCollectorManager(int k, IndexSearcher searcher) {
-        return new IVFCollectorManager(k);
+    protected IVFCollectorManager getKnnCollectorManager(int k, IndexSearcher searcher) {
+        return new IVFCollectorManager(k, searcher);
     }
 
     @Override
@@ -236,14 +237,17 @@ protected boolean match(int doc) {
 
     static class IVFCollectorManager implements KnnCollectorManager {
         private final int k;
+        final LongAccumulator longAccumulator;
 
-        IVFCollectorManager(int k) {
+        IVFCollectorManager(int k, IndexSearcher searcher) {
             this.k = k;
+            longAccumulator = searcher.getIndexReader().leaves().size() > 1 ? new LongAccumulator(Long::max, LEAST_COMPETITIVE) : null;
         }
 
         @Override
-        public KnnCollector newCollector(int visitedLimit, KnnSearchStrategy searchStrategy, LeafReaderContext context) throws IOException {
-            return new TopKnnCollector(k, visitedLimit, searchStrategy);
+        public AbstractMaxScoreKnnCollector newCollector(int visitedLimit, KnnSearchStrategy searchStrategy, LeafReaderContext context)
+            throws IOException {
+            return new MaxScoreTopKnnCollector(k, visitedLimit, searchStrategy);
         }
     }
 }
diff --git a/server/src/main/java/org/elasticsearch/search/vectors/AbstractMaxScoreKnnCollector.java b/server/src/main/java/org/elasticsearch/search/vectors/AbstractMaxScoreKnnCollector.java
@@ -0,0 +1,44 @@
+/*
+ * Copyright Elasticsearch B.V. and/or licensed to Elasticsearch B.V. under one
+ * or more contributor license agreements. Licensed under the "Elastic License
+ * 2.0", the "GNU Affero General Public License v3.0 only", and the "Server Side
+ * Public License v 1"; you may not use this file except in compliance with, at
+ * your election, the "Elastic License 2.0", the "GNU Affero General Public
+ * License v3.0 only", or the "Server Side Public License, v 1".
+ */
+
+package org.elasticsearch.search.vectors;
+
+import org.apache.lucene.search.AbstractKnnCollector;
+import org.apache.lucene.search.knn.KnnSearchStrategy;
+import org.elasticsearch.index.codec.vectors.cluster.NeighborQueue;
+
+/**
+ * Abstract class for collectors that maintain a maximum score for KNN search.
+ * It extends the {@link AbstractKnnCollector} and provides methods to manage
+ * the minimum competitive document score, useful for tracking competitive scores
+ * over multiple leaves.
+ */
+abstract class AbstractMaxScoreKnnCollector extends AbstractKnnCollector {
+    public static final long LEAST_COMPETITIVE = NeighborQueue.encodeRaw(Integer.MAX_VALUE, Float.NEGATIVE_INFINITY);
+
+    protected AbstractMaxScoreKnnCollector(int k, long visitLimit, KnnSearchStrategy searchStrategy) {
+        super(k, visitLimit, searchStrategy);
+    }
+
+    /**
+     * Returns the minimum competitive document score.
+     * This is used to determine the global competitiveness of documents in the search.
+     * This may be a competitive score even if the collector hasn't collected k results yet.
+     *
+     * @return the minimum competitive document score
+     */
+    public abstract long getMinCompetitiveDocScore();
+
+    /**
+     * Updates the minimum competitive document score.
+     *
+     * @param minCompetitiveDocScore the new minimum competitive document score to set
+     */
+    abstract void updateMinCompetitiveDocScore(long minCompetitiveDocScore);
+}
diff --git a/server/src/main/java/org/elasticsearch/search/vectors/DiversifiedIVFKnnCollectorManager.java b/server/src/main/java/org/elasticsearch/search/vectors/DiversifiedIVFKnnCollectorManager.java
@@ -10,25 +10,26 @@
 package org.elasticsearch.search.vectors;
 
 import org.apache.lucene.index.LeafReaderContext;
-import org.apache.lucene.search.KnnCollector;
+import org.apache.lucene.search.IndexSearcher;
 import org.apache.lucene.search.join.BitSetProducer;
-import org.apache.lucene.search.knn.KnnCollectorManager;
 import org.apache.lucene.search.knn.KnnSearchStrategy;
 import org.apache.lucene.util.BitSet;
 
 import java.io.IOException;
 
-public class DiversifiedIVFKnnCollectorManager implements KnnCollectorManager {
+public class DiversifiedIVFKnnCollectorManager extends AbstractIVFKnnVectorQuery.IVFCollectorManager {
     private final int k;
     private final BitSetProducer parentsFilter;
 
-    DiversifiedIVFKnnCollectorManager(int k, BitSetProducer parentsFilter) {
+    DiversifiedIVFKnnCollectorManager(int k, IndexSearcher searcher, BitSetProducer parentsFilter) {
+        super(k, searcher);
         this.k = k;
         this.parentsFilter = parentsFilter;
     }
 
     @Override
-    public KnnCollector newCollector(int visitedLimit, KnnSearchStrategy searchStrategy, LeafReaderContext context) throws IOException {
+    public AbstractMaxScoreKnnCollector newCollector(int visitedLimit, KnnSearchStrategy searchStrategy, LeafReaderContext context)
+        throws IOException {
         BitSet parentBitSet = parentsFilter.getBitSet(context);
         if (parentBitSet == null) {
             return null;
diff --git a/server/src/main/java/org/elasticsearch/search/vectors/DiversifyingChildrenIVFKnnFloatVectorQuery.java b/server/src/main/java/org/elasticsearch/search/vectors/DiversifyingChildrenIVFKnnFloatVectorQuery.java
@@ -12,7 +12,6 @@
 import org.apache.lucene.search.IndexSearcher;
 import org.apache.lucene.search.Query;
 import org.apache.lucene.search.join.BitSetProducer;
-import org.apache.lucene.search.knn.KnnCollectorManager;
 
 import java.util.Objects;
 
@@ -45,8 +44,8 @@ public DiversifyingChildrenIVFKnnFloatVectorQuery(
     }
 
     @Override
-    protected KnnCollectorManager getKnnCollectorManager(int k, IndexSearcher searcher) {
-        return new DiversifiedIVFKnnCollectorManager(k, parentsFilter);
+    protected IVFCollectorManager getKnnCollectorManager(int k, IndexSearcher searcher) {
+        return new DiversifiedIVFKnnCollectorManager(k, searcher, parentsFilter);
     }
 
     @Override
diff --git a/server/src/main/java/org/elasticsearch/search/vectors/DiversifyingNearestChildrenKnnCollector.java b/server/src/main/java/org/elasticsearch/search/vectors/DiversifyingNearestChildrenKnnCollector.java
@@ -20,22 +20,24 @@
 package org.elasticsearch.search.vectors;
 
 import org.apache.lucene.internal.hppc.IntIntHashMap;
-import org.apache.lucene.search.AbstractKnnCollector;
 import org.apache.lucene.search.ScoreDoc;
 import org.apache.lucene.search.TopDocs;
 import org.apache.lucene.search.TotalHits;
 import org.apache.lucene.search.knn.KnnSearchStrategy;
 import org.apache.lucene.util.ArrayUtil;
 import org.apache.lucene.util.BitSet;
+import org.elasticsearch.index.codec.vectors.cluster.NeighborQueue;
 
 /**
  * This collects the nearest children vectors. Diversifying the results over the provided parent
  * filter. This means the nearest children vectors are returned, but only one per parent
  */
-class DiversifyingNearestChildrenKnnCollector extends AbstractKnnCollector {
+class DiversifyingNearestChildrenKnnCollector extends AbstractMaxScoreKnnCollector {
 
     private final BitSet parentBitSet;
     private final NodeIdCachingHeap heap;
+    private long minCompetitiveDocScore = LEAST_COMPETITIVE;
+    private float minCompetitiveScore = Float.NEGATIVE_INFINITY;
 
     /**
      * Create a new object for joining nearest child kNN documents with a parent bitset
@@ -72,7 +74,7 @@ public boolean collect(int docId, float nodeScore) {
 
     @Override
     public float minCompetitiveSimilarity() {
-        return heap.size >= k() ? heap.topScore() : Float.NEGATIVE_INFINITY;
+        return heap.size < k() ? Float.NEGATIVE_INFINITY : Math.max(minCompetitiveScore, heap.topScore());
     }
 
     @Override
@@ -101,6 +103,20 @@ public int numCollected() {
         return heap.size();
     }
 
+    @Override
+    public long getMinCompetitiveDocScore() {
+        return heap.size() > 0
+            ? Math.max(NeighborQueue.encodeRaw(heap.topNode(), heap.topScore()), minCompetitiveDocScore)
+            : minCompetitiveDocScore;
+    }
+
+    @Override
+    void updateMinCompetitiveDocScore(long minCompetitiveDocScore) {
+        long queueMinCompetitiveDocScore = heap.size() > 0 ? NeighborQueue.encodeRaw(heap.topNode(), heap.topScore()) : LEAST_COMPETITIVE;
+        this.minCompetitiveDocScore = Math.max(this.minCompetitiveDocScore, Math.max(queueMinCompetitiveDocScore, minCompetitiveDocScore));
+        this.minCompetitiveScore = NeighborQueue.decodeScoreRaw(this.minCompetitiveDocScore);
+    }
+
     /**
      * This is a minimum binary heap, inspired by {@link org.apache.lucene.util.LongHeap}. But instead
      * of encoding and using `long` values. Node ids and scores are kept separate. Additionally, this
@@ -134,10 +150,16 @@ private static class NodeIdCachingHeap {
         }
 
         public final int topNode() {
+            if (size == 0) {
+                return Integer.MAX_VALUE;
+            }
             return heapNodes[1].child;
         }
 
         public final float topScore() {
+            if (size == 0) {
+                return Float.NEGATIVE_INFINITY;
+            }
             return heapNodes[1].score;
         }
 
diff --git a/server/src/main/java/org/elasticsearch/search/vectors/IVFKnnFloatVectorQuery.java b/server/src/main/java/org/elasticsearch/search/vectors/IVFKnnFloatVectorQuery.java
@@ -11,11 +11,8 @@
 import org.apache.lucene.index.FloatVectorValues;
 import org.apache.lucene.index.LeafReader;
 import org.apache.lucene.index.LeafReaderContext;
-import org.apache.lucene.search.KnnCollector;
 import org.apache.lucene.search.Query;
 import org.apache.lucene.search.TopDocs;
-import org.apache.lucene.search.knn.KnnCollectorManager;
-import org.apache.lucene.search.knn.KnnSearchStrategy;
 import org.apache.lucene.util.Bits;
 
 import java.io.IOException;
@@ -78,7 +75,7 @@ protected TopDocs approximateSearch(
         LeafReaderContext context,
         Bits acceptDocs,
         int visitedLimit,
-        KnnCollectorManager knnCollectorManager,
+        IVFCollectorManager knnCollectorManager,
         float visitRatio
     ) throws IOException {
         LeafReader reader = context.reader();
@@ -90,11 +87,12 @@ protected TopDocs approximateSearch(
         if (floatVectorValues.size() == 0) {
             return NO_RESULTS;
         }
-        KnnSearchStrategy strategy = new IVFKnnSearchStrategy(visitRatio);
-        KnnCollector knnCollector = knnCollectorManager.newCollector(visitedLimit, strategy, context);
+        IVFKnnSearchStrategy strategy = new IVFKnnSearchStrategy(visitRatio, knnCollectorManager.longAccumulator);
+        AbstractMaxScoreKnnCollector knnCollector = knnCollectorManager.newCollector(visitedLimit, strategy, context);
         if (knnCollector == null) {
             return NO_RESULTS;
         }
+        strategy.setCollector(knnCollector);
         reader.searchNearestVectors(field, query, knnCollector, acceptDocs);
         TopDocs results = knnCollector.topDocs();
         return results != null ? results : NO_RESULTS;
diff --git a/server/src/main/java/org/elasticsearch/search/vectors/IVFKnnSearchStrategy.java b/server/src/main/java/org/elasticsearch/search/vectors/IVFKnnSearchStrategy.java
diff --git a/server/src/main/java/org/elasticsearch/search/vectors/MaxScoreTopKnnCollector.java b/server/src/main/java/org/elasticsearch/search/vectors/MaxScoreTopKnnCollector.java
diff --git a/server/src/test/java/org/elasticsearch/search/vectors/IVFKnnSearchStrategyTests.java b/server/src/test/java/org/elasticsearch/search/vectors/IVFKnnSearchStrategyTests.java
diff --git a/server/src/test/java/org/elasticsearch/search/vectors/MaxScoreTopKnnCollectorTests.java b/server/src/test/java/org/elasticsearch/search/vectors/MaxScoreTopKnnCollectorTests.java

Original file line number	Diff line number	Diff line change
`@@ -269,6 +269,9 @@ public final void search(String field, float[] target, KnnCollector knnCollector`
`269`	`269`	`// is enough?`
`270`	`270`	`expectedDocs += scorer.resetPostingsScorer(offsetAndLength.offset());`
`271`	`271`	`actualDocs += scorer.visit(knnCollector);`
	`272`	`+ if (knnCollector.getSearchStrategy() != null) {`
	`273`	`+ knnCollector.getSearchStrategy().nextVectorsBlock();`
	`274`	`+ }`
`272`	`275`	`}`
`273`	`276`	`if (acceptDocs != null) {`
`274`	`277`	`float unfilteredRatioVisited = (float) expectedDocs / numVectors;`
`@@ -278,6 +281,9 @@ public final void search(String field, float[] target, KnnCollector knnCollector`
`278`	`281`	`CentroidOffsetAndLength offsetAndLength = centroidPrefetchingIterator.nextPostingListOffsetAndLength();`
`279`	`282`	`scorer.resetPostingsScorer(offsetAndLength.offset());`
`280`	`283`	`actualDocs += scorer.visit(knnCollector);`
	`284`	`+ if (knnCollector.getSearchStrategy() != null) {`
	`285`	`+ knnCollector.getSearchStrategy().nextVectorsBlock();`
	`286`	`+ }`
`281`	`287`	`}`
`282`	`288`	`}`
`283`	`289`	`}`
Original file line number	Diff line number	Diff line change
`@@ -12,7 +12,6 @@`
`12`	`12`	`import org.apache.lucene.search.IndexSearcher;`
`13`	`13`	`import org.apache.lucene.search.Query;`
`14`	`14`	`import org.apache.lucene.search.join.BitSetProducer;`
`15`		`-import org.apache.lucene.search.knn.KnnCollectorManager;`
`16`	`15`
`17`	`16`	`import java.util.Objects;`
`18`	`17`
`@@ -45,8 +44,8 @@ public DiversifyingChildrenIVFKnnFloatVectorQuery(`
`45`	`44`	`}`
`46`	`45`
`47`	`46`	`@Override`
`48`		`- protected KnnCollectorManager getKnnCollectorManager(int k, IndexSearcher searcher) {`
`49`		`- return new DiversifiedIVFKnnCollectorManager(k, parentsFilter);`
	`47`	`+ protected IVFCollectorManager getKnnCollectorManager(int k, IndexSearcher searcher) {`
	`48`	`+ return new DiversifiedIVFKnnCollectorManager(k, searcher, parentsFilter);`
`50`	`49`	`}`
`51`	`50`
`52`	`51`	`@Override`