solidify test

jimczi · jimczi · commit 05efc92b0bf8 · 2025-03-18T19:14:30.000Z
diff --git a/x-pack/plugin/ml/src/test/java/org/elasticsearch/xpack/ml/inference/ltr/QueryFeatureExtractorTests.java b/x-pack/plugin/ml/src/test/java/org/elasticsearch/xpack/ml/inference/ltr/QueryFeatureExtractorTests.java
@@ -12,7 +12,7 @@
 import org.apache.lucene.document.IntField;
 import org.apache.lucene.index.IndexReader;
 import org.apache.lucene.index.LeafReaderContext;
-import org.apache.lucene.search.IndexSearcher;
+import org.apache.lucene.index.NoMergePolicy;
 import org.apache.lucene.search.Query;
 import org.apache.lucene.search.ScoreMode;
 import org.apache.lucene.search.Weight;
@@ -43,13 +43,11 @@
 
 public class QueryFeatureExtractorTests extends AbstractBuilderTestCase {
 
-    private Directory dir;
-    private IndexReader reader;
-    private IndexSearcher searcher;
-
-    private void addDocs(String[] textValues, int[] numberValues) throws IOException {
-        dir = newDirectory();
-        try (RandomIndexWriter indexWriter = new RandomIndexWriter(random(), dir)) {
+    private IndexReader addDocs(Directory dir, String[] textValues, int[] numberValues) throws IOException {
+        var config = newIndexWriterConfig();
+        // override the merge policy to ensure that docs remain in the same ingestion order
+        config.setMergePolicy(newLogMergePolicy(random()));
+        try (RandomIndexWriter indexWriter = new RandomIndexWriter(random(), dir, config)) {
             for (int i = 0; i < textValues.length; i++) {
                 Document doc = new Document();
                 doc.add(newTextField(TEXT_FIELD_NAME, textValues[i], Field.Store.NO));
@@ -59,103 +57,111 @@ private void addDocs(String[] textValues, int[] numberValues) throws IOException
                     indexWriter.flush();
                 }
             }
-            reader = indexWriter.getReader();
+            return indexWriter.getReader();
         }
-        searcher = newSearcher(reader);
-        searcher.setSimilarity(new ClassicSimilarity());
     }
 
     public void testQueryExtractor() throws IOException {
-        addDocs(
-            new String[] { "the quick brown fox", "the slow brown fox", "the grey dog", "yet another string" },
-            new int[] { 5, 10, 12, 11 }
-        );
-        QueryRewriteContext ctx = createQueryRewriteContext();
-        List<QueryExtractorBuilder> queryExtractorBuilders = List.of(
-            new QueryExtractorBuilder("text_score", QueryProvider.fromParsedQuery(QueryBuilders.matchQuery(TEXT_FIELD_NAME, "quick fox")))
-                .rewrite(ctx),
-            new QueryExtractorBuilder(
-                "number_score",
-                QueryProvider.fromParsedQuery(QueryBuilders.rangeQuery(INT_FIELD_NAME).from(12).to(12))
-            ).rewrite(ctx),
-            new QueryExtractorBuilder(
-                "matching_none",
-                QueryProvider.fromParsedQuery(QueryBuilders.termQuery(TEXT_FIELD_NAME, "never found term"))
-            ).rewrite(ctx),
-            new QueryExtractorBuilder(
-                "matching_missing_field",
-                QueryProvider.fromParsedQuery(QueryBuilders.termQuery("missing_text", "quick fox"))
-            ).rewrite(ctx),
-            new QueryExtractorBuilder("phrase_score", QueryProvider.fromParsedQuery(QueryBuilders.matchPhraseQuery(TEXT_FIELD_NAME, "slow brown fox"))
-            ).rewrite(ctx)
-        );
-        SearchExecutionContext dummySEC = createSearchExecutionContext();
-        List<Weight> weights = new ArrayList<>();
-        List<String> featureNames = new ArrayList<>();
-        for (QueryExtractorBuilder qeb : queryExtractorBuilders) {
-            Query q = qeb.query().getParsedQuery().toQuery(dummySEC);
-            Weight weight = searcher.rewrite(q).createWeight(searcher, ScoreMode.COMPLETE, 1f);
-            weights.add(weight);
-            featureNames.add(qeb.featureName());
-        }
-        QueryFeatureExtractor queryFeatureExtractor = new QueryFeatureExtractor(featureNames, weights);
-        List<Map<String, Object>> extractedFeatures = new ArrayList<>();
-        for (LeafReaderContext leafReaderContext : searcher.getLeafContexts()) {
-            int maxDoc = leafReaderContext.reader().maxDoc();
-            queryFeatureExtractor.setNextReader(leafReaderContext);
-            for (int i = 0; i < maxDoc; i++) {
-                Map<String, Object> featureMap = new HashMap<>();
-                queryFeatureExtractor.addFeatures(featureMap, i);
-                extractedFeatures.add(featureMap);
+        try (var dir = newDirectory()) {
+            try (var reader = addDocs(
+                    dir,
+                    new String[]{"the quick brown fox", "the slow brown fox", "the grey dog", "yet another string"},
+                    new int[]{5, 10, 12, 11}
+            )) {
+                var searcher = newSearcher(reader);
+                searcher.setSimilarity(new ClassicSimilarity());
+                QueryRewriteContext ctx = createQueryRewriteContext();
+                List<QueryExtractorBuilder> queryExtractorBuilders = List.of(
+                        new QueryExtractorBuilder("text_score", QueryProvider.fromParsedQuery(QueryBuilders.matchQuery(TEXT_FIELD_NAME, "quick fox")))
+                                .rewrite(ctx),
+                        new QueryExtractorBuilder(
+                                "number_score",
+                                QueryProvider.fromParsedQuery(QueryBuilders.rangeQuery(INT_FIELD_NAME).from(12).to(12))
+                        ).rewrite(ctx),
+                        new QueryExtractorBuilder(
+                                "matching_none",
+                                QueryProvider.fromParsedQuery(QueryBuilders.termQuery(TEXT_FIELD_NAME, "never found term"))
+                        ).rewrite(ctx),
+                        new QueryExtractorBuilder(
+                                "matching_missing_field",
+                                QueryProvider.fromParsedQuery(QueryBuilders.termQuery("missing_text", "quick fox"))
+                        ).rewrite(ctx),
+                        new QueryExtractorBuilder("phrase_score", QueryProvider.fromParsedQuery(QueryBuilders.matchPhraseQuery(TEXT_FIELD_NAME, "slow brown fox"))
+                        ).rewrite(ctx)
+                );
+                SearchExecutionContext dummySEC = createSearchExecutionContext();
+                List<Weight> weights = new ArrayList<>();
+                List<String> featureNames = new ArrayList<>();
+                for (QueryExtractorBuilder qeb : queryExtractorBuilders) {
+                    Query q = qeb.query().getParsedQuery().toQuery(dummySEC);
+                    Weight weight = searcher.rewrite(q).createWeight(searcher, ScoreMode.COMPLETE, 1f);
+                    weights.add(weight);
+                    featureNames.add(qeb.featureName());
+                }
+                QueryFeatureExtractor queryFeatureExtractor = new QueryFeatureExtractor(featureNames, weights);
+                List<Map<String, Object>> extractedFeatures = new ArrayList<>();
+                for (LeafReaderContext leafReaderContext : searcher.getLeafContexts()) {
+                    int maxDoc = leafReaderContext.reader().maxDoc();
+                    queryFeatureExtractor.setNextReader(leafReaderContext);
+                    for (int i = 0; i < maxDoc; i++) {
+                        Map<String, Object> featureMap = new HashMap<>();
+                        queryFeatureExtractor.addFeatures(featureMap, i);
+                        extractedFeatures.add(featureMap);
+                    }
+                }
+                assertThat(extractedFeatures, hasSize(4));
+                // Should never add features for queries that don't match a document or on documents where the field is missing
+                for (Map<String, Object> features : extractedFeatures) {
+                    assertThat(features, not(hasKey("matching_none")));
+                    assertThat(features, not(hasKey("matching_missing_field")));
+                }
+                // First two only match the text field
+                assertThat(extractedFeatures.get(0), hasEntry("text_score", 1.7135582f));
+                assertThat(extractedFeatures.get(0), not(hasKey("number_score")));
+                assertThat(extractedFeatures.get(0), not(hasKey("phrase_score")));
+                assertThat(extractedFeatures.get(1), hasEntry("text_score", 0.7554128f));
+                assertThat(extractedFeatures.get(1), not(hasKey("number_score")));
+                assertThat(extractedFeatures.get(1), hasEntry("phrase_score", 2.468971f));
+
+                // Only matches the range query
+                assertThat(extractedFeatures.get(2), hasEntry("number_score", 1f));
+                assertThat(extractedFeatures.get(2), not(hasKey("text_score")));
+                assertThat(extractedFeatures.get(2), not(hasKey("phrase_score")));
+
+                // No query matches
+                assertThat(extractedFeatures.get(3), anEmptyMap());
             }
         }
-        assertThat(extractedFeatures, hasSize(4));
-        // Should never add features for queries that don't match a document or on documents where the field is missing
-        for (Map<String, Object> features : extractedFeatures) {
-            assertThat(features, not(hasKey("matching_none")));
-            assertThat(features, not(hasKey("matching_missing_field")));
-        }
-        // First two only match the text field
-        assertThat(extractedFeatures.get(0), hasEntry("text_score", 1.7135582f));
-        assertThat(extractedFeatures.get(0), not(hasKey("number_score")));
-        assertThat(extractedFeatures.get(0), not(hasKey("phrase_score")));
-        assertThat(extractedFeatures.get(1), hasEntry("text_score", 0.7554128f));
-        assertThat(extractedFeatures.get(1), not(hasKey("number_score")));
-        assertThat(extractedFeatures.get(1), hasEntry("phrase_score", 2.468971f));
-
-        // Only matches the range query
-        assertThat(extractedFeatures.get(2), hasEntry("number_score", 1f));
-        assertThat(extractedFeatures.get(2), not(hasKey("text_score")));
-        assertThat(extractedFeatures.get(2), not(hasKey("phrase_score")));
-        // No query matches
-        assertThat(extractedFeatures.get(3), anEmptyMap());
-        reader.close();
-        dir.close();
     }
 
     public void testEmptyDisiPriorityQueue() throws IOException {
-        addDocs(
-            new String[] { "the quick brown fox", "the slow brown fox", "the grey dog", "yet another string" },
-            new int[] { 5, 10, 12, 11 }
-        );
+        try (var dir = newDirectory()) {
+            var config = newIndexWriterConfig();
+            config.setMergePolicy(NoMergePolicy.INSTANCE);
+            try (var reader = addDocs(
+                    dir,
+                    new String[]{"the quick brown fox", "the slow brown fox", "the grey dog", "yet another string"},
+                    new int[]{5, 10, 12, 11}
+            )) {
 
-        // Scorers returned by weights are null
-        List<String> featureNames = randomList(1, 10, ESTestCase::randomIdentifier);
-        List<Weight> weights = Stream.generate(() -> mock(Weight.class)).limit(featureNames.size()).toList();
+                var searcher = newSearcher(reader);
+                searcher.setSimilarity(new ClassicSimilarity());
 
-        QueryFeatureExtractor featureExtractor = new QueryFeatureExtractor(featureNames, weights);
+                // Scorers returned by weights are null
+                List<String> featureNames = randomList(1, 10, ESTestCase::randomIdentifier);
+                List<Weight> weights = Stream.generate(() -> mock(Weight.class)).limit(featureNames.size()).toList();
 
-        for (LeafReaderContext leafReaderContext : searcher.getLeafContexts()) {
-            int maxDoc = leafReaderContext.reader().maxDoc();
-            featureExtractor.setNextReader(leafReaderContext);
-            for (int i = 0; i < maxDoc; i++) {
-                Map<String, Object> featureMap = new HashMap<>();
-                featureExtractor.addFeatures(featureMap, i);
-                assertThat(featureMap, anEmptyMap());
+                QueryFeatureExtractor featureExtractor = new QueryFeatureExtractor(featureNames, weights);
+                for (LeafReaderContext leafReaderContext : searcher.getLeafContexts()) {
+                    int maxDoc = leafReaderContext.reader().maxDoc();
+                    featureExtractor.setNextReader(leafReaderContext);
+                    for (int i = 0; i < maxDoc; i++) {
+                        Map<String, Object> featureMap = new HashMap<>();
+                        featureExtractor.addFeatures(featureMap, i);
+                        assertThat(featureMap, anEmptyMap());
+                    }
+                }
             }
         }
-
-        reader.close();
-        dir.close();
     }
 }