danzhewuju
diff --git a/‎paimon-core/src/main/java/org/apache/paimon/stats/SimpleStatsEvolution.java‎
Lines changed: 24 additions & 0 deletions b/‎paimon-core/src/main/java/org/apache/paimon/stats/SimpleStatsEvolution.java‎
Lines changed: 24 additions & 0 deletions
diff --git a/‎paimon-core/src/main/java/org/apache/paimon/table/source/DataSplit.java‎
Lines changed: 44 additions & 0 deletions b/‎paimon-core/src/main/java/org/apache/paimon/table/source/DataSplit.java‎
Lines changed: 44 additions & 0 deletions
diff --git a/‎paimon-core/src/test/java/org/apache/paimon/table/source/SplitTest.java‎
Lines changed: 107 additions & 3 deletions b/‎paimon-core/src/test/java/org/apache/paimon/table/source/SplitTest.java‎
Lines changed: 107 additions & 3 deletions
diff --git a/‎paimon-spark/paimon-spark-common/src/main/scala/org/apache/paimon/spark/PaimonScanBuilder.scala‎
Lines changed: 23 additions & 17 deletions b/‎paimon-spark/paimon-spark-common/src/main/scala/org/apache/paimon/spark/PaimonScanBuilder.scala‎
Lines changed: 23 additions & 17 deletions
@@ -64,6 +64,30 @@ public SimpleStatsEvolution(
         this.emptyNullCounts = new GenericArray(new Object[fieldNames.size()]);
     }
 
+    public InternalRow evolution(InternalRow row, @Nullable List<String> denseFields) {
+        InternalRow result = row;
+
+        if (denseFields != null && denseFields.isEmpty()) {
+            result = emptyValues;
+        } else if (denseFields != null) {
+            int[] denseIndexMapping =
+                    indexMappings.computeIfAbsent(
+                            denseFields,
+                            k -> fieldNames.stream().mapToInt(denseFields::indexOf).toArray());
+            result = ProjectedRow.from(denseIndexMapping).replaceRow(result);
+        }
+
+        if (indexMapping != null) {
+            result = ProjectedRow.from(indexMapping).replaceRow(result);
+        }
+
+        if (castFieldGetters != null) {
+            result = CastedRow.from(castFieldGetters).replaceRow(result);
+        }
+
+        return result;
+    }
+
     public Result evolution(
             SimpleStats stats, @Nullable Long rowCount, @Nullable List<String> denseFields) {
         InternalRow minValues = stats.minValues();
 
@@ -19,6 +19,7 @@
 package org.apache.paimon.table.source;
 
 import org.apache.paimon.data.BinaryRow;
+import org.apache.paimon.data.InternalRow;
 import org.apache.paimon.io.DataFileMeta;
 import org.apache.paimon.io.DataFileMeta08Serializer;
 import org.apache.paimon.io.DataFileMeta09Serializer;
@@ -28,7 +29,12 @@
 import org.apache.paimon.io.DataInputViewStreamWrapper;
 import org.apache.paimon.io.DataOutputView;
 import org.apache.paimon.io.DataOutputViewStreamWrapper;
+import org.apache.paimon.predicate.CompareUtils;
+import org.apache.paimon.stats.SimpleStatsEvolution;
+import org.apache.paimon.stats.SimpleStatsEvolutions;
+import org.apache.paimon.types.DataField;
 import org.apache.paimon.utils.FunctionWithIOException;
+import org.apache.paimon.utils.InternalRowUtils;
 import org.apache.paimon.utils.SerializationUtils;
 
 import javax.annotation.Nullable;
@@ -141,6 +147,44 @@ public long mergedRowCount() {
         return partialMergedRowCount();
     }
 
+    public Object minValue(int fieldIndex, DataField dataField, SimpleStatsEvolutions evolutions) {
+        Object minValue = null;
+        for (DataFileMeta dataFile : dataFiles) {
+            SimpleStatsEvolution evolution = evolutions.getOrCreate(dataFile.schemaId());
+            InternalRow minValues =
+                    evolution.evolution(
+                            dataFile.valueStats().minValues(), dataFile.valueStatsCols());
+            Object other = InternalRowUtils.get(minValues, fieldIndex, dataField.type());
+            if (minValue == null) {
+                minValue = other;
+            } else if (other != null) {
+                if (CompareUtils.compareLiteral(dataField.type(), minValue, other) > 0) {
+                    minValue = other;
+                }
+            }
+        }
+        return minValue;
+    }
+
+    public Object maxValue(int fieldIndex, DataField dataField, SimpleStatsEvolutions evolutions) {
+        Object maxValue = null;
+        for (DataFileMeta dataFile : dataFiles) {
+            SimpleStatsEvolution evolution = evolutions.getOrCreate(dataFile.schemaId());
+            InternalRow maxValues =
+                    evolution.evolution(
+                            dataFile.valueStats().maxValues(), dataFile.valueStatsCols());
+            Object other = InternalRowUtils.get(maxValues, fieldIndex, dataField.type());
+            if (maxValue == null) {
+                maxValue = other;
+            } else if (other != null) {
+                if (CompareUtils.compareLiteral(dataField.type(), maxValue, other) < 0) {
+                    maxValue = other;
+                }
+            }
+        }
+        return maxValue;
+    }
+
     /**
      * Obtain merged row count as much as possible. There are two scenarios where accurate row count
      * can be calculated:
 
@@ -28,18 +28,30 @@
 import org.apache.paimon.io.DataOutputViewStreamWrapper;
 import org.apache.paimon.manifest.FileSource;
 import org.apache.paimon.stats.SimpleStats;
+import org.apache.paimon.stats.SimpleStatsEvolutions;
+import org.apache.paimon.types.BigIntType;
+import org.apache.paimon.types.DataField;
+import org.apache.paimon.types.DoubleType;
+import org.apache.paimon.types.FloatType;
+import org.apache.paimon.types.IntType;
+import org.apache.paimon.types.SmallIntType;
+import org.apache.paimon.types.TimestampType;
 import org.apache.paimon.utils.IOUtils;
 import org.apache.paimon.utils.InstantiationUtil;
 
 import org.junit.jupiter.api.Test;
 
+import javax.annotation.Nullable;
+
 import java.io.ByteArrayOutputStream;
 import java.io.IOException;
 import java.time.LocalDateTime;
 import java.util.ArrayList;
 import java.util.Arrays;
 import java.util.Collections;
+import java.util.HashMap;
 import java.util.List;
+import java.util.Map;
 import java.util.concurrent.ThreadLocalRandom;
 
 import static org.apache.paimon.data.BinaryArray.fromLongArray;
@@ -84,6 +96,70 @@ public void testSplitMergedRowCount() {
         assertThat(split.mergedRowCount()).isEqualTo(5700L);
     }
 
+    @Test
+    public void testSplitMinMaxValue() {
+        Map<Long, List<DataField>> schemas = new HashMap<>();
+
+        Timestamp minTs = Timestamp.fromLocalDateTime(LocalDateTime.parse("2025-01-01T00:00:00"));
+        Timestamp maxTs1 = Timestamp.fromLocalDateTime(LocalDateTime.parse("2025-03-01T00:00:00"));
+        Timestamp maxTs2 = Timestamp.fromLocalDateTime(LocalDateTime.parse("2025-03-12T00:00:00"));
+        BinaryRow min1 = newBinaryRow(new Object[] {10, 123L, 888.0D, minTs});
+        BinaryRow max1 = newBinaryRow(new Object[] {99, 456L, 999.0D, maxTs1});
+        SimpleStats valueStats1 = new SimpleStats(min1, max1, fromLongArray(new Long[] {0L}));
+
+        BinaryRow min2 = newBinaryRow(new Object[] {5, 0L, 777.0D, minTs});
+        BinaryRow max2 = newBinaryRow(new Object[] {90, 789L, 899.0D, maxTs2});
+        SimpleStats valueStats2 = new SimpleStats(min2, max2, fromLongArray(new Long[] {0L}));
+
+        // test the common case.
+        DataFileMeta d1 = newDataFile(100, valueStats1, null);
+        DataFileMeta d2 = newDataFile(100, valueStats2, null);
+        DataSplit split1 = newDataSplit(true, Arrays.asList(d1, d2), null);
+
+        DataField intField = new DataField(0, "c_int", new IntType());
+        DataField longField = new DataField(1, "c_long", new BigIntType());
+        DataField doubleField = new DataField(2, "c_double", new DoubleType());
+        DataField tsField = new DataField(3, "c_ts", new TimestampType());
+        schemas.put(1L, Arrays.asList(intField, longField, doubleField, tsField));
+
+        SimpleStatsEvolutions evolutions = new SimpleStatsEvolutions(schemas::get, 1);
+        assertThat(split1.minValue(0, intField, evolutions)).isEqualTo(5);
+        assertThat(split1.maxValue(0, intField, evolutions)).isEqualTo(99);
+        assertThat(split1.minValue(1, longField, evolutions)).isEqualTo(0L);
+        assertThat(split1.maxValue(1, longField, evolutions)).isEqualTo(789L);
+        assertThat(split1.minValue(2, doubleField, evolutions)).isEqualTo(777D);
+        assertThat(split1.maxValue(2, doubleField, evolutions)).isEqualTo(999D);
+        assertThat(split1.minValue(3, tsField, evolutions)).isEqualTo(minTs);
+        assertThat(split1.maxValue(3, tsField, evolutions)).isEqualTo(maxTs2);
+
+        // test the case which provide non-null valueStatsCol and there are different between file
+        // schema and table schema.
+        BinaryRow min3 = newBinaryRow(new Object[] {10, 123L, minTs});
+        BinaryRow max3 = newBinaryRow(new Object[] {99, 456L, maxTs1});
+        SimpleStats valueStats3 = new SimpleStats(min3, max3, fromLongArray(new Long[] {0L}));
+        BinaryRow min4 = newBinaryRow(new Object[] {5, 0L, minTs});
+        BinaryRow max4 = newBinaryRow(new Object[] {90, 789L, maxTs2});
+        SimpleStats valueStats4 = new SimpleStats(min4, max4, fromLongArray(new Long[] {0L}));
+        List<String> valueStatsCols2 = Arrays.asList("c_int", "c_long", "c_ts");
+        DataFileMeta d3 = newDataFile(100, valueStats3, valueStatsCols2);
+        DataFileMeta d4 = newDataFile(100, valueStats4, valueStatsCols2);
+        DataSplit split2 = newDataSplit(true, Arrays.asList(d3, d4), null);
+
+        DataField smallField = new DataField(4, "c_small", new SmallIntType());
+        DataField floatField = new DataField(5, "c_float", new FloatType());
+        schemas.put(2L, Arrays.asList(intField, smallField, tsField, floatField));
+
+        evolutions = new SimpleStatsEvolutions(schemas::get, 2);
+        assertThat(split2.minValue(0, intField, evolutions)).isEqualTo(5);
+        assertThat(split2.maxValue(0, intField, evolutions)).isEqualTo(99);
+        assertThat(split2.minValue(1, smallField, evolutions)).isEqualTo(null);
+        assertThat(split2.maxValue(1, smallField, evolutions)).isEqualTo(null);
+        assertThat(split2.minValue(2, tsField, evolutions)).isEqualTo(minTs);
+        assertThat(split2.maxValue(2, tsField, evolutions)).isEqualTo(maxTs2);
+        assertThat(split2.minValue(3, floatField, evolutions)).isEqualTo(null);
+        assertThat(split2.maxValue(3, floatField, evolutions)).isEqualTo(null);
+    }
+
     @Test
     public void testSerializer() throws IOException {
         DataFileTestDataGenerator gen = DataFileTestDataGenerator.builder().build();
@@ -436,18 +512,23 @@ public void testSerializerCompatibleV5() throws Exception {
     }
 
     private DataFileMeta newDataFile(long rowCount) {
+        return newDataFile(rowCount, null, null);
+    }
+
+    private DataFileMeta newDataFile(
+            long rowCount, SimpleStats rowStats, @Nullable List<String> valueStatsCols) {
         return DataFileMeta.forAppend(
                 "my_data_file.parquet",
                 1024 * 1024,
                 rowCount,
-                null,
+                rowStats,
                 0L,
-                rowCount,
+                rowCount - 1,
                 1,
                 Collections.emptyList(),
                 null,
                 null,
-                null,
+                valueStatsCols,
                 null);
     }
 
@@ -467,4 +548,27 @@ private DataSplit newDataSplit(
         }
         return builder.build();
     }
+
+    private BinaryRow newBinaryRow(Object[] objs) {
+        BinaryRow row = new BinaryRow(objs.length);
+        BinaryRowWriter writer = new BinaryRowWriter(row);
+        writer.reset();
+        for (int i = 0; i < objs.length; i++) {
+            if (objs[i] instanceof Integer) {
+                writer.writeInt(i, (Integer) objs[i]);
+            } else if (objs[i] instanceof Long) {
+                writer.writeLong(i, (Long) objs[i]);
+            } else if (objs[i] instanceof Float) {
+                writer.writeFloat(i, (Float) objs[i]);
+            } else if (objs[i] instanceof Double) {
+                writer.writeDouble(i, (Double) objs[i]);
+            } else if (objs[i] instanceof Timestamp) {
+                writer.writeTimestamp(i, (Timestamp) objs[i], 5);
+            } else {
+                throw new UnsupportedOperationException("It's not supported.");
+            }
+        }
+        writer.complete();
+        return row;
+    }
 }
@@ -19,8 +19,8 @@
 package org.apache.paimon.spark
 
 import org.apache.paimon.predicate.{PartitionPredicateVisitor, Predicate, PredicateBuilder}
-import org.apache.paimon.spark.aggregate.LocalAggregator
-import org.apache.paimon.table.Table
+import org.apache.paimon.spark.aggregate.{AggregatePushDownUtils, LocalAggregator}
+import org.apache.paimon.table.{FileStoreTable, Table}
 import org.apache.paimon.table.source.DataSplit
 
 import org.apache.spark.sql.PaimonUtils
@@ -101,13 +101,12 @@ class PaimonScanBuilder(table: Table)
       return true
     }
 
-    // Only support when there is no post scan predicates.
-    if (hasPostScanPredicates) {
+    if (!table.isInstanceOf[FileStoreTable]) {
       return false
     }
 
-    val aggregator = new LocalAggregator(table)
-    if (!aggregator.pushAggregation(aggregation)) {
+    // Only support when there is no post scan predicates.
+    if (hasPostScanPredicates) {
       return false
     }
 
@@ -116,19 +115,26 @@ class PaimonScanBuilder(table: Table)
       val pushedPartitionPredicate = PredicateBuilder.and(pushedPaimonPredicates.toList.asJava)
       readBuilder.withFilter(pushedPartitionPredicate)
     }
-    val dataSplits =
+    val dataSplits = if (AggregatePushDownUtils.hasMinMaxAggregation(aggregation)) {
+      readBuilder.newScan().plan().splits().asScala.map(_.asInstanceOf[DataSplit])
+    } else {
       readBuilder.dropStats().newScan().plan().splits().asScala.map(_.asInstanceOf[DataSplit])
-    if (!dataSplits.forall(_.mergedRowCountAvailable())) {
-      return false
     }
-    dataSplits.foreach(aggregator.update)
-    localScan = Some(
-      PaimonLocalScan(
-        aggregator.result(),
-        aggregator.resultSchema(),
-        table,
-        pushedPaimonPredicates))
-    true
+    if (AggregatePushDownUtils.canPushdownAggregation(table, aggregation, dataSplits.toSeq)) {
+      val aggregator = new LocalAggregator(table.asInstanceOf[FileStoreTable])
+      aggregator.initialize(aggregation)
+      dataSplits.foreach(aggregator.update)
+      localScan = Some(
+        PaimonLocalScan(
+          aggregator.result(),
+          aggregator.resultSchema(),
+          table,
+          pushedPaimonPredicates)
+      )
+      true
+    } else {
+      false
+    }
   }
 
   override def build(): Scan = {