optimization

huyuanfeng · huyuanfeng · commit 9419df9ee03a · 2024-10-24T10:53:35.000+08:00
diff --git a/flink-autoscaler/src/main/java/org/apache/flink/autoscaler/JobVertexScaler.java b/flink-autoscaler/src/main/java/org/apache/flink/autoscaler/JobVertexScaler.java
@@ -53,7 +53,6 @@
 import static org.apache.flink.autoscaler.metrics.ScalingMetric.NUM_SOURCE_PARTITIONS;
 import static org.apache.flink.autoscaler.metrics.ScalingMetric.PARALLELISM;
 import static org.apache.flink.autoscaler.metrics.ScalingMetric.TRUE_PROCESSING_RATE;
-import static org.apache.flink.autoscaler.topology.ShipStrategy.HASH;
 import static org.apache.flink.util.Preconditions.checkArgument;
 
 /** Component responsible for computing vertex parallelism based on the scaling metrics. */
@@ -355,12 +354,9 @@ private boolean detectIneffectiveScaleUp(
      * But we limit newParallelism between parallelismLowerLimit and min(parallelismUpperLimit,
      * maxParallelism).
      *
-     * <p>Also, in order to ensure the data is evenly spread across subtasks, we try to adjust the
-     * parallelism for source and keyed vertex such that it divides the maxParallelism without a
-     * remainder.
-     *
-     * <p>This method also attempts to adjust the parallelism to ensure it aligns well with the
-     * number of source partitions if a vertex has a known source partition count.
+     * <p>Also, if we know the number of partitions or key groups corresponding to the current
+     * vertex, the degree of parallelism will be adjusted accordingly. For specific logic, please
+     * refer to {@link ParallelismAdjuster}.
      */
     @VisibleForTesting
     protected static <KEY, Context extends JobAutoScalerContext<KEY>> int scale(
@@ -403,23 +399,16 @@ protected static <KEY, Context extends JobAutoScalerContext<KEY>> int scale(
         // Apply min/max parallelism
         newParallelism = Math.min(Math.max(parallelismLowerLimit, newParallelism), upperBound);
 
-        var adjustByMaxParallelismOrPartitions =
-                numSourcePartitions > 0 || inputShipStrategies.contains(HASH);
-        if (!adjustByMaxParallelismOrPartitions) {
-            return newParallelism;
-        }
-
-        newParallelism =
-                NumKeyGroupsOrPartitionsParallelismAdjuster.adjust(
-                        vertex,
-                        context,
-                        eventHandler,
-                        maxParallelism,
-                        numSourcePartitions,
-                        newParallelism,
-                        upperBound,
-                        parallelismLowerLimit);
-        return newParallelism;
+        return ParallelismAdjuster.adjust(
+                vertex,
+                context,
+                eventHandler,
+                maxParallelism,
+                numSourcePartitions,
+                newParallelism,
+                upperBound,
+                parallelismLowerLimit,
+                inputShipStrategies);
     }
 
     @VisibleForTesting
diff --git a/flink-autoscaler/src/main/java/org/apache/flink/autoscaler/ParallelismAdjuster.java b/flink-autoscaler/src/main/java/org/apache/flink/autoscaler/ParallelismAdjuster.java
@@ -19,20 +19,29 @@
 
 import org.apache.flink.autoscaler.config.AutoScalerOptions;
 import org.apache.flink.autoscaler.event.AutoScalerEventHandler;
+import org.apache.flink.autoscaler.topology.ShipStrategy;
 import org.apache.flink.configuration.DescribedEnum;
 import org.apache.flink.configuration.description.InlineElement;
 import org.apache.flink.runtime.jobgraph.JobVertexID;
 
+import java.util.Collection;
+
 import static org.apache.flink.autoscaler.JobVertexScaler.SCALE_LIMITED_MESSAGE_FORMAT;
 import static org.apache.flink.autoscaler.JobVertexScaler.SCALING_LIMITED;
+import static org.apache.flink.autoscaler.ParallelismAdjuster.KeyGroupOrPartitionsAdjustMode.MAXIMIZE_UTILISATION;
 import static org.apache.flink.autoscaler.config.AutoScalerOptions.SCALING_EVENT_INTERVAL;
+import static org.apache.flink.autoscaler.topology.ShipStrategy.HASH;
 import static org.apache.flink.configuration.description.TextElement.text;
 
 /**
- * Component responsible adjusts the parallelism of a vertex that knows the number of partitions or
- * a vertex whose upstream shuffle is key by.
+ * Component responsible adjusts the parallelism of a vertex.
+ *
+ * <p>When input vertex {@link ShipStrategy} is {@link ShipStrategy#HASH} or knows the number of
+ * current partitions of vertex. We hope to adjust the parallelism of the current vertex according
+ * to the number of key groups or partitions to achieve the goal of evenly distributing data among
+ * subtasks or maximizing utilization.
  */
-public class NumKeyGroupsOrPartitionsParallelismAdjuster {
+public class ParallelismAdjuster {
 
     public static <KEY, Context extends JobAutoScalerContext<KEY>> int adjust(
             JobVertexID vertex,
@@ -42,12 +51,17 @@ public static <KEY, Context extends JobAutoScalerContext<KEY>> int adjust(
             int numSourcePartitions,
             int newParallelism,
             int upperBound,
-            int parallelismLowerLimit) {
-
+            int parallelismLowerLimit,
+            Collection<ShipStrategy> inputShipStrategies) {
+        var adjustByMaxParallelismOrPartitions =
+                numSourcePartitions > 0 || inputShipStrategies.contains(HASH);
+        if (!adjustByMaxParallelismOrPartitions) {
+            return newParallelism;
+        }
         var numKeyGroupsOrPartitions =
                 numSourcePartitions <= 0 ? maxParallelism : numSourcePartitions;
 
-        Mode mode =
+        KeyGroupOrPartitionsAdjustMode mode =
                 context.getConfiguration()
                         .get(AutoScalerOptions.SCALING_KEY_GROUP_PARTITIONS_ADJUST_MODE);
 
@@ -61,7 +75,7 @@ public static <KEY, Context extends JobAutoScalerContext<KEY>> int adjust(
                     ||
                     // When Mode is MAXIMIZE_UTILISATION , Try to find the smallest parallelism
                     // that can satisfy the current consumption rate.
-                    (mode == Mode.MAXIMIZE_UTILISATION
+                    (mode == MAXIMIZE_UTILISATION
                             && numKeyGroupsOrPartitions / p
                                     < numKeyGroupsOrPartitions / newParallelism)) {
                 return p;
@@ -108,8 +122,8 @@ private static int calculateMinimumParallelism(
         return p;
     }
 
-    /** The mode of the parallelism adjustment. */
-    public enum Mode implements DescribedEnum {
+    /** The mode of the key group or parallelism adjustment. */
+    public enum KeyGroupOrPartitionsAdjustMode implements DescribedEnum {
         DEFAULT(
                 "This mode ensures that the parallelism adjustment attempts to evenly distribute data across subtasks"
                         + ". It is particularly effective for source vertices that are aware of partition counts or vertices after "
@@ -122,7 +136,7 @@ public enum Mode implements DescribedEnum {
 
         private final InlineElement description;
 
-        Mode(String description) {
+        KeyGroupOrPartitionsAdjustMode(String description) {
             this.description = text(description);
         }
 
diff --git a/flink-autoscaler/src/main/java/org/apache/flink/autoscaler/config/AutoScalerOptions.java b/flink-autoscaler/src/main/java/org/apache/flink/autoscaler/config/AutoScalerOptions.java
@@ -17,7 +17,7 @@
 
 package org.apache.flink.autoscaler.config;
 
-import org.apache.flink.autoscaler.NumKeyGroupsOrPartitionsParallelismAdjuster;
+import org.apache.flink.autoscaler.ParallelismAdjuster;
 import org.apache.flink.autoscaler.metrics.MetricAggregator;
 import org.apache.flink.configuration.ConfigOption;
 import org.apache.flink.configuration.ConfigOptions;
@@ -353,11 +353,12 @@ private static ConfigOptions.OptionBuilder autoScalerConfig(String key) {
                     .withDescription(
                             "Quota of the CPU count. When scaling would go beyond this number the the scaling is not going to happen.");
 
-    public static final ConfigOption<NumKeyGroupsOrPartitionsParallelismAdjuster.Mode>
+    public static final ConfigOption<ParallelismAdjuster.KeyGroupOrPartitionsAdjustMode>
             SCALING_KEY_GROUP_PARTITIONS_ADJUST_MODE =
                     autoScalerConfig("scaling.key-group.partitions.adjust.mode")
-                            .enumType(NumKeyGroupsOrPartitionsParallelismAdjuster.Mode.class)
-                            .defaultValue(NumKeyGroupsOrPartitionsParallelismAdjuster.Mode.DEFAULT)
+                            .enumType(ParallelismAdjuster.KeyGroupOrPartitionsAdjustMode.class)
+                            .defaultValue(
+                                    ParallelismAdjuster.KeyGroupOrPartitionsAdjustMode.DEFAULT)
                             .withFallbackKeys(
                                     oldOperatorConfigKey(
                                             "scaling.key-group.partitions.adjust.mode"))
diff --git a/flink-autoscaler/src/test/java/org/apache/flink/autoscaler/JobVertexScalerTest.java b/flink-autoscaler/src/test/java/org/apache/flink/autoscaler/JobVertexScalerTest.java
@@ -323,8 +323,8 @@ public void testParallelismComputation() {
     @MethodSource("adjustmentInputsProvider")
     public void testParallelismComputationWithAdjustment(
             Collection<ShipStrategy> inputShipStrategies) {
-        final int minParallelism = 1;
-        final int maxParallelism = Integer.MAX_VALUE;
+        final int parallelismLowerLimit = 1;
+        final int parallelismUpperLimit = Integer.MAX_VALUE;
         final var vertex = new JobVertexID();
 
         assertEquals(
@@ -336,8 +336,8 @@ public void testParallelismComputationWithAdjustment(
                         0,
                         36,
                         0.8,
-                        minParallelism,
-                        maxParallelism,
+                        parallelismLowerLimit,
+                        parallelismUpperLimit,
                         eventCollector,
                         context));
         assertEquals(
@@ -349,8 +349,8 @@ public void testParallelismComputationWithAdjustment(
                         0,
                         128,
                         1.5,
-                        minParallelism,
-                        maxParallelism,
+                        parallelismLowerLimit,
+                        parallelismUpperLimit,
                         eventCollector,
                         context));
         assertEquals(
@@ -362,8 +362,8 @@ public void testParallelismComputationWithAdjustment(
                         0,
                         720,
                         1.3,
-                        minParallelism,
-                        maxParallelism,
+                        parallelismLowerLimit,
+                        parallelismUpperLimit,
                         eventCollector,
                         context));
         assertEquals(
@@ -375,39 +375,44 @@ public void testParallelismComputationWithAdjustment(
                         0,
                         720,
                         Integer.MAX_VALUE,
-                        minParallelism,
-                        maxParallelism,
+                        parallelismLowerLimit,
+                        parallelismUpperLimit,
                         eventCollector,
                         context));
 
+        int maxParallelism = 128;
+        double scaleFactor = 2.5;
+        int currentParallelism = 10;
+        int expectedEvenly = 32;
+        int expectedMaximumUtilization = 26;
         assertEquals(
-                32,
+                expectedEvenly,
                 JobVertexScaler.scale(
                         vertex,
-                        10,
+                        currentParallelism,
                         inputShipStrategies,
                         0,
-                        128,
-                        2.5,
-                        minParallelism,
                         maxParallelism,
+                        scaleFactor,
+                        parallelismLowerLimit,
+                        parallelismUpperLimit,
                         eventCollector,
                         context));
 
         Configuration conf = context.getConfiguration();
         conf.set(
                 AutoScalerOptions.SCALING_KEY_GROUP_PARTITIONS_ADJUST_MODE,
-                NumKeyGroupsOrPartitionsParallelismAdjuster.Mode.MAXIMIZE_UTILISATION);
+                ParallelismAdjuster.KeyGroupOrPartitionsAdjustMode.MAXIMIZE_UTILISATION);
         assertEquals(
-                26,
+                expectedMaximumUtilization,
                 JobVertexScaler.scale(
                         vertex,
-                        10,
+                        currentParallelism,
                         inputShipStrategies,
                         0,
-                        128,
-                        2.5,
-                        minParallelism,
+                        maxParallelism,
+                        scaleFactor,
+                        parallelismLowerLimit,
                         maxParallelism,
                         eventCollector,
                         context));
@@ -1037,15 +1042,23 @@ public void testNumPartitionsAdjustment() {
                         eventCollector,
                         context));
 
+        int partition = 199;
+        double scaleFactor = 4;
+        int currentParallelism = 24;
+        int expectedEvenly = 199;
+        // At MAXIMIZE_UTILISATION, 99 subtasks consume two partitions,
+        // one subtask consumes one partition.
+        int expectedMaximumUtilization = 100;
+
         assertEquals(
-                199,
+                expectedEvenly,
                 JobVertexScaler.scale(
                         vertex,
-                        24,
+                        currentParallelism,
                         List.of(),
-                        199,
-                        256,
-                        4,
+                        partition,
+                        parallelismUpperLimit,
+                        scaleFactor,
                         parallelismLowerLimit,
                         parallelismUpperLimit,
                         eventCollector,
@@ -1054,16 +1067,17 @@ public void testNumPartitionsAdjustment() {
         Configuration conf = context.getConfiguration();
         conf.set(
                 AutoScalerOptions.SCALING_KEY_GROUP_PARTITIONS_ADJUST_MODE,
-                NumKeyGroupsOrPartitionsParallelismAdjuster.Mode.MAXIMIZE_UTILISATION);
+                ParallelismAdjuster.KeyGroupOrPartitionsAdjustMode.MAXIMIZE_UTILISATION);
+
         assertEquals(
-                100,
+                expectedMaximumUtilization,
                 JobVertexScaler.scale(
                         vertex,
-                        24,
+                        currentParallelism,
                         List.of(),
-                        199,
-                        256,
-                        4,
+                        partition,
+                        parallelismUpperLimit,
+                        scaleFactor,
                         parallelismLowerLimit,
                         parallelismUpperLimit,
                         eventCollector,