apache
diff --git a/‎embedded-tests/src/test/java/org/apache/druid/testing/embedded/indexing/autoscaler/CostBasedAutoScalerIntegrationTest.java‎
Lines changed: 23 additions & 41 deletions b/‎embedded-tests/src/test/java/org/apache/druid/testing/embedded/indexing/autoscaler/CostBasedAutoScalerIntegrationTest.java‎
Lines changed: 23 additions & 41 deletions
diff --git a/‎extensions-core/kafka-indexing-service/src/main/java/org/apache/druid/indexing/kafka/KafkaConsumerMonitor.java‎
Lines changed: 17 additions & 0 deletions b/‎extensions-core/kafka-indexing-service/src/main/java/org/apache/druid/indexing/kafka/KafkaConsumerMonitor.java‎
Lines changed: 17 additions & 0 deletions
diff --git a/‎extensions-core/kafka-indexing-service/src/main/java/org/apache/druid/indexing/kafka/KafkaRecordSupplier.java‎
Lines changed: 29 additions & 17 deletions b/‎extensions-core/kafka-indexing-service/src/main/java/org/apache/druid/indexing/kafka/KafkaRecordSupplier.java‎
Lines changed: 29 additions & 17 deletions
diff --git a/‎indexing-service/src/main/java/org/apache/druid/indexing/seekablestream/common/RecordSupplier.java‎
Lines changed: 9 additions & 1 deletion b/‎indexing-service/src/main/java/org/apache/druid/indexing/seekablestream/common/RecordSupplier.java‎
Lines changed: 9 additions & 1 deletion
diff --git a/‎indexing-service/src/main/java/org/apache/druid/indexing/seekablestream/supervisor/SeekableStreamSupervisor.java‎
Lines changed: 5 additions & 0 deletions b/‎indexing-service/src/main/java/org/apache/druid/indexing/seekablestream/supervisor/SeekableStreamSupervisor.java‎
Lines changed: 5 additions & 0 deletions
@@ -26,7 +26,6 @@
 import org.apache.druid.indexing.overlord.supervisor.SupervisorStatus;
 import org.apache.druid.indexing.seekablestream.supervisor.autoscaler.CostBasedAutoScalerConfig;
 import org.apache.druid.java.util.common.StringUtils;
-import org.apache.druid.query.DruidMetrics;
 import org.apache.druid.testing.embedded.EmbeddedBroker;
 import org.apache.druid.testing.embedded.EmbeddedClusterApis;
 import org.apache.druid.testing.embedded.EmbeddedCoordinator;
@@ -35,15 +34,13 @@
 import org.apache.druid.testing.embedded.EmbeddedIndexer;
 import org.apache.druid.testing.embedded.EmbeddedOverlord;
 import org.apache.druid.testing.embedded.EmbeddedRouter;
-import org.apache.druid.testing.embedded.emitter.LatchableEmitterModule;
 import org.apache.druid.testing.embedded.indexing.MoreResources;
 import org.apache.druid.testing.embedded.junit5.EmbeddedClusterTestBase;
 import org.apache.kafka.clients.producer.ProducerRecord;
 import org.hamcrest.Matchers;
 import org.joda.time.DateTime;
 import org.joda.time.DateTimeZone;
 import org.junit.jupiter.api.Assertions;
-import org.junit.jupiter.api.Disabled;
 import org.junit.jupiter.api.Test;
 import org.junit.jupiter.api.Timeout;
 
@@ -52,21 +49,17 @@
 import java.util.stream.Collectors;
 import java.util.stream.IntStream;
 
-import static org.apache.druid.indexing.seekablestream.supervisor.SeekableStreamSupervisor.AUTOSCALER_REQUIRED_TASKS_METRIC;
-
 /**
  * Integration test for {@link org.apache.druid.indexing.seekablestream.supervisor.autoscaler.CostBasedAutoScaler}.
  * <p>
- * Tests the autoscaler's ability to compute optimal task counts based
- * on partition count and cost metrics (lag and idle time).
+ * Tests the autoscaler's ability to compute optimal task counts based on partition count and cost metrics (lag and idle time).
  */
 public class CostBasedAutoScalerIntegrationTest extends EmbeddedClusterTestBase
 {
   private static final String TOPIC = EmbeddedClusterApis.createTestDatasourceName();
   private static final String EVENT_TEMPLATE = "{\"timestamp\":\"%s\",\"dimension\":\"value%d\",\"metric\":%d}";
-  ;
-  private static final int PARTITION_COUNT = 100;
-  private static final int INITIAL_TASK_COUNT = 25;
+  private static final int PARTITION_COUNT = 10;
+  private static final int INITIAL_TASK_COUNT = 10;
 
   private final EmbeddedBroker broker = new EmbeddedBroker();
   private final EmbeddedIndexer indexer = new EmbeddedIndexer();
@@ -87,6 +80,7 @@ public void start()
       {
         super.start();
         createTopicWithPartitions(TOPIC, PARTITION_COUNT);
+        produceRecordsToKafka(500);
       }
 
       @Override
@@ -107,31 +101,27 @@ public void stop()
 
     coordinator.addProperty("druid.manager.segments.useIncrementalCache", "ifSynced");
 
-    cluster.addExtension(KafkaIndexTaskModule.class)
-           .addExtension(LatchableEmitterModule.class)
-           .useDefaultTimeoutForLatchableEmitter(300)
-           .addCommonProperty("druid.emitter", "latching")
-           .addCommonProperty("druid.monitoring.emissionPeriod", "PT0.1s")
-           .addResource(kafkaServer)
+    cluster.useLatchableEmitter()
            .addServer(coordinator)
            .addServer(overlord)
            .addServer(indexer)
            .addServer(broker)
            .addServer(historical)
+           .addExtension(KafkaIndexTaskModule.class)
+           .addCommonProperty("druid.monitoring.emissionPeriod", "PT0.5s")
+           .addResource(kafkaServer)
            .addServer(new EmbeddedRouter());
 
     return cluster;
   }
 
-  @Disabled
   @Test
   @Timeout(45)
   public void test_autoScaler_computesOptimalTaskCountAndProduceScaleDown()
   {
-    final String supervisorId = dataSource + "_supe";
+    final String superId = dataSource + "_super";
 
-    // Produce some amount of data to kafka, to trigger a 'scale down' decision to 17 tasks.
-    produceRecordsToKafka(50);
+    // Produce some amount of data to kafka, to trigger a 'scale down' decision to 4 tasks.
 
     final CostBasedAutoScalerConfig autoScalerConfig = CostBasedAutoScalerConfig
         .builder()
@@ -140,35 +130,27 @@ public void test_autoScaler_computesOptimalTaskCountAndProduceScaleDown()
         .taskCountMax(100)
         .taskCountStart(INITIAL_TASK_COUNT)
         .metricsCollectionIntervalMillis(3000)
-        .metricsCollectionRangeMillis(2000)
-        .scaleActionStartDelayMillis(3000)
-        .scaleActionPeriodMillis(2000)
-        .minTriggerScaleActionFrequencyMillis(3000)
+        .scaleActionStartDelayMillis(5000)
+        .scaleActionPeriodMillis(5000)
+        .minTriggerScaleActionFrequencyMillis(5000)
         // Weight configuration: strongly favor lag reduction over idle time
         .lagWeight(0.9)
         .idleWeight(0.1)
         .build();
 
-    final KafkaSupervisorSpec kafkaSupervisorSpec = createKafkaSupervisorWithAutoScaler(
-        supervisorId,
-        autoScalerConfig
-    );
+    final KafkaSupervisorSpec kafkaSupervisorSpec = createKafkaSupervisorWithAutoScaler(superId, autoScalerConfig);
 
     // Submit the supervisor
-    Assertions.assertEquals(
-        supervisorId,
-        cluster.callApi().postSupervisor(kafkaSupervisorSpec)
-    );
+    Assertions.assertEquals(superId, cluster.callApi().postSupervisor(kafkaSupervisorSpec));
 
     // Wait for the supervisor to be healthy and running
-    waitForSupervisorRunning(supervisorId);
+    waitForSupervisorRunning(superId);
 
-    // Wait for autoscaler to emit optimalTaskCount metric indicating scale-up
-    // We expect the optimal task count to be either 34 or 50.
+    // Wait for autoscaler to emit optimalTaskCount metric indicating scale-down
+    // We expect the optimal task count to 2
     overlord.latchableEmitter().waitForEvent(
-        event -> event.hasMetricName(AUTOSCALER_REQUIRED_TASKS_METRIC)
-                      .hasDimension(DruidMetrics.DATASOURCE, dataSource)
-                      .hasValueMatching(Matchers.equalTo(17L))
+        event -> event.hasMetricName("task/autoScaler/costBased/optimalTaskCount")
+                       .hasValueMatching(Matchers.equalTo(4L))
     );
 
     // Suspend the supervisor
@@ -177,7 +159,7 @@ public void test_autoScaler_computesOptimalTaskCountAndProduceScaleDown()
 
   private void waitForSupervisorRunning(String supervisorId)
   {
-    int maxAttempts = 120;
+    int maxAttempts = 10;
     int attempt = 0;
     while (attempt < maxAttempts) {
       SupervisorStatus status = cluster.callApi().getSupervisorStatus(supervisorId);
@@ -186,7 +168,7 @@ private void waitForSupervisorRunning(String supervisorId)
       }
       attempt++;
       try {
-        Thread.sleep(3000);
+        Thread.sleep(1000);
       }
       catch (InterruptedException e) {
         Thread.currentThread().interrupt();
@@ -222,7 +204,7 @@ private KafkaSupervisorSpec createKafkaSupervisorWithAutoScaler(
     return MoreResources.Supervisor.KAFKA_JSON
         .get()
         .withDataSchema(schema -> schema.withTimestamp(new TimestampSpec("timestamp", "iso", null)))
-        .withTuningConfig(tuningConfig -> tuningConfig.withMaxRowsPerSegment(1000))
+        .withTuningConfig(tuningConfig -> tuningConfig.withMaxRowsPerSegment(100))
         .withIoConfig(
             ioConfig -> ioConfig
                 .withConsumerProperties(kafkaServer.consumerProperties())
 
@@ -19,6 +19,7 @@
 
 package org.apache.druid.indexing.kafka;
 
+import com.google.common.util.concurrent.AtomicDouble;
 import org.apache.druid.error.DruidException;
 import org.apache.druid.java.util.common.logger.Logger;
 import org.apache.druid.java.util.emitter.service.ServiceEmitter;
@@ -47,6 +48,8 @@ public class KafkaConsumerMonitor extends AbstractMonitor
   private static final String PARTITION_TAG = "partition";
   private static final String NODE_ID_TAG = "node-id";
 
+  private static final String POLL_IDLE_RATION_METRIC_NAME = "poll-idle-ratio-avg";
+
   /**
    * Kafka metric name -> Kafka metric descriptor. Taken from
    * https://kafka.apache.org/documentation/#consumer_fetch_monitoring.
@@ -129,6 +132,7 @@ public class KafkaConsumerMonitor extends AbstractMonitor
 
   private final KafkaConsumer<?, ?> consumer;
   private final Map<MetricName, AtomicLong> counters = new HashMap<>();
+  private final AtomicDouble pollIdleRatioAvg = new AtomicDouble(1.0d);
 
   public KafkaConsumerMonitor(final KafkaConsumer<?, ?> consumer)
   {
@@ -172,6 +176,13 @@ public boolean doMonitor(final ServiceEmitter emitter)
           emitter.emit(builder.setMetric(kafkaConsumerMetric.getDruidMetricName(), emitValue));
         }
       }
+
+      // Capture `poll-idle-ratio-avg` metric for autoscaler purposes.
+      if (POLL_IDLE_RATION_METRIC_NAME.equals(metricName.name())) {
+        if (entry.getValue().metricValue() != null) {
+          pollIdleRatioAvg.set(((Number) entry.getValue().metricValue()).doubleValue());
+        }
+      }
     }
 
     return !stopAfterNext;
@@ -181,4 +192,10 @@ public void stopAfterNextEmit()
   {
     stopAfterNext = true;
   }
+
+  // Use that method in the future as metrics forwarder to supervisor
+  public double getPollIdleRatioAvg()
+  {
+    return pollIdleRatioAvg.get();
+  }
 }
@@ -160,9 +160,7 @@ public Set<StreamPartition<KafkaTopicPartition>> getAssignment()
                                         .stream()
                                         .map(e -> new StreamPartition<>(
                                             stream,
-                                            new KafkaTopicPartition(multiTopic, e.topic(),
-                                                                    e.partition()
-                                            )
+                                            new KafkaTopicPartition(multiTopic, e.topic(), e.partition())
                                         ))
                                         .collect(Collectors.toSet()));
   }
@@ -223,17 +221,23 @@ public Long getPosition(StreamPartition<KafkaTopicPartition> partition)
   public Map<KafkaTopicPartition, Long> getLatestSequenceNumbers(Set<StreamPartition<KafkaTopicPartition>> partitions)
   {
     return wrapExceptions(() -> CollectionUtils.mapKeys(
-      consumer.endOffsets(
-        partitions
-            .stream()
-            .map(e -> e.getPartitionId().asTopicPartition(e.getStream()))
-            .collect(Collectors.toList()
-        )
-      ),
-      p -> new KafkaTopicPartition(multiTopic, p.topic(), p.partition())
+        consumer.endOffsets(
+            partitions
+                .stream()
+                .map(e -> e.getPartitionId().asTopicPartition(e.getStream()))
+                .collect(Collectors.toList()
+                )
+        ),
+        p -> new KafkaTopicPartition(multiTopic, p.topic(), p.partition())
     ));
   }
 
+  @Override
+  public double getPollIdleRatioMetric()
+  {
+    return monitor.getPollIdleRatioAvg();
+  }
+
   @Override
   public Set<KafkaTopicPartition> getPartitionIds(String stream)
   {
@@ -250,16 +254,20 @@ public Set<KafkaTopicPartition> getPartitionIds(String stream)
         if (allPartitions.isEmpty()) {
           throw DruidException.forPersona(DruidException.Persona.OPERATOR)
                               .ofCategory(DruidException.Category.INVALID_INPUT)
-                              .build("No partitions found for topics that match given pattern [%s]."
-                                     + "Check that the pattern regex is correct and matching topics exists", stream);
+                              .build(
+                                  "No partitions found for topics that match given pattern [%s]."
+                                  + "Check that the pattern regex is correct and matching topics exists", stream
+                              );
         }
       } else {
         allPartitions = consumer.partitionsFor(stream);
         if (allPartitions == null) {
           throw DruidException.forPersona(DruidException.Persona.OPERATOR)
                               .ofCategory(DruidException.Category.INVALID_INPUT)
-                              .build("Topic [%s] is not found."
-                                     + " Check that the topic exists in Kafka cluster", stream);
+                              .build(
+                                  "Topic [%s] is not found."
+                                  + " Check that the topic exists in Kafka cluster", stream
+                              );
         }
       }
       return allPartitions.stream()
@@ -316,7 +324,10 @@ public static void addConsumerPropertiesFromConfig(
     // Additional DynamicConfigProvider based extensible support for all consumer properties
     Object dynamicConfigProviderJson = consumerProperties.get(KafkaSupervisorIOConfig.DRUID_DYNAMIC_CONFIG_PROVIDER_KEY);
     if (dynamicConfigProviderJson != null) {
-      DynamicConfigProvider dynamicConfigProvider = configMapper.convertValue(dynamicConfigProviderJson, DynamicConfigProvider.class);
+      DynamicConfigProvider dynamicConfigProvider = configMapper.convertValue(
+          dynamicConfigProviderJson,
+          DynamicConfigProvider.class
+      );
       Map<String, String> dynamicConfig = dynamicConfigProvider.getConfig();
       for (Map.Entry<String, String> e : dynamicConfig.entrySet()) {
         properties.setProperty(e.getKey(), e.getValue());
@@ -344,7 +355,8 @@ private static Deserializer getKafkaDeserializer(Properties properties, String k
                                            deserializerReturnType.getTypeName());
       }
     }
-    catch (ClassNotFoundException | NoSuchMethodException | InstantiationException | IllegalAccessException | InvocationTargetException e) {
+    catch (ClassNotFoundException | NoSuchMethodException | InstantiationException | IllegalAccessException |
+           InvocationTargetException e) {
       throw new StreamException(e);
     }
 
 
@@ -128,7 +128,6 @@ boolean isOffsetAvailable(StreamPartition<PartitionIdType> partition,
    * returns the set of partitions under the given stream
    *
    * @param stream name of stream
-   *
    * @return set of partitions
    */
   Set<PartitionIdType> getPartitionIds(String stream);
@@ -143,6 +142,15 @@ default Map<PartitionIdType, SequenceOffsetType> getLatestSequenceNumbers(Set<St
     throw new UnsupportedOperationException();
   }
 
+  /**
+   * @return Kafka's `poll-idle-ratio-avg` an it's analog for Kinesis,
+   * required for correct autoscaler work
+   */
+  default double getPollIdleRatioMetric()
+  {
+    throw new UnsupportedOperationException();
+  }
+
   /**
    * close the RecordSupplier
    */
 
@@ -4371,6 +4371,11 @@ public ConcurrentHashMap<PartitionIdType, SequenceOffsetType> getPartitionOffset
     return partitionOffsets;
   }
 
+  public double getPollIdleRatioMetric()
+  {
+    return recordSupplier.getPollIdleRatioMetric();
+  }
+
   /**
    * Should never be called outside of tests.
    */