getsentry · james-mcnulty · Jan 2, 2026 · Jan 2, 2026 · Jan 2, 2026 · Jan 3, 2026
@@ -26,7 +26,7 @@ metrics = "0.24.0"
 metrics-exporter-statsd = "0.9.0"
 prost = "0.13"
 prost-types = "0.13.3"
-rand = "0.8.5"
+rand = "0.9.2"
 rdkafka = { version = "0.37.0", features = ["cmake-build", "ssl"] }
 sentry = { version = "0.41.0", default-features = false, features = [
     # default features, except `release-health` is disabled
@@ -39,7 +39,8 @@ sentry = { version = "0.41.0", default-features = false, features = [
     "tracing",
     "logs"
 ] }
-sentry_protos = "0.4.10"
+sentry_protos = { git = "https://github.com/getsentry/sentry-protos", branch = "george/push-broker-worker" }
+itertools = "0.14.0"
 serde = "1.0.214"
 serde_yaml = "0.9.34"
 sha2 = "0.10.8"

@@ -15,11 +15,11 @@ use tokio::task::JoinSet;
 
 async fn get_pending_activations(num_activations: u32, num_workers: u32) {
     let url = if cfg!(feature = "bench-with-mnt-disk") {
-        let mut rng = rand::thread_rng();
+        let mut rng = rand::rng();
         format!(
             "/mnt/disks/sqlite/{}-{}.sqlite",
             Utc::now(),
-            rng.r#gen::<u64>()
+            rng.random::<u64>()
         )
     } else {
         generate_temp_filename()
@@ -78,11 +78,11 @@ async fn set_status(num_activations: u32, num_workers: u32) {
     assert!(num_activations.is_multiple_of(num_workers));
 
     let url = if cfg!(feature = "bench-with-mnt-disk") {
-        let mut rng = rand::thread_rng();
+        let mut rng = rand::rng();
         format!(
             "/mnt/disks/sqlite/{}-{}.sqlite",
             Utc::now(),
-            rng.r#gen::<u64>()
+            rng.random::<u64>()
         )
     } else {
         generate_temp_filename()

@@ -0,0 +1,6 @@
+kafka_topic: "test-topic"
+push: true
+# workers:
+#   - "http://127.0.0.1:50052"
+#   - "http://127.0.0.1:50053"
+#   - "http://127.0.0.1:50054"
@@ -214,6 +214,12 @@ pub struct Config {
 
     /// Enable additional metrics for the sqlite.
     pub enable_sqlite_status_metrics: bool,
+
+    /// Enable push mode.
+    pub push: bool,
+
+    /// Worker addresses.
+    pub workers: Vec<String>,
 }
 
 impl Default for Config {
@@ -279,6 +285,8 @@ impl Default for Config {
             full_vacuum_on_upkeep: true,
             vacuum_interval_ms: 30000,
             enable_sqlite_status_metrics: true,
+            push: false,
+            workers: vec![],
         }
     }
 }

@@ -2,22 +2,46 @@ use chrono::Utc;
 use prost::Message;
 use sentry_protos::taskbroker::v1::consumer_service_server::ConsumerService;
 use sentry_protos::taskbroker::v1::{
-    FetchNextTask, GetTaskRequest, GetTaskResponse, SetTaskStatusRequest, SetTaskStatusResponse,
+    AddWorkerRequest, AddWorkerResponse, FetchNextTask, GetTaskRequest, GetTaskResponse,
+    RemoveWorkerRequest, RemoveWorkerResponse, SetTaskStatusRequest, SetTaskStatusResponse,
     TaskActivation, TaskActivationStatus,
 };
 use std::sync::Arc;
 use std::time::Instant;
+use tokio::sync::RwLock;
 use tonic::{Request, Response, Status};
 
+use crate::pool::WorkerPool;
 use crate::store::inflight_activation::{InflightActivationStatus, InflightActivationStore};
 use tracing::{error, instrument};
 
 pub struct TaskbrokerServer {
     pub store: Arc<InflightActivationStore>,
+    pub pool: Arc<RwLock<WorkerPool>>,
 }
 
 #[tonic::async_trait]
 impl ConsumerService for TaskbrokerServer {
+    #[instrument(skip_all)]
+    async fn add_worker(
+        &self,
+        request: Request<AddWorkerRequest>,
+    ) -> Result<Response<AddWorkerResponse>, Status> {
+        let address = &request.get_ref().address;
+        self.pool.write().await.add_worker(address);
+        Ok(Response::new(AddWorkerResponse {}))
+    }
+
+    #[instrument(skip_all)]
+    async fn remove_worker(
+        &self,
+        request: Request<RemoveWorkerRequest>,
+    ) -> Result<Response<RemoveWorkerResponse>, Status> {
+        let address = &request.get_ref().address;
+        self.pool.write().await.remove_worker(address);
+        Ok(Response::new(RemoveWorkerResponse {}))
+    }
+
     #[instrument(skip_all)]
     async fn get_task(
         &self,
@@ -67,6 +91,12 @@ impl ConsumerService for TaskbrokerServer {
         let start_time = Instant::now();
         let id = request.get_ref().id.clone();
 
+        // Update worker queue size estimate
+        // self.pool
+        //     .write()
+        //     .await
+        //     .decrement_queue_size(&request.get_ref().address);
+
         let status: InflightActivationStatus =
             TaskActivationStatus::try_from(request.get_ref().status)
                 .map_err(|e| {

@@ -4,12 +4,14 @@ use tonic::{Code, Request};
 
 use crate::grpc::server::TaskbrokerServer;
 
-use crate::test_utils::{create_test_store, make_activations};
+use crate::test_utils::{create_pool, create_test_store, make_activations};
 
 #[tokio::test]
 async fn test_get_task() {
     let store = create_test_store().await;
-    let service = TaskbrokerServer { store };
+    let pool = create_pool();
+
+    let service = TaskbrokerServer { store, pool };
     let request = GetTaskRequest { namespace: None };
     let response = service.get_task(Request::new(request)).await;
     assert!(response.is_err());
@@ -22,11 +24,14 @@ async fn test_get_task() {
 #[allow(deprecated)]
 async fn test_set_task_status() {
     let store = create_test_store().await;
-    let service = TaskbrokerServer { store };
+    let pool = create_pool();
+
+    let service = TaskbrokerServer { store, pool };
     let request = SetTaskStatusRequest {
         id: "test_task".to_string(),
         status: 5, // Complete
         fetch_next_task: None,
+        address: "http://127.0.0.1:50052".into(),
     };
     let response = service.set_task_status(Request::new(request)).await;
     assert!(response.is_ok());
@@ -38,11 +43,14 @@ async fn test_set_task_status() {
 #[allow(deprecated)]
 async fn test_set_task_status_invalid() {
     let store = create_test_store().await;
-    let service = TaskbrokerServer { store };
+    let pool = create_pool();
+
+    let service = TaskbrokerServer { store, pool };
     let request = SetTaskStatusRequest {
         id: "test_task".to_string(),
         status: 1, // Invalid
         fetch_next_task: None,
+        address: "http://127.0.0.1:50052".into(),
     };
     let response = service.set_task_status(Request::new(request)).await;
     assert!(response.is_err());
@@ -58,10 +66,12 @@ async fn test_set_task_status_invalid() {
 #[allow(deprecated)]
 async fn test_get_task_success() {
     let store = create_test_store().await;
+    let pool = create_pool();
+
     let activations = make_activations(1);
     store.store(activations).await.unwrap();
 
-    let service = TaskbrokerServer { store };
+    let service = TaskbrokerServer { store, pool };
     let request = GetTaskRequest { namespace: None };
     let response = service.get_task(Request::new(request)).await;
     assert!(response.is_ok());
@@ -75,10 +85,12 @@ async fn test_get_task_success() {
 #[allow(deprecated)]
 async fn test_set_task_status_success() {
     let store = create_test_store().await;
+    let pool = create_pool();
+
     let activations = make_activations(2);
     store.store(activations).await.unwrap();
 
-    let service = TaskbrokerServer { store };
+    let service = TaskbrokerServer { store, pool };
 
     let request = GetTaskRequest { namespace: None };
     let response = service.get_task(Request::new(request)).await;
@@ -92,6 +104,7 @@ async fn test_set_task_status_success() {
         id: "id_0".to_string(),
         status: 5, // Complete
         fetch_next_task: Some(FetchNextTask { namespace: None }),
+        address: "http://127.0.0.1:50052".into(),
     };
     let response = service.set_task_status(Request::new(request)).await;
     assert!(response.is_ok());

@@ -6,6 +6,8 @@ pub mod grpc;
 pub mod kafka;
 pub mod logging;
 pub mod metrics;
+pub mod pool;
+pub mod push;
 pub mod runtime_config;
 pub mod store;
 pub mod test_utils;

@@ -5,8 +5,11 @@ use std::{sync::Arc, time::Duration};
 use taskbroker::kafka::inflight_activation_batcher::{
     ActivationBatcherConfig, InflightActivationBatcher,
 };
+use taskbroker::pool::WorkerPool;
+use taskbroker::push::TaskPusher;
 use taskbroker::upkeep::upkeep;
 use tokio::signal::unix::SignalKind;
+use tokio::sync::RwLock;
 use tokio::task::JoinHandle;
 use tokio::{select, time};
 use tonic::transport::Server;
@@ -57,6 +60,8 @@ async fn main() -> Result<(), Error> {
     let runtime_config_manager =
         Arc::new(RuntimeConfigManager::new(config.runtime_config_path.clone()).await);
 
+    let pool = Arc::new(RwLock::new(WorkerPool::new(config.workers.clone())));
+
     println!("taskbroker starting");
     println!("version: {}", get_version().trim());
 
@@ -177,10 +182,29 @@ async fn main() -> Result<(), Error> {
         }
     });
 
+    // Push task loop (conditionally enabled)
+    let push_task = if config.push {
+        info!("Running in PUSH mode");
+
+        let push_task_store = store.clone();
+        let push_task_config = config.clone();
+        let push_task_pool = pool.clone();
+
+        Some(tokio::spawn(async move {
+            let pusher = TaskPusher::new(push_task_store, push_task_config, push_task_pool);
+            pusher.start().await
+        }))
+    } else {
+        info!("Running in PULL mode");
+        None
+    };
+
     // GRPC server
     let grpc_server_task = tokio::spawn({
         let grpc_store = store.clone();
         let grpc_config = config.clone();
+        let grpc_pool = pool.clone();
+
         async move {
             let addr = format!("{}:{}", grpc_config.grpc_addr, grpc_config.grpc_port)
                 .parse()
@@ -195,6 +219,7 @@ async fn main() -> Result<(), Error> {
                 .layer(layers)
                 .add_service(ConsumerServiceServer::new(TaskbrokerServer {
                     store: grpc_store,
+                    pool: grpc_pool,
                 }))
                 .add_service(health_service.clone())
                 .serve(addr);
@@ -225,16 +250,22 @@ async fn main() -> Result<(), Error> {
         }
     });
 
-    elegant_departure::tokio::depart()
+    let mut depart = elegant_departure::tokio::depart()
         .on_termination()
         .on_sigint()
         .on_signal(SignalKind::hangup())
         .on_signal(SignalKind::quit())
         .on_completion(log_task_completion("consumer", consumer_task))
         .on_completion(log_task_completion("grpc_server", grpc_server_task))
         .on_completion(log_task_completion("upkeep_task", upkeep_task))
-        .on_completion(log_task_completion("maintenance_task", maintenance_task))
-        .await;
+        .on_completion(log_task_completion("maintenance_task", maintenance_task));
+
+    // Only register push_task if it was spawned
+    if let Some(task) = push_task {
+        depart = depart.on_completion(log_task_completion("push_task", task));
+    }
+
+    depart.await;
 
     Ok(())
 }