KAFKA-17871: avoid blocking the herder thread when producer flushing hangs #21

arvi18 · 2025-08-11T08:02:17Z

Delete this text and replace it with a detailed description of your change. The
PR title and body will become the squashed commit message.

If you would like to tag individuals, add some commentary, upload images, or
include other supplemental information that should not be part of the eventual
commit message, please use a separate comment.

If applicable, please include a summary of the testing strategy (including
rationale) for the proposed change. Unit and/or integration tests are expected
for any behavior change and system tests should be considered for larger
changes.

…9521) This patch addresses issue apache#19516 and corrects a typo in `ApiKeyVersionsProvider`: when `toVersion` exceeds `latestVersion`, the `IllegalArgumentException` message was erroneously formatted with `fromVersion`. The format argument has been updated to use `toVersion` so that the error message reports the correct value. Reviewers: Ken Huang <[email protected]>, PoAn Yang <[email protected]>, Jhen-Yung Hsu <[email protected]>, Chia-Ping Tsai <[email protected]>

…pache#19302) Move the static fields/methods Reviewers: Luke Chen <[email protected]>

The check for `scheduler.pendingTaskSize()` may fail if the thread pool is too slow to consume the runnable objects Reviewers: Ken Huang <[email protected]>, PoAn Yang <[email protected]>, Chia-Ping Tsai <[email protected]>

…#17099) Two sets of tests are added: 1. KafkaProducerTest - when send success, both record.headers() and onAcknowledgement headers are read only - when send failure, record.headers() is writable as before and onAcknowledgement headers is read only 2. ProducerInterceptorsTest - make both old and new onAcknowledgement method are called successfully Reviewers: Lianet Magrans <[email protected]>, Omnia Ibrahim <[email protected]>, Matthias J. Sax <[email protected]>, Andrew Schofield <[email protected]>, Chia-Ping Tsai <[email protected]>

about https://github.com/apache/kafka/pull/19387/files#r2052025917 Reviewers: PoAn Yang <[email protected]>, Chia-Ping Tsai <[email protected]>, TengYao Chi <[email protected]>

…pache#19437) This PR adds the support for remote storage fetch for share groups. There is a limitation in remote storage fetch for consumer groups that we can only perform remote fetch for a single topic partition in a fetch request. Since, the logic of share fetch requests is largely based on how consumer groups work, we are following similar logic in implementing remote storage fetch. However, this problem should be addressed as part of KAFKA-19133 which should help us perform fetch for multiple remote fetch topic partition in a single share fetch request. Reviewers: Jun Rao <[email protected]>

As the title. Ticket: https://issues.apache.org/jira/browse/KAFKA-19179 Reviewers: PoAn Yang <[email protected]>, Jhen-Yung Hsu <[email protected]>, TengYao Chi <[email protected]>, Nick Guo <[email protected]>, Ken Huang <[email protected]>, Chia-Ping Tsai <[email protected]>

@Goooler

Note: this is a apache#18018 offshoot. See this comment made by @Goooler: apache#18018 (comment) ![image](https://github.com/user-attachments/assets/c41acba6-9f2a-44a5-b47f-60a4d7078100) Reviewers: Apoorv Mittal <[email protected]>, David Arthur <[email protected]>, Goooler <[email protected]>

The release script was pushing the RC tag off of a temporary branch that was never merged back into the release branch. This meant that our RC and release tags were detached from the rest of the repository. This patch changes the release script to merge the RC tag back into the release branch and pushes both the tag and the branch. Reviewers: Luke Chen <[email protected]>

This PR removes the unstable API flag for the KIP-932 RPCs. The 4 RPCs which were exposed for the early access release in AK 4.0 are stabilised at v1. This is because the RPCs have evolved over time and AK 4.0 clients are not compatible with AK 4.1 brokers. By stabilising at v1, the API version checks prevent incompatible communication and server-side exceptions when trying to parse the requests from the older clients. Reviewers: Apoorv Mittal <[email protected]>

…19500) Currently the share session cache is desgined like the fetch session cache. If the cache is full and a new share session is trying to get get initialized, then the sessions which haven't been touched for more than 2minutes are evicted. This wouldn't be right for share sessions as the members also hold locks on the acquired records, and session eviction would mean theose locks will need to be dropped and the corresponding records re-delivered. This PR removes the time based eviction logic for share sessions. Refer: [KAFKA-19159](https://issues.apache.org/jira/browse/KAFKA-19159) Reviewers: Apoorv Mittal <[email protected]>, Chia-Ping Tsai <[email protected]>

Small improvements to share consumer javadoc. Reviewers: Apoorv Mittal <[email protected]>

Updated the Kafka Streams documentation to include metrics for tasks, process nodes, and threads that were missing. I was unable to find metrics such as stream-state-metrics, client-metrics, state-store-metrics, and record-cache-metrics in the codebase, so they are not included in this update. Reviewers: Bill Bejeck <[email protected]>

…ache#19416) This change implements upgrading the kraft version from 0 to 1 in existing clusters. Previously, clusters were formatted with either version 0 or version 1, and could not be moved between them. The kraft version for the cluster metadata partition is recorded using the KRaftVersion control record. If there is no KRaftVersion control record the default kraft version is 0. The kraft version is upgraded using the UpdateFeatures RPC. These RPCs are handled by the QuorumController and FeatureControlManager. This change adds special handling in the FeatureControlManager so that upgrades to the kraft.version are directed to RaftClient#upgradeKRaftVersion. To allow the FeatureControlManager to call RaftClient#upgradeKRaftVersion is a non-blocking fashion, the kraft version upgrade uses optimistic locking. The call to RaftClient#upgradeKRaftVersion does validations of the version change. If the validations succeeds, it generates the necessary control records and adds them to the BatchAccumulator. Before the kraft version can be upgraded to version 1, all of the brokers and controllers in the cluster need to support kraft version 1. The check that all brokers support kraft version 1 is done by the FeatureControlManager. The check that all of the controllers support kraft version is done by KafkaRaftClient and LeaderState. When the kraft version is 0, the kraft leader starts by assuming that all voters do not support kraft version 1. The leader discovers which voters support kraft version 1 through the UpdateRaftVoter RPC. The KRaft leader handles UpdateRaftVoter RPCs by storing the updated information in-memory until the kraft version is upgraded to version 1. This state is stored in LeaderState and contains the latest directory id, endpoints and supported kraft version for each voter. Only when the KRaft leader has received an UpdateRaftVoter RPC from all of the voters will it allow the upgrade from kraft.version 0 to 1. Reviewers: Alyssa Huang <[email protected]>, Colin P. McCabe <[email protected]>

This patch extends the OffsetCommit API to support topic ids. From version 10 of the API, topic ids must be used. Originally, we wanted to support both using topic ids and topic names from version 10 but it turns out that it makes everything more complicated. Hence we propose to only support topic ids from version 10. Clients which only support using topic names can either lookup the topic ids using the Metadata API or stay on using an earlier version. The patch only contains the server side changes and it keeps the version 10 as unstable for now. We will mark the version as stable when the client side changes are merged in. Reviewers: Lianet Magrans <[email protected]>, PoAn Yang <[email protected]>

…a result of change in assignor algorithm (apache#19541) The system test `ShareConsumerTest.test_share_multiple_partitions` started failing because of the recent change in the SimpleAssignor algorithm. The tests assumed that if a share group is subscribed to a topic, then every share consumers part of the group will be assigned all partitions of the topic. But that does not happen now, and partitions are split between the share consumers in certain cases, in which some partitions are only assigned to a subset of share consumers. This change removes that assumption Reviewers: PoAn Yang <[email protected]>, Andrew Schofield <[email protected]>

…ionCache (apache#19505) This PR removes the group.share.max.groups config. This config was used to calculate the maximum size of share session cache. But with the new config group.share.max.share.sessions in place with exactly this purpose, the ShareSessionCache initialization has also been passed the new config. Refer: [KAFKA-19156](https://issues.apache.org/jira/browse/KAFKA-19156) Reviewers: Apoorv Mittal <[email protected]>, Andrew Schofield <[email protected]>, Chia-Ping Tsai <[email protected]>

…ache#19443) * There could be scenarios where share partition records in `__share_group_state` internal topic are not updated for a while implying these partitions are basically cold. * In this situation, the presence of these holds back the pruner from keeping the topic clean and of manageable size. * To remedy the situation, we have added a periodic `setupSnapshotColdPartitions` in `ShareCoordinatorService` which does a writeAll operation on the associated shards in the coordinator and forces snapshot creation for any cold partitions. In this way the pruner can continue. This job has been added as a timer task. * A new internal config `share.coordinator.cold.partition.snapshot.interval.ms` has been introduced to set the period of the job. * Any failures are logged and ignored. * New tests have been added to verify the feature. Reviewers: PoAn Yang <[email protected]>, Andrew Schofield <[email protected]>

Improves a variable name and handling of an Optional. Reviewers: Bill Bejeck <[email protected]>, Chia-Ping Tsai <[email protected]>, PoAn Yang <[email protected]>

…pache#19440) Introduces a concrete subclass of `KafkaThread` named `SenderThread`. The poisoning of the TransactionManager on invalid state changes is determined by looking at the type of the current thread. Reviewers: Chia-Ping Tsai <[email protected]>

…pache#19457) - Construct `AsyncKafkaConsumer` constructor and verify that the `RequestManagers.supplier()` contains Streams-specific data structures. - Verify that `RequestManagers` constructs the Streams request managers correctly - Test `StreamsGroupHeartbeatManager#resetPollTimer()` - Test `StreamsOnTasksRevokedCallbackCompletedEvent`, `StreamsOnTasksAssignedCallbackCompletedEvent`, and `StreamsOnAllTasksLostCallbackCompletedEvent` in `ApplicationEventProcessor` - Test `DefaultStreamsRebalanceListener` - Test `StreamThread`. - Test `handleStreamsRebalanceData`. - Test `StreamsRebalanceData`. Reviewers: Lucas Brutschy <[email protected]>, Bill Bejeck <[email protected]> Signed-off-by: PoAn Yang <[email protected]>

…he#19547) Change the log messages which used to warn that KIP-932 was an Early Access feature to say that it is now a Preview feature. This will make the broker logs far less noisy when share groups are enabled. Reviewers: Apoorv Mittal <[email protected]>

The generated response data classes take Readable as input to parse the Response. However, the associated response objects take ByteBuffer as input and thus convert them to Readable using `new ByteBufferAccessor` call. This PR changes the parse method of all the response classes to take the Readable interface instead so that no such conversion is needed. To support parsing the ApiVersionsResponse twice for different version this change adds the "slice" method to the Readable interface. Reviewers: José Armando García Sancio <[email protected]>, Truc Nguyen <[[email protected]](mailto:[email protected])>, Aadithya Chandra <[[email protected]](mailto:[email protected])>

…#19549) The heartbeat logic for share groups is tricky when the set of topic-partitions eligible for assignment changes. We have observed epoch mismatches when brokers are restarted, which should not be possible. Improving the logging so we can see the previous member epoch and tally this with the logged state. Reviewers: Apoorv Mittal <[email protected]>, Sushant Mahajan <[email protected]>

…19536) This PR marks the records as non-nullable for ShareFetch. This PR is as per the changes for Fetch: apache#18726 and some work for ShareFetch was done here: apache#19167. I tested with marking `records` as non-nullable in ShareFetch, which required additional handling. The same has been fixed in current PR. Reviewers: Andrew Schofield <[email protected]>, Chia-Ping Tsai <[email protected]>, TengYao Chi <[email protected]>, PoAn Yang <[email protected]>

…tProducerId (KIP-939) (apache#19429) This is part of the client side changes required to enable 2PC for KIP-939 **Producer Config:** transaction.two.phase.commit.enable The default would be ‘false’. If set to ‘true’, the broker is informed that the client is participating in two phase commit protocol and transactions that this client starts never expire. **Overloaded InitProducerId method** If the value is 'true' then the corresponding field is set in the InitProducerIdRequest Reviewers: Justine Olshan <[email protected]>, Artem Livshits <[email protected]>

…ics) (apache#17988) Reviewers: Greg Harris <[email protected]>

This patch does a few code changes: * It cleans up the GroupCoordinatorService; * It moves the helper methods to validate request to Utils; * It moves the helper methods to create the assignment for the ConsumerGroupHeartbeatResponse and the ShareGroupHeartbeatResponse from the GroupMetadataManager to the respective classes. Reviewers: Chia-Ping Tsai <[email protected]>, Jeff Kim <[email protected]>

…rvers (apache#19545) Old bootstrap.metadata files cause problems with server that include KAFKA-18601. When the server tries to read the bootstrap.checkpoint file, it will fail if the metadata.version is older than 3.3-IV3 (feature level 7). This causes problems when these clusters are upgraded. This PR makes it possible to represent older MVs in BootstrapMetadata objects without causing an exception. An exception is thrown only if we attempt to access the BootstrapMetadata. This ensures that only the code path in which we start with an empty metadata log checks that the metadata version is 7 or newer. Reviewers: José Armando García Sancio <[email protected]>, Ismael Juma <[email protected]>, PoAn Yang <[email protected]>, Liu Zeyu <[email protected]>, Alyssa Huang <[email protected]>

Replace names like a, b, c, ... with meaningful names in AsyncKafkaConsumerTest. Follow-up: apache#19457 (comment) Signed-off-by: PoAn Yang <[email protected]> Reviewers: Bill Bejeck <[email protected]>, Ken Huang <[email protected]>

…pache#19450) Kafka Streams calls `prepareCommit()` in `Taskmanager#closeTaskDirty()`. However, the dirty task must not get committed and therefore, prepare-commit tasks such as getting offsets should not be needed as well. The only thing needed before closing a task dirty is flushing. Therefore, separating `flush` and `prepareCommit` could be a good fix. Reviewers: Bill Bejeck <[email protected]>, Matthias J. Sax <[email protected]>

…ache#19548) If a streams, share or consumer group is described, all group IDs sent to all shards of the group coordinator. This change fixes it. It tested in the unit tests, since it's somewhat inconvenient to test the passed read operation lambda. Reviewers: David Jacot <[email protected]>, Andrew Schofield <[email protected]>

apache#19552) This PR just resolves an NPE when a topic assigned in a share group is deleted. The NPE is caused by code which uses the current metadata image to convert from a topic ID to the topic name. For a deleted topic, there is no longer any entry in the image. A future PR will properly handle the topic deletion. Reviewers: Apoorv Mittal <[email protected]>, PoAn Yang <[email protected]>

If the streams rebalance protocol is enabled in StreamsUncaughtExceptionHandlerIntegrationTest, the streams application does not shut down correctly upon error. There are two causes for this. First, sometimes, the SHUTDOWN_APPLICATION code only sent with the leave heartbeat, but that is not handled broker side. Second, the SHUTDOWN_APPLICATION code wasn't properly handled client-side at all. Reviewers: Bruno Cadonna <[email protected]>, Bill Bejeck <[email protected]>, PoAn Yang <[email protected]>

…upMetadataValue (apache#19504) * Add MetadataHash field to ConsumerGroupMetadataValue, ShareGroupMetadataValue, and StreamGroupMetadataValue. * Add metadataHash field to GroupCoordinatorRecordHelpers#newConsumerGroupEpochRecord, GroupCoordinatorRecordHelpers#newShareGroupEpochRecord, and StreamsCoordinatorRecordHelpers#newStreamsGroupEpochRecord. * Add deprecated message to ConsumerGroupPartitionMetadataKey and ConsumerGroupPartitionMetadataValue. * ShareGroupPartitionMetadataKey / ShareGroupPartitionMetadataValue / StreamGroupPartitionMetadataKey / StreamGroupPartitionMetadataValue will be removed in next PR. Reviewers: Lucas Brutschy <[email protected]>, David Jacot <[email protected]> --------- Signed-off-by: PoAn Yang <[email protected]>

…hangs The call to `backingStore.get()` (called by connector task threads through `OffsetStorageReaderImpl.offsets()`) can block for long time waiting for data flush to complete (`KafkaProducer.flush()`). This change moves that call outside the synchronized clause that holds `offsetReadFutures`, so that if `backingStore.get()` hangs then it does not keep `offsetReadFutures` locked. The access to `closed` flag (`closed.get()`) is kept inside the synchronize clause to avoid race condition with `close()`. This is important because `OffsetStorageReaderImpl.close()` needs to lock `offsetReadFutures` as well in order to cancel the futures. Since the herder thread calls `OffsetStorageReaderImpl.close()` when attempting to stops a task, before this change this was resulting in the herder thread hanging indefinetely waiting for `backingStore.get()` to complete.

coderabbitai · 2025-08-11T08:02:27Z

Important

Review skipped

More than 25% of the files skipped due to max files limit. The review is being skipped to prevent a low-quality review.

193 files out of 300 files are above the max files limit of 100. Please upgrade to Pro plan to get higher limits.

You can disable this status message by setting the reviews.review_status to false in the CodeRabbit configuration file.

✨ Finishing Touches

📝 Generate Docstrings

🧪 Generate unit tests

Create PR with unit tests
Post copyable unit tests in a comment
Commit unit tests in branch clone-KAFKA-17871-avoid-blocking-herder-thread

Thanks for using CodeRabbit! It's free for OSS, and your support helps us grow. If you like it, consider giving us a shout-out.

❤️ Share

🪧 Tips

Chat

There are 3 ways to chat with CodeRabbit:

Review comments: Directly reply to a review comment made by CodeRabbit. Example:
- I pushed a fix in commit <commit_id>, please review it.
- Explain this complex logic.
- Open a follow-up GitHub issue for this discussion.
Files and specific lines of code (under the "Files changed" tab): Tag @coderabbitai in a new review comment at the desired location with your query. Examples:
- @coderabbitai explain this code block.
PR comments: Tag @coderabbitai in a new PR comment to ask questions about the PR branch. For the best results, please provide a very specific query, as very limited context is provided in this mode. Examples:
- @coderabbitai gather interesting stats about this repository and render them as a table. Additionally, render a pie chart showing the language distribution in the codebase.
- @coderabbitai read src/utils.ts and explain its main purpose.
- @coderabbitai read the files in the src/scheduler package and generate a class diagram using mermaid and a README in the markdown format.

Support

Need help? Create a ticket on our support page for assistance with any issues or questions.

CodeRabbit Commands (Invoked using PR comments)

@coderabbitai pause to pause the reviews on a PR.
@coderabbitai resume to resume the paused reviews.
@coderabbitai review to trigger an incremental review. This is useful when automatic reviews are disabled for the repository.
@coderabbitai full review to do a full review from scratch and review all the files again.
@coderabbitai summary to regenerate the summary of the PR.
@coderabbitai generate docstrings to generate docstrings for this PR.
@coderabbitai generate sequence diagram to generate a sequence diagram of the changes in this PR.
@coderabbitai generate unit tests to generate unit tests for this PR.
@coderabbitai resolve resolve all the CodeRabbit review comments.
@coderabbitai configuration to show the current CodeRabbit configuration for the repository.
@coderabbitai help to get help.

Other keywords and placeholders

Add @coderabbitai ignore anywhere in the PR description to prevent this PR from being reviewed.
Add @coderabbitai summary to generate the high-level summary at a specific location in the PR description.
Add @coderabbitai anywhere in the PR title to generate the title automatically.

CodeRabbit Configuration File (`.coderabbit.yaml`)

You can programmatically configure CodeRabbit by adding a .coderabbit.yaml file to the root of your repository.
Please see the configuration documentation for more information.
If your editor has YAML language server enabled, you can add the path at the top of this file to enable auto-completion and validation: # yaml-language-server: $schema=https://coderabbit.ai/integrations/schema.v2.json

Documentation and Community

Visit our Documentation for detailed information on how to use CodeRabbit.
Join our Discord Community to get help, request features, and share feedback.
Follow us on X/Twitter for updates and announcements.

refacto-test · 2025-08-11T08:03:09Z

🤖 Refacto.AI: PR Summary & Reviewer Guide

🎯 1. The Goal (Why was this PR raised?)

This PR aims to implement KAFKA-17871, which focuses on avoiding blocking the herder thread when producer flushing hangs. The changes involve significant modifications to the Kafka Raft implementation, transaction management, and KRaft version upgrade capabilities.

🗺️ 2. The Changes (What was implemented?)

File Name	Implementation Details	Goal / Requirement Addressed
raft/src/main/java/org/apache/kafka/raft/LeaderState.java (Modified)	Replaced `ReplicaKey localReplicaKey` with `VoterSet.VoterNode localVoterNode`, added KRaft version upgrade functionality, and implemented methods for handling voter updates and version transitions.	Support KRaft version upgrades and improve voter management
raft/src/test/java/org/apache/kafka/raft/LeaderStateTest.java (Modified)	Updated tests to match the new LeaderState implementation, added tests for volatile voters and KRaft version upgrades.	Test new KRaft version upgrade functionality
clients/src/main/java/org/apache/kafka/clients/producer/internals/TransactionManager.java (Modified)	Refactored thread safety handling by replacing ThreadLocal with a method, added 2PC (two-phase commit) support, and added keepPreparedTxn parameter.	Improve transaction management and add 2PC support
clients/src/test/java/org/apache/kafka/clients/producer/internals/TransactionManagerTest.java (Modified)	Updated tests for the refactored TransactionManager, added test for initializing transactions with keepPreparedTxn, and created a TestableTransactionManager subclass.	Test new transaction management functionality
raft/src/main/java/org/apache/kafka/raft/internals/UpdateVoterHandler.java (Modified)	Enhanced to support updating voters when KRaft version doesn't support reconfiguration, improved error handling and logging.	Support voter updates with different KRaft versions
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/TransformationStage.java (Modified)	Added version tracking for transforms and predicates, created new record classes for plugin information.	Track plugin versions in transformations
metadata/src/main/java/org/apache/kafka/controller/FeatureControlManager.java (Modified)	Added KRaftVersionAccessor interface, implemented KRaft version upgrade support.	Support KRaft version upgrades
metadata/src/test/java/org/apache/kafka/controller/FeatureControlManagerTest.java (Modified)	Updated tests to handle the new currentClaimedEpoch parameter in updateFeatures method.	Test KRaft version upgrade functionality
metadata/src/main/java/org/apache/kafka/controller/KRaftVersionAccessor.java (Added)	Created interface for upgrading and reading the kraft version.	Support KRaft version upgrades
metadata/src/main/java/org/apache/kafka/controller/RaftClientKRaftVersionAccessor.java (Added)	Implemented KRaftVersionAccessor using RaftClient.	Support KRaft version upgrades
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/rest/entities/ConnectorStateInfo.java (Modified)	Added version field to AbstractState, ConnectorState, and TaskState classes.	Track connector versions
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/TaskPluginsMetadata.java (Added)	Added new class to track metadata about plugins used in tasks.	Track plugin versions in tasks
clients/src/main/java/org/apache/kafka/common/requests/CreateDelegationTokenResponse.java (Modified)	Updated parse method to use Readable instead of ByteBuffer.	Improve request/response handling
clients/src/main/java/org/apache/kafka/common/requests/DescribeDelegationTokenResponse.java (Modified)	Updated parse method to use Readable instead of ByteBuffer.	Improve request/response handling
clients/src/main/java/org/apache/kafka/common/requests/ExpireDelegationTokenResponse.java (Modified)	Updated parse method to use Readable instead of ByteBuffer.	Improve request/response handling
clients/src/main/java/org/apache/kafka/common/requests/RenewDelegationTokenResponse.java (Modified)	Updated parse method to use Readable instead of ByteBuffer.	Improve request/response handling
clients/src/test/java/org/apache/kafka/common/security/authenticator/SaslAuthenticatorTest.java (Modified)	Updated tests to use ByteBufferAccessor with parse methods.	Update tests for request/response changes
clients/src/test/java/org/apache/kafka/common/security/authenticator/SaslServerAuthenticatorTest.java (Modified)	Updated tests to use ByteBufferAccessor with parse methods.	Update tests for request/response changes
docs/ops.html (Modified)	Added documentation for new Kafka Streams metrics: commit-ratio, poll-ratio, poll-records-avg, poll-records-max, process-ratio, process-records-avg, process-records-max, punctuate-ratio, punctuate-latency-avg, punctuate-latency-max, punctuate-total, punctuate-rate, active-buffer-count, record-rate, record-total, update-rate, update-total, and Idempotent-update-skip metrics.	Document new metrics

🤔 3. Key Areas for Human Review

Here are the most important areas to focus your review on, including specific testing instructions.

Area of Concern: KRaft Version Upgrade Handling

File: raft/src/main/java/org/apache/kafka/raft/LeaderState.java (Lines 95-638)
Why: This introduces complex logic for handling KRaft version upgrades with optimistic locking and state transitions. The code contains significant changes to core functionality with multiple edge cases.
Testing Instruction: Test KRaft version upgrades with different configurations, especially focusing on scenarios where voters have different version support levels. Verify that the upgrade process correctly handles concurrent updates and edge cases.

Area of Concern: Transaction Management Thread Safety

File: clients/src/main/java/org/apache/kafka/clients/producer/internals/TransactionManager.java (Lines 228-283)
Why: The code replaces a ThreadLocal variable with a method for determining thread safety behavior, which is critical for transaction integrity. This change affects how invalid state transitions are handled.
Testing Instruction: Test transaction operations from both application threads and Sender threads to verify that invalid state transitions are handled correctly in both contexts. Verify that the FATAL_ERROR state is set appropriately when errors occur in the Sender thread.

Area of Concern: UpdateVoterHandler Logic

File: raft/src/main/java/org/apache/kafka/raft/internals/UpdateVoterHandler.java (Lines 104-288)
Why: The file contains significant changes to how voter updates are handled, particularly with different KRaft versions. The complexity of the conditional logic and error handling increases the risk of bugs.
Testing Instruction: Test voter updates with different KRaft versions, especially when reconfiguration is not supported. Verify that in-memory voter updates work correctly and that appropriate errors are returned when updates cannot be processed.

Area of Concern: Feature Control for KRaft Version

File: metadata/src/main/java/org/apache/kafka/controller/FeatureControlManager.java (Lines 273-303)
Why: This adds new logic for upgrading KRaft versions through the feature control framework. The code contains complex validation and error handling for version upgrades.
Testing Instruction: Test KRaft version upgrades through the feature control API, including validation-only requests, downgrade attempts, and concurrent upgrades. Verify that appropriate errors are returned for invalid operations.

gemini-code-assist

Summary of Changes

Hello @arvi18, I'm Gemini Code Assist¹! I'm currently reviewing this pull request and will post my feedback shortly. In the meantime, here's a summary to help you and other reviewers quickly get up to speed!

This pull request introduces several significant enhancements across the Kafka ecosystem. My primary focus was to address a critical reliability issue in the Connect framework, preventing the herder thread from blocking when producer flushing operations hang. Beyond this, I've advanced the maturity of the 'Share Group' feature, moving it from an experimental 'early access' to a more stable 'preview' state. A major new capability is the introduction of two-phase commit (2PC) support for transactional producers, enabling external coordination of transactions. I've also improved producer interceptors by providing access to record headers in acknowledgment callbacks. Furthermore, this PR lays the groundwork for KRaft versioning and upgrade mechanisms, and significantly enhances the Connect framework's observability by adding plugin versioning and metrics. Finally, I've refined API parsing to use a more flexible Readable interface and integrated topic IDs into the consumer group protocol.

Highlights

Connect Framework Reliability: I've implemented a crucial fix to prevent the Connect framework's herder thread from blocking indefinitely when a producer's flushing operation hangs. This significantly enhances the overall stability and resilience of the Connect cluster.
Share Group Feature Maturity: The 'Share Group' feature (KIP-932) has matured from an 'early access' experimental state to a more stable 'preview feature'. This involved updating documentation, removing unstable.api.versions.enable flags from tests, and refining related admin client APIs.
Transactional Producer Enhancements: I've introduced robust support for two-phase commit (2PC) in transactional producers. This allows external transaction managers to coordinate the finalization of transactions, ensuring greater data consistency and flexibility in distributed systems.
Producer Interceptor Improvements: Producer interceptors now receive record headers in their onAcknowledgement callbacks. This provides more context for custom interceptor logic, allowing for richer data processing and monitoring capabilities.
KRaft Versioning and Upgrade: I've added the foundational mechanisms for updating and tracking KRaft protocol versions. This includes handling voter set updates during version transitions, ensuring a smoother and more controlled evolution of the KRaft cluster.
Connect Plugin Versioning and Metrics: The Connect framework now tracks and exposes detailed version information and metrics for connectors, tasks, and their associated plugins (converters, transforms, predicates). This provides better visibility into the operational state and composition of Connect deployments.
API Refinements: I've standardized the API request and response parsing across various client and server components by transitioning from ByteBuffer to Readable. This improves the flexibility and consistency of data handling within the Kafka ecosystem.
Consumer Group Protocol (KIP-848) Updates: I've integrated topic IDs into OffsetCommitRequest and OffsetCommitResponse as part of the ongoing work for the new consumer group protocol (KIP-848). This is a step towards more efficient and robust consumer group management.

Using Gemini Code Assist

The full guide for Gemini Code Assist can be found on our documentation page, here are some quick tips.

Invoking Gemini

You can request assistance from Gemini at any point in your pull request via creating an issue comment (i.e. comment on the pull request page) using either /gemini <command> or @gemini-code-assist <command>. Below is a summary of the supported commands.

Feature	Command	Description
Code Review	`/gemini review`	Performs a code review for the current pull request in its current state.
Pull Request Summary	`/gemini summary`	Provides a summary of the current pull request in its current state.
Comment	@gemini-code-assist	Responds in comments when explicitly tagged, both in issue comments and review comments.
Help	`/gemini help`	Displays a list of available commands.

Customization

To customize Gemini Code Assist for GitHub experience, repository maintainers can create a configuration file and/or provide a custom code review style guide (such as PEP-8 for Python) by creating and adding files to a .gemini/ folder in the base of the repository. Detailed instructions can be found here.

Limitations & Feedback

Gemini Code Assist may make mistakes. Please leave feedback on any instances where its feedback is incorrect or counter productive. You can react with 👍 and 👎 on @gemini-code-assist comments or fill out our survey to provide feedback.

You can also get AI-powered code generation, chat, as well as code reviews directly in the IDE at no cost with the Gemini Code Assist IDE Extension.

Review the Privacy Notices, Generative AI Prohibited Use Policy, Terms of Service, and learn how to configure Gemini Code Assist in GitHub here. Gemini can make mistakes, so double check it and use code with caution. ↩

gemini-code-assist

Code Review

This is a substantial pull request that introduces several significant changes and refactorings across the codebase. The primary goal, to prevent the Connect herder thread from blocking, appears to be correctly addressed in OffsetStorageReaderImpl by moving a potentially long-running operation out of a synchronized block.

Other major changes include the stabilization of Share Group APIs (KIP-932), the addition of topic ID support to the OffsetCommit API (KIP-848), and a new feature to allow upgrading the KRaft version. The codebase also benefits from several cleanups, such as a large-scale refactoring to use a Readable interface for response parsing and centralizing LogManager logic. The changes are well-implemented and include corresponding tests.

I have a couple of minor suggestions to improve code consistency in AsyncKafkaConsumer.java by applying a refactoring pattern uniformly across similar methods.

gemini-code-assist · 2025-08-11T08:10:08Z

clients/src/main/java/org/apache/kafka/clients/consumer/internals/AsyncKafkaConsumer.java

                                                                                           final CompletableFuture<Void> future) {
            final Optional<KafkaException> error;
-            final Optional<Exception> exceptionFromCallback = streamsGroupRebalanceCallbacks().onTasksAssigned(assignment);
+            final Optional<Exception> exceptionFromCallback = streamsRebalanceListener().onTasksAssigned(assignment);


For consistency with invokeOnTasksRevokedCallback, this method could also be refactored to use Optional.map to simplify the logic for handling the optional exception. This would make the code more concise and uniform across similar methods in this class.

For example:

final Optional<Exception> exceptionFromCallback = streamsRebalanceListener().onTasksAssigned(assignment); final Optional<KafkaException> error = exceptionFromCallback.map(e -> ConsumerUtils.maybeWrapAsKafkaException(e, "Task assignment callback throws an error")); return new StreamsOnTasksAssignedCallbackCompletedEvent(future, error);

gemini-code-assist · 2025-08-11T08:10:08Z

clients/src/main/java/org/apache/kafka/clients/consumer/internals/AsyncKafkaConsumer.java

        private StreamsOnAllTasksLostCallbackCompletedEvent invokeOnAllTasksLostCallback(final CompletableFuture<Void> future) {
            final Optional<KafkaException> error;
-            final Optional<Exception> exceptionFromCallback = streamsGroupRebalanceCallbacks().onAllTasksLost();
+            final Optional<Exception> exceptionFromCallback = streamsRebalanceListener().onAllTasksLost();


Similar to invokeOnTasksRevokedCallback, this method can be simplified by using Optional.map to handle the optional exception. This would improve code consistency within the class.

For example:

final Optional<Exception> exceptionFromCallback = streamsRebalanceListener().onAllTasksLost(); final Optional<KafkaException> error = exceptionFromCallback.map(e -> ConsumerUtils.maybeWrapAsKafkaException(e, "All tasks lost callback throws an error")); return new StreamsOnAllTasksLostCallbackCompletedEvent(future, error);

arvi18 · 2025-08-11T08:11:13Z

/refacto-test

refacto-test · 2025-08-11T08:15:59Z

Refacto is reviewing this PR. Please wait for the review comments to be posted.

refacto-test · 2025-08-11T08:20:09Z

Code Review: Thread Safety and KRaft Version Upgrade

👍 Well Done

Atomic State Updates

Using AtomicReference for KRaftVersionUpgrade ensures thread-safe state transitions.

Thread Safety Improvement

Replacing ThreadLocal with thread identification prevents potential memory leaks.

📌 Files Processed

raft/src/main/java/org/apache/kafka/raft/LeaderState.java
raft/src/test/java/org/apache/kafka/raft/LeaderStateTest.java
clients/src/main/java/org/apache/kafka/clients/producer/internals/TransactionManager.java
clients/src/test/java/org/apache/kafka/clients/producer/internals/TransactionManagerTest.java
raft/src/main/java/org/apache/kafka/raft/internals/UpdateVoterHandler.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/TransformationStage.java
metadata/src/main/java/org/apache/kafka/controller/FeatureControlManager.java
metadata/src/test/java/org/apache/kafka/controller/FeatureControlManagerTest.java
docs/ops.html
metadata/src/main/java/org/apache/kafka/controller/KRaftVersionAccessor.java
metadata/src/main/java/org/apache/kafka/controller/RaftClientKRaftVersionAccessor.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/rest/entities/ConnectorStateInfo.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/TaskPluginsMetadata.java
clients/src/main/java/org/apache/kafka/common/requests/CreateDelegationTokenResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeDelegationTokenResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ExpireDelegationTokenResponse.java
clients/src/main/java/org/apache/kafka/common/requests/RenewDelegationTokenResponse.java
clients/src/test/java/org/apache/kafka/common/security/authenticator/SaslAuthenticatorTest.java
clients/src/test/java/org/apache/kafka/common/security/authenticator/SaslServerAuthenticatorTest.java
core/src/main/java/kafka/server/share/DelayedShareFetch.java
raft/src/main/java/org/apache/kafka/raft/FollowerState.java
clients/src/main/java/org/apache/kafka/common/requests/AbstractResponse.java
clients/src/main/java/org/apache/kafka/common/requests/OffsetCommitResponse.java
clients/src/test/java/org/apache/kafka/common/message/MessageTest.java
group-coordinator/src/main/java/org/apache/kafka/coordinator/group/GroupCoordinatorService.java
connect/runtime/src/test/java/org/apache/kafka/connect/storage/OffsetStorageReaderTest.java
raft/src/main/java/org/apache/kafka/raft/internals/KRaftVersionUpgrade.java
core/src/test/scala/unit/kafka/server/KafkaApisTest.scala
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/GroupMetadataManagerTest.java
group-coordinator/src/main/java/org/apache/kafka/coordinator/group/GroupMetadataManager.java
raft/src/main/java/org/apache/kafka/raft/KafkaRaftClient.java
group-coordinator/src/main/java/org/apache/kafka/coordinator/group/Utils.java
core/src/main/scala/kafka/log/LogManager.scala
core/src/main/scala/kafka/server/KafkaApis.scala
clients/src/test/java/org/apache/kafka/clients/producer/KafkaProducerTest.java
core/src/test/java/kafka/server/share/SharePartitionManagerTest.java
core/src/test/scala/unit/kafka/log/LogManagerTest.scala
clients/src/main/java/org/apache/kafka/clients/producer/KafkaProducer.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/ConnectMetricsRegistry.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/WorkerTask.java
clients/src/main/resources/common/message/OffsetCommitRequest.json
clients/src/main/resources/common/message/OffsetCommitResponse.json
clients/src/main/resources/common/message/ShareAcknowledgeRequest.json
clients/src/main/resources/common/message/ShareAcknowledgeResponse.json
clients/src/main/resources/common/message/ShareFetchRequest.json
clients/src/main/resources/common/message/ShareFetchResponse.json
clients/src/main/resources/common/message/ShareGroupDescribeRequest.json
clients/src/main/resources/common/message/ShareGroupDescribeResponse.json
clients/src/main/resources/common/message/ShareGroupHeartbeatRequest.json
clients/src/main/resources/common/message/ShareGroupHeartbeatResponse.json
clients/src/main/resources/common/message/ReadShareGroupStateResponse.json
clients/src/main/resources/common/message/WriteShareGroupStateRequest.json
raft/src/main/java/org/apache/kafka/raft/internals/RequestSendResult.java
clients/src/main/java/org/apache/kafka/common/requests/DeleteShareGroupStateRequest.java
clients/src/main/java/org/apache/kafka/common/requests/DeleteShareGroupStateResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeTransactionsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/InitializeShareGroupStateRequest.java
clients/src/main/java/org/apache/kafka/common/requests/InitializeShareGroupStateResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ListTransactionsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ReadShareGroupStateRequest.java
clients/src/main/java/org/apache/kafka/common/requests/ReadShareGroupStateResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ReadShareGroupStateSummaryRequest.java
clients/src/main/java/org/apache/kafka/common/requests/ReadShareGroupStateSummaryResponse.java
clients/src/main/java/org/apache/kafka/common/requests/WriteShareGroupStateRequest.java
clients/src/main/java/org/apache/kafka/common/requests/WriteShareGroupStateResponse.java
clients/src/test/java/org/apache/kafka/clients/consumer/internals/AsyncKafkaConsumerTest.java
clients/src/test/java/org/apache/kafka/clients/consumer/internals/RequestManagersTest.java
clients/src/test/java/org/apache/kafka/clients/consumer/internals/events/ApplicationEventProcessorTest.java
clients/src/test/java/org/apache/kafka/clients/producer/internals/ProducerInterceptorsTest.java
core/src/test/scala/unit/kafka/server/ShareFetchAcknowledgeRequestTest.scala
core/src/test/scala/unit/kafka/server/ShareGroupHeartbeatRequestTest.scala
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/OffsetMetadataManagerTest.java
metadata/src/main/java/org/apache/kafka/controller/ConfigurationControlManager.java
metadata/src/test/java/org/apache/kafka/controller/ConfigurationControlManagerTest.java
raft/src/test/java/org/apache/kafka/raft/FollowerStateTest.java
clients/src/main/java/org/apache/kafka/common/requests/AlterUserScramCredentialsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ConsumerGroupHeartbeatResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeUserScramCredentialsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/OffsetCommitRequest.java
clients/src/main/java/org/apache/kafka/common/requests/ShareGroupHeartbeatResponse.java
clients/src/test/java/org/apache/kafka/common/requests/RequestResponseTest.java
clients/src/main/java/org/apache/kafka/clients/consumer/KafkaShareConsumer.java
clients/src/main/java/org/apache/kafka/clients/consumer/internals/AsyncKafkaConsumer.java
clients/src/main/java/org/apache/kafka/clients/producer/ProducerConfig.java
clients/src/main/java/org/apache/kafka/clients/producer/ProducerInterceptor.java
clients/src/main/java/org/apache/kafka/clients/producer/internals/ProducerInterceptors.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/AbstractHerder.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/AbstractStatus.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/ConnectorConfig.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/Worker.java
group-coordinator/src/main/java/org/apache/kafka/coordinator/group/modern/share/ShareGroupConfig.java
metadata/src/main/java/org/apache/kafka/metadata/bootstrap/BootstrapMetadata.java
raft/src/main/java/org/apache/kafka/raft/VoterSet.java
core/src/test/java/kafka/server/share/DelayedShareFetchTest.java
raft/src/test/java/org/apache/kafka/raft/KafkaRaftClientReconfigTest.java
clients/src/test/java/org/apache/kafka/clients/consumer/internals/StreamsGroupHeartbeatRequestManagerTest.java
clients/src/test/java/org/apache/kafka/clients/producer/ProducerConfigTest.java
clients/src/test/java/org/apache/kafka/clients/producer/internals/SenderTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/RestartPlanTest.java
core/src/test/scala/integration/kafka/server/KRaftClusterTest.scala
core/src/test/scala/unit/kafka/server/GroupCoordinatorBaseRequestTest.scala
core/src/test/scala/unit/kafka/server/OffsetCommitRequestTest.scala
core/src/test/scala/unit/kafka/server/RequestQuotaTest.scala
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/GroupCoordinatorRecordHelpersTest.java
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/GroupCoordinatorServiceTest.java
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/modern/share/ShareGroupConfigTest.java
raft/src/test/java/org/apache/kafka/raft/VoterSetTest.java
release/git.py
group-coordinator/src/main/resources/common/message/ConsumerGroupMetadataValue.json
checkstyle/import-control-storage.xml
checkstyle/suppressions.xml
clients/src/main/java/org/apache/kafka/common/protocol/Readable.java
clients/src/main/java/org/apache/kafka/common/requests/AddOffsetsToTxnResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AddPartitionsToTxnResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AddRaftVoterResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AllocateProducerIdsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AlterClientQuotasResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AlterConfigsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AlterPartitionReassignmentsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AlterPartitionResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AlterReplicaLogDirsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AlterShareGroupOffsetsRequest.java
clients/src/main/java/org/apache/kafka/common/requests/AlterShareGroupOffsetsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ApiVersionsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/AssignReplicasToDirsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/BeginQuorumEpochResponse.java
clients/src/main/java/org/apache/kafka/common/requests/BrokerHeartbeatResponse.java
clients/src/main/java/org/apache/kafka/common/requests/BrokerRegistrationResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ConsumerGroupDescribeResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ControllerRegistrationResponse.java
clients/src/main/java/org/apache/kafka/common/requests/CreateAclsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/CreatePartitionsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/CreateTopicsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DeleteAclsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DeleteGroupsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DeleteRecordsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DeleteShareGroupOffsetsRequest.java
clients/src/main/java/org/apache/kafka/common/requests/DeleteShareGroupOffsetsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DeleteTopicsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeAclsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeClientQuotasResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeClusterResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeConfigsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeGroupsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeLogDirsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeProducersResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeQuorumResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeShareGroupOffsetsRequest.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeShareGroupOffsetsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/DescribeTopicPartitionsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ElectLeadersResponse.java
clients/src/main/java/org/apache/kafka/common/requests/EndQuorumEpochResponse.java
clients/src/main/java/org/apache/kafka/common/requests/EndTxnResponse.java
clients/src/main/java/org/apache/kafka/common/requests/EnvelopeResponse.java
clients/src/main/java/org/apache/kafka/common/requests/FetchResponse.java
clients/src/main/java/org/apache/kafka/common/requests/FetchSnapshotResponse.java
clients/src/main/java/org/apache/kafka/common/requests/FindCoordinatorResponse.java
clients/src/main/java/org/apache/kafka/common/requests/GetTelemetrySubscriptionsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/HeartbeatResponse.java
clients/src/main/java/org/apache/kafka/common/requests/IncrementalAlterConfigsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/InitProducerIdResponse.java
clients/src/main/java/org/apache/kafka/common/requests/JoinGroupResponse.java
clients/src/main/java/org/apache/kafka/common/requests/LeaveGroupResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ListClientMetricsResourcesResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ListGroupsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ListOffsetsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ListPartitionReassignmentsResponse.java
clients/src/main/java/org/apache/kafka/common/requests/MetadataResponse.java
clients/src/main/java/org/apache/kafka/common/requests/OffsetDeleteResponse.java
clients/src/main/java/org/apache/kafka/common/requests/OffsetFetchResponse.java
clients/src/main/java/org/apache/kafka/common/requests/OffsetsForLeaderEpochResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ProduceResponse.java
clients/src/main/java/org/apache/kafka/common/requests/PushTelemetryResponse.java
clients/src/main/java/org/apache/kafka/common/requests/RemoveRaftVoterResponse.java
clients/src/main/java/org/apache/kafka/common/requests/SaslAuthenticateResponse.java
clients/src/main/java/org/apache/kafka/common/requests/SaslHandshakeResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ShareAcknowledgeRequest.java
clients/src/main/java/org/apache/kafka/common/requests/ShareAcknowledgeResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ShareFetchRequest.java
clients/src/main/java/org/apache/kafka/common/requests/ShareFetchResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ShareGroupDescribeRequest.java
clients/src/main/java/org/apache/kafka/common/requests/ShareGroupDescribeResponse.java
clients/src/main/java/org/apache/kafka/common/requests/ShareGroupHeartbeatRequest.java
clients/src/main/java/org/apache/kafka/common/requests/StreamsGroupDescribeResponse.java
clients/src/main/java/org/apache/kafka/common/requests/StreamsGroupHeartbeatResponse.java
clients/src/main/java/org/apache/kafka/common/requests/SyncGroupResponse.java
clients/src/main/java/org/apache/kafka/common/requests/TxnOffsetCommitResponse.java
clients/src/main/java/org/apache/kafka/common/requests/UnregisterBrokerResponse.java
clients/src/main/java/org/apache/kafka/common/requests/UpdateFeaturesResponse.java
clients/src/main/java/org/apache/kafka/common/requests/UpdateRaftVoterResponse.java
clients/src/main/java/org/apache/kafka/common/requests/VoteResponse.java
clients/src/main/java/org/apache/kafka/common/requests/WriteTxnMarkersResponse.java
clients/src/test/java/org/apache/kafka/common/requests/DeleteAclsResponseTest.java
clients/src/test/java/org/apache/kafka/common/requests/DescribeAclsResponseTest.java
clients/src/test/java/org/apache/kafka/common/requests/LeaveGroupResponseTest.java
clients/src/test/java/org/apache/kafka/common/requests/OffsetCommitRequestTest.java
clients/src/test/java/org/apache/kafka/common/requests/OffsetCommitResponseTest.java
core/src/test/scala/unit/kafka/utils/SchedulerTest.scala
group-coordinator/src/main/java/org/apache/kafka/coordinator/group/GroupCoordinatorRecordHelpers.java
group-coordinator/src/main/java/org/apache/kafka/coordinator/group/streams/StreamsCoordinatorRecordHelpers.java
server-common/src/main/java/org/apache/kafka/server/common/KRaftVersion.java
server-common/src/test/java/org/apache/kafka/server/common/KRaftVersionTest.java
build.gradle
clients/src/main/java/org/apache/kafka/clients/consumer/internals/StreamsGroupHeartbeatRequestManager.java
clients/src/main/java/org/apache/kafka/clients/consumer/internals/StreamsMembershipManager.java
clients/src/main/java/org/apache/kafka/clients/consumer/internals/StreamsRebalanceData.java
clients/src/main/java/org/apache/kafka/clients/producer/Producer.java
clients/src/main/java/org/apache/kafka/clients/producer/internals/Sender.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/AbstractWorkerSourceTask.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/ConnectorStatus.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/TransformationChain.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/WorkerConnector.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/WorkerSinkTask.java
connect/runtime/src/main/java/org/apache/kafka/connect/storage/KafkaStatusBackingStore.java
connect/runtime/src/main/java/org/apache/kafka/connect/storage/OffsetStorageReaderImpl.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/TransformationStageTest.java
core/src/main/java/kafka/server/share/SharePartitionManager.java
group-coordinator/src/main/java/org/apache/kafka/coordinator/group/OffsetMetadataManager.java
raft/src/main/java/org/apache/kafka/raft/RaftClient.java
clients/src/main/resources/common/message/AlterShareGroupOffsetsRequest.json
clients/src/main/resources/common/message/AlterShareGroupOffsetsResponse.json
clients/src/main/resources/common/message/DeleteShareGroupOffsetsRequest.json
clients/src/main/resources/common/message/DescribeShareGroupOffsetsRequest.json
clients/src/main/resources/common/message/DeleteShareGroupStateRequest.json
clients/src/main/resources/common/message/InitializeShareGroupStateRequest.json
clients/src/main/resources/common/message/ReadShareGroupStateRequest.json
clients/src/main/resources/common/message/ReadShareGroupStateSummaryRequest.json
clients/src/main/resources/common/message/WriteShareGroupStateResponse.json
clients/clients-integration-tests/src/test/java/org/apache/kafka/clients/consumer/ShareConsumerTest.java
clients/src/main/java/org/apache/kafka/clients/admin/internals/AlterConsumerGroupOffsetsHandler.java
clients/src/main/java/org/apache/kafka/clients/admin/internals/DeleteShareGroupOffsetsHandler.java
clients/src/main/java/org/apache/kafka/clients/admin/internals/DescribeShareGroupsHandler.java
clients/src/main/java/org/apache/kafka/clients/admin/internals/ListShareGroupOffsetsHandler.java
clients/src/test/java/org/apache/kafka/clients/MetadataTest.java
clients/src/test/java/org/apache/kafka/clients/consumer/internals/StreamsRebalanceDataTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/ErrorHandlingTaskTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/WorkerTaskTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/WorkerTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/standalone/StandaloneHerderTest.java
core/src/test/scala/integration/kafka/api/AuthorizerIntegrationTest.scala
core/src/test/scala/integration/kafka/api/IntegrationTestHarness.scala
core/src/test/scala/unit/kafka/raft/RaftManagerTest.scala
core/src/test/scala/unit/kafka/server/ConsumerProtocolMigrationTest.scala
core/src/test/scala/unit/kafka/server/OffsetFetchRequestTest.scala
core/src/test/scala/unit/kafka/server/ShareGroupDescribeRequestTest.scala
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/streams/StreamsCoordinatorRecordHelpersTest.java
metadata/src/main/java/org/apache/kafka/controller/QuorumController.java
metadata/src/test/java/org/apache/kafka/metadata/bootstrap/BootstrapMetadataTest.java
metadata/src/test/java/org/apache/kafka/metalog/LocalLogManager.java
raft/src/main/java/org/apache/kafka/raft/QuorumState.java
server-common/src/main/java/org/apache/kafka/server/share/persister/PersisterStateManager.java
clients/src/test/java/org/apache/kafka/common/utils/annotation/ApiKeyVersionsProvider.java
.github/scripts/junit.py
release/release.py
group-coordinator/src/main/resources/common/message/ConsumerGroupPartitionMetadataKey.json
group-coordinator/src/main/resources/common/message/ConsumerGroupPartitionMetadataValue.json
group-coordinator/src/main/resources/common/message/ShareGroupMetadataValue.json
group-coordinator/src/main/resources/common/message/StreamsGroupMetadataValue.json
clients/src/main/java/org/apache/kafka/common/header/internals/RecordHeaders.java
clients/src/main/java/org/apache/kafka/common/protocol/ByteBufferAccessor.java
clients/src/test/java/org/apache/kafka/common/requests/OffsetFetchResponseTest.java
clients/src/test/java/org/apache/kafka/common/requests/RequestContextTest.java
clients/src/test/java/org/apache/kafka/common/requests/TxnOffsetCommitResponseTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/WorkerTestUtils.java
core/src/main/java/kafka/server/share/ShareFetchUtils.java
core/src/test/scala/integration/kafka/server/IntegrationTestUtils.scala
core/src/main/scala/kafka/raft/RaftManager.scala
core/src/main/scala/kafka/server/BrokerServer.scala
core/src/main/scala/kafka/server/KafkaConfig.scala
clients/src/main/java/org/apache/kafka/clients/consumer/internals/CommitRequestManager.java
clients/src/main/java/org/apache/kafka/clients/consumer/internals/ConsumerCoordinator.java
clients/src/main/java/org/apache/kafka/clients/consumer/internals/ShareConsumerDelegateCreator.java
clients/src/main/java/org/apache/kafka/clients/producer/MockProducer.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/ExactlyOnceWorkerSourceTask.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/TaskStatus.java
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/WorkerSourceTask.java
core/src/main/scala/kafka/server/metadata/BrokerMetadataPublisher.scala
group-coordinator/src/main/java/org/apache/kafka/coordinator/group/GroupCoordinatorConfig.java
group-coordinator/src/main/java/org/apache/kafka/coordinator/group/modern/consumer/ConsumerGroup.java
clients/src/test/java/org/apache/kafka/clients/consumer/internals/ConsumerCoordinatorTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/AbstractWorkerSourceTaskTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/ExactlyOnceWorkerSourceTaskTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/WorkerSinkTaskTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/WorkerSinkTaskThreadedTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/WorkerSourceTaskTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/distributed/DistributedHerderTest.java
connect/runtime/src/test/java/org/apache/kafka/connect/runtime/rest/resources/ConnectorsResourceTest.java
core/src/test/java/kafka/server/share/ShareFetchUtilsTest.java
core/src/test/scala/unit/kafka/server/AlterPartitionManagerTest.scala
core/src/test/scala/unit/kafka/server/BaseRequestTest.scala
core/src/test/scala/unit/kafka/server/DeleteGroupsRequestTest.scala
core/src/test/scala/unit/kafka/server/EdgeCaseRequestTest.scala
core/src/test/scala/unit/kafka/server/KafkaConfigTest.scala
core/src/test/scala/unit/kafka/server/OffsetDeleteRequestTest.scala
core/src/test/scala/unit/kafka/server/ServerShutdownTest.scala
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/GroupConfigTest.java
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/modern/consumer/ConsumerGroupBuilder.java
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/modern/share/ShareGroupBuilder.java
group-coordinator/src/test/java/org/apache/kafka/coordinator/group/streams/StreamsGroupBuilder.java
metadata/src/test/java/org/apache/kafka/image/publisher/SnapshotEmitterTest.java

📝 Additional Comments

raft/src/main/java/org/apache/kafka/raft/LeaderState.java (2)
Inefficient Voter Lookup
Multiple key comparisons in voter lookup operations create inefficient access patterns. Using direct reference to localVoterNode.voterKey() improves lookup efficiency in hot paths.
boolean hasAcknowledgedLeader = voterNode.isVoter(localVoterNode.voterKey());
if (replicaKey.id() == localVoterNode.voterKey().id()) {
.filter(state -> !state.matchesKey(localVoterNode.voterKey()))
Standards:

ISO-IEC-25010-Performance-Time-Behaviour

Algorithm-Opt-Reference-Efficiency

Netflix-Hot-Path-Optimization
Exception Handling Improvement
Exception message exposes internal version details to clients. Could provide unnecessary information to attackers. Violates principle of minimal information disclosure.
                throw new InvalidUpdateVersionException(
                    String.format(
                        "Invalid concurrent upgrade of %s",
                        KRaftVersion.FEATURE_NAME
                    )
                );
Standards:

CWE-209

OWASP-A01
connect/runtime/src/main/java/org/apache/kafka/connect/runtime/TransformationStage.java (1)
Redundant Object Creation
Calling transformationPlugin.get() for each transformationStageInfo() invocation creates unnecessary objects. This can cause GC pressure when called frequently in hot paths.
public StageInfo transformationStageInfo() {
    Transformation<R> transformInstance = transformationPlugin.get();
    AliasedPluginInfo transformInfo = new AliasedPluginInfo(
        transformAlias,
        transformInstance.getClass().getName(),
        transformVersion
    );
    AliasedPluginInfo predicateInfo = predicatePlugin != null ? new AliasedPluginInfo(
        predicateAlias,
        predicatePlugin.get().getClass().getName(), predicateVersion
    ) : null;
    return new StageInfo(transformInfo, predicateInfo);
}
Standards:

ISO-IEC-25010-Performance-Resource-Utilization

Netflix-Object-Creation-Optimization

Google-Performance-Best-Practices

refacto-test · 2025-08-11T08:20:10Z

clients/src/main/java/org/apache/kafka/clients/producer/internals/TransactionManager.java

        this.pendingPartitionsInTransaction = new HashSet<>();
        this.partitionsInTransaction = new HashSet<>();
-        this.shouldPoisonStateOnInvalidTransition = ThreadLocal.withInitial(() -> false);
        this.pendingRequests = new PriorityQueue<>(10, Comparator.comparingInt(o -> o.priority().priority));


ThreadLocal Resource Leak

ThreadLocal creates memory leaks in thread pools where threads are reused. The current implementation doesn't properly clean up ThreadLocal values, potentially causing memory growth under load and resource exhaustion in production environments.

Suggested change

this.pendingRequests = new PriorityQueue<>(10, Comparator.comparingInt(o -> o.priority().priority));

protected boolean shouldPoisonStateOnInvalidTransition() {

return Thread.currentThread() instanceof Sender.SenderThread;

}

Standards

CWE-567

OWASP-A05

ISO-IEC-25010-Performance-Resource-Utilization

refacto-test · 2025-08-11T08:20:11Z

clients/src/main/java/org/apache/kafka/clients/producer/internals/TransactionManager.java

+    protected boolean shouldPoisonStateOnInvalidTransition() {
+        return Thread.currentThread() instanceof Sender.SenderThread;
    }


Thread Safety Issue

Thread identification using instanceof is fragile and can lead to false negatives. If thread implementation changes, the condition fails silently causing reliability issues.

Suggested change

protected boolean shouldPoisonStateOnInvalidTransition() {

return Thread.currentThread() instanceof Sender.SenderThread;

}

protected boolean shouldPoisonStateOnInvalidTransition() {

Thread currentThread = Thread.currentThread();

return currentThread instanceof Sender.SenderThread ||

(currentThread.getName() != null && currentThread.getName().contains("kafka-sender"));

}

Standards

ISO-IEC-25010-Reliability-Fault-Tolerance

ISO-IEC-25010-Functional-Correctness-Completeness

SRE-Error-Handling

refacto-test · 2025-08-11T08:20:13Z

raft/src/main/java/org/apache/kafka/raft/LeaderState.java

+        if (localVoterNode.voterKey().directoryId().isEmpty()) {
+            throw new IllegalArgumentException(
+                String.format("Unknown local replica directory id: %s", localVoterNode)
+            );
+        } else if (!voterSetAtEpochStart.isVoter(localVoterNode.voterKey())) {
+            throw new IllegalArgumentException(
+                String.format(


Missing Directory Validation

Directory ID validation only checks if empty but not for malformed values. Could allow invalid directory IDs to pass validation. Potential for inconsistent voter state.

Suggested change

if (localVoterNode.voterKey().directoryId().isEmpty()) {

throw new IllegalArgumentException(

String.format("Unknown local replica directory id: %s", localVoterNode)

);

} else if (!voterSetAtEpochStart.isVoter(localVoterNode.voterKey())) {

throw new IllegalArgumentException(

String.format(

if (localVoterNode.voterKey().directoryId().isEmpty()) {

throw new IllegalArgumentException(

String.format(

"Unknown local replica directory id: %s", localVoterNode

)

);

} else if (!UUID.nameUUIDFromBytes(localVoterNode.voterKey().directoryId().get()).equals(localVoterNode.voterKey().directoryId().get())) {

throw new IllegalArgumentException(

String.format(

"Malformed local replica directory id: %s", localVoterNode.voterKey().directoryId().get()

)

);

} else if (!voterSetAtEpochStart.isVoter(localVoterNode.voterKey())) {

Standards

CWE-20

OWASP-A03

refacto-test · 2025-08-11T08:20:15Z

raft/src/main/java/org/apache/kafka/raft/LeaderState.java

+    private final AtomicReference<KRaftVersionUpgrade> kraftVersionUpgradeState = new AtomicReference<>(
+        KRaftVersionUpgrade.empty()
+    );


Potential Race Condition

AtomicReference is initialized but lacks proper memory visibility guarantees across threads. Without volatile field or synchronized access patterns, other threads might see stale values.

Suggested change

private final AtomicReference<KRaftVersionUpgrade> kraftVersionUpgradeState = new AtomicReference<>(

KRaftVersionUpgrade.empty()

);

private final volatile AtomicReference<KRaftVersionUpgrade> kraftVersionUpgradeState = new AtomicReference<>(

KRaftVersionUpgrade.empty()

);

Standards

ISO-IEC-25010-Reliability-Fault-Tolerance

ISO-IEC-25010-Functional-Correctness-Appropriateness

SRE-Thread-Safety

refacto-test · 2025-08-11T08:20:17Z

connect/runtime/src/main/java/org/apache/kafka/connect/runtime/TransformationStage.java

+        AliasedPluginInfo predicateInfo = predicatePlugin != null ? new AliasedPluginInfo(
+            predicateAlias,
+            predicatePlugin.get().getClass().getName(), predicateVersion
+        ) : null;


Missing Null Check

Potential NullPointerException if predicatePlugin is non-null but predicateAlias is null. The AliasedPluginInfo constructor requires non-null alias but no validation occurs before invocation.

Suggested change

AliasedPluginInfo predicateInfo = predicatePlugin != null ? new AliasedPluginInfo(

predicateAlias,

predicatePlugin.get().getClass().getName(), predicateVersion

) : null;

AliasedPluginInfo predicateInfo = (predicatePlugin != null && predicateAlias != null) ? new AliasedPluginInfo(

predicateAlias,

predicatePlugin.get().getClass().getName(), predicateVersion

) : null;

Standards

ISO-IEC-25010-Reliability-Fault-Tolerance

ISO-IEC-25010-Functional-Correctness-Appropriateness

DbC-Precondition-Validation

refacto-test · 2025-08-11T08:20:19Z

raft/src/main/java/org/apache/kafka/raft/internals/UpdateVoterHandler.java

+            var successful = leaderState.compareAndSetVolatileVoters(
+                inMemoryVoters.get(),
+                new KRaftVersionUpgrade.Voters(newVoters)
+            );


Unchecked Exception Propagation

Unchecked exceptions from compareAndSetVolatileVoters aren't handled. If operation fails with runtime exception, it could leave the system in inconsistent state and propagate failure.

Suggested change

var successful = leaderState.compareAndSetVolatileVoters(

inMemoryVoters.get(),

new KRaftVersionUpgrade.Voters(newVoters)

);

boolean successful;

try {

successful = leaderState.compareAndSetVolatileVoters(

inMemoryVoters.get(),

new KRaftVersionUpgrade.Voters(newVoters)

);

} catch (RuntimeException e) {

log.error("Failed to update in-memory voters", e);

return CompletableFuture.completedFuture(

RaftUtil.updateVoterResponse(

Errors.UNKNOWN_SERVER_ERROR,

requestListenerName,

new LeaderAndEpoch(

localId,

leaderState.epoch()

),

leaderState.leaderEndpoints()

)

);

}

Standards

ISO-IEC-25010-Reliability-Fault-Tolerance

ISO-IEC-25010-Functional-Correctness-Appropriateness

SRE-Error-Handling

refacto-test · 2025-08-11T08:20:20Z

raft/src/main/java/org/apache/kafka/raft/internals/UpdateVoterHandler.java

-                )
-            );
-        }
+        final Optional<KRaftVersionUpgrade.Voters> inMemoryVoters;


Optimized Version Upgrade

Current implementation rejects updates when kraft.version < 1, causing unnecessary request failures. Supporting in-memory voter updates for kraft.version 0 improves system availability during version transitions.

Suggested change

final Optional<KRaftVersionUpgrade.Voters> inMemoryVoters;

final Optional<KRaftVersionUpgrade.Voters> inMemoryVoters;

final Optional<VoterSet> voters;

if (kraftVersion.isReconfigSupported()) {

inMemoryVoters = Optional.empty();

// Check that there are no uncommitted VotersRecord

Optional<LogHistory.Entry<VoterSet>> votersEntry = partitionState.lastVoterSetEntry();

if (votersEntry.isEmpty() || votersEntry.get().offset() >= highWatermark.get()) {

voters = Optional.empty();

} else {

voters = votersEntry.map(LogHistory.Entry::value);

}

} else {

inMemoryVoters = leaderState.volatileVoters();

if (inMemoryVoters.isEmpty()) {

/* This can happen if the remote voter sends an update voter request before the

* updated kraft version has been written to the log

*/

return CompletableFuture.completedFuture(

RaftUtil.updateVoterResponse(

Errors.REQUEST_TIMED_OUT,

requestListenerName,

new LeaderAndEpoch(

localId,

leaderState.epoch()

),

leaderState.leaderEndpoints()

)

);

}

voters = inMemoryVoters.map(KRaftVersionUpgrade.Voters::voters);

}

Standards

ISO-IEC-25010-Performance-Time-Behaviour

Netflix-Availability-Optimization

Google-Performance-Best-Practices

apalan60 and others added 30 commits April 21, 2025 15:35

KAFKA-14487: Move LogManager static methods/fields to storage module (a…

7710d1c

…pache#19302) Move the static fields/methods Reviewers: Luke Chen <[email protected]>

KAFKA-19180 Fix the hanging testPendingTaskSize (apache#19526)

a04c2fe

The check for `scheduler.pendingTaskSize()` may fail if the thread pool is too slow to consume the runnable objects Reviewers: Ken Huang <[email protected]>, PoAn Yang <[email protected]>, Chia-Ping Tsai <[email protected]>

MINOR: ignore null judgement in LogCleaner (apache#19524)

18584b1

about https://github.com/apache/kafka/pull/19387/files#r2052025917 Reviewers: PoAn Yang <[email protected]>, Chia-Ping Tsai <[email protected]>, TengYao Chi <[email protected]>

MINOR: Improve javadoc for share consumer (apache#19533)

e78e106

Small improvements to share consumer javadoc. Reviewers: Apoorv Mittal <[email protected]>

KAFKA-19124: Follow up on code improvements (apache#19453)

efd7852

Improves a variable name and handling of an Optional. Reviewers: Bill Bejeck <[email protected]>, Chia-Ping Tsai <[email protected]>, PoAn Yang <[email protected]>

KAFKA-18988: Connect Multiversion Support (Updates to status and metr…

d6133f6

…ics) (apache#17988) Reviewers: Greg Harris <[email protected]>

aliehsaeedii and others added 7 commits April 24, 2025 21:23

KAFKA-17871: fixup tests

5d8f00c

gemini-code-assist bot reviewed Aug 11, 2025

View reviewed changes

refacto-test bot reviewed Aug 11, 2025

View reviewed changes

arvi18 closed this Aug 11, 2025

-            var successful = leaderState.compareAndSetVolatileVoters(
-                inMemoryVoters.get(),
-                new KRaftVersionUpgrade.Voters(newVoters)
-            );
+            boolean successful;
+            try {
+                successful = leaderState.compareAndSetVolatileVoters(
+                    inMemoryVoters.get(),
+                    new KRaftVersionUpgrade.Voters(newVoters)
+                );
+            } catch (RuntimeException e) {
+                log.error("Failed to update in-memory voters", e);
+                return CompletableFuture.completedFuture(
+                    RaftUtil.updateVoterResponse(
+                        Errors.UNKNOWN_SERVER_ERROR,
+                        requestListenerName,
+                        new LeaderAndEpoch(
+                            localId,
+                            leaderState.epoch()
+                        ),
+                        leaderState.leaderEndpoints()
+                    )
+                );
+            }

-        final Optional<KRaftVersionUpgrade.Voters> inMemoryVoters;
+final Optional<KRaftVersionUpgrade.Voters> inMemoryVoters;
+final Optional<VoterSet> voters;
+if (kraftVersion.isReconfigSupported()) {
+    inMemoryVoters = Optional.empty();
+    // Check that there are no uncommitted VotersRecord
+    Optional<LogHistory.Entry<VoterSet>> votersEntry = partitionState.lastVoterSetEntry();
+    if (votersEntry.isEmpty() || votersEntry.get().offset() >= highWatermark.get()) {
+        voters = Optional.empty();
+    } else {
+        voters = votersEntry.map(LogHistory.Entry::value);
+    }
+} else {
+    inMemoryVoters = leaderState.volatileVoters();
+    if (inMemoryVoters.isEmpty()) {
+        /* This can happen if the remote voter sends an update voter request before the
+         * updated kraft version has been written to the log
+         */
+        return CompletableFuture.completedFuture(
+            RaftUtil.updateVoterResponse(
+                Errors.REQUEST_TIMED_OUT,
+                requestListenerName,
+                new LeaderAndEpoch(
+                    localId,
+                    leaderState.epoch()
+                ),
+                leaderState.leaderEndpoints()
+            )
+        );
+    }
+    voters = inMemoryVoters.map(KRaftVersionUpgrade.Voters::voters);
+}

KAFKA-17871: avoid blocking the herder thread when producer flushing hangs #21

KAFKA-17871: avoid blocking the herder thread when producer flushing hangs #21

Conversation

arvi18 commented Aug 11, 2025

Uh oh!

coderabbitai bot commented Aug 11, 2025

Review skipped

Chat

Support

CodeRabbit Commands (Invoked using PR comments)

Other keywords and placeholders

CodeRabbit Configuration File (.coderabbit.yaml)

Documentation and Community

Uh oh!

refacto-test bot commented Aug 11, 2025

🤖 Refacto.AI: PR Summary & Reviewer Guide

🎯 1. The Goal (Why was this PR raised?)

🗺️ 2. The Changes (What was implemented?)

🤔 3. Key Areas for Human Review

Area of Concern: KRaft Version Upgrade Handling

Area of Concern: Transaction Management Thread Safety

Area of Concern: UpdateVoterHandler Logic

Area of Concern: Feature Control for KRaft Version

Uh oh!

gemini-code-assist bot left a comment

Choose a reason for hiding this comment

Summary of Changes

Highlights

Footnotes

Uh oh!

gemini-code-assist bot left a comment

Choose a reason for hiding this comment

Code Review

Uh oh!

gemini-code-assist bot Aug 11, 2025

Choose a reason for hiding this comment

Uh oh!

gemini-code-assist bot Aug 11, 2025

Choose a reason for hiding this comment

Uh oh!

arvi18 commented Aug 11, 2025

Uh oh!

refacto-test bot commented Aug 11, 2025

Uh oh!

refacto-test bot commented Aug 11, 2025

Code Review: Thread Safety and KRaft Version Upgrade

Uh oh!

refacto-test bot Aug 11, 2025

Choose a reason for hiding this comment

ThreadLocal Resource Leak

Uh oh!

refacto-test bot Aug 11, 2025

Choose a reason for hiding this comment

Thread Safety Issue

Uh oh!

refacto-test bot Aug 11, 2025

Choose a reason for hiding this comment

Missing Directory Validation

Uh oh!

refacto-test bot Aug 11, 2025

Choose a reason for hiding this comment

Potential Race Condition

Uh oh!

refacto-test bot Aug 11, 2025

Choose a reason for hiding this comment

Missing Null Check

Uh oh!

refacto-test bot Aug 11, 2025

Choose a reason for hiding this comment

Unchecked Exception Propagation

Uh oh!

refacto-test bot Aug 11, 2025

Choose a reason for hiding this comment

Optimized Version Upgrade

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

CodeRabbit Configuration File (`.coderabbit.yaml`)