Missing ETP Support in mca_adapter Under Expert Parallelism

Could we consider adding support for Megatron-MoE's ETP (Expert-Tensor Parallel) sharding?
Right now, when initializing expert-parallel in MoE, it inherits the non-MoE tensor-parallel group by default.