benchmark/nixlbench: NB_ARG_x introduced

anton-nayshtut · anton-nayshtut · commit bb87ce762d79 · 2025-11-04T10:44:34.000+02:00
gflags-specific parameter definitions have been replaced with the
NB_ARG_x macros.

This will help minimize changes when we move to a different parameter
parsing infrastructure in upcoming patches.

This patch doesn't change any logic.

Signed-off-by: Anton Nayshtut &lt;anayshtut@nvidia.com&gt;
diff --git a/benchmark/nixlbench/src/utils/utils.cpp b/benchmark/nixlbench/src/utils/utils.cpp
@@ -35,101 +35,111 @@
 #include "runtime/etcd/etcd_rt.h"
 #include "utils/utils.h"
 
+// Define gflags params
+#define NB_ARG_STRING(param_name, def_val, help_text) \
+    DEFINE_string(param_name, def_val, help_text);
+#define NB_ARG_BOOL(param_name, def_val, help_text) \
+    DEFINE_bool(param_name, def_val, help_text);
+#define NB_ARG_UINT64(param_name, def_val, help_text) \
+    DEFINE_uint64(param_name, def_val, help_text);
+#define NB_ARG_INT32(param_name, def_val, help_text) \
+    DEFINE_int32(param_name, def_val, help_text);
+
 /**********
  * xferBench Config
  **********/
-DEFINE_string(benchmark_group, "default",
-              "Name of benchmark group. Use different names to run multiple benchmarks in parallel "
-              "(Default: default)");
-DEFINE_string(runtime_type, XFERBENCH_RT_ETCD, "Runtime type to use for communication [ETCD]");
-DEFINE_string(worker_type, XFERBENCH_WORKER_NIXL, "Type of worker [nixl, nvshmem]");
-DEFINE_string(backend, XFERBENCH_BACKEND_UCX,
-              "Name of NIXL backend [UCX, UCX_MO, GDS, GDS_MT, POSIX, GPUNETIO, Mooncake, HF3FS, OBJ, GUSLI]"
-              " (only used with nixl worker)");
-DEFINE_string(initiator_seg_type, XFERBENCH_SEG_TYPE_DRAM, "Type of memory segment for initiator"
-              " [DRAM, VRAM]. Note: Storage backends always use DRAM locally.");
-DEFINE_string(target_seg_type, XFERBENCH_SEG_TYPE_DRAM, "Type of memory segment for target"
-              " [DRAM, VRAM]. Note: Storage backends determine remote type automatically.");
-DEFINE_string(scheme, XFERBENCH_SCHEME_PAIRWISE, "Scheme: pairwise, maytoone, onetomany, tp");
-DEFINE_string(mode, XFERBENCH_MODE_SG, "MODE: SG (Single GPU per proc), MG (Multi GPU per proc) [default: SG]");
-DEFINE_string(op_type, XFERBENCH_OP_WRITE, "Op type: READ, WRITE");
-DEFINE_bool(check_consistency, false, "Enable Consistency Check");
-DEFINE_uint64(total_buffer_size, 8LL * 1024 * (1 << 20), "Total buffer"
-              " size across device for each process (Default: 80 GiB)");
-DEFINE_uint64(start_block_size, 4 * (1 << 10), "Max size of block (Default: 4 KiB)");
-DEFINE_uint64(max_block_size, 64 * (1 << 20), "Max size of block (Default: 64 MiB)");
-DEFINE_uint64(start_batch_size, 1, "Starting size of batch (Default: 1)");
-DEFINE_uint64(max_batch_size, 1, "Max size of batch (starts from 1)");
-DEFINE_int32(num_iter, 1000, "Max iterations");
-DEFINE_int32(large_blk_iter_ftr, 16, "factor to reduce test iteration when testing large block size(>1MB)");
-DEFINE_int32(warmup_iter, 100, "Number of warmup iterations before timing");
-DEFINE_int32 (num_threads, 1, "Number of threads used by benchmark."
-              " Num_iter must be greater or equal than num_threads and equally divisible by num_threads."
-              " (Default: 1)");
-DEFINE_int32(num_initiator_dev, 1, "Number of device in initiator process");
-DEFINE_int32(num_target_dev, 1, "Number of device in target process");
-DEFINE_bool(enable_pt, false, "Enable Progress Thread (only used with nixl worker)");
-DEFINE_uint64(progress_threads, 0, "Number of progress threads (default: 0)");
-DEFINE_bool(enable_vmm, false, "Enable VMM memory allocation when DRAM is requested");
+NB_ARG_STRING(benchmark_group, "default", \
+              "Name of benchmark group. Use different names to run multiple benchmarks in parallel " \
+              "(Default: default)")
+NB_ARG_STRING(runtime_type, XFERBENCH_RT_ETCD, "Runtime type to use for communication [ETCD]")
+NB_ARG_STRING(worker_type, XFERBENCH_WORKER_NIXL, "Type of worker [nixl, nvshmem]")
+NB_ARG_STRING(backend, XFERBENCH_BACKEND_UCX, \
+              "Name of NIXL backend [UCX, UCX_MO, GDS, GDS_MT, POSIX, GPUNETIO, Mooncake, HF3FS, OBJ, GUSLI]" \
+              " (only used with nixl worker)")
+NB_ARG_STRING(initiator_seg_type, XFERBENCH_SEG_TYPE_DRAM, "Type of memory segment for initiator" \
+              " [DRAM, VRAM]. Note: Storage backends always use DRAM locally.")
+NB_ARG_STRING(target_seg_type, XFERBENCH_SEG_TYPE_DRAM, "Type of memory segment for target" \
+              " [DRAM, VRAM]. Note: Storage backends determine remote type automatically.")
+NB_ARG_STRING(scheme, XFERBENCH_SCHEME_PAIRWISE, "Scheme: pairwise, maytoone, onetomany, tp")
+NB_ARG_STRING(mode, XFERBENCH_MODE_SG, "MODE: SG (Single GPU per proc), MG (Multi GPU per proc) [default: SG]")
+NB_ARG_STRING(op_type, XFERBENCH_OP_WRITE, "Op type: READ, WRITE")
+NB_ARG_BOOL(check_consistency, false, "Enable Consistency Check")
+NB_ARG_UINT64(total_buffer_size, 8LL * 1024 * (1 << 20), "Total buffer" \
+              " size across device for each process (Default: 80 GiB)")
+NB_ARG_UINT64(start_block_size, 4 * (1 << 10), "Max size of block (Default: 4 KiB)")
+NB_ARG_UINT64(max_block_size, 64 * (1 << 20), "Max size of block (Default: 64 MiB)")
+NB_ARG_UINT64(start_batch_size, 1, "Starting size of batch (Default: 1)")
+NB_ARG_UINT64(max_batch_size, 1, "Max size of batch (starts from 1)")
+NB_ARG_INT32(num_iter, 1000, "Max iterations")
+NB_ARG_INT32(large_blk_iter_ftr, 16, "factor to reduce test iteration when testing large block size(>1MB)")
+NB_ARG_INT32(warmup_iter, 100, "Number of warmup iterations before timing")
+NB_ARG_INT32 (num_threads, 1, "Number of threads used by benchmark." \
+              " Num_iter must be greater or equal than num_threads and equally divisible by num_threads." \
+              " (Default: 1)")
+NB_ARG_INT32(num_initiator_dev, 1, "Number of device in initiator process")
+NB_ARG_INT32(num_target_dev, 1, "Number of device in target process")
+NB_ARG_BOOL(enable_pt, false, "Enable Progress Thread (only used with nixl worker)")
+NB_ARG_UINT64(progress_threads, 0, "Number of progress threads (default: 0)")
+NB_ARG_BOOL(enable_vmm, false, "Enable VMM memory allocation when DRAM is requested")
 
 // Storage backend(GDS, GDS_MT, POSIX, HF3FS, OBJ) options
-DEFINE_string (filepath, "", "File path for storage operations");
-DEFINE_int32 (num_files, 1, "Number of files used by benchmark");
-DEFINE_bool (storage_enable_direct, false, "Enable direct I/O for storage operations");
+NB_ARG_STRING (filepath, "", "File path for storage operations")
+NB_ARG_INT32 (num_files, 1, "Number of files used by benchmark")
+NB_ARG_BOOL (storage_enable_direct, false, "Enable direct I/O for storage operations")
 
 // GDS options - only used when backend is GDS
-DEFINE_int32(gds_batch_pool_size, 32, "Batch pool size for GDS operations (default: 32, only used with GDS backend)");
-DEFINE_int32(gds_batch_limit, 128, "Batch limit for GDS operations (default: 128, only used with GDS backend)");
-DEFINE_int32(gds_mt_num_threads, 1, "Number of threads used by GDS MT plugin (Default: 1)");
+NB_ARG_INT32(gds_batch_pool_size, 32, "Batch pool size for GDS operations (default: 32, only used with GDS backend)")
+NB_ARG_INT32(gds_batch_limit, 128, "Batch limit for GDS operations (default: 128, only used with GDS backend)")
+NB_ARG_INT32(gds_mt_num_threads, 1, "Number of threads used by GDS MT plugin (Default: 1)")
 
 // TODO: We should take rank wise device list as input to extend support
-// <rank>:<device_list>, ...
-// For example- 0:mlx5_0,mlx5_1,mlx5_2,1:mlx5_3,mlx5_4, ...
-DEFINE_string(device_list, "all", "Comma-separated device name to use for"
-              " communication (only used with nixl worker)");
-DEFINE_string(etcd_endpoints, "",
-              "ETCD server endpoints for communication (optional for storage backends)");
-
-// POSIX options - only used when backend is POSIX
-DEFINE_string (posix_api_type, XFERBENCH_POSIX_API_AIO,
-               "API type for POSIX operations [AIO, URING] (only used with POSIX backend)");
-
-// DOCA GPUNetIO options - only used when backend is DOCA GPUNetIO
-DEFINE_string(gpunetio_device_list, "0", "Comma-separated GPU CUDA device id to use for"
-              " communication (only used with nixl worker)");
-// DOCA GPUNetIO options - only used when backend is DOCA GPUNetIO
-DEFINE_string(gpunetio_oob_list, "", "Comma-separated OOB network interface name"
-              " for control path (only used with nixl worker)");
-
-// OBJ options - only used when backend is OBJ
-DEFINE_string(obj_access_key, "", "Access key for S3 backend");
-DEFINE_string(obj_secret_key, "", "Secret key for S3 backend");
-DEFINE_string(obj_session_token, "", "Session token for S3 backend");
-DEFINE_string(obj_bucket_name, XFERBENCH_OBJ_BUCKET_NAME_DEFAULT, "Bucket name for S3 backend");
-DEFINE_string(obj_scheme, XFERBENCH_OBJ_SCHEME_HTTP, "HTTP scheme for S3 backend [http, https]");
-DEFINE_string(obj_region, XFERBENCH_OBJ_REGION_EU_CENTRAL_1, "Region for S3 backend");
-DEFINE_bool(obj_use_virtual_addressing, false, "Use virtual addressing for S3 backend");
-DEFINE_string(obj_endpoint_override, "", "Endpoint override for S3 backend");
-DEFINE_string(obj_req_checksum, XFERBENCH_OBJ_REQ_CHECKSUM_SUPPORTED,
-              "Required checksum for S3 backend [supported, required]");
-DEFINE_string(obj_ca_bundle, "", "Path to CA bundle for S3 backend");
-
-// HF3FS options - only used when backend is HF3FS
-DEFINE_int32(hf3fs_iopool_size, 64, "Size of io memory pool");
-
-// GUSLI options - only used when backend is GUSLI
-DEFINE_string(gusli_client_name, "NIXLBench", "Client name for GUSLI backend");
-DEFINE_int32(gusli_max_simultaneous_requests, 32,
-             "Maximum number of simultaneous requests for GUSLI backend");
-DEFINE_string(gusli_config_file, "",
-    "Configuration file content for GUSLI backend (if empty, auto-generated from device_list)");
-DEFINE_uint64(gusli_bdev_byte_offset, 1048576,
-              "Byte offset in block device for GUSLI operations (default: 1MB)");
-DEFINE_string(gusli_device_security, "",
-              "Comma-separated list of security flags per device (e.g. 'sec=0x3,sec=0x71'). "
-              "If empty or fewer than devices, uses 'sec=0x3' as default. "
-              "For GUSLI backend, use device_list in format 'id:type:path' where type is F (file) "
-              "or K (kernel device).");
+// <rank>:<device_list>, ... */
+// For example- 0:mlx5_0,mlx5_1,mlx5_2,1:mlx5_3,mlx5_4, ... */
+NB_ARG_STRING(device_list, "all", "Comma-separated device name to use for" \
+              " communication (only used with nixl worker)")
+NB_ARG_STRING(etcd_endpoints, "", \
+              "ETCD server endpoints for communication (optional for storage backends)")
+/* POSIX options - only used when backend is POSIX */ \
+NB_ARG_STRING (posix_api_type, XFERBENCH_POSIX_API_AIO, \
+               "API type for POSIX operations [AIO, URING] (only used with POSIX backend)")
+/* DOCA GPUNetIO options - only used when backend is DOCA GPUNetIO */ \
+NB_ARG_STRING(gpunetio_device_list, "0", "Comma-separated GPU CUDA device id to use for" \
+              " communication (only used with nixl worker)")
+/* DOCA GPUNetIO options - only used when backend is DOCA GPUNetIO */ \
+NB_ARG_STRING(gpunetio_oob_list, "", "Comma-separated OOB network interface name" \
+              " for control path (only used with nixl worker)")
+/* OBJ options - only used when backend is OBJ */ \
+NB_ARG_STRING(obj_access_key, "", "Access key for S3 backend")
+NB_ARG_STRING(obj_secret_key, "", "Secret key for S3 backend")
+NB_ARG_STRING(obj_session_token, "", "Session token for S3 backend")
+NB_ARG_STRING(obj_bucket_name, XFERBENCH_OBJ_BUCKET_NAME_DEFAULT, "Bucket name for S3 backend")
+NB_ARG_STRING(obj_scheme, XFERBENCH_OBJ_SCHEME_HTTP, "HTTP scheme for S3 backend [http, https]")
+NB_ARG_STRING(obj_region, XFERBENCH_OBJ_REGION_EU_CENTRAL_1, "Region for S3 backend")
+NB_ARG_BOOL(obj_use_virtual_addressing, false, "Use virtual addressing for S3 backend")
+NB_ARG_STRING(obj_endpoint_override, "", "Endpoint override for S3 backend")
+NB_ARG_STRING(obj_req_checksum, XFERBENCH_OBJ_REQ_CHECKSUM_SUPPORTED, \
+              "Required checksum for S3 backend [supported, required]")
+NB_ARG_STRING(obj_ca_bundle, "", "Path to CA bundle for S3 backend")
+/* HF3FS options - only used when backend is HF3FS */ \
+NB_ARG_INT32(hf3fs_iopool_size, 64, "Size of io memory pool")
+/* GUSLI options - only used when backend is GUSLI */ \
+NB_ARG_STRING(gusli_client_name, "NIXLBench", "Client name for GUSLI backend")
+NB_ARG_INT32(gusli_max_simultaneous_requests, 32, \
+             "Maximum number of simultaneous requests for GUSLI backend")
+NB_ARG_STRING(gusli_config_file, "", \
+    "Configuration file content for GUSLI backend (if empty, auto-generated from device_list)")
+NB_ARG_UINT64(gusli_bdev_byte_offset, 1048576, \
+              "Byte offset in block device for GUSLI operations (default: 1MB)")
+NB_ARG_STRING(gusli_device_security, "", \
+              "Comma-separated list of security flags per device (e.g. 'sec=0x3,sec=0x71'). " \
+              "If empty or fewer than devices, uses 'sec=0x3' as default. " \
+              "For GUSLI backend, use device_list in format 'id:type:path' where type is F (file) " \
+              "or K (kernel device).")
+
+#undef NB_ARG_INT32
+#undef NB_ARG_UINT64
+#undef NB_ARG_BOOL
+#undef NB_ARG_STRING
 
 std::string xferBenchConfig::runtime_type = "";
 std::string xferBenchConfig::worker_type = "";