feat: update requirements:

kmehant · kmehant · commit bc5fbf3bf2ca · 2025-06-13T14:46:58.000+05:30
Signed-off-by: Mehant Kammakomati &lt;mehant.kammakomati2@ibm.com&gt;
diff --git a/plugins/accelerated-peft/requirements.txt b/plugins/accelerated-peft/requirements.txt
@@ -5,7 +5,8 @@
 accelerate >= 0.29
 
 # bitsandbytes for the BNB plugin
-# exact version is needed 0.45.1 for torch upgrade to 2.6
+# versions above 0.45.1 to support torch 2.6
+# exact version is used since upper bound is not known
 
 bitsandbytes == 0.45.1
 
diff --git a/sample-configurations/moe-scattermoe-granite-ep8-padding-free-foak-sample-configuration.yaml b/sample-configurations/moe-scattermoe-granite-ep8-padding-free-foak-sample-configuration.yaml
diff --git a/scripts/benchmarks/compare_with_reference.py b/scripts/benchmarks/compare_with_reference.py
@@ -10,16 +10,16 @@
 
 # default columns to compare
 DEFAULT_PLOT_COLUMNS = [
-    # "mem_torch_mem_alloc_in_bytes",
-    # "mem_peak_torch_mem_alloc_in_bytes",
+    "mem_torch_mem_alloc_in_bytes",
+    "mem_peak_torch_mem_alloc_in_bytes",
     'mem_nvidia_mem_reserved',
     "train_loss",
     "train_tokens_per_second",
 ]
 # Used as combined identifier of experiment
 DEFAULT_INDICES = [
     "framework_config",
-    # "peft_method",
+    "peft_method",
     "model_name_or_path",
     "num_gpus",
     "per_device_train_batch_size",
@@ -30,7 +30,7 @@
     "train_runtime",
     "train_steps_per_second",
     "train_samples_per_second",
-    # "mem_nvidia_mem_reserved",
+    "mem_nvidia_mem_reserved",
 ]
 
 DEFAULT_REFERENCE_FILEPATH = "scripts/benchmarks/refs/a100_80gb.csv"
diff --git a/scripts/benchmarks/refs/requirements_moe.txt b/scripts/benchmarks/refs/requirements_moe.txt
@@ -1,87 +1,91 @@
-accelerate==1.0.1
-aiohappyeyeballs==2.4.6
-aiohttp==3.11.12
+accelerate==1.6.0
+aiohappyeyeballs==2.6.1
+aiohttp==3.12.12
 aiosignal==1.3.2
-attrs==25.1.0
-bitsandbytes==0.43.3
-certifi==2025.1.31
-charset-normalizer==3.4.1
-contourpy==1.3.1
+attrs==25.3.0
+bitsandbytes==0.45.1
+causal-conv1d==1.5.0.post8
+certifi==2025.4.26
+charset-normalizer==3.4.2
+contourpy==1.3.2
 cycler==0.12.1
-datasets==2.21.0
+datasets==3.6.0
 dill==0.3.8
 einops==0.8.1
-filelock==3.17.0
+filelock==3.18.0
 flash_attn==2.7.4.post1
--e git+https://github.com/foundation-model-stack/fms-acceleration.git@21af5fb9f2989b3dbf443c016e4c0470b536a593#egg=fms_acceleration&subdirectory=plugins/framework
--e git+https://github.com/foundation-model-stack/fms-acceleration.git@21af5fb9f2989b3dbf443c016e4c0470b536a593#egg=fms_acceleration_aadp&subdirectory=plugins/attention-and-distributed-packing
--e git+https://github.com/foundation-model-stack/fms-acceleration.git@21af5fb9f2989b3dbf443c016e4c0470b536a593#egg=fms_acceleration_foak&subdirectory=plugins/fused-ops-and-kernels
--e git+https://github.com/foundation-model-stack/fms-acceleration.git@21af5fb9f2989b3dbf443c016e4c0470b536a593#egg=fms_acceleration_moe&subdirectory=plugins/accelerated-moe
--e git+https://github.com/foundation-model-stack/fms-acceleration.git@21af5fb9f2989b3dbf443c016e4c0470b536a593#egg=fms_acceleration_peft&subdirectory=plugins/accelerated-peft
-fms-hf-tuning @ git+https://github.com/foundation-model-stack/fms-hf-tuning.git@fdc7527510692ada03e4303df1549cebc5139b31
-fonttools==4.56.0
-frozenlist==1.5.0
-fsspec==2024.6.1
-huggingface-hub==0.29.0
+-e git+https://github.com/kmehant/fms-acceleration.git@bb3c88ecf960403295c34a49b9a4acdeff782d1d#egg=fms_acceleration&subdirectory=plugins/framework
+-e git+https://github.com/kmehant/fms-acceleration.git@bb3c88ecf960403295c34a49b9a4acdeff782d1d#egg=fms_acceleration_aadp&subdirectory=plugins/attention-and-distributed-packing
+-e git+https://github.com/kmehant/fms-acceleration.git@bb3c88ecf960403295c34a49b9a4acdeff782d1d#egg=fms_acceleration_foak&subdirectory=plugins/fused-ops-and-kernels
+-e git+https://github.com/kmehant/fms-acceleration.git@bb3c88ecf960403295c34a49b9a4acdeff782d1d#egg=fms_acceleration_moe&subdirectory=plugins/accelerated-moe
+-e git+https://github.com/kmehant/fms-acceleration.git@bb3c88ecf960403295c34a49b9a4acdeff782d1d#egg=fms_acceleration_peft&subdirectory=plugins/accelerated-peft
+fms-hf-tuning @ git+https://github.com/foundation-model-stack/fms-hf-tuning.git@9ca5739a4f7c1f0c9446b28d1bb80939d4199a75
+fonttools==4.58.2
+frozenlist==1.7.0
+fsspec==2025.3.0
+hf-xet==1.1.3
+huggingface-hub==0.33.0
 idna==3.10
-Jinja2==3.1.5
-kernel-hyperdrive @ git+https://github.com/fabianlim/kernel-hyperdrive.git@45036497e12444ca98a6f0072204538aee4543ba
+Jinja2==3.1.6
 kiwisolver==1.4.8
 llvmlite==0.44.0
+mamba-ssm==2.2.4
 markdown-it-py==3.0.0
 MarkupSafe==3.0.2
-matplotlib==3.10.0
+matplotlib==3.10.3
 mdurl==0.1.2
 mpmath==1.3.0
-multidict==6.1.0
+multidict==6.4.4
 multiprocess==0.70.16
-networkx==3.4.2
-numba==0.61.0
+networkx==3.5
+ninja==1.11.1.4
+numba==0.61.2
 numpy==1.26.4
-nvidia-cublas-cu12==12.1.3.1
-nvidia-cuda-cupti-cu12==12.1.105
-nvidia-cuda-nvrtc-cu12==12.1.105
-nvidia-cuda-runtime-cu12==12.1.105
+nvidia-cublas-cu12==12.4.5.8
+nvidia-cuda-cupti-cu12==12.4.127
+nvidia-cuda-nvrtc-cu12==12.4.127
+nvidia-cuda-runtime-cu12==12.4.127
 nvidia-cudnn-cu12==9.1.0.70
-nvidia-cufft-cu12==11.0.2.54
-nvidia-curand-cu12==10.3.2.106
-nvidia-cusolver-cu12==11.4.5.107
-nvidia-cusparse-cu12==12.1.0.106
+nvidia-cufft-cu12==11.2.1.3
+nvidia-cufile-cu12==1.11.1.6
+nvidia-curand-cu12==10.3.5.147
+nvidia-cusolver-cu12==11.6.1.9
+nvidia-cusparse-cu12==12.3.1.170
 nvidia-cusparselt-cu12==0.6.2
-nvidia-nccl-cu12==2.20.5
+nvidia-nccl-cu12==2.21.5
 nvidia-nvjitlink-cu12==12.4.127
-nvidia-nvtx-cu12==12.1.105
-packaging==24.2
-pandas==2.2.3
-peft==0.13.2
-pillow==11.1.0
-propcache==0.2.1
-protobuf==5.29.3
+nvidia-nvtx-cu12==12.4.127
+packaging==25.0
+pandas==2.3.0
+peft==0.14.0
+pillow==11.2.1
+propcache==0.3.2
+protobuf==5.29.5
 psutil==7.0.0
-pyarrow==19.0.1
+pyarrow==20.0.0
 Pygments==2.19.1
-pyparsing==3.2.1
+pyparsing==3.2.3
 python-dateutil==2.9.0.post0
-pytz==2025.1
+pytz==2025.2
 PyYAML==6.0.2
 regex==2024.11.6
-requests==2.32.3
-rich==13.9.4
-safetensors==0.5.2
+requests==2.32.4
+rich==14.0.0
+safetensors==0.5.3
 sentencepiece==0.2.0
-setuptools==75.8.0
-simpleeval==0.9.13
+setuptools==80.9.0
+simpleeval==1.0.3
 six==1.17.0
 sympy==1.13.1
-threadpoolctl==3.5.0
-tokenizers==0.21.0
-torch==2.4.1
+threadpoolctl==3.6.0
+tokenizers==0.21.1
+torch==2.6.0
 tqdm==4.67.1
-transformers==4.49.0
-triton==3.0.0
-trl==0.14.0
-typing_extensions==4.12.2
-tzdata==2025.1
-urllib3==2.3.0
+transformers==4.52.4
+triton==3.2.0
+trl==0.17.0
+typing_extensions==4.14.0
+tzdata==2025.2
+urllib3==2.4.0
 xxhash==3.5.0
-yarl==1.18.3
+yarl==1.20.1
diff --git a/tox.ini b/tox.ini
@@ -34,7 +34,7 @@ commands =
     # some models need this for tokenizers
     pip install protobuf
 
-    # for mamba based models
+    # install mamba kernels to benchmark mamba based models
     pip install --no-build-isolation mamba_ssm[causal-conv1d]>=2.0.0
 
     # install the plugins for test
@@ -45,7 +45,7 @@ commands =
     python -m fms_acceleration.cli install -e {toxinidir}/plugins/accelerated-moe
 
     # install the flash attn at the last 
-    pip install flash-attn --no-build-isolation
+    pip install flash-attn
 
     # run the benchmark script
     bash scripts/run_benchmarks.sh {posargs:"1 2" "4 8" benchmark_outputs}