kozistr
diff --git a/‎.github/workflows/static_analysis.yml‎
Lines changed: 1 addition & 1 deletion b/‎.github/workflows/static_analysis.yml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎README.md‎
Lines changed: 2 additions & 1 deletion b/‎README.md‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎docs/changelogs/v3.8.1.md‎
Lines changed: 2 additions & 0 deletions b/‎docs/changelogs/v3.8.1.md‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎docs/index.md‎
Lines changed: 2 additions & 1 deletion b/‎docs/index.md‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎docs/optimizer.md‎
Lines changed: 4 additions & 0 deletions b/‎docs/optimizer.md‎
Lines changed: 4 additions & 0 deletions
@@ -24,4 +24,4 @@ jobs:
 
     - uses: jakebailey/pyright-action@v2
       with:
-        version: 1.1.404
+        version: 1.1.406
@@ -10,7 +10,7 @@
 
 ## The reasons why you use `pytorch-optimizer`.
 
-* Wide range of supported optimizers. Currently, **128 optimizers (+ `bitsandbytes`, `qgalore`, `torchao`)**, **16 lr schedulers**, and **13 loss functions** are supported!
+* Wide range of supported optimizers. Currently, **129 optimizers (+ `bitsandbytes`, `qgalore`, `torchao`)**, **16 lr schedulers**, and **13 loss functions** are supported!
 * Including many variants such as `ADOPT`, `Cautious`, `AdamD`, `StableAdamW`, and `Gradient Centrailiaztion`
 * Easy to use, clean, and tested codes
 * Active maintenance
@@ -222,6 +222,7 @@ get_supported_optimizers(['adam*', 'ranger*'])
 | Refined Schedule-Free | *Through the River: Understanding the Benefit of Schedule-Free Methods for Language Model Training*            |                                                                                                                | <https://arxiv.org/abs/2507.09846>                                                                                   | [cite](https://ui.adsabs.harvard.edu/abs/2025arXiv250709846S/exportcitation)                                                        |
 | FriendlySAM           | *Friendly Sharpness-Aware Minimization*                                                                        | [github](https://github.com/nblt/F-SAM)                                                                        | <https://openaccess.thecvf.com/content/CVPR2024/papers/Li_Friendly_Sharpness-Aware_Minimization_CVPR_2024_paper.pdf> | [cite](https://github.com/nblt/F-SAM?tab=readme-ov-file#citation)                                                                   |
 | AdaGO                 | *AdaGrad Meets Muon: Adaptive Stepsizes for Orthogonal Updates*                                                |                                                                                                                | <https://arxiv.org/abs/2509.02981>                                                                                   | [cite](https://ui.adsabs.harvard.edu/abs/2025arXiv250902981Z/exportcitation)                                                        |
+| Conda                 | *Column-Normalized Adam for Training Large Language Models Faster*                                             | [github](https://github.com/jie040109/Conda)                                                                   | <https://arxiv.org/abs/2509.24218>                                                                                   | [cite](https://ui.adsabs.harvard.edu/abs/2025arXiv250924218W/exportcitation)                                                        |
 
 ## Supported LR Scheduler
 
 
@@ -8,6 +8,8 @@
     * [AdaGrad Meets Muon: Adaptive Stepsizes for Orthogonal Updates](https://arxiv.org/abs/2509.02981) 
 * Update `EXAdam` optimizer to the latest version. (#438)
 * Update `EmoNavi` optimizer to the latest version. (#433, #439)
+* Implement `Conda` optimizer. (#440, #441)
+    * [Conda: Column-Normalized Adam for Training Large Language Models Faster](https://arxiv.org/abs/2509.24218)
 
 ### Bug
 
 
@@ -10,7 +10,7 @@
 
 ## The reasons why you use `pytorch-optimizer`.
 
-* Wide range of supported optimizers. Currently, **128 optimizers (+ `bitsandbytes`, `qgalore`, `torchao`)**, **16 lr schedulers**, and **13 loss functions** are supported!
+* Wide range of supported optimizers. Currently, **129 optimizers (+ `bitsandbytes`, `qgalore`, `torchao`)**, **16 lr schedulers**, and **13 loss functions** are supported!
 * Including many variants such as `ADOPT`, `Cautious`, `AdamD`, `StableAdamW`, and `Gradient Centrailiaztion`
 * Easy to use, clean, and tested codes
 * Active maintenance
@@ -222,6 +222,7 @@ get_supported_optimizers(['adam*', 'ranger*'])
 | Refined Schedule-Free | *Through the River: Understanding the Benefit of Schedule-Free Methods for Language Model Training*            |                                                                                                                | <https://arxiv.org/abs/2507.09846>                                                                                   | [cite](https://ui.adsabs.harvard.edu/abs/2025arXiv250709846S/exportcitation)                                                        |
 | FriendlySAM           | *Friendly Sharpness-Aware Minimization*                                                                        | [github](https://github.com/nblt/F-SAM)                                                                        | <https://openaccess.thecvf.com/content/CVPR2024/papers/Li_Friendly_Sharpness-Aware_Minimization_CVPR_2024_paper.pdf> | [cite](https://github.com/nblt/F-SAM?tab=readme-ov-file#citation)                                                                   |
 | AdaGO                 | *AdaGrad Meets Muon: Adaptive Stepsizes for Orthogonal Updates*                                                |                                                                                                                | <https://arxiv.org/abs/2509.02981>                                                                                   | [cite](https://ui.adsabs.harvard.edu/abs/2025arXiv250902981Z/exportcitation)                                                        |
+| Conda                 | *Column-Normalized Adam for Training Large Language Models Faster*                                             | [github](https://github.com/jie040109/Conda)                                                                   | <https://arxiv.org/abs/2509.24218>                                                                                   | [cite](https://ui.adsabs.harvard.edu/abs/2025arXiv250924218W/exportcitation)                                                        |
 
 ## Supported LR Scheduler
 
 
@@ -160,6 +160,10 @@
     :docstring:
     :members:
 
+::: pytorch_optimizer.Conda
+    :docstring:
+    :members:
+
 ::: pytorch_optimizer.DAdaptAdaGrad
     :docstring:
     :members: