Releases · kozistr/pytorch_optimizer · GitHub

02 Feb 10:52

kozistr

pytorch-optimizer v2.4.0

Change Log

Feature

Implement D-Adaptation optimizers (DAdaptAdaGrad, DAdaptAdam, DAdaptSGD), #101
- Learning rate free learning for SGD, AdaGrad and Adam
- original implementation: https://github.com/facebookresearch/dadaptation
Shampoo optimizer
- Support no_preconditioning_for_layers_with_dim_gt (default 8192)

Improvement

refactor/improve matrix_power(), unroll the loop due to the performance, #101
speed-up/fix power_iter(), not to deep-copy mat_v. #101

Docs

D-Adaptation optimizers & Shampoo utils

Assets 2

31 Jan 13:20

kozistr

pytorch-optimizer v2.3.1

Change Log

Feature

more add-ons for Shampoo optimizer, #99
- implement moving_average_for_momentum
- implement decoupled_weight_decay
- implement decoupled_learning_rate
- supports more grafting (RMSProp, SQRT_N)
- supports more PreConditioner (ALL, INPUT)

Docs

apply pydocstyle linter, #91

Refactor

deberta_v3_large_lr_scheduler, #91

ETC

add more Ruff rules (ICN, TID, ERA, RUF, YTT, PL), #91

Assets 2

30 Jan 07:42

kozistr

pytorch-optimizer v2.3.0

Change Log

Feature

re-implement Shampoo Optimizer (#97, related to #93)
- layer-wise grafting (none, adagrad, sgd)
- block partitioner
- preconditioner
remove casting to fp16 or bf16 inside of the step() not to lose consistency with the other optimizers. #96
change some ops to in-place operations to speed up. #96

Fix

fix exp_avg_var when amsgrad is True. #96

Refactor

change linter from Pylint to Ruff, #97

Assets 2

28 Jan 11:50

kozistr

pytorch-optimizer v2.2.1

Change Log

Feature

Support max_grad_norm (Adan optimizer)
Support gradient averaging (Lamb optimizer)
Support dampening, nesterov parameters (Lars optimizer)

Refactor

move step parameter from state to group. (to reduce computation cost & memory)
load betas by group, not a parameter.
change to in-place operations.

Fix

fix when momentum is 0 (Lars optimizer)

Assets 2

24 Jan 13:25

kozistr

pytorch-optimizer v2.2.0

Change Log

Implement GSAM (Surrogate Gap Guided Sharpness-Aware Minimization) optimizer, ICLR 22

Assets 2

02 Jan 12:18

kozistr

pytorch-optimizer v2.1.1

Change Log

Feature

Support gradient centralization for Adai optimizer
Support AdamD debias for AdaPNM optimizer
Register custom exceptions (e.g. NoSparseGradientError, NoClosureError, ...)

Documentation

Add API documentation

Bug

Fix SAM optimizer

Assets 2

01 Jan 11:53

kozistr

pytorch-optimizer v2.1.0

Change Log

Implement Adai optimizer, #89
Speed up the testing, #88
Upgrade to Python 3.11 (only for CI pipeline), #86

Assets 2

01 Nov 05:22

kozistr

pytorch-optimizer v2.0.1

Change Log

[Fix] update hubconf.py, #81
[Fix] python 3.7 for Colab environment, #83 (#82)

Assets 2

21 Oct 01:35

kozistr

pytorch-optimizer v2.0.0

Chage Log

Refactor the package depth
- 4 depths
  - pytorch_optimizer.lr_scheduler : lr schedulers
  - pytorch_optimizer.optimizer : optimizers
  - pytorch_optimizer.base : base utils
  - pytorch_optimizer.experimental : any experimental features
- pytorch_optimizer.adamp -> pytorch_optimizer.optimizer.adamp
- Still from pytorch_optimizer import AdamP is possible
Implement lr schedulers
- CosineAnealingWarmupRestarts
Implement (experimental) lr schedulers
- DeBERTaV3-large layer-wise lr scheduler

Other changes (bug fixes, small refactors)

Fix AGC (to returning the parameter)
Make a room for experimental features (at pytorch_optimizer.experimental)
base types

Assets 2

02 Sep 10:56

kozistr

pytorch-optimizer v1.3.2

Change Log

torch.hub usage in docs, #76
Adan optimizer, #77
- fix: forgot to divide into beta_correction
- feat: support weight_decouple

Assets 2