pytorch-optimizer v2.4.0

kozistr released this 02 Feb 10:52

75a023a

Change Log

Feature

Implement D-Adaptation optimizers (DAdaptAdaGrad, DAdaptAdam, DAdaptSGD), #101
- Learning rate free learning for SGD, AdaGrad and Adam
- original implementation: https://github.com/facebookresearch/dadaptation
Shampoo optimizer
- Support no_preconditioning_for_layers_with_dim_gt (default 8192)

Improvement

refactor/improve matrix_power(), unroll the loop due to the performance, #101
speed-up/fix power_iter(), not to deep-copy mat_v. #101

Docs

D-Adaptation optimizers & Shampoo utils

Assets 2