AdaGo

Will conduct some experiments on different deep learning tasks using AdaGO optimizer

The paper link is https://arxiv.org/pdf/2509.02981?

Implementation / experiments for AdaGrad Meets Muon: Adaptive Stepsizes for Orthogonal Updates (AdaGO).

This repository contains training scripts, configs, and utilities to reproduce runs and plots used in our experiments.

Dataset

This project uses CIFAR-100.

Download automatically via torchvision:

from torchvision.datasets import CIFAR100

CIFAR100(root="./data", train=True, download=True)

## How to run 
>>> python train_cifar100_vit_adago.py --run_all --out_dir results --exp_name cifar100_vit --epochs 30 --batch_size 128
Will get file tree like:
results/
├── cifar100_vit_adago/
├── cifar100_vit_muon/
└── cifar100_vit_adamw_only/

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
results		results
README.md		README.md
train_cifar100_vit_adago.py		train_cifar100_vit_adago.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AdaGo

The paper link is https://arxiv.org/pdf/2509.02981?

Dataset

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Err0rzzzz/AdaGo

Folders and files

Latest commit

History

Repository files navigation

AdaGo

The paper link is https://arxiv.org/pdf/2509.02981?

Dataset

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages