Image Classification with Vision Transformer from Scratch

Multi-class classification with Vision Transformer from Scratch using TensorFlow and Python

The Vision Transformer (ViT) model architecture was introduced in a research paper published as a conference paper at ICLR 2021 titled “An Image is Worth 16*16 Words: Transformers for Image Recognition at Scale”. URL: https://arxiv.org/abs/2010.11929

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
LICENSE		LICENSE
README.md		README.md
Vision_Transformer.py		Vision_Transformer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Image Classification with Vision Transformer from Scratch

About

Uh oh!

Releases

Packages

Languages

License

Imran-Iqbal/Multi-class_classification_with_Vision_Transformer_from_Scratch

Folders and files

Latest commit

History

Repository files navigation

Image Classification with Vision Transformer from Scratch

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages