🎉 CLIP-fine-tune 2026 ! 🤖🫶🤓

📄 Paper: Latent Crossroads Regression CLIP

📄 Latent Crossroads paper references: Click here!

The config .json are in `utils_xconfigs_examples` --- Training code: `all_in_one_clip_fine_tune.py` --- To reproduce main experiments: `eval_reproduce_*.py` --- Details can be found in the docstring at the top of every script

New Regression-CLIP models:

Balanced: CLIP-Regression-ViT-L-14 🤗
Brut: CLIP-Regression-BRUT-ViT-L-14 🤗
All my CLIP models: huggingface.co/zer0int 🤗

What's New in CLIP-fine-tune? 🎉

All-in-one complete fine-tuning suite
'It basically fine-tunes itself' auto-mode 👶
Just check all_in_one_clip_fine_tune.py for config & run!
Super fast: Time slashed in half** (vs. my previous code)
Includes NEW method: Regression-CLIP with Teachers
Includes all my previous methods like KO-CLIP
Read the NEW Regression-CLIP paper
Read the (previous) KO-CLIP paper

Regression-CLIP in a nutshell: 🎯

Enable for block 22, 23 (ViT-L/14) if:
You have issues with CLIP misclassifying 'text in image'
Well-known -> typographic attack vulnerability, e.g.:
You have product photos with text labels on them
You have comics with text in them, etc. ...

Models & Datasets: 🗂️

Supports HuggingFace models and Long-CLIP 248 tokens
Loads any .safetensors, OpenAI pickle, or HF Hub CLIP
Dataset heuristics: Config-free mode to figure out any of:
Sidecar labels, txt, .csv, .tsv, .json, .mat, parquet
You provide a root directory, I'll figure out the rest!
HuggingFace datasets: Will prompt if >1 text column found.

Code optimization, **speed: 👨🏻‍💻

One-time process spawn (Windows) -> re-use for speed
Efficient threading, persistent workers, prefetching
Pretokenize -> Token table with IDs for fast reference
See utils_train code & docstrings for all details
Example (my): Windows, RTX 4090 -> was: ~1h -> is: 25 min / Epoch

Quality of Life: 📈

.json config auto-save, loading from .json config
Includes optimizer state saving & continuing
Includes EMA-Model support (kept in RAM, not VRAM)
Presets for optimizer groups (and a manual params+lr mode)
Automated ZS + LP + Typo Attack mini-benchmarks (train -> val)
Logs & plots: VRAM / Epoch, gradient norms, loss, margins, ...

Toolkit Suite: 🛟

Rescue ('transplant') for single-Encoder collapsed embeddings
Benchmark suite: typographic attack, zero-shot, retrieval
Post-training logit_scale calibration
Geometry analysis tools with heuristics:
Report problematic geometry -> what & where for each Encoder
E.g. rank of embeddings, sphericity, anisotropy, ...
All scripts have docstrings with info / instructions at the top

More

View the old version (pre-2026) of CLIP-fine-tune here: Previous version of CLIP-fine-tune

Love ❤️ this CLIP?

ᐅ Buy me a coffee on Ko-Fi ☕

Or click here for address to send 🪙₿ BTC

3PscBrWYvrutXedLmvpcnQbE12Py8qLqMK

Friendly config in all_in_one_clip_fine_tune.py:

Automatic dataset config of as above: Heuristics + ask user if multiple labels present:

Geometry analysis suite eval_measure_modality_gap_geometry.py; heuristics will inform about issues (e.g. 'did embeddings collapse?'):

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
attnclip		attnclip
attnclipdecouple		attnclipdecouple
attnclipindiv		attnclipindiv
docs_ko_clip		docs_ko_clip
docs_regression_clip		docs_regression_clip
gmpclipheaddropout		gmpclipheaddropout
gmpclipregression		gmpclipregression
image_sets		image_sets
oaiclip		oaiclip
opt_sophia		opt_sophia
utils_clip_loader		utils_clip_loader
utils_convert_hf		utils_convert_hf
utils_datasets		utils_datasets
utils_merge_sdxl_clip		utils_merge_sdxl_clip
utils_train		utils_train
utils_xconfigs_examples		utils_xconfigs_examples
README.MD		README.MD
all_in_one_clip_fine_tune.py		all_in_one_clip_fine_tune.py
all_pytorch_model_convert_huggingface.py		all_pytorch_model_convert_huggingface.py
calibrate_fine_tuned_logit_scale.py		calibrate_fine_tuned_logit_scale.py
calibrate_rescue_fail_encoder_merge.py		calibrate_rescue_fail_encoder_merge.py
eval_benchmark_linear_probe_imagenet.py		eval_benchmark_linear_probe_imagenet.py
eval_benchmark_retrieval_mscoco.py		eval_benchmark_retrieval_mscoco.py
eval_benchmark_retrieval_sugar_crepe.py		eval_benchmark_retrieval_sugar_crepe.py
eval_benchmark_zs_mvt_objectnet.py		eval_benchmark_zs_mvt_objectnet.py
eval_benchmark_zs_typoattack_scam_rta.py		eval_benchmark_zs_typoattack_scam_rta.py
eval_measure_attn_mlp_output.py		eval_measure_attn_mlp_output.py
eval_measure_cls_patch_reg_geometry.py		eval_measure_cls_patch_reg_geometry.py
eval_measure_comp_reg_explained_var.py		eval_measure_comp_reg_explained_var.py
eval_measure_comp_register_subspace.py		eval_measure_comp_register_subspace.py
eval_measure_modality_gap_geometry.py		eval_measure_modality_gap_geometry.py
eval_measure_ood_logit_scale_imagenet.py		eval_measure_ood_logit_scale_imagenet.py
eval_measure_quick_reg_gate_probe.py		eval_measure_quick_reg_gate_probe.py
eval_measure_register_norm_density.py		eval_measure_register_norm_density.py
eval_measure_second_order_registers.py		eval_measure_second_order_registers.py
eval_reproduce_attn_reg_delta_norms.py		eval_reproduce_attn_reg_delta_norms.py
eval_reproduce_decoupling_cls_patch.py		eval_reproduce_decoupling_cls_patch.py
eval_reproduce_reg_write_subspace_adv.py		eval_reproduce_reg_write_subspace_adv.py
eval_reproduce_reg_write_subspace_scam.py		eval_reproduce_reg_write_subspace_scam.py
eval_reproduce_regression_probe_zs.py		eval_reproduce_regression_probe_zs.py
eval_visualize_attn_and_patch_norm.py		eval_visualize_attn_and_patch_norm.py
eval_visualize_attn_vit_heads_qv.py		eval_visualize_attn_vit_heads_qv.py
eval_visualize_eval_pgd_attacks.py		eval_visualize_eval_pgd_attacks.py
fun_clip_opinion_text_gradient_ascent.py		fun_clip_opinion_text_gradient_ascent.py
fun_generate_feature_act_max_vis.py		fun_generate_feature_act_max_vis.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🎉 CLIP-fine-tune 2026 ! 🤖🫶🤓

New Regression-CLIP models:

What's New in CLIP-fine-tune? 🎉

Regression-CLIP in a nutshell: 🎯

Models & Datasets: 🗂️

Code optimization, **speed: 👨🏻‍💻

Quality of Life: 📈

Toolkit Suite: 🛟

More

About

Uh oh!

Releases

Packages

Uh oh!

Languages

zer0int/CLIP-fine-tune

Folders and files

Latest commit

History

Repository files navigation

🎉 CLIP-fine-tune 2026 ! 🤖🫶🤓

New Regression-CLIP models:

What's New in CLIP-fine-tune? 🎉

Regression-CLIP in a nutshell: 🎯

Models & Datasets: 🗂️

Code optimization, **speed: 👨🏻‍💻

Quality of Life: 📈

Toolkit Suite: 🛟

More

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages