- PEFT — Parameter-Efficient Fine-Tuning: LoRA, QLoRA, prefix tuning
- TRL — Transformer Reinforcement Learning: RLHF, DPO для выравнивания LLM
- Axolotl — обёртка для fine-tuning LLM с поддержкой множества методов
- Unsloth — ускоренный fine-tuning LLM (2-5x) с пониженным потреблением памяти
- vLLM — быстрый инференс LLM с PagedAttention и continuous batching
- Ollama — запуск LLM локально одной командой
- llama.cpp — инференс LLM на CPU, квантизация GGUF
- TGI (Hugging Face) — production-сервер для LLM
- LangChain — оркестрация цепочек вызовов LLM, RAG, агенты
- LlamaIndex — фреймворк для RAG: индексация, поиск, генерация ответов
- DSPy (Stanford) — программирование LLM вместо ручного промптинга