Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.github/workflows		.github/workflows
docker		docker
go		go
gpu		gpu
k8s		k8s
rl		rl
README.md		README.md

Repository files navigation

AI-powered Kubernetes Scheduler

This repository demonstrates three AI-specific Kubernetes scheduling approaches:

Reinforcement Learning–based Scheduler (PPO)
GPU-aware AI Scheduler (DCGM / Prometheus metrics)
Production-grade Kubernetes Scheduler Plugin (Go)

Architecture

Pod (schedulerName=ai-scheduler) → AI Scheduler → Metrics (CPU/GPU/Node) → AI Model → Node Binding

Use cases

GenAI / LLM inference
Distributed ML training
GPU cost optimization

About

AI-powered Kubernetes scheduler with RL-based decision making, GPU-aware placement, and a production-grade Scheduler Framework plugin.

Report repository

Releases 1

Basic Release Latest

Packages

Contributors

Languages