🇺🇸 English |
🇩🇪 Deutsch |
🇷🇺 Русский |
🇫🇷 Français |
🇪🇸 Español |
🇯🇵 日本語 |
🇨🇳 中文 |
🇵🇹 Português |
🇰🇷 한국어 |
🇮🇳 हिंदी
MyGPU:轻量级GPU管理工具:一个紧凑的
nvidia-smi包装器,配有一个优雅的网络仪表盘。
- 轻量级:资源占用最小。
- 灵活:可作为命令行工具或功能全面的 Web 仪表盘运行。
- 以管理员为中心的:包含 VRAM 强制执行(自动杀死超出限制的进程)和 监控列表等功能。
- 开发人员友好:内置基准测试和压力测试工具(GEMM、粒子物理),用于验证系统稳定性。
-
实时监控:
- 详细的 GPU 指标(利用率、显存、功率、温度)。
- 系统指标(CPU、内存等)。
-
管理与强制执行:
- 显存上限:为每个 GPU 设置显存使用量的硬性限制。
- 自动终止:(仅管理员可操作)自动终止违反显存政策的进程。
- 监控列表:监控特定 PIDs 或进程名称。
-
基准测试与模拟:
- 压力测试:可配置的 GEMM 工作负载用于测试热量限制和稳定性。
- 可视化模拟:交互式 3D 粒子物理模拟,用于可视化 GPU 加载。
欢迎贡献!主要需要涵盖的未来工作点包括:
- 多GPU支持:增强多卡设置和 NVLink 拓扑的处理能力。
- 容器化:官方 Docker 支持,便于在容器化环境中部署。
- 远程访问:集成 SSH 隧道和安全远程管理。
- 跨平台:
- [已完成] Linux 支持(Ubuntu/Debian 重点)。
- [已完成] macOS 支持(Apple Silicon 监控)。
- 硬件无关:
- [待完成] AMD ROCm 支持。
- [待完成] Intel Arc 支持。
- 多语言文档(已删除):支持 GitHub 上最受欢迎的语言。
请参阅 CONTRIBUTING.md 了解如何参与进来。
- 操作系统:Windows 10/11、Linux、macOS
- Python:3.10+
- 硬件:NVIDIA GPU(所有平台)、Apple Silicon(macOS)或仅 CPU。
- CUDA:12.x 工具包(NVIDIA 平台的基准测试/模拟推荐)。
- 注意:如果未检测到 CUDA/MPS,某些基准测试功能可能无法启用。
该工具支持模块化安装,以满足您的需求:
适用于无头服务器或后台监控。
- 命令行界面。
- 基本系统/GPU指标。
大多数用户的最佳选择。
- 包含网页仪表盘。
- REST API 端点。
- 实时图表。
- 但无模拟或基准测试功能。
最适合开发和压力测试。
- 包含模拟。
- PyTorch/CuPy 依赖项用于基准测试。
-
下载 或克隆仓库。
-
运行设置:
Windows:
.\setup.ps1Linux/macOS:
chmod +x setup.sh
./setup.sh启动
# 启动网络仪表盘(标准/完整)
python health_monitor.py web
# 启动命令行界面
python health_monitor.py cli请参阅 LICENSE 了解详细信息。









