|
| 1 | +<!-- HTML_BLOCK:1... --> |
| 2 | +<div align="center"> |
| 3 | + <a href="../README.md">🇺🇸 Inglés</a> | |
| 4 | + <a href="../locales/README.de.md">🇩🇪 Alemán</a> | |
| 5 | + <a href="../locales/README.ru.md">🇷🇺 Ruso</a> | |
| 6 | + <a href="../locales/README.fr.md">🇫🇷 Francés</a> | |
| 7 | + <a href="../locales/README.es.md">🇪🇸 Español</a> | |
| 8 | + <a href="../locales/README.ja.md">🇯🇵 Japonés</a> | |
| 9 | + <a href="../locales/README.zh.md">🇨🇳 Chino</a> | |
| 10 | + <a href="../locales/README.pt.md">🇵🇹 Portugués</a> | |
| 11 | + <a href="../locales/README.ko.md">🇰🇷 Coreano</a> | |
| 12 | + <a href="../locales/README.hi.md">🇮🇳 Hindi</a> |
| 13 | +</div> |
| 14 | +<!-- HTML_BLOCK:2... --> |
| 15 | +<div style="text-align:center; margin:18px 0;"> |
| 16 | + <img src="../monitor/api/static/logo.png" alt="MyGPU logo"/> |
| 17 | +</div> |
| 18 | +<!-- HTML_BLOCK:... --> |
| 19 | + |
| 20 | +> *MyGPU: Utilidad de gestión de GPU ligera: un envoltorio compacto de `nvidia-smi` con un elegante tablero web.* |
| 21 | +
|
| 22 | +<!-- HTML_BLOCK: no change to url; output entire as it is... --> |
| 23 | + |
| 24 | + |
| 25 | + |
| 26 | + |
| 27 | + |
| 28 | + |
| 29 | +## Galería |
| 30 | + |
| 31 | +<details> |
| 32 | + |
| 33 | + <summary> |
| 34 | + Tablero web |
| 35 | + </summary> |
| 36 | + |
| 37 | + <div style="display:flex; overflow-x:auto; gap:10px; padding:12px 0; scroll-snap-type:x mandatory; -webkit-overflow-scrolling:touch;"> |
| 38 | + <!-- Utilizar la relación de aspecto 1624x675 para el marco de la diapositiva; las imágenes se ajustan automáticamente con object-fit:contain --> |
| 39 | + <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
| 40 | + <img src="../monitor/api/static/web1.png" style="width:100%; height:100%; object-fit:contain;" /> |
| 41 | + </div> |
| 42 | + <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
| 43 | + <img src="../monitor/api/static/web2.png" style="width:100%; height:100%; object-fit:contain;" /> |
| 44 | + </div> |
| 45 | + <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
| 46 | + <img src="../monitor/api/static/web3.png" style="width:100%; height:100%; object-fit:contain;" /> |
| 47 | + </div> |
| 48 | + <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
| 49 | + <img src="../monitor/api/static/web4.png" style="width:100%; height:100%; object-fit:contain;" /> |
| 50 | + </div> |
| 51 | + </div> |
| 52 | + |
| 53 | +</details> |
| 54 | +<details> |
| 55 | + <summary>CLI</summary> |
| 56 | + <div style="display:flex; overflow-x:auto; gap:10px; padding:12px 0; scroll-snap-type:x mandatory; -webkit-overflow-scrolling:touch;"> |
| 57 | + <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
| 58 | + <img src="../monitor/api/static/cli1.png" style="width:100%; height:100%; object-fit:contain;" /> |
| 59 | + </div> |
| 60 | + <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
| 61 | + <img src="../monitor/api/static/cli2.png" style="width:100%; height:100%; object-fit:contain;" /> |
| 62 | + </div> |
| 63 | + <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
| 64 | + <img src="../monitor/api/static/cli3.png" style="width:100%; height:100%; object-fit:contain;" /> |
| 65 | + </div> |
| 66 | + <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
| 67 | + <img src="../monitor/api/static/cli4.png" style="width:100%; height:100%; object-fit:contain;" /> |
| 68 | + </div> |
| 69 | + <div style="flex:0 0 100%; scroll-snap-align:center; aspect-ratio:1624/675; display:flex; align-items:center; justify-content:center;"> |
| 70 | + <img src="../monitor/api/static/cli5.png" style="width:100%; height:100%; object-fit:contain;" /> |
| 71 | + </div> |
| 72 | + </div> |
| 73 | +</details> |
| 74 | + |
| 75 | +### ¿Por qué usar esto? |
| 76 | + |
| 77 | +- **Ligero**: Bajo consumo de recursos. |
| 78 | +- **Versátil**: Funciona como herramienta de línea de comandos, o como un completo tablero web. |
| 79 | +- **Orientado a la administración**: Incluye características como **límites de VRAM** (cierre automático de procesos que excedan los límites) y **listas de vigilancia**. |
| 80 | +- **Amigable con el desarrollador**: Incorporado en herramientas de prueba y simulación (GEMM, física de partículas) para validar la estabilidad del sistema. |
| 81 | + |
| 82 | +--- |
| 83 | + |
| 84 | +## Características |
| 85 | + |
| 86 | +- **Monitoreo en tiempo real**: |
| 87 | + - Métricas detalladas de GPU (utilización, VRAM, potencia, temperatura). |
| 88 | + - Métricas del sistema (CPU, RAM, etc.). |
| 89 | + |
| 90 | +- **Administración y aplicación de políticas**: |
| 91 | + - **Límites de VRAM**: Establecer límites duros de uso de VRAM por GPU. |
| 92 | + - **Cierre automático**: Automatizar el cierre de procesos que violen las políticas de VRAM (solo para administradores). |
| 93 | + - **Listas de vigilancia**: Monitorear PIDs o nombres de procesos específicos. |
| 94 | + |
| 95 | +- **Pruebas y simulación**: |
| 96 | + - **Pruebas de estrés**: Configurar cargas de trabajo GEMM para probar el rendimiento térmico y la estabilidad. |
| 97 | + - **Simulación visual**: Simulación interactiva de física de partículas para visualizar la carga de GPU. |
| 98 | + |
| 99 | +--- |
| 100 | + |
| 101 | +## Roadmap y trabajo futuro |
| 102 | + |
| 103 | +Las contribuciones son bienvenidas. Los puntos principales a cubrir serían: |
| 104 | + |
| 105 | +- **Soporte multi-GPU**: Mejorar el manejo de configuraciones multi-tarjeta y topologías NVLink. |
| 106 | +- **Contenedorización**: Soporte oficial para Docker para una fácil implementación en entornos contenedorizados. |
| 107 | +- **Acceso remoto**: Integración de túneles SSH y gestión remota segura. |
| 108 | +- **Plataforma cruzada**: |
| 109 | + - [ ] Soporte para Ubuntu/Debian (foco en Linux). |
| 110 | + - [ ] Soporte para Apple Silicon (monitoreo). |
| 111 | +- **Independencia de hardware**: |
| 112 | + - [ ] Soporte para AMD ROCm. |
| 113 | + - [ ] Soporte para Intel Arc. |
| 114 | +- ~~**Documentación multilingüe**: Apoyar los lenguajes de documentación más populares de GitHub.~~ |
| 115 | + |
| 116 | +Consulte [CONTRIBUTING.md](../CONTRIBUTING.md) para saber cómo involucrarse. |
| 117 | + |
| 118 | +--- |
| 119 | + |
| 120 | +## Requisitos |
| 121 | + |
| 122 | +- **OS**: Windows 10/11 |
| 123 | +- **Python**: 3.10+ |
| 124 | +- **Hardware**: GPU NVIDIA con controladores instalados. |
| 125 | +- **CUDA**: Versión 12.x (Requerida estrictamente para las características de benchmarking/simulación). |
| 126 | + - *Nota: Si CUDA 12.x no se detecta, las características de benchmarking se desactivarán.* |
| 127 | + |
| 128 | +--- |
| 129 | + |
| 130 | +## Instalación |
| 131 | + |
| 132 | +La herramienta admite una instalación modular para adaptarse a sus necesidades: |
| 133 | + |
| 134 | +### 1. Mínimo (solo CLI) |
| 135 | + |
| 136 | +Ideal para servidores sin cabeza o monitoreo en segundo plano. |
| 137 | + |
| 138 | +- Interfaz de línea de comandos. |
| 139 | +- Métricas básicas del sistema y GPU. |
| 140 | + |
| 141 | +### 2. Estándar (CLI + Tablero web) |
| 142 | + |
| 143 | +Ideal para la mayoría de los usuarios. |
| 144 | + |
| 145 | +- Incluye el tablero web. |
| 146 | +- Puntos finales de API REST. |
| 147 | +- Gráficos en tiempo real. |
| 148 | +- Pero sin simulación ni benchmarking. |
| 149 | + |
| 150 | +### 3. Completo (Estándar + Visualización) |
| 151 | + |
| 152 | +Ideal para el desarrollo y las pruebas de estrés. |
| 153 | + |
| 154 | +- Incluye simulación. |
| 155 | +- Dependencias de PyTorch/CuPy para benchmarking. |
| 156 | + |
| 157 | +### Inicio rápido |
| 158 | + |
| 159 | +1. **Descargar** la última versión o clonar el repositorio. |
| 160 | +2. **Ejecutar el script de configuración**: |
| 161 | + |
| 162 | + ```powershell |
| 163 | + .\setup.ps1 |
| 164 | + ``` |
| 165 | + |
| 166 | +3. **Iniciar**: |
| 167 | + |
| 168 | +```powershell |
| 169 | +# Iniciar el tablero web (Estándar/Completo) |
| 170 | +python health_monitor.py web |
| 171 | +
|
| 172 | +# Iniciar la CLI |
| 173 | +python health_monitor.py cli |
| 174 | +``` |
0 commit comments