You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
<!-- Erstes Bild mit 1624x675 Pixeln als Rahmen für die Folie; Bilder passen sich mit object-fit:contain innerhalb an -->
16
+
<!-- Verwenden Sie das erste Bild mit einem Seitenverhältnis von 1624x675 für den Folienrahmen; Bilder passen sich mit `object-fit:contain` automatisch an -->
-**Flexibel**: Als CLI-Tool oder als vollständiges Web-Dashboard ausführbar.
56
56
-**admin-zentriert**: Enthält Funktionen wie **VRAM-Enforcement** (Automatische Beendigung von Prozessen, die VRAM-Richtlinien verletzen) und **Watchlists**.
57
57
-**entwicklerfreundlich**: Integrierte Benchmarking- und Stresstest-Tools (GEMM, Teilchenphysik) zur Validierung der Systemstabilität.
<!-- Utilizar la primera imagen con relación de aspecto 1624x675 para el marco de diapositiva; las imágenes se ajustan automáticamente con `object-fit: contain` -->
30
+
<!-- Utilizar la relación de aspecto 1624x675 para las imágenes del carrusel -->
-**Ligero**: Pie de contacto mínimo con los recursos.
55
-
-**Flexible**: Funciona como una herramienta de línea de comandos o un tablero web completo.
56
-
-**Orientado a administradores**: Incluye características como **restricciones de VRAM** (terminación automática de procesos que superen los límites) y **listas de vigilancia**.
57
-
-**Amigable con los desarrolladores**: Herramientas integradas de prueba y simulación (GEMM, Física de Partículas) para validar la estabilidad del sistema.
70
+
-**Ligero**: Pie de contacto mínimo.
71
+
-**Versátil**: Funciona como herramienta de línea de comandos, o como un panel web completo.
72
+
-**Orientado a la administración**: Incluye características como **límites de VRAM** (terminación automática de procesos que superen los límites) y **listas de vigilancia**.
73
+
-**Amigable con el desarrollador**: Herramientas integradas para pruebas de estrés y simulación (GEMM, física de partículas).
58
74
59
75
---
60
76
61
-
## Características
77
+
###Características
62
78
63
79
-**Monitoreo en tiempo real**:
64
80
- Métricas detalladas de GPU (utilización, VRAM, potencia, temperatura).
65
81
- Métricas del sistema (CPU, RAM, etc.).
66
82
67
83
-**Administración y aplicación de políticas**:
68
-
-**Límites de VRAM**: Establecer límites duros en el uso de VRAM por GPU.
69
-
-**Terminación automática**: Terminar automáticamente los procesos que violen las políticas de VRAM (solo para administradores).
70
-
-**Listas de vigilancia**: Monitorear PIDs o nombres de procesos específicos.
84
+
-**Límites de VRAM**: Establezca límites duros de uso de VRAM por GPU.
85
+
-**Terminación automática**: Termine automáticamente los procesos que violen las políticas de VRAM (solo para administradores).
86
+
-**Listas de vigilancia**: Monitoree procesos específicos o nombres.
71
87
72
-
-**Pruebas y simulación**:
73
-
-**Pruebas de estrés**: Configurar cargas de trabajo GEMM para probar el throtting térmico y la estabilidad.
74
-
-**Simulación visual**: Simulación interactiva de física de partículaspara visualizar la carga de GPU.
88
+
-**Simulación y pruebas de estrés**:
89
+
-**Pruebas de estrés**: Configure cargas de trabajo GEMM configurables para probar la estabilidad y el rendimiento térmico.
90
+
-**Simulación de física de partículas**: Simulación interactiva para visualizar la carga de trabajo de la GPU.
75
91
76
92
---
77
93
78
-
## Roadmap y trabajo futuro
94
+
###Roadmap y trabajo futuro
79
95
80
-
¡Las contribuciones son bienvenidas! Los puntos futuros principales a cubrir serían:
96
+
Las contribuciones son bienvenidas. Los puntos principales a cubrir serían:
81
97
82
98
-**Soporte multi-GPU**: Manejo mejorado para configuraciones multi-tarjeta y topologías NVLink.
83
-
-**Contenedorización**: Soporte oficial para Docker para un despliegue fácil en entornos contenedorizados.
99
+
-**Contenedorización**: Soporte oficial para Docker para una implementación fácil en entornos contenedorizados.
84
100
-**Acceso remoto**: Integración de túneles SSH y gestión remota segura.
85
101
-**Plataforma cruzada**:
86
-
-[ ] Soporte para Ubuntu/Debian (enfocado en Linux).
87
-
-[ ] Soporte para Apple Silicon (monitoreo).
102
+
-[ ] Soporte para macOS (Apple Silicon).
88
103
-**Independencia de hardware**:
89
104
-[ ] Soporte para AMD ROCm.
90
105
-[ ] Soporte para Intel Arc.
@@ -94,17 +109,17 @@ Consulte [CONTRIBUTING.md](../CONTRIBUTING.md) para saber cómo involucrarse.
94
109
95
110
---
96
111
97
-
## Requisitos
112
+
###Requisitos
98
113
99
114
-**OS**: Windows 10/11
100
115
-**Python**: 3.10+
101
116
-**Hardware**: GPU NVIDIA con controladores instalados.
102
-
-**CUDA**: Toolkit 12.x (Requerido estrictamente para las características de prueba y simulación).
103
-
-*Nota: Si CUDA 12.x no se detecta, las características de prueba y simulación se desactivarán.*
117
+
-**CUDA**: CUDA Toolkit 12.x (Requerido estrictamente para las características de simulación y pruebas de estrés).
118
+
-*Nota: Si CUDA 12.x no se detecta, las características de simulación y benchmarking se desactivarán.*
104
119
105
120
---
106
121
107
-
## Instalación
122
+
###Instalación
108
123
109
124
La herramienta admite una instalación modular para adaptarse a sus necesidades:
110
125
@@ -115,36 +130,37 @@ Ideal para servidores sin cabeza o monitoreo en segundo plano.
115
130
- Interfaz de línea de comandos.
116
131
- Métricas básicas del sistema y la GPU.
117
132
118
-
### 2. Estándar (CLI + Tablero web)
133
+
### 2. Estándar (CLI + Panel web)
119
134
120
135
Ideal para la mayoría de los usuarios.
121
136
122
-
- Incluye el tablero web.
137
+
- Incluye el panel web.
123
138
- Puntos finales de API REST.
124
139
- Gráficos en tiempo real.
140
+
- Pero sin simulación ni benchmarking.
125
141
126
142
### 3. Completo (Estándar + Visualización)
127
143
128
144
Ideal para desarrollo y pruebas de estrés.
129
145
130
146
- Incluye simulación.
131
-
- Dependencias de PyTorch/CuPy para pruebas de rendimiento.
147
+
- Dependencias de PyTorch/CuPy para benchmarking.
132
148
133
149
### Inicio rápido
134
150
135
-
1.**Descargar** la última versión o clonar el repositorio.
136
-
2.**Ejecutar configuración**:
151
+
1.**Descargue** la última versión o clone el repositorio.
0 commit comments