You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
<!-- Bilder passend zuschneiden, um das Rasterlayout beizubehalten -->
10
+
<!-- Verwenden Sie das erste Bild mit einem Seitenverhältnis von 1624x675 für den Slide-Rahmen; die Bilder passen sich mit `object-fit: contain` innerhalb an -->
-**Flexibel**: Verfügbar als CLI-Tool oder voll ausgestattetes Web-Dashboard.
65
-
-**admin-zentriert**: Enthält Funktionen wie VRAM-Enforcementund Watchlists.
49
+
-**Flexibel**: Als CLI-Tool oder als Web-Dashboard einsetzbar.
50
+
-**Admin-zentriert**: Enthält Funktionen wie **VRAM-Enforcement** (Automatische Beendigung von Prozessen, die VRAM-Grenzen überschreiten) und **Watchlists**.
66
51
-**Entwicklerfreundlich**: Integrierte Benchmarking- und Stresstest-Tools (GEMM, Teilchenphysik) zur Validierung der Systemstabilität.
<!-- Utilizar la relación de aspecto 1624x675 para el marco de la diapositiva; las imágenes se ajustan automáticamente con object-fit:contain -->
10
+
<!-- Utiliza la primera imagen con relación de aspecto 1624x675 para el marco de diapositivas; las imágenes se ajustan automáticamente con object-fit:contain -->
-**Versátil**: Funciona como herramienta de línea de comandos, o como un completo panel web.
72
-
-**Orientado a administradores**: Incluye características como **límites de VRAM** (terminación automática de procesos que superen los límites) y **listas de vigilancia**.
73
-
-**Amigable con el desarrollador**: Herramientas integradas para pruebas de estrés y simulación (GEMM, física de partículas).
48
+
-**Ligero**: Pie de contacto mínimo.
49
+
-**Versátil**: Funciona como una herramienta de línea de comandos o un tablero web completo.
50
+
-**Orientado a la administración**: Incluye características como **límites de VRAM** (terminación automática de procesos que superen los límites) y **listas de vigilancia**.
51
+
-**Amigable para desarrolladores**: Herramientas integradas de prueba y simulación (GEMM, Física de Partículas) para validar la estabilidad del sistema.
74
52
75
53
---
76
54
77
-
###Características
55
+
## Características
78
56
79
57
-**Monitoreo en tiempo real**:
80
58
- Métricas detalladas de GPU (utilización, VRAM, potencia, temperatura).
81
59
- Métricas del sistema (CPU, RAM, etc.).
82
60
83
61
-**Administración y aplicación de políticas**:
84
-
-**Límites de VRAM**: Establecer límites duros de uso de VRAM por GPU.
85
-
-**Terminación automática**: Terminar automáticamente los procesos que violen las políticas de VRAM (solo para administradores).
86
-
-**Listas de vigilancia**: Monitorear procesos específicos o nombres de procesos.
62
+
-**Límites de VRAM**: Establezca límites duros en el uso de VRAM por GPU.
63
+
-**Terminación automática**: Termine automáticamente los procesos que violen las políticas de VRAM (solo para administradores).
64
+
-**Listas de vigilancia**: Monitoree PIDs o nombres de procesos específicos.
87
65
88
-
-**Pruebas de estrés y simulación**:
89
-
-**Pruebas de estrés**: Configurar cargas de trabajo GEMM para probar el rendimiento térmico y la estabilidad.
90
-
-**Simulación visual**: Simulación interactiva de física de partículas para visualizar la carga de trabajo de la GPU.
66
+
-**Pruebas y simulación**:
67
+
-**Pruebas de estrés**: Configure cargas de trabajo GEMM configurables para probar el throtting térmico y la estabilidad.
68
+
-**Simulación visual**: Simulación interactiva de física de partículas para visualizar la carga de GPU.
91
69
92
70
---
93
71
94
-
###Roadmap y trabajo futuro
72
+
## Roadmap y trabajo futuro
95
73
96
-
Las contribuciones son bienvenidas. Los puntos principales a cubrir serían:
74
+
¡Las contribuciones son bienvenidas! Los puntos principales a cubrir serían:
97
75
98
-
-**Soporte multi-GPU**: Manejo mejorado para configuraciones multi-tarjeta y topologías NVLink.
99
-
-**Contenedorización**: Soporte oficial para Docker para una fácil implementación en entornos contenedorizados.
100
-
-**Acceso remoto**: Integración de túneles SSH y gestión segura remota.
101
-
-**Plataforma cruzada**:
102
-
-[ ] Soporte para macOS (enfocado en monitoreo de Apple Silicon).
103
-
-**Hardware Agnóstico**:
76
+
-**Soporte para múltiples GPU**: Manejo mejorado para configuraciones de múltiples tarjetas y topologías NVLink.
77
+
-**Contenedorización**: Soporte oficial para Docker para un despliegue fácil en entornos contenedorizados.
78
+
-**Acceso remoto**: Integración de túneles SSH y gestión remota segura.
79
+
-**Compatibilidad multiplataforma**:
80
+
-[ ] Soporte para Ubuntu/Debian (foco en Linux).
81
+
-[ ] Soporte para Apple Silicon (monitoreo de física de partículas).
82
+
-**Independencia de hardware**:
104
83
-[ ] Soporte para AMD ROCm.
105
84
-[ ] Soporte para Intel Arc.
106
-
-~~**Documentación multilingüe**: Apoyar los lenguajes de GitHub más populares.~~
85
+
-~~**Documentación multilingüe**: Apoyo a los lenguajes más populares de GitHub.~~
107
86
108
87
Consulte [CONTRIBUTING.md](../CONTRIBUTING.md) para saber cómo involucrarse.
109
88
110
89
---
111
90
112
-
###Requisitos
91
+
## Requisitos
113
92
114
93
-**OS**: Windows 10/11
115
94
-**Python**: 3.10+
116
-
-**Hardware**: GPU de NVIDIA con controladores instalados.
117
-
-**CUDA**: Versión 12.x (requerida estrictamente para características de benchmarking/simulación).
118
-
-*Nota: Si CUDA 12.x no se detecta, las características de benchmarking se desactivarán.*
95
+
-**Hardware**: GPU NVIDIA con controladores instalados.
96
+
-**CUDA**: Toolkit 12.x (Requerido estrictamente para características de prueba y simulación).
97
+
-*Nota: Si CUDA 12.x no se detecta, las características de prueba y simulación se desactivarán.*
119
98
120
99
---
121
100
122
-
###Instalación
101
+
## Instalación
123
102
124
103
La herramienta admite una instalación modular para adaptarse a sus necesidades:
125
104
@@ -130,37 +109,37 @@ Ideal para servidores sin cabeza o monitoreo en segundo plano.
130
109
- Interfaz de línea de comandos.
131
110
- Métricas básicas del sistema y la GPU.
132
111
133
-
### 2. Estándar (CLI + Panel web)
112
+
### 2. Estándar (CLI + Tablero web)
134
113
135
114
Ideal para la mayoría de los usuarios.
136
115
137
-
- Incluye el panel web.
116
+
- Incluye el tablero web.
138
117
- Puntos finales de API REST.
139
118
- Gráficos en tiempo real.
140
-
- Pero sin simulación ni benchmarking.
119
+
- Pero sin simulación ni pruebas.
141
120
142
121
### 3. Completo (Estándar + Visualización)
143
122
144
123
Ideal para desarrollo y pruebas de estrés.
145
124
146
125
- Incluye simulación.
147
-
- Dependencias de PyTorch/CuPy para benchmarking.
126
+
- Dependencias de PyTorch/CuPy para pruebas de estrés.
148
127
149
128
### Inicio rápido
150
129
151
-
1.**Descargar** la última versión o clonar el repositorio.
152
-
2.**Ejecutar configuración**:
130
+
1.**Descargue** la última versión o clone el repositorio.
0 commit comments