माईजीपीयू: एक हल्का जीपीयू प्रबंधन उपयोगी उपकरण: एक सुंदर वेब डैशबोर्ड के साथ एक संक्षिप्त
nvidia-smiवैपर।
- लाइटवेट: न्यूनतम रिसोर्स फुटप्रिंट।
- फ्लेक्सिबल: CLI टूल के रूप में चलाएँ, या एक पूर्ण सुविधा वाला वेब डैशबोर्ड।
- एडमिन-सेंट्रिक: VRAM एनफोर्समेंट (सीमाओं से अधिक प्रक्रियाओं को स्वचालित रूप से बंद करना) और वॉचलिस्ट्स जैसी सुविधाएँ शामिल हैं।
- डेवलपर-फ्रेंडली: जेएमएम (GEMM) और पार्टिकल फिजिक्स जैसे इनबिल्ट बेंचमार्किंग और स्ट्रेस टेस्टिंग टूल्स के साथ सिस्टम स्थिरता का मूल्यांकन करने के लिए।
-
रीयल-टाइम निगरानी:
- विस्तृत GPU मेट्रिक्स (उपयोग, VRAM, शक्ति, तापमान)।
- सिस्टम मेट्रिक्स (CPU, RAM आदि)।
-
प्रशासन और प्रवर्तन:
- VRAM कैप्स: प्रत्येक GPU के लिए VRAM उपयोग पर कठोर सीमाएँ निर्धारित करें।
- स्वचालित समाप्ति: VRAM नीतियों का उल्लंघन करने वाली प्रक्रियाओं को स्वचालित रूप से समाप्त करें (केवल प्रशासक के लिए)।
- वॉचलिस्ट: विशिष्ट PIDs या प्रक्रिया नामों की निगरानी करें।
-
बेंचमार्किंग और सिमुलेशन:
- स्ट्रेस टेस्टिंग: थर्मल थ्रॉटलिंग और स्थिरता का परीक्षण करने के लिए कॉन्फ़िगरेबल GEMM वर्कलोड।
- विज़ुअल सिमुलेशन: इंटरैक्टिव 3D कण भौतिकी सिमुलेशन के माध्यम से GPU लोड का दृश्यात्मक प्रदर्शन।
योगदान का स्वागत है! मुख्य भविष्य के बिंदुओं को कवर करना होगा:
-
बहु-GPU समर्थन: बहु-कार्ड सेटअप और NVLink टॉपोलॉजी के लिए बढ़िया हैंडलिंग।
-
कंटेनराइजेशन: आधिकारिक Docker समर्थन कंटेनराइज्ड वातावरणों में आसान तैनाती के लिए।
-
दूरस्थ एक्सेस: SSH टनलिंग इंटीग्रेशन और सुरक्षित दूरस्थ प्रबंधन।
-
क्रॉस-प्लेटफ़ॉर्म:
- लिनक्स समर्थन (यूबंटू/डेबियन पर ध्यान केंद्रित)।
- मैकओएस समर्थन (एपल सिलिकॉन निगरानी)।
-
हार्डवेयर-स्वतंत्र:
- AMD ROCm समर्थन।
- इंटेल आर्क समर्थन।
-
बहु-भाषा दस्तावेज़ीकरण: सबसे लोकप्रिय GitHub भाषाओं का समर्थन।
CONTRIBUTING.md देखें कि कैसे शामिल हों।
- ऑपरेटिंग सिस्टम: विंडोज 10/11, लिनक्स, मैकओएस
- पायथन: 3.10+
- हार्डवेयर: NVIDIA GPU (सभी प्लेटफार्मों पर), Apple Silicon (मैकओएस) या केवल CPU.
- CUDA: टूलकिट 12.x (NVIDIA पर बेंचमार्किंग/सिमुलेशन के लिए अनुशंसित)।
- नोट: यदि CUDA/MPS नहीं मिला जाता है, तो कुछ बेंचमार्किंग फीचर्स अक्षम हो सकते हैं।
यह उपकरण आपकी ज़रूरतों के अनुरूप फिट होने के लिए मॉड्यूलर स्थापना का समर्थन करता है:
हेडलेस सर्वर या बैकग्राउंड मॉनिटरिंग के लिए सबसे अच्छा।
- कमांड-लाइन इंटरफ़ेस।
- बुनियादी सिस्टम/जीपीयू मेट्रिक्स।
अधिकांश उपयोगकर्ताओं के लिए सबसे अच्छा।
- वेब डैशबोर्ड शामिल है।
- REST API एंडपॉइंट्स।
- रीयल-टाइम चार्ट्स।
- लेकिन न तो सिमुलेशन न ही बेंचमार्किंग।
विकास और तनाव परीक्षण के लिए सबसे अच्छा।
- सिमुलेशन शामिल है।
- PyTorch/CuPy निर्भरताएँ बेंचमार्किंग के लिए।
-
डाउनलोड करें या रिपॉजिटरी क्लोन करें।
-
सेटअप चलाएँ:
विंडोज़:
भाईया, अब सेटअप चला लीजिए।
.\setup.ps1ब्रदरजी, लिनक्स/मैकओएस के लिए:
chmod +x setup.sh
./setup.sh(चार्मेक्स +x setup.sh करें और फिर setup.sh चलाएँ)
लॉन्च:
# वेब डैशबोर्ड (स्टैंडर्ड/फुल) शुरू करें
python health_monitor.py web
# CLI शुरू करें
python health_monitor.py cliकृपया LICENSE को देखें विस्तृत जानकारी के लिए।









