Skip to content

Latest commit

 

History

History
196 lines (142 loc) · 11.5 KB

File metadata and controls

196 lines (142 loc) · 11.5 KB
MyGPU logo

माईजीपीयू: एक हल्का जीपीयू प्रबंधन उपयोगी उपकरण: एक सुंदर वेब डैशबोर्ड के साथ एक संक्षिप्त nvidia-smi वैपर।

License Python Version Platform cuda 12.x

गैलरी

वेब डैशबोर्ड
CLI

क्यों इसका उपयोग करें?

  • लाइटवेट: न्यूनतम रिसोर्स फुटप्रिंट।
  • फ्लेक्सिबल: CLI टूल के रूप में चलाएँ, या एक पूर्ण सुविधा वाला वेब डैशबोर्ड।
  • एडमिन-सेंट्रिक: VRAM एनफोर्समेंट (सीमाओं से अधिक प्रक्रियाओं को स्वचालित रूप से बंद करना) और वॉचलिस्ट्स जैसी सुविधाएँ शामिल हैं।
  • डेवलपर-फ्रेंडली: जेएमएम (GEMM) और पार्टिकल फिजिक्स जैसे इनबिल्ट बेंचमार्किंग और स्ट्रेस टेस्टिंग टूल्स के साथ सिस्टम स्थिरता का मूल्यांकन करने के लिए।

विशेषताएँ

  • रीयल-टाइम निगरानी:

    • विस्तृत GPU मेट्रिक्स (उपयोग, VRAM, शक्ति, तापमान)।
    • सिस्टम मेट्रिक्स (CPU, RAM आदि)।
  • प्रशासन और प्रवर्तन:

    • VRAM कैप्स: प्रत्येक GPU के लिए VRAM उपयोग पर कठोर सीमाएँ निर्धारित करें।
    • स्वचालित समाप्ति: VRAM नीतियों का उल्लंघन करने वाली प्रक्रियाओं को स्वचालित रूप से समाप्त करें (केवल प्रशासक के लिए)।
    • वॉचलिस्ट: विशिष्ट PIDs या प्रक्रिया नामों की निगरानी करें।
  • बेंचमार्किंग और सिमुलेशन:

    • स्ट्रेस टेस्टिंग: थर्मल थ्रॉटलिंग और स्थिरता का परीक्षण करने के लिए कॉन्फ़िगरेबल GEMM वर्कलोड।
    • विज़ुअल सिमुलेशन: इंटरैक्टिव 3D कण भौतिकी सिमुलेशन के माध्यम से GPU लोड का दृश्यात्मक प्रदर्शन।

रोडमैप और भविष्य का काम

योगदान का स्वागत है! मुख्य भविष्य के बिंदुओं को कवर करना होगा:

  • बहु-GPU समर्थन: बहु-कार्ड सेटअप और NVLink टॉपोलॉजी के लिए बढ़िया हैंडलिंग।

  • कंटेनराइजेशन: आधिकारिक Docker समर्थन कंटेनराइज्ड वातावरणों में आसान तैनाती के लिए।

  • दूरस्थ एक्सेस: SSH टनलिंग इंटीग्रेशन और सुरक्षित दूरस्थ प्रबंधन।

  • क्रॉस-प्लेटफ़ॉर्म:

    • लिनक्स समर्थन (यूबंटू/डेबियन पर ध्यान केंद्रित)।
    • मैकओएस समर्थन (एपल सिलिकॉन निगरानी)।
  • हार्डवेयर-स्वतंत्र:

    • AMD ROCm समर्थन।
    • इंटेल आर्क समर्थन।
  • बहु-भाषा दस्तावेज़ीकरण: सबसे लोकप्रिय GitHub भाषाओं का समर्थन।

CONTRIBUTING.md देखें कि कैसे शामिल हों।

आवश्यकताएँ

  • ऑपरेटिंग सिस्टम: विंडोज 10/11, लिनक्स, मैकओएस
  • पायथन: 3.10+
  • हार्डवेयर: NVIDIA GPU (सभी प्लेटफार्मों पर), Apple Silicon (मैकओएस) या केवल CPU.
  • CUDA: टूलकिट 12.x (NVIDIA पर बेंचमार्किंग/सिमुलेशन के लिए अनुशंसित)।
    • नोट: यदि CUDA/MPS नहीं मिला जाता है, तो कुछ बेंचमार्किंग फीचर्स अक्षम हो सकते हैं।

स्थापना

यह उपकरण आपकी ज़रूरतों के अनुरूप फिट होने के लिए मॉड्यूलर स्थापना का समर्थन करता है:

1. न्यूनतम (केवल CLI)

हेडलेस सर्वर या बैकग्राउंड मॉनिटरिंग के लिए सबसे अच्छा।

  • कमांड-लाइन इंटरफ़ेस।
  • बुनियादी सिस्टम/जीपीयू मेट्रिक्स।

2. मानक (CLI + वेब यूआई)

अधिकांश उपयोगकर्ताओं के लिए सबसे अच्छा।

  • वेब डैशबोर्ड शामिल है।
  • REST API एंडपॉइंट्स।
  • रीयल-टाइम चार्ट्स।
  • लेकिन न तो सिमुलेशन न ही बेंचमार्किंग।

3. पूर्ण (मानक + दृश्यात्मक)

विकास और तनाव परीक्षण के लिए सबसे अच्छा।

  • सिमुलेशन शामिल है।
  • PyTorch/CuPy निर्भरताएँ बेंचमार्किंग के लिए।

त्वरित शुरुआत

  1. डाउनलोड करें या रिपॉजिटरी क्लोन करें।

  2. सेटअप चलाएँ:

    विंडोज़:

    भाईया, अब सेटअप चला लीजिए।

   .\setup.ps1

ब्रदरजी, लिनक्स/मैकओएस के लिए:

   chmod +x setup.sh
   ./setup.sh

(चार्मेक्स +x setup.sh करें और फिर setup.sh चलाएँ)

लॉन्च:

# वेब डैशबोर्ड (स्टैंडर्ड/फुल) शुरू करें
python health_monitor.py web

# CLI शुरू करें
python health_monitor.py cli

लाइसेंस

Translation

कृपया LICENSE को देखें विस्तृत जानकारी के लिए।