Skip to content

Commit 3788619

Browse files
committed
Added hindi translation of all Vizualization base README
1 parent 6a4c5f0 commit 3788619

File tree

1 file changed

+191
-0
lines changed
  • 3-Data-Visualization/10-visualization-distributions/translations

1 file changed

+191
-0
lines changed
Lines changed: 191 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,191 @@
1+
# विज़ुअलाइज़िंग वितरण
2+
3+
|![ सकेटच्नोते करने वाला [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/10-Visualizing-Distributions.png)|
4+
|:---:|
5+
| विज़ुअलाइज़िंग वितरण - _सकेटच्नोते करने वाला [@nitya](https://twitter.com/nitya)_ |
6+
7+
In the previous lesson, you learned some interesting facts about a dataset about the birds of Minnesota. You found some erroneous data by visualizing outliers and looked at the differences between bird categories by their maximum length.
8+
9+
## [प्री-लेक्चर क्विज](https://red-water-0103e7a0f.azurestaticapps.net/quiz/18)
10+
## पक्षियों के डेटासेट का अन्वेषण करें
11+
12+
डेटा में खुदाई करने का दूसरा तरीका इसके वितरण को देखना है, या डेटा को एक अक्ष के साथ कैसे व्यवस्थित किया जाता है। शायद, उदाहरण के लिए, आप इस डेटासेट के सामान्य वितरण के बारे में जानना चाहेंगे, मिनेसोटा के पक्षियों के लिए अधिकतम पंख या अधिकतम शरीर द्रव्यमान।
13+
14+
आइए इस डेटासेट में डेटा के वितरण के बारे में कुछ तथ्यों की खोज करें। इस पाठ फ़ोल्डर के मूल में _नोटबुक.आईपीएनबी_ फ़ाइल में, पांडा, मैटप्लोटलिब और अपना डेटा आयात करें:
15+
16+
```python
17+
import pandas as pd
18+
import matplotlib.pyplot as plt
19+
birds = pd.read_csv('../../data/birds.csv')
20+
birds.head()
21+
```
22+
23+
सामान्य तौर पर, आप देख सकते हैं कि स्कैटर प्लॉट का उपयोग करके डेटा कैसे वितरित किया जाता है, जैसा कि हमने पिछले पाठ में किया था:
24+
25+
```python
26+
birds.plot(kind='scatter',x='MaxLength',y='Order',figsize=(12,8))
27+
28+
plt.title('Max Length per Order')
29+
plt.ylabel('Order')
30+
plt.xlabel('Max Length')
31+
32+
plt.show()
33+
```
34+
यह प्रति पक्षी क्रम में शरीर की लंबाई के सामान्य वितरण का एक सिंहावलोकन देता है, लेकिन यह सही वितरण प्रदर्शित करने का सबसे अच्छा तरीका नहीं है। उस कार्य को आमतौर पर हिस्टोग्राम बनाकर नियंत्रित किया जाता है।
35+
## हिस्टोग्राम के साथ काम करना
36+
37+
माटप्लोटलिब हिस्टोग्राम का उपयोग करके डेटा वितरण की कल्पना करने के लिए बहुत अच्छे तरीके प्रदान करता है। इस प्रकार का चार्ट एक बार चार्ट की तरह होता है जहां वितरण को बार के ऊपर और नीचे के माध्यम से देखा जा सकता है। हिस्टोग्राम बनाने के लिए, आपको संख्यात्मक डेटा की आवश्यकता होती है। हिस्टोग्राम बनाने के लिए, आप हिस्टोग्राम के लिए 'इतिहास' के रूप में परिभाषित एक चार्ट तैयार कर सकते हैं। यह चार्ट संख्यात्मक डेटा की संपूर्ण डेटासेट की श्रेणी के लिए MaxBodyMass के वितरण को दर्शाता है। डेटा की सरणी को विभाजित करके इसे छोटे डिब्बे में दिया जाता है, यह डेटा के मूल्यों के वितरण को प्रदर्शित कर सकता है:
38+
39+
```python
40+
birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
41+
plt.show()
42+
```
43+
![संपूर्ण डेटासेट पर वितरण](images/dist1.png)
44+
45+
जैसा कि आप देख सकते हैं, इस डेटासेट में 400+ पक्षी अपने मैक्स बॉडी मास के लिए 2000 से कम की सीमा में आते हैं। `बिन्स` पैरामीटर को अधिक संख्या में बदलकर डेटा में अधिक जानकारी प्राप्त करें, जैसे कुछ 30:
46+
47+
```python
48+
birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
49+
plt.show()
50+
```
51+
![बड़े डिब्बे परम के साथ संपूर्ण डेटासेट पर वितरण](images/dist2.png)
52+
53+
यह चार्ट वितरण को कुछ अधिक बारीक तरीके से दिखाता है। यह सुनिश्चित करके कि आप केवल एक दी गई सीमा के भीतर डेटा का चयन करते हैं, बाईं ओर कम तिरछा एक चार्ट बनाया जा सकता है:
54+
55+
केवल उन पक्षियों को प्राप्त करने के लिए अपना डेटा फ़िल्टर करें जिनके शरीर का द्रव्यमान 60 से कम है, और 40 `डिब्बे` दिखाएं:
56+
57+
```python
58+
filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
59+
filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
60+
plt.show()
61+
```
62+
![फ़िल्टर्ड हिस्टोग्राम](images/dist3.png)
63+
64+
✅ कुछ अन्य फ़िल्टर और डेटा बिंदु आज़माएं। डेटा का पूरा वितरण देखने के लिए, लेबल किए गए वितरण दिखाने के लिए `['मैक्सबॉडीमास']` फ़िल्टर को हटा दें।
65+
66+
हिस्टोग्राम भी कोशिश करने के लिए कुछ अच्छे रंग और लेबलिंग संवर्द्धन प्रदान करता है:
67+
68+
दो वितरणों के बीच संबंध की तुलना करने के लिए एक 2डी हिस्टोग्राम बनाएं। आइए `मैक्सबॉडीमास` बनाम `अधिकतम लंबाई` की तुलना करें। माटप्लोटलिब चमकीले रंगों का उपयोग करके अभिसरण दिखाने के लिए एक अंतर्निहित तरीका प्रदान करता है:
69+
70+
```python
71+
x = filteredBirds['MaxBodyMass']
72+
y = filteredBirds['MaxLength']
73+
74+
fig, ax = plt.subplots(tight_layout=True)
75+
hist = ax.hist2d(x, y)
76+
```
77+
एक विशेष रूप से मजबूत अभिसरण बिंदु के साथ, एक अपेक्षित अक्ष के साथ इन दो तत्वों के बीच एक अपेक्षित सहसंबंध प्रतीत होता है:
78+
79+
![2डी प्लॉट](images/2D.png)
80+
81+
संख्यात्मक डेटा के लिए हिस्टोग्राम डिफ़ॉल्ट रूप से अच्छी तरह से काम करते हैं। क्या होगा यदि आपको टेक्स्ट डेटा के अनुसार वितरण देखने की आवश्यकता है?
82+
## टेक्स्ट डेटा का उपयोग करके वितरण के लिए डेटासेट का अन्वेषण करें
83+
84+
इस डेटासेट में पक्षी श्रेणी और उसके जीनस, प्रजातियों और परिवार के साथ-साथ इसके संरक्षण की स्थिति के बारे में अच्छी जानकारी भी शामिल है। आइए इस संरक्षण जानकारी में खुदाई करें। पक्षियों का वितरण उनकी संरक्षण स्थिति के अनुसार क्या है?
85+
86+
> ✅ डेटासेट में, संरक्षण की स्थिति का वर्णन करने के लिए कई समरूपों का उपयोग किया जाता है। ये एक्रोनिम्स [IUCN रेड लिस्ट कैटेगरी](https://www.iucnredlist.org/) से आते हैं, जो एक संगठन है जो प्रजातियों की स्थिति को सूचीबद्ध करता है।
87+
>
88+
> - सीआर: गंभीर रूप से संकटग्रस्त
89+
> - एन: लुप्तप्राय
90+
> - पूर्व: विलुप्त
91+
> - एलसी: कम से कम चिंता
92+
> - एनटी: खतरे के पास
93+
> - वीयू: कमजोर
94+
95+
ये टेक्स्ट-आधारित मान हैं इसलिए आपको हिस्टोग्राम बनाने के लिए एक ट्रांसफ़ॉर्म करना होगा। फ़िल्टर्ड बर्ड्स डेटाफ़्रेम का उपयोग करते हुए, इसके न्यूनतम विंगस्पैन के साथ-साथ इसकी संरक्षण स्थिति प्रदर्शित करें। क्या देखती है?
96+
97+
```python
98+
x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan']
99+
x2 = filteredBirds.loc[filteredBirds.ConservationStatus=='CR', 'MinWingspan']
100+
x3 = filteredBirds.loc[filteredBirds.ConservationStatus=='EN', 'MinWingspan']
101+
x4 = filteredBirds.loc[filteredBirds.ConservationStatus=='NT', 'MinWingspan']
102+
x5 = filteredBirds.loc[filteredBirds.ConservationStatus=='VU', 'MinWingspan']
103+
x6 = filteredBirds.loc[filteredBirds.ConservationStatus=='LC', 'MinWingspan']
104+
105+
kwargs = dict(alpha=0.5, bins=20)
106+
107+
plt.hist(x1, **kwargs, color='red', label='Extinct')
108+
plt.hist(x2, **kwargs, color='orange', label='Critically Endangered')
109+
plt.hist(x3, **kwargs, color='yellow', label='Endangered')
110+
plt.hist(x4, **kwargs, color='green', label='Near Threatened')
111+
plt.hist(x5, **kwargs, color='blue', label='Vulnerable')
112+
plt.hist(x6, **kwargs, color='gray', label='Least Concern')
113+
114+
plt.gca().set(title='Conservation Status', ylabel='Max Body Mass')
115+
plt.legend();
116+
```
117+
118+
![विंगस्पैन और संरक्षण संयोजन](images/histogram-conservation.png)
119+
120+
न्यूनतम पंखों की अवधि और संरक्षण की स्थिति के बीच कोई अच्छा संबंध प्रतीत नहीं होता है। इस पद्धति का उपयोग करके डेटासेट के अन्य तत्वों का परीक्षण करें। आप अलग-अलग फ़िल्टर भी आज़मा सकते हैं। क्या आप कोई सहसंबंध पाते हैं?
121+
## घनत्व भूखंड
122+
123+
आपने देखा होगा कि अब तक हमने जिन आयतचित्रों को देखा है वे 'चरणबद्ध' हैं और एक चाप में सुचारू रूप से प्रवाहित नहीं होते हैं। एक आसान घनत्व चार्ट दिखाने के लिए, आप एक घनत्व प्लॉट आज़मा सकते हैं।
124+
125+
घनत्व वाले भूखंडों के साथ काम करने के लिए, अपने आप को एक नई प्लॉटिंग लाइब्रेरी से परिचित कराएं, [सीबॉर्न](https://seaborn.pydata.org/generated/seaborn.kdeplot.html).
126+
127+
सीबॉर्न लोड हो रहा है, एक बुनियादी घनत्व प्लॉट आज़माएं:
128+
129+
```python
130+
import seaborn as sns
131+
import matplotlib.pyplot as plt
132+
sns.kdeplot(filteredBirds['MinWingspan'])
133+
plt.show()
134+
```
135+
![घनत्व प्लॉट](images/density1.png)
136+
137+
आप देख सकते हैं कि न्यूनतम विंगस्पैन डेटा के लिए प्लॉट पिछले वाले को कैसे गूँजता है; यह थोड़ा चिकना है। सीबॉर्न के दस्तावेज़ीकरण के अनुसार, "हिस्टोग्राम के सापेक्ष, केडीई एक ऐसे प्लॉट का निर्माण कर सकता है जो कम अव्यवस्थित और अधिक व्याख्या योग्य हो, विशेष रूप से कई वितरणों को चित्रित करते समय। लेकिन इसमें विकृतियों को पेश करने की क्षमता होती है यदि अंतर्निहित वितरण बाध्य है या सुचारू नहीं है। जैसे हिस्टोग्राम, प्रतिनिधित्व की गुणवत्ता भी अच्छे चौरसाई मापदंडों के चयन पर निर्भर करती है।" [स्रोत](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) दूसरे शब्दों में, आउटलेयर हमेशा की तरह आपके चार्ट को खराब व्यवहार करेंगे।
138+
139+
यदि आप अपने द्वारा बनाए गए दूसरे चार्ट में उस दांतेदार मैक्सबॉडीमास लाइन को फिर से देखना चाहते हैं, तो आप इस पद्धति का उपयोग करके इसे फिर से बनाकर इसे बहुत अच्छी तरह से सुचारू कर सकते हैं:
140+
141+
```python
142+
sns.kdeplot(filteredBirds['MaxBodyMass'])
143+
plt.show()
144+
```
145+
![चिकनी बॉडीमास लाइन](images/density2.png)
146+
147+
यदि आप एक चिकनी, लेकिन बहुत चिकनी रेखा नहीं चाहते हैं, तो `bw_adjust` पैरामीटर संपादित करें:
148+
149+
```python
150+
sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
151+
plt.show()
152+
```
153+
![कम चिकनी बॉडीमास लाइन](images/density3.png)
154+
155+
✅ इस प्रकार के प्लॉट और प्रयोग के लिए उपलब्ध मापदंडों के बारे में पढ़ें!
156+
157+
इस प्रकार का चार्ट खूबसूरती से व्याख्यात्मक दृश्य प्रस्तुत करता है। कोड की कुछ पंक्तियों के साथ, उदाहरण के लिए, आप प्रति पक्षी अधिकतम शरीर द्रव्यमान घनत्व दिखा सकते हैं:
158+
159+
```python
160+
sns.kdeplot(
161+
data=filteredBirds, x="MaxBodyMass", hue="Order",
162+
fill=True, common_norm=False, palette="crest",
163+
alpha=.5, linewidth=0,
164+
)
165+
```
166+
167+
![प्रति आदेश बॉडीमास](images/density4.png)
168+
169+
आप एक चार्ट में कई चरों के घनत्व को भी मैप कर सकते हैं। किसी पक्षी की संरक्षण स्थिति की तुलना में उसकी अधिकतम लंबाई और न्यूनतम लंबाई को टेक्स्ट करें:
170+
171+
```python
172+
sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
173+
```
174+
175+
![एकाधिक घनत्व, आरोपित](images/multi.png)
176+
177+
शायद यह शोध करने लायक है कि 'कमजोर' पक्षियों का समूह उनकी लंबाई के अनुसार सार्थक है या नहीं।
178+
179+
## 🚀 चुनौती
180+
181+
हिस्टोग्राम बुनियादी स्कैटरप्लॉट, बार चार्ट या लाइन चार्ट की तुलना में अधिक परिष्कृत प्रकार के चार्ट हैं। हिस्टोग्राम के उपयोग के अच्छे उदाहरण खोजने के लिए इंटरनेट पर खोज करें। उनका उपयोग कैसे किया जाता है, वे क्या प्रदर्शित करते हैं, और किन क्षेत्रों या पूछताछ के क्षेत्रों में उनका उपयोग किया जाता है?
182+
183+
## [व्याख्यान के बाद प्रश्नोत्तरी](https://red-water-0103e7a0f.azurestaticapps.net/quiz/19)
184+
185+
## समीक्षा और स्व अध्ययन
186+
187+
इस पाठ में, आपने Matplotlib का उपयोग किया और अधिक परिष्कृत चार्ट दिखाने के लिए Seaborn के साथ काम करना शुरू किया। सीबॉर्न में `केडीप्लॉट` पर कुछ शोध करें, "एक या अधिक आयामों में निरंतर संभाव्यता घनत्व वक्र"। यह कैसे काम करता है, यह समझने के लिए [दस्तावेज](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) पढ़ें।
188+
189+
## कार्यभार
190+
191+
[अपने कौशल को लागू करें](assignment.md)

0 commit comments

Comments
 (0)