|
| 1 | +# विज़ुअलाइज़िंग अनुपात |
| 2 | + |
| 3 | +| ](../../sketchnotes/11-Visualizing-Proportions.png)| |
| 4 | +|:---:| |
| 5 | +|विज़ुअलाइज़िंग अनुपात - _सकेटच्नोते करने वाला [@nitya](https://twitter.com/nitya)_ | |
| 6 | + |
| 7 | +इस पाठ में, आप अनुपात की कल्पना करने के लिए एक अलग प्रकृति-केंद्रित डेटासेट का उपयोग करेंगे, जैसे कि मशरूम के बारे में दिए गए डेटासेट में कितने अलग-अलग प्रकार के कवक आते हैं। आइए ऑडबोन सूची से प्राप्त डेटासेट का उपयोग करके इन आकर्षक कवक का पता लगाएं, एग्रिकस और लेपियोटा परिवारों में ग्रील्ड मशरूम की 23 प्रजातियों के बारे में विवरण। आप स्वादिष्ट विज़ुअलाइज़ेशन के साथ प्रयोग करेंगे जैसे: |
| 8 | + |
| 9 | +- पाई चार्ट 🥧 |
| 10 | +- डोनट चार्ट 🍩 |
| 11 | +- वफ़ल चार्ट 🧇 |
| 12 | + |
| 13 | + |
| 14 | +> 💡 माइक्रोसॉफ्ट अनुसंधान द्वारा [चार्टिकुलेटर](https://charticulator.com) नामक एक बहुत ही रोचक परियोजना डेटा विज़ुअलाइज़ेशन के लिए एक निःशुल्क ड्रैग एंड ड्रॉप इंटरफ़ेस प्रदान करती है। अपने एक ट्यूटोरियल में वे इस मशरूम डेटासेट का भी उपयोग करते हैं! तो आप एक ही समय में डेटा का पता लगा सकते हैं और पुस्तकालय सीख सकते हैं: [चार्टिकुलेटर ट्यूटोरियल](https://charticulator.com/tutorials/tutorial4.html)। |
| 15 | +
|
| 16 | +## [प्री-लेक्चर क्विज](https://red-water-0103e7a0f.azurestaticapps.net/quiz/20) |
| 17 | + |
| 18 | +## अपने मशरूम को जानें 🍄 |
| 19 | + |
| 20 | +मशरूम बहुत दिलचस्प हैं। आइए उनका अध्ययन करने के लिए एक डेटासेट आयात करें: |
| 21 | + |
| 22 | +```python |
| 23 | +import pandas as pd |
| 24 | +import matplotlib.pyplot as plt |
| 25 | +mushrooms = pd.read_csv('../../data/mushrooms.csv') |
| 26 | +mushrooms.head() |
| 27 | +``` |
| 28 | +विश्लेषण के लिए कुछ महान डेटा के साथ एक तालिका मुद्रित की जाती है: |
| 29 | + |
| 30 | + |
| 31 | +| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat | |
| 32 | +| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- | |
| 33 | +| Poisonous | Convex | Smooth | Brown | Bruises | Pungent | Free | Close | Narrow | Black | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban | |
| 34 | +| Edible | Convex | Smooth | Yellow | Bruises | Almond | Free | Close | Broad | Black | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Grasses | |
| 35 | +| Edible | Bell | Smooth | White | Bruises | Anise | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Meadows | |
| 36 | +| Poisonous | Convex | Scaly | White | Bruises | Pungent | Free | Close | Narrow | Brown | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban | |
| 37 | + |
| 38 | +तुरंत, आप देखते हैं कि सभी डेटा टेक्स्टुअल है। चार्ट में इसका उपयोग करने में सक्षम होने के लिए आपको इस डेटा को परिवर्तित करना होगा। अधिकांश डेटा, वास्तव में, एक वस्तु के रूप में दर्शाया जाता है: |
| 39 | + |
| 40 | +```python |
| 41 | +print(mushrooms.select_dtypes(["object"]).columns) |
| 42 | +``` |
| 43 | + |
| 44 | +आउटपुट है: |
| 45 | + |
| 46 | +```output |
| 47 | +Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor', |
| 48 | + 'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color', |
| 49 | + 'stalk-shape', 'stalk-root', 'stalk-surface-above-ring', |
| 50 | + 'stalk-surface-below-ring', 'stalk-color-above-ring', |
| 51 | + 'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number', |
| 52 | + 'ring-type', 'spore-print-color', 'population', 'habitat'], |
| 53 | + dtype='object') |
| 54 | +``` |
| 55 | +यह डेटा लें और 'वर्ग' कॉलम को एक श्रेणी में बदलें: |
| 56 | + |
| 57 | +```python |
| 58 | +cols = mushrooms.select_dtypes(["object"]).columns |
| 59 | +mushrooms[cols] = mushrooms[cols].astype('category') |
| 60 | +``` |
| 61 | +अब, यदि आप मशरूम डेटा का प्रिंट आउट लेते हैं, तो आप देख सकते हैं कि इसे जहरीले/खाद्य वर्ग के अनुसार श्रेणियों में बांटा गया है: |
| 62 | + |
| 63 | + |
| 64 | +| | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | ... | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat | |
| 65 | +| --------- | --------- | ----------- | --------- | ------- | ---- | --------------- | ------------ | --------- | ---------- | ----------- | --- | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- | |
| 66 | +| class | | | | | | | | | | | | | | | | | | | | | | |
| 67 | +| Edible | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | |
| 68 | +| Poisonous | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | |
| 69 | + |
| 70 | +यदि आप अपने वर्ग श्रेणी लेबल बनाने के लिए इस तालिका में प्रस्तुत क्रम का पालन करते हैं, तो आप एक पाई चार्ट बना सकते हैं: |
| 71 | + |
| 72 | +## Pie! |
| 73 | + |
| 74 | +```python |
| 75 | +labels=['Edible','Poisonous'] |
| 76 | +plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%') |
| 77 | +plt.title('Edible?') |
| 78 | +plt.show() |
| 79 | +``` |
| 80 | +वोइला, मशरूम के इन दो वर्गों के अनुसार इस डेटा के अनुपात को दर्शाने वाला एक पाई चार्ट। लेबल के क्रम को सही करना बहुत महत्वपूर्ण है, विशेष रूप से यहां, इसलिए उस क्रम को सत्यापित करना सुनिश्चित करें जिसके साथ लेबल सरणी बनाई गई है! |
| 81 | + |
| 82 | + |
| 83 | + |
| 84 | +## डोनट्स! |
| 85 | + |
| 86 | +कुछ अधिक नेत्रहीन दिलचस्प पाई चार्ट एक डोनट चार्ट है, जो बीच में एक छेद के साथ एक पाई चार्ट है। आइए इस पद्धति का उपयोग करके हमारे डेटा को देखें। |
| 87 | + |
| 88 | +विभिन्न आवासों पर एक नज़र डालें जहाँ मशरूम उगते हैं: |
| 89 | + |
| 90 | +```python |
| 91 | +habitat=mushrooms.groupby(['habitat']).count() |
| 92 | +habitat |
| 93 | +``` |
| 94 | +यहां, आप अपने डेटा को आवास के आधार पर समूहित कर रहे हैं। 7 सूचीबद्ध हैं, इसलिए उन्हें अपने डोनट चार्ट के लिए लेबल के रूप में उपयोग करें: |
| 95 | + |
| 96 | +```python |
| 97 | +labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood'] |
| 98 | + |
| 99 | +plt.pie(habitat['class'], labels=labels, |
| 100 | + autopct='%1.1f%%', pctdistance=0.85) |
| 101 | + |
| 102 | +center_circle = plt.Circle((0, 0), 0.40, fc='white') |
| 103 | +fig = plt.gcf() |
| 104 | + |
| 105 | +fig.gca().add_artist(center_circle) |
| 106 | + |
| 107 | +plt.title('Mushroom Habitats') |
| 108 | + |
| 109 | +plt.show() |
| 110 | +``` |
| 111 | + |
| 112 | + |
| 113 | + |
| 114 | +यह कोड एक चार्ट और एक केंद्र वृत्त बनाता है, फिर उस केंद्र वृत्त को चार्ट में जोड़ता है। `0.40` को दूसरे मान में बदलकर केंद्र वृत्त की चौड़ाई संपादित करें। |
| 115 | + |
| 116 | +डोनट चार्ट को लेबल बदलने के लिए कई तरह से ट्वीक किया जा सकता है। विशेष रूप से लेबल को पठनीयता के लिए हाइलाइट किया जा सकता है। [दस्तावेज़] (https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut) में और जानें। |
| 117 | + |
| 118 | +अब जबकि आप जानते हैं कि अपने डेटा को कैसे समूहबद्ध करना है और फिर उसे पाई या डोनट के रूप में प्रदर्शित करना है, तो आप अन्य प्रकार के चार्टों को एक्सप्लोर कर सकते हैं। एक वफ़ल चार्ट आज़माएं, जो मात्रा की खोज का एक अलग तरीका है। |
| 119 | +## Waffles! |
| 120 | + |
| 121 | +एक 'वफ़ल' प्रकार का चार्ट मात्राओं को वर्गों के 2डी सरणी के रूप में देखने का एक अलग तरीका है। इस डेटासेट में मशरूम कैप रंगों की विभिन्न मात्राओं को देखने का प्रयास करें। ऐसा करने के लिए, आपको [PyWaffle](https://pypi.org/project/pywaffle/) नामक एक सहायक पुस्तकालय स्थापित करने और Matplotlib का उपयोग करने की आवश्यकता है: |
| 122 | + |
| 123 | +```python |
| 124 | +pip install pywaffle |
| 125 | +``` |
| 126 | + |
| 127 | +समूह के लिए अपने डेटा का एक खंड चुनें: |
| 128 | + |
| 129 | +```python |
| 130 | +capcolor=mushrooms.groupby(['cap-color']).count() |
| 131 | +capcolor |
| 132 | +``` |
| 133 | + |
| 134 | +लेबल बनाकर और फिर अपने डेटा को समूहीकृत करके एक वफ़ल चार्ट बनाएं: |
| 135 | + |
| 136 | +```python |
| 137 | +import pandas as pd |
| 138 | +import matplotlib.pyplot as plt |
| 139 | +from pywaffle import Waffle |
| 140 | + |
| 141 | +data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'], |
| 142 | + 'amount': capcolor['class'] |
| 143 | + } |
| 144 | + |
| 145 | +df = pd.DataFrame(data) |
| 146 | + |
| 147 | +fig = plt.figure( |
| 148 | + FigureClass = Waffle, |
| 149 | + rows = 100, |
| 150 | + values = df.amount, |
| 151 | + labels = list(df.color), |
| 152 | + figsize = (30,30), |
| 153 | + colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"], |
| 154 | +) |
| 155 | +``` |
| 156 | + |
| 157 | +वफ़ल चार्ट का उपयोग करके, आप स्पष्ट रूप से इस मशरूम डेटासेट के कैप रंगों के अनुपात को देख सकते हैं। दिलचस्प बात यह है कि कई हरे-छिपे हुए मशरूम हैं! |
| 158 | + |
| 159 | + |
| 160 | + |
| 161 | +✅ Pywaffle उन चार्ट के भीतर आइकन का समर्थन करता है जो [Font Awesome](https://fontawesome.com/) में उपलब्ध किसी भी आइकन का उपयोग करते हैं। वर्गों के बजाय आइकन का उपयोग करके और भी अधिक रोचक वफ़ल चार्ट बनाने के लिए कुछ प्रयोग करें। |
| 162 | + |
| 163 | +इस पाठ में, आपने अनुपातों की कल्पना करने के तीन तरीके सीखे। सबसे पहले, आपको अपने डेटा को श्रेणियों में समूहित करना होगा और फिर यह तय करना होगा कि डेटा प्रदर्शित करने का सबसे अच्छा तरीका कौन सा है - पाई, डोनट, या वफ़ल। सभी स्वादिष्ट हैं और डेटासेट के तत्काल स्नैपशॉट के साथ उपयोगकर्ता को संतुष्ट करते हैं। |
| 164 | +## 🚀 चुनौती |
| 165 | + |
| 166 | +इन स्वादिष्ट चार्ट को फिर से बनाने का प्रयास करें [चार्टिकुलेटर](https://charticulator.com). |
| 167 | +## [व्याख्यान के बाद प्रश्नोत्तरी](https://red-water-0103e7a0f.azurestaticapps.net/quiz/21) |
| 168 | + |
| 169 | +## समीक्षा और आत्म अध्ययन |
| 170 | + |
| 171 | +कभी-कभी यह स्पष्ट नहीं होता कि पाई, डोनट, या वफ़ल चार्ट का उपयोग कब करना है। इस विषय पर पढ़ने के लिए यहां कुछ लेख दिए गए हैं: |
| 172 | + |
| 173 | +https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart |
| 174 | + |
| 175 | +https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce |
| 176 | + |
| 177 | +https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm |
| 178 | + |
| 179 | +https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402 |
| 180 | + |
| 181 | +इस चिपचिपे निर्णय के बारे में अधिक जानकारी प्राप्त करने के लिए कुछ शोध करें। |
| 182 | +## कार्यभार |
| 183 | + |
| 184 | +[इसे एक्सेल में आज़माएं](assignment.md) |
0 commit comments