You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
|Beziehungen visualisieren - _Sketchnote von [@nitya](https://twitter.com/nitya)_|
15
15
16
-
Im Rahmen unseres naturbezogenen Forschungsfokus wollen wir interessante Visualisierungen entdecken, um die Beziehungen zwischen verschiedenen Honigsorten darzustellen, basierend auf einem Datensatz des [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
16
+
Im Rahmen unseres naturbezogenen Forschungsfokus entdecken wir interessante Visualisierungen, um die Beziehungen zwischen verschiedenen Honigsorten darzustellen, basierend auf einem Datensatz des [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
17
17
18
18
Dieser Datensatz mit etwa 600 Einträgen zeigt die Honigproduktion in vielen US-Bundesstaaten. So können Sie beispielsweise die Anzahl der Bienenvölker, den Ertrag pro Volk, die Gesamtproduktion, Lagerbestände, den Preis pro Pfund und den Wert des produzierten Honigs in einem bestimmten Bundesstaat von 1998 bis 2012 betrachten, wobei jede Zeile ein Jahr pro Bundesstaat darstellt.
19
19
20
-
Es wäre interessant, die Beziehung zwischen der jährlichen Produktion eines Bundesstaates und beispielsweise dem Honigpreis in diesem Bundesstaat zu visualisieren. Alternativ könnten Sie die Beziehung zwischen den Erträgen pro Volk in verschiedenen Bundesstaaten darstellen. Dieser Zeitraum umfasst das verheerende „CCD“ oder „Colony Collapse Disorder“, das erstmals 2006 beobachtet wurde (http://npic.orst.edu/envir/ccd.html), was diesen Datensatz besonders interessant macht. 🐝
20
+
Es wäre interessant, die Beziehung zwischen der jährlichen Produktion eines Bundesstaates und beispielsweise dem Honigpreis in diesem Bundesstaat zu visualisieren. Alternativ könnten Sie die Beziehung zwischen den Erträgen pro Volk in verschiedenen Bundesstaaten darstellen. Dieser Zeitraum umfasst das verheerende 'CCD' oder 'Colony Collapse Disorder', das erstmals 2006 beobachtet wurde (http://npic.orst.edu/envir/ccd.html), was diesen Datensatz besonders relevant macht. 🐝
21
21
22
22
## [Quiz vor der Lektion](https://ff-quizzes.netlify.app/en/ds/quiz/22)
23
23
24
24
In dieser Lektion können Sie Seaborn verwenden, eine Bibliothek, die Sie bereits kennen, um Beziehungen zwischen Variablen zu visualisieren. Besonders interessant ist die Funktion `relplot` von Seaborn, die Streudiagramme und Liniendiagramme ermöglicht, um schnell '[statistische Beziehungen](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' zu visualisieren. Dies hilft Datenwissenschaftlern, besser zu verstehen, wie Variablen miteinander in Beziehung stehen.
25
25
26
26
## Streudiagramme
27
27
28
-
Verwenden Sie ein Streudiagramm, um zu zeigen, wie sich der Honigpreis Jahr für Jahr in den einzelnen Bundesstaaten entwickelt hat. Seaborn gruppiert mit `relplot` bequem die Daten der Bundesstaaten und zeigt Datenpunkte sowohl für kategoriale als auch für numerische Daten an.
28
+
Verwenden Sie ein Streudiagramm, um zu zeigen, wie sich der Honigpreis Jahr für Jahr in den einzelnen Bundesstaaten entwickelt hat. Seaborn gruppiert mit `relplot` bequem die Daten der Bundesstaaten und zeigt Datenpunkte sowohl für kategoriale als auch numerische Daten an.
29
29
30
30
Beginnen wir mit dem Import der Daten und Seaborn:
31
31
@@ -51,16 +51,16 @@ Erstellen Sie ein einfaches Streudiagramm, um die Beziehung zwischen dem Preis p
Zeigen Sie nun dieselben Daten mit einer Honig-Farbpalette, um zu zeigen, wie sich der Preis im Laufe der Jahre entwickelt. Sie können dies tun, indem Sie einen 'hue'-Parameter hinzufügen, um die Veränderung Jahr für Jahr darzustellen:
56
+
Zeigen Sie nun dieselben Daten mit einer honigfarbenen Farbpalette, um zu zeigen, wie sich der Preis im Laufe der Jahre entwickelt. Sie können dies tun, indem Sie einen 'hue'-Parameter hinzufügen, der die Veränderung Jahr für Jahr darstellt:
57
57
58
58
> ✅ Erfahren Sie mehr über die [Farbpaletten, die Sie in Seaborn verwenden können](https://seaborn.pydata.org/tutorial/color_palettes.html) - probieren Sie ein schönes Regenbogen-Farbschema aus!
Mit dieser Farbänderung können Sie deutlich sehen, dass es im Laufe der Jahre eine starke Entwicklung des Honigpreises pro Pfund gibt. Wenn Sie beispielsweise einen Bundesstaat wie Arizona auswählen, können Sie ein Muster von Preissteigerungen Jahr für Jahr mit wenigen Ausnahmen erkennen:
66
66
@@ -82,14 +82,14 @@ Mit dieser Farbänderung können Sie deutlich sehen, dass es im Laufe der Jahre
Eine andere Möglichkeit, diese Entwicklung zu visualisieren, ist die Verwendung von Größe anstelle von Farbe. Für farbenblinde Benutzer könnte dies eine bessere Option sein. Bearbeiten Sie Ihre Visualisierung, um eine Preissteigerung durch eine Zunahme des Punktumfangs darzustellen:
85
+
Eine andere Möglichkeit, diese Entwicklung zu visualisieren, ist die Verwendung von Größe anstelle von Farbe. Für farbenblinde Benutzer könnte dies eine bessere Option sein. Bearbeiten Sie Ihre Visualisierung, um die Preissteigerung durch eine Zunahme des Punktumfangs darzustellen:
Ist dies ein einfacher Fall von Angebot und Nachfrage? Aufgrund von Faktoren wie Klimawandel und dem Zusammenbruch von Bienenvölkern gibt es Jahr für Jahr weniger Honig zu kaufen, und daher steigen die Preise?
✅ Da Seaborn die Daten um eine Linie aggregiert, zeigt es „die mehrfachen Messungen bei jedem x-Wert, indem es den Mittelwert und das 95%-Konfidenzintervall um den Mittelwert herum darstellt“. [Quelle](https://seaborn.pydata.org/tutorial/relational.html). Dieses zeitaufwändige Verhalten kann durch Hinzufügen von `ci=None` deaktiviert werden.
109
+
✅ Da Seaborn die Daten um eine Linie aggregiert, zeigt es "die mehrfachen Messungen bei jedem x-Wert, indem es den Mittelwert und das 95%-Konfidenzintervall um den Mittelwert herum darstellt". [Quelle](https://seaborn.pydata.org/tutorial/relational.html). Dieses zeitaufwändige Verhalten kann durch Hinzufügen von `ci=None` deaktiviert werden.
110
110
111
-
Frage: Nun, im Jahr 2003 können wir auch einen Anstieg des Honigangebots sehen? Was passiert, wenn Sie die Gesamtproduktion Jahr für Jahr betrachten?
111
+
Frage: Nun, können wir im Jahr 2003 auch einen Anstieg des Honigangebots sehen? Was passiert, wenn Sie die Gesamtproduktion Jahr für Jahr betrachten?
Antwort: Nicht wirklich. Wenn Sie die Gesamtproduktion betrachten, scheint sie in diesem Jahr tatsächlich gestiegen zu sein, obwohl die Honigproduktion im Allgemeinen in diesen Jahren rückläufig ist.
120
120
121
-
Frage: Was könnte in diesem Fallden Preisanstieg für Honig um das Jahr 2003 verursacht haben?
121
+
Frage: In diesem Fall, was könnte den Preisanstieg von Honig um das Jahr 2003 verursacht haben?
122
122
123
123
Um dies herauszufinden, können Sie ein Facet Grid erkunden.
124
124
125
125
## Facet Grids
126
126
127
-
Facet Grids nehmen eine Facette Ihres Datensatzes (in unserem Fall können Sie 'Jahr' wählen, um zu vermeiden, dass zu viele Facetten erstellt werden). Seaborn kann dann für jede dieser Facetten Ihrer gewählten x- und y-Koordinaten eine Grafik erstellen, um den Vergleich zu erleichtern. Fällt das Jahr 2003 in dieser Art von Vergleich auf?
127
+
Facet Grids nehmen eine Facette Ihres Datensatzes (in unserem Fall können Sie 'Jahr' wählen, um zu vermeiden, dass zu viele Facetten erstellt werden). Seaborn kann dann für jede dieser Facetten Ihrer gewählten x- und y-Koordinaten eine Grafik erstellen, um den Vergleich zu erleichtern. Fällt das Jahr 2003 in diesem Vergleich auf?
128
128
129
129
Erstellen Sie ein Facet Grid, indem Sie weiterhin `relplot` verwenden, wie in der [Seaborn-Dokumentation](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid) empfohlen.
130
130
@@ -135,16 +135,17 @@ sns.relplot(
135
135
col="year",
136
136
col_wrap=3,
137
137
kind="line"
138
+
)
138
139
```
139
140
In dieser Visualisierung können Sie den Ertrag pro Volk und die Anzahl der Bienenvölker Jahr für Jahr nebeneinander vergleichen, mit einer Wrap-Einstellung von 3 für die Spalten:
Für diesen Datensatz fällt nichts Besonderes in Bezug auf die Anzahl der Bienenvölker und deren Ertrag Jahr für Jahr und Bundesstaat für Bundesstaat auf. Gibt es eine andere Möglichkeit, eine Korrelation zwischen diesen beiden Variablen zu finden?
144
145
145
146
## Dual-Line-Diagramme
146
147
147
-
Versuchen Sie ein Multiline-Diagramm, indem Sie zwei Liniendiagramme übereinander legen, Seaborns 'despine' verwenden, um die oberen und rechten Achsen zu entfernen, und `ax.twinx` [abgeleitet von Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) verwenden. Twinx ermöglicht es einem Diagramm, die x-Achse zu teilen und zwei y-Achsen anzuzeigen. Zeigen Sie den Ertrag pro Volk und die Anzahl der Bienenvölker übereinander an:
148
+
Versuchen Sie ein Multiline-Diagramm, indem Sie zwei Liniendiagramme übereinander legen, Seaborns 'despine' verwenden, um die oberen und rechten Achsen zu entfernen, und `ax.twinx`[abgeleitet von Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html) verwenden. Twinx ermöglicht es einem Diagramm, die x-Achse zu teilen und zwei y-Achsen anzuzeigen. Zeigen Sie den Ertrag pro Volk und die Anzahl der Bienenvölker übereinandergelegt an:
Während nichts um das Jahr 2003 besonders auffällt, können wir diese Lektion mit einer etwas erfreulicheren Note abschließen: Obwohl die Anzahl der Bienenvölker insgesamt rückläufig ist, stabilisiert sich die Anzahl der Bienenvölker, auch wenn ihr Ertrag pro Volk abnimmt.
167
+
Während nichts um das Jahr 2003 besonders auffällt, können wir diese Lektion mit einer etwas erfreulicheren Note abschließen: Obwohl die Anzahl der Bienenvölker insgesamt abnimmt, stabilisiert sich die Anzahl der Bienenvölker, auch wenn ihr Ertrag pro Volk sinkt.
167
168
168
169
Go, bees, go!
169
170
@@ -179,9 +180,9 @@ In dieser Lektion haben Sie mehr über andere Anwendungen von Streudiagrammen un
179
180
Liniendiagramme können einfach oder ziemlich komplex sein. Lesen Sie ein wenig in der [Seaborn-Dokumentation](https://seaborn.pydata.org/generated/seaborn.lineplot.html) über die verschiedenen Möglichkeiten, wie Sie sie erstellen können. Versuchen Sie, die Liniendiagramme, die Sie in dieser Lektion erstellt haben, mit anderen in den Dokumenten aufgeführten Methoden zu verbessern.
180
181
## Aufgabe
181
182
182
-
[Dive into the beehive](assignment.md)
183
+
[Tauchen Sie in den Bienenstock ein](assignment.md)
183
184
184
185
---
185
186
186
187
**Haftungsausschluss**:
187
-
Dieses Dokument wurde mithilfe desKI-Übersetzungsdienstes [Co-op Translator](https://github.com/Azure/co-op-translator) übersetzt. Obwohl wir uns um Genauigkeit bemühen, weisen wir darauf hin, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als maßgebliche Quelle betrachtet werden. Für kritische Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.
188
+
Dieses Dokument wurde mit dem KI-Übersetzungsdienst[Co-op Translator](https://github.com/Azure/co-op-translator) übersetzt. Obwohl wir uns um Genauigkeit bemühen, beachten Sie bitte, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als maßgebliche Quelle betrachtet werden. Für kritische Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.
0 commit comments