You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
@@ -451,9 +450,20 @@ learnr::question_checkbox("Was kannst du erkennen??",
451
450
```
452
451
453
452
454
-
Was es genau mit dem Datenformat `factor` auf sich hat erfährst du im nächsten Kapitel.
453
+
Was es genau mit der Klasse `factor` auf sich hat erfährst du im nächsten Kapitel.
454
+
455
+
## Kategoriale Variablen in R
456
+
457
+
Denken wir uns einen numerischen Vektor `1 2 3 2 3 3`. R weiß zunächst erst mal nicht, welches Skalenniveau dahinter steht und was mit den Zahlen sinnvoll zu rechnen ist, und was keinen Sinn macht.
458
+
459
+
Beispielsweise, wenn die Zahlen Codierungen für verschiedene Kategorien wären, also Nominalskala oder Ordinalskala vorliegen würde, dann wäre es falsch hier einen Mittelwert auszurechnen. R würde das dennoch klaglos für euch tun.
460
+
461
+
Wenn die 1 z.B. bedeutet "Brillenträger, die 2 bedeutet "Kontaktlinsen" und die 3 bedeutet "keine Sehhilfen". Dann könnte man zwar den Mittelwert ausrechnen mit `mean()` (2.3333). Aber das würde rein gar keine Information bringen. Da die Abstände und Reihenfolge der Zahlen hier keine Rollen spielen würden, lediglich dass ob sie unterschiedlich oder gleich sind ist die Relation, die ausgewertet wird.
462
+
463
+
Das ist wichtig,
464
+
455
465
456
-
## Kategoriale Variablen
466
+
**Codierung und Codebook**
457
467
458
468
In der Forschung werden kategoriale Variablen meist in sogenannte *Codes* übersetzt. So werden die Kategorien nicht mehr als Text, sondern als Zahlen repräsentiert. Dies ist v.a. beim händischen Erfassen oder Digitalisieren der Daten unablässlich, denn niemand möchte "zu Fuß" mehr als 25 Mal aufschreiben oder abtippen müssen. Stattdessen wird ein sog. *Codebook* erstellt, in dem die jeweiligen Codes aufgeschlüsselt werden.
459
469
@@ -482,7 +492,7 @@ Da diese Verwendung von Codes gängige Praxis sind, gibt es in R einen Befehl, d
482
492
483
493
Warum brauchen wir die `factor()`-Funktion?
484
494
485
-
1.**Interpretation von Kategorien:** Kategoriale Variablen können eine begrenzte Anzahl von Kategorien haben, z. B. Farben, Geschlecht oder Verkehrsmitteltypen. Der Befehl `factor()` weist diesen Kategorien Beschriftungen zu, um die Daten in einer für uns leicht verständlichen Form darzustellen.
495
+
1.**Interpretation von Kategorien:** Kategoriale Variablen können eine begrenzte Anzahl von Kategorien haben, z. B. Farben, Geschlechter, Messzeitpunkte, Verkehrsmitteltypen... Der Befehl `factor()` weist diesen Kategorien Beschriftungen zu, um die Daten in einer für uns leicht verständlichen Form darzustellen.
486
496
487
497
2.**Ordinalität beachten:** Bei ordinalen kategorialen Variablen, bei denen die Reihenfolge der Kategorien wichtig ist (z. B. Bildungsniveau - Grundschule, Mittelschule, Hochschule), ermöglicht `factor()` die korrekte Berücksichtigung dieser Ordnung.
0 commit comments