Skip to content

Commit 21c3fb1

Browse files
committed
feat: Propose changes to language, typos, spelling
1 parent 39f58f1 commit 21c3fb1

File tree

3 files changed

+4
-4
lines changed

3 files changed

+4
-4
lines changed

bereinigung/openRefine/2_import.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -15,7 +15,7 @@ Für die Bereinigung von Datensätzen müssen diese in das Programm importiert w
1515

1616
**Daten- und Metadatenformate**
1717
- **JSON** – Kompaktes, strukturiertes Datenformat.
18-
- **RDF/XML, JSON-LD, N3, N-Triples, Turtle** – Linked Data-Formate.
18+
- **RDF/XML, JSON-LD, N3, N-Triples, Turtle** – Linked-Data-Formate.
1919
- **PC-Axis (PX)** – Statistische Daten.
2020
- **MARC** – Bibliothekskataloge.
2121

@@ -28,7 +28,7 @@ Im Kapitel zum [Datenmodell](../modell.md) wurde bereits kurz auf das Format *TS
2828
Im Grunde handelt es sich bei *TSV* und *CSV* ebenfalls um *TXT* Dateien, also einfache Textdateien, die jede Art von Zeichen und Text enthalten können, einschließlich unstrukturierter oder formatierter Daten.
2929
Um Daten zu formatieren, müssen einzelne Einträge, wie etwa die einzelnen Zellen in einer Tabelle, im Text erkennbar voneinander getrennt werden. Zu diesem Zweck haben sich als gängige Trennzeichen (engl. **separator** oder konkreter **delimiter**) das Tabulatorzeichen und das Komma durchgesetzt. Aus ihnen erklären sich die Namen der anderen oben genannten Formate: "**T**ab **S**eparated **V**alues" und "**C**omma **S**eparated **V**alues".
3030

31-
Für das Arbeiten mit Datensätzen, die ausschließlich aus Zahlen bestehen, ist das Komma als Trennzeichen vollkommen ausreichend. In den *Digital Humanities* wird allerdings typischerweise mit Daten gearbeitet, die neben Zahlen auch Texte enthalten, etwa Filmtitel oder Beschreibungen. In einem *CSV*-Datensatz würde ein Filmtitel wie "*The Good, the Bad and the Ugly*" als zwei getrennte Einträge interpretiert werden, nämlich "*The Good*" und "*the Bad and the Ugly*", da das Komma als Zeichen für einen neuen Eintrag gelesen würde. Daher ist zu empfehlen, stattdessen bei der Erstellung von Datensätzen ein eindeutiges, in Texten selten auftretendes Zeichen als Trennzeichen einzusetzen - wie etwa das Tabulatorzeichen oder den senkrechten Strich `|` (engl. **Pipe**). Unter Windows wird dieser senkrechte Strich mit der Tastenkombination `Alt Gr`+`<` erzeugt, auf dem Mac mit `option`+`7`.
31+
Für das Arbeiten mit Datensätzen, die ausschließlich aus Zahlen bestehen, ist das Komma als Trennzeichen vollkommen ausreichend. In den _Digital Humanities_ wird allerdings typischerweise mit Daten gearbeitet, die neben Zahlen auch Texte enthalten, etwa Filmtitel oder Beschreibungen. In einem _CSV_-Datensatz würde ein Filmtitel wie `The Good, the Bad and the Ugly` als zwei getrennte Einträge interpretiert werden, nämlich `The Good` und `the Bad and the Ugly`, da das Komma als Zeichen für einen neuen Eintrag gelesen würde. Daher ist zu empfehlen, stattdessen bei der Erstellung von Datensätzen ein eindeutiges, in Texten selten auftretendes Zeichen als Trennzeichen einzusetzen - wie etwa das Tabulatorzeichen oder den senkrechten Strich `|` (engl. **Pipe**). Unter Windows wird dieser senkrechte Strich mit der Tastenkombination `Alt Gr`+`<` erzeugt, auf dem Mac mit `option`+`7`.
3232

3333
Für den Übungsdatensatz zu diesem Kapitel der OER haben wir das Tabulatorzeichen verwendet, in einem herkömmlichen Texteditor sieht die Darstellung des Datensatzes folgendermaßen aus:
3434

bereinigung/openRefine/4_spalten.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -54,7 +54,7 @@ Der Menüpunkt zur Löschung einer Spalte
5454
```
5555

5656
Neben dem Spalten-Dropdown-Menü gibt es noch eine eigene Oberfläche zum Löschen und Umordnen von Spalten.
57-
Dieses *Re-oder / Remove columns* Menü wird über das Dropdown-Menü der Spalte *All* und den Reiter *Edit columns* geöffnet.
57+
Dieses *Re-order / Remove columns* Menü wird über das Dropdown-Menü der Spalte *All* und den Reiter *Edit columns* geöffnet.
5858

5959
```{figure} ../../assets/bereinigung/openRefine/spalten/reorder_columns_1.png
6060
---

recherche/material.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -97,7 +97,7 @@ alt: Darstellung der Anzeige Suche nach Schlagwort Dokumentarfilm. Anzahl der Tr
9797
Anzeige der Suche nach Schlagwort "Dokumentarfilm"
9898
```
9999

100-
Für diese Suchanfrage ergibt sich als "_Anzahl der Treffer: 0_". Wie kann dies sein? Es ist sehr unwahrscheinlich, dass im abgefragten Zeitraum keine Dokumentarfilme bzw. als Dokumentarfilm verschlagtwortete Filme im Katalog des Filmarchivs vorhanden sind. Hierzu ist wichtig zu wissen, dass auch der Eintrag der Gattungen nach der festgelegten Systematik der Bibliothek der Filmuniversität erfolgt. Die <a href="https://server8.bibl.filmuniversitaet.de" class="external-link" target="_blank">alphabetische Liste aller Schlagworte</a> ist unten links auf der Startseite des Bibliothekskatalogs anklickbar. Aus der Liste ergibt sich, dass Dokumentarfilme unter dem Schlagwort "Dokumentarfilm/B" eingetragen wurden. Eine Suche mit dem angepassten Suchbegriff _"Dokumentarfilm/B"_ ergibt _329 Treffer_. Im Unterschied zu Schlagworten werden Stichworte übrigens frei vergeben und müssen nicht einer vorgegebenen Liste folgen.
100+
Für diese Suchanfrage ergibt sich als "_Anzahl der Treffer: 0_". Wie kann dies sein? Es ist sehr unwahrscheinlich, dass im abgefragten Zeitraum keine Dokumentarfilme bzw. als Dokumentarfilm verschlagtwortete Filme im Katalog des Filmarchivs vorhanden sind. Hierzu ist wichtig zu wissen, dass auch der Eintrag der Gattungen nach der festgelegten Systematik der Bibliothek der Filmuniversität erfolgt. Die <a href="https://server8.bibl.filmuniversitaet.de" class="external-link" target="_blank">alphabetische Liste aller Schlagworte</a> ist unten links auf der Startseite des Bibliothekskatalogs anklickbar. Aus der Liste ergibt sich, dass Dokumentarfilme unter dem Schlagwort "Dokumentarfilm/B" eingetragen wurden. Eine Suche mit dem angepassten Suchbegriff _"Dokumentarfilm/B"_ ergibt _329 Treffer_. Im Unterschied zu Schlagworten werden Stichworte frei vergeben und müssen nicht einer vorgegebenen Liste folgen.
101101

102102
```{figure} ../assets/recherche/OPAC_erweiterte_Suche_Dokfilm_mit_Treffer.jpg
103103
---

0 commit comments

Comments
 (0)