You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
@@ -28,7 +28,7 @@ Im Kapitel zum [Datenmodell](../modell.md) wurde bereits kurz auf das Format *TS
28
28
Im Grunde handelt es sich bei *TSV* und *CSV* ebenfalls um *TXT* Dateien, also einfache Textdateien, die jede Art von Zeichen und Text enthalten können, einschließlich unstrukturierter oder formatierter Daten.
29
29
Um Daten zu formatieren, müssen einzelne Einträge, wie etwa die einzelnen Zellen in einer Tabelle, im Text erkennbar voneinander getrennt werden. Zu diesem Zweck haben sich als gängige Trennzeichen (engl. **separator** oder konkreter **delimiter**) das Tabulatorzeichen und das Komma durchgesetzt. Aus ihnen erklären sich die Namen der anderen oben genannten Formate: "**T**ab **S**eparated **V**alues" und "**C**omma **S**eparated **V**alues".
30
30
31
-
Für das Arbeiten mit Datensätzen, die ausschließlich aus Zahlen bestehen, ist das Komma als Trennzeichen vollkommen ausreichend. In den *Digital Humanities* wird allerdings typischerweise mit Daten gearbeitet, die neben Zahlen auch Texte enthalten, etwa Filmtitel oder Beschreibungen. In einem *CSV*-Datensatz würde ein Filmtitel wie "*The Good, the Bad and the Ugly*" als zwei getrennte Einträge interpretiert werden, nämlich "*The Good*" und "*the Bad and the Ugly*", da das Komma als Zeichen für einen neuen Eintrag gelesen würde. Daher ist zu empfehlen, stattdessen bei der Erstellung von Datensätzen ein eindeutiges, in Texten selten auftretendes Zeichen als Trennzeichen einzusetzen - wie etwa das Tabulatorzeichen oder den senkrechten Strich `|` (engl. **Pipe**). Unter Windows wird dieser senkrechte Strich mit der Tastenkombination `Alt Gr`+`<` erzeugt, auf dem Mac mit `option`+`7`.
31
+
Für das Arbeiten mit Datensätzen, die ausschließlich aus Zahlen bestehen, ist das Komma als Trennzeichen vollkommen ausreichend. In den _Digital Humanities_ wird allerdings typischerweise mit Daten gearbeitet, die neben Zahlen auch Texte enthalten, etwa Filmtitel oder Beschreibungen. In einem _CSV_-Datensatz würde ein Filmtitel wie `The Good, the Bad and the Ugly` als zwei getrennte Einträge interpretiert werden, nämlich `The Good` und `the Bad and the Ugly`, da das Komma als Zeichen für einen neuen Eintrag gelesen würde. Daher ist zu empfehlen, stattdessen bei der Erstellung von Datensätzen ein eindeutiges, in Texten selten auftretendes Zeichen als Trennzeichen einzusetzen - wie etwa das Tabulatorzeichen oder den senkrechten Strich `|` (engl. **Pipe**). Unter Windows wird dieser senkrechte Strich mit der Tastenkombination `Alt Gr`+`<` erzeugt, auf dem Mac mit `option`+`7`.
32
32
33
33
Für den Übungsdatensatz zu diesem Kapitel der OER haben wir das Tabulatorzeichen verwendet, in einem herkömmlichen Texteditor sieht die Darstellung des Datensatzes folgendermaßen aus:
Copy file name to clipboardExpand all lines: recherche/material.md
+1-1Lines changed: 1 addition & 1 deletion
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -97,7 +97,7 @@ alt: Darstellung der Anzeige Suche nach Schlagwort Dokumentarfilm. Anzahl der Tr
97
97
Anzeige der Suche nach Schlagwort "Dokumentarfilm"
98
98
```
99
99
100
-
Für diese Suchanfrage ergibt sich als "_Anzahl der Treffer: 0_". Wie kann dies sein? Es ist sehr unwahrscheinlich, dass im abgefragten Zeitraum keine Dokumentarfilme bzw. als Dokumentarfilm verschlagtwortete Filme im Katalog des Filmarchivs vorhanden sind. Hierzu ist wichtig zu wissen, dass auch der Eintrag der Gattungen nach der festgelegten Systematik der Bibliothek der Filmuniversität erfolgt. Die <ahref="https://server8.bibl.filmuniversitaet.de"class="external-link"target="_blank">alphabetische Liste aller Schlagworte</a> ist unten links auf der Startseite des Bibliothekskatalogs anklickbar. Aus der Liste ergibt sich, dass Dokumentarfilme unter dem Schlagwort "Dokumentarfilm/B" eingetragen wurden. Eine Suche mit dem angepassten Suchbegriff _"Dokumentarfilm/B"_ ergibt _329 Treffer_. Im Unterschied zu Schlagworten werden Stichworte übrigens frei vergeben und müssen nicht einer vorgegebenen Liste folgen.
100
+
Für diese Suchanfrage ergibt sich als "_Anzahl der Treffer: 0_". Wie kann dies sein? Es ist sehr unwahrscheinlich, dass im abgefragten Zeitraum keine Dokumentarfilme bzw. als Dokumentarfilm verschlagtwortete Filme im Katalog des Filmarchivs vorhanden sind. Hierzu ist wichtig zu wissen, dass auch der Eintrag der Gattungen nach der festgelegten Systematik der Bibliothek der Filmuniversität erfolgt. Die <ahref="https://server8.bibl.filmuniversitaet.de"class="external-link"target="_blank">alphabetische Liste aller Schlagworte</a> ist unten links auf der Startseite des Bibliothekskatalogs anklickbar. Aus der Liste ergibt sich, dass Dokumentarfilme unter dem Schlagwort "Dokumentarfilm/B" eingetragen wurden. Eine Suche mit dem angepassten Suchbegriff _"Dokumentarfilm/B"_ ergibt _329 Treffer_. Im Unterschied zu Schlagworten werden Stichworte frei vergeben und müssen nicht einer vorgegebenen Liste folgen.
0 commit comments