You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: auswertung/datenvisualisierung.md
+12-12Lines changed: 12 additions & 12 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -90,16 +90,16 @@ alt: Darstellung der Auswahl der Import-Datei. Die Auswahlfelder sind mit roten
90
90
Auswahl der Import-Datei
91
91
```
92
92
93
-
Im ersten Schritt des Textkonvertierungs-Assistenten ist unter Datentyp der Punkt *Getrennt* (also mit Tabulatoren getrennt) bereits korrekt ausgewählt und kann so übernommen werden. *Import beginnen in Zeile* stellen Sie von *1* auf *2* ein, da beim Import ja die erste Zeile mit dem Hinweis auf die Übungsdatei übersprungen werden soll. Für *Dateiursprung* wählen Sie *65001 : Unicode (UTF-8)* aus - dies ist die Zeichen-Codierung, die beim Export aus *OpenRefine* verwendet wurde. Rufen Sie den zweiten Schritt durch Klick auf *Weiter* auf. ({numref}`excel_assistent_1`)
93
+
Im ersten Schritt des Textkonvertierungs-Assistenten ist unter Datentyp der Punkt *Getrennt* (also mit Tabulatoren getrennt) bereits korrekt ausgewählt und kann so übernommen werden. *Import beginnen in Zeile* stellen Sie von *1* auf *2* ein, da beim Import ja die erste Zeile mit dem Hinweis auf die Übungsdatei übersprungen werden soll. Für *Dateiursprung* wählen Sie *65001 : Unicode (UTF-8)* aus – dies ist die Zeichen-Codierung, die beim Export aus *OpenRefine* verwendet wurde. Rufen Sie den zweiten Schritt durch Klick auf *Weiter* auf. ({numref}`excel_assistent_1`)
alt: Darstellung des Textkonvertierungs-Assistenten - Schritt 1. Die Auswahlfelder sind mit roten Kreisen gekennzeichnet.
100
+
alt: Darstellung des Textkonvertierungs-Assistenten – Schritt 1. Die Auswahlfelder sind mit roten Kreisen gekennzeichnet.
101
101
---
102
-
Textkonvertierungs-Assistent - Schritt 1
102
+
Textkonvertierungs-Assistent – Schritt 1
103
103
```
104
104
105
105
Im zweiten Schritt des Assistenten wird *Tabstopp* als *Trennzeichen* korrekt erkannt und kann mit *Weiter* übernommen werden. ({numref}`excel_assistent_2`)
@@ -109,9 +109,9 @@ Im zweiten Schritt des Assistenten wird *Tabstopp* als *Trennzeichen* korrekt er
109
109
align: center
110
110
width: 80%
111
111
name: excel_assistent_2
112
-
alt: Darstellung des Textkonvertierungs-Assistenten - Schritt 2. Die Auswahlfelder sind mit roten Kreisen gekennzeichnet.
112
+
alt: Darstellung des Textkonvertierungs-Assistenten – Schritt 2. Die Auswahlfelder sind mit roten Kreisen gekennzeichnet.
113
113
---
114
-
Textkonvertierungs-Assistent - Schritt 2
114
+
Textkonvertierungs-Assistent – Schritt 2
115
115
```
116
116
117
117
Auch im dritten Schritt des Assistenten kann die Einstellung *Datenformat der Spalten* -> *Standard* beibehalten werden. Schließen Sie den Textkonvertierungs-Assistenten mit *Fertig stellen* ab. ({numref}`excel_assistent_3`)
@@ -121,9 +121,9 @@ Auch im dritten Schritt des Assistenten kann die Einstellung *Datenformat der Sp
121
121
align: center
122
122
width: 80%
123
123
name: excel_assistent_3
124
-
alt: Darstellung des Textkonvertierungs-Assistenten - Schritt 3. Die Auswahlfelder sind mit roten Kreisen gekennzeichnet.
124
+
alt: Darstellung des Textkonvertierungs-Assistenten – Schritt 3. Die Auswahlfelder sind mit roten Kreisen gekennzeichnet.
125
125
---
126
-
Textkonvertierungs-Assistent - Schritt 3
126
+
Textkonvertierungs-Assistent – Schritt 3
127
127
```
128
128
129
129
Sie können nun den Ort in der Excel-Arbeitsmappe auswählen, an dem der Import durchgeführt werden soll. Auch hier können sie die Vorgabe *Bestehendes Arbeitsblatt* übernehmen und die Daten mit einem Klick auf *OK* aus der tsv-Datei in Excel importieren. ({numref}`excel_import_ort`)
@@ -495,7 +495,7 @@ alt: Darstellung Option Spalten auswählen. Einzelne Eingaben sind mit roten Kre
495
495
Option *Spalten auswählen*
496
496
```
497
497
498
-
Es öffnet sich ein Fenster zur Auswahl der Spalten. Wählen Sie zunächst zu Beginn der Liste alle Spalten ab und klicken sie anschließend auf *verantw,_Gewerk_1 bis 4*. Beenden Sie die Eingabe mit *OK*. ({numref}`excel_spalten_gewerk`)
498
+
Es öffnet sich ein Fenster zur Auswahl der Spalten. Wählen Sie zunächst zu Beginn der Liste alle Spalten ab und klicken sie anschließend auf *verantw._Gewerk_1 bis 4*. Beenden Sie die Eingabe mit *OK*. ({numref}`excel_spalten_gewerk`)
@@ -659,7 +659,7 @@ alt: Darstellung der Anzahl der verantwortlichen Gewerke als Kreisdiagramm
659
659
Anzahl der verantwortlichen Gewerke als Kreisdiagramm
660
660
```
661
661
662
-
Wie auch bei den bisherigen Visualisierungen und Auswertungen zum Datensatz muss bedacht werden, dass nicht für alle Titel die jeweils verantwortlichen Gewerke bei der Datenerfassung in die filmografischen Angaben aufgenommen wurden. Weiterführende Recherchen im Filmarchiv und in weiteren Archiven mit Informationen zu Entstehungskontexten der Filme sind also notwendig. Die Domianz der Regie in der Anzahl der für die Filme verantwortlichen Gewerke ist nicht weiter verwunderlich, wird die Regie - dem Auteur-Gedanken folgend - doch meist als die für den gesamten künstlerischen Prozess verantwortliche Instanz angesehen. Die Zuordnung verantwortlicher Gewerke zu studentischen Produktionen kann aber auch mit Lehrplänen und Studienordnungen zusammenhängen. Diese sollten in eine genauere Analyse der Zahlen zu den verantwortlichen Gewerken einbezogen werden.
662
+
Wie auch bei den bisherigen Visualisierungen und Auswertungen zum Datensatz muss bedacht werden, dass nicht für alle Titel die jeweils verantwortlichen Gewerke bei der Datenerfassung in die filmografischen Angaben aufgenommen wurden. Weiterführende Recherchen im Filmarchiv und in weiteren Archiven mit Informationen zu Entstehungskontexten der Filme sind also notwendig. Die Domianz der Regie in der Anzahl der für die Filme verantwortlichen Gewerke ist nicht weiter verwunderlich, wird die Regie – dem Auteur-Gedanken folgend – doch meist als die für den gesamten künstlerischen Prozess verantwortliche Instanz angesehen. Die Zuordnung verantwortlicher Gewerke zu studentischen Produktionen kann aber auch mit Lehrplänen und Studienordnungen zusammenhängen. Diese sollten in eine genauere Analyse der Zahlen zu den verantwortlichen Gewerken einbezogen werden.
663
663
664
664
## Anzahl der Schlagworte pro Jahr
665
665
Die Visuallsierung und Auswertung der Anzahl der Schlagworte pro Jahr folgt einem ähnlichen Vorgehen wie im letzten Abschnitt zu den verantwortlichen Gewerken. Die Schlagworte sind auf sechs Spalten verteilt (*Schlagwort_1* bis *Schlagwort_6*), die zur weiteren Verabeitung in eine Spalte überführt werden müssen. Für die Visualisierung ist zusätzlich noch die Spalte *Jahr_1* notwendig.
@@ -730,7 +730,7 @@ alt: Anzahl ausgewählter Schlagworte pro ausgewählte Jahre
730
730
Anzahl ausgewählter Schlagworte pro ausgewählte Jahre
731
731
```
732
732
733
-
Aus der Grafik ist ersichtlich, dass das Schlagwort *Wende*- wie zu erwarten war - erst im Jahr 1989 auftritt, im Jahr 1990 seinen Höhepunkt erreicht und ab 1991 wieder abflacht. Hier wäre es interessant, diese Auswertung mit in eine genauerer Recherche im Archiv zu nehmen und sich z.B. gezielt die studentischen Filme anzusehen, die mit dem Schlagwort *Wende* versehen sind. Auch wäre es sinnvoll, im Archiv dem auffallend häufigen Auftreten des Schlagworts *Porträtfilm* in den Jahren 1987 bis 1989 nachzugehen.
733
+
Aus der Grafik ist ersichtlich, dass das Schlagwort *Wende*– wie zu erwarten war – erst im Jahr 1989 auftritt, im Jahr 1990 seinen Höhepunkt erreicht und ab 1991 wieder abflacht. Hier wäre es interessant, diese Auswertung mit in eine genauerer Recherche im Archiv zu nehmen und sich z.B. gezielt die studentischen Filme anzusehen, die mit dem Schlagwort *Wende* versehen sind. Auch wäre es sinnvoll, im Archiv dem auffallend häufigen Auftreten des Schlagworts *Porträtfilm* in den Jahren 1987 bis 1989 nachzugehen.
734
734
735
735
Für eine weitere Auswertung sollte mit der Visualisierung weiterer, unterschiedlicher Schlagwortkombinationen fortgefahren werden. Wiederum ist anzumerken, dass nicht alle Filme mit Schlagworten versehen wurden, die Auswertung der Anzahl der Schlagworte also mit Bedacht vonstatten gehen sollte.
736
736
@@ -761,7 +761,7 @@ alt: Darstellung Einfügen der Schlagworte aus der Zwischenablage. Einzelne Eing
761
761
Einfügen der Schlagworte aus der Zwischenablage
762
762
```
763
763
764
-
Die Arbeitsoberfläche von *Voyant Tools* zur Auswertung des eingelesenen Textes wird geföffnet. Setzen Sie in ihrem Browser ein Lesezeichen zu dieser Seite. Ihr Textkorpus - in diesem Fall die Schlagworte aus unserem Datensatz - wird hier gespeichert und kann später unter dieser URL weiter ausgewertet werden. Für jedes Auswertungs-Projekt wird eine einzigartige URL erzeugt.
764
+
Die Arbeitsoberfläche von *Voyant Tools* zur Auswertung des eingelesenen Textes wird geföffnet. Setzen Sie in ihrem Browser ein Lesezeichen zu dieser Seite. Ihr Textkorpus – in diesem Fall die Schlagworte aus unserem Datensatz – wird hier gespeichert und kann später unter dieser URL weiter ausgewertet werden. Für jedes Auswertungs-Projekt wird eine einzigartige URL erzeugt.
765
765
766
766
Die Arbeitsoberfläche von *Voyant Tools* enthält mehrere Fenster, in denen Auswertungen zum eingelesenen Korpus vorgenommen werden können. Wir werden uns auf das Fenster links oben konzentrieren, in dem *Cirrus* aktviert ist. Es enthält bereits eine Wortwolke aus den eingelesenen Schlagworten. Die am häufigsten vorkommenden Worte werden größer dargesellt.
767
767
@@ -836,4 +836,4 @@ In diesem Kapitel haben wir Möglichkeiten der Visualisierung und Auswertung uns
836
836
837
837
Es hat sich gezeigt, dass durch Visualisierungen eine explorative Auswertung des Datensatzes möglich ist. Es wurde u.a. deutlich, dass Ende der 1980er Jahre die Anzahl der Titel im Datensatz ansteigt, verstärkt dokumentarische Formen entstanden sind und die Anzahl bestimmter Projektarten größer wird. Diese Auswertungen und Visualisierungen können eine gute Grundlage für weitere Recherchen im Filmarchiv der Filmuniversität und weiteren Archiven bilden.
838
838
839
-
Dabei muss im Blick behalten werden, dass im Datensatz nicht alle Angaben vollständig enthalten sind. So werden Gattungen oder Projektakrten nicht immer in die filmografischen Angaben im Archivkatalog aufgenommen. Die erstellten Visualisierungen und die Datengrundlage, auf der sie basieren, müssen also immer kritisch hinterfragt werden. Dennoch bieten sie gute und hilfreiche Ausgangspunkte für die weitere Arbeit an den Fragestellungen.
839
+
Dabei muss im Blick behalten werden, dass im Datensatz nicht alle Angaben vollständig enthalten sind. So werden Gattungen oder Projektakrten nicht immer in die filmografischen Angaben im Archivkatalog aufgenommen. Die erstellten Visualisierungen und die Datengrundlage, auf der sie basieren, müssen also immer kritisch hinterfragt werden. Dennoch bieten sie gute und hilfreiche Ausgangspunkte für die weitere Arbeit an den Fragestellungen.
Copy file name to clipboardExpand all lines: bereinigung/datenquelle.md
+4-4Lines changed: 4 additions & 4 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -1,5 +1,5 @@
1
1
# Datenquelle
2
-
Ausgangspunkt für die Fallstudie sind existierende Daten in Form eines Auszugs aus der Datenbank des Bibliothekskatalogs (OPAC) der Filmuniversität Babelsberg. In diesem Auszug sind **alle im Katalog vorhandenen Angaben zu studentischen Filmen aus den Jahren 1985 bis 1999** enthalten. Johanna Drucker weist darauf hin, dass bei der Arbeit mit existierenden Daten danach gefragt werden sollte, wie vollständig diese Daten sind und wer diese wie erstellt hat. {cite}`d-Drucker_2021` Solche Datensätze enthalten nach Drucker selten Angaben darüber, wie sie entstanden sind - weder in einer möglichen zusätzlichen Dokumentation noch in den Metadaten. Daher sollte das den Daten zugrunde liegende Modell analysiert werden. Zielführende Fragen sind für einen Rückschluss auf das Modell z.B.: Welche Feldnamen wurden für die Charakterisierung einzelner Informationen verwendet? Welche Systeme zur Kategorisierung sind erkennbar? Wo fehlen Angaben?
2
+
Ausgangspunkt für die Fallstudie sind existierende Daten in Form eines Auszugs aus der Datenbank des Bibliothekskatalogs (OPAC) der Filmuniversität Babelsberg. In diesem Auszug sind **alle im Katalog vorhandenen Angaben zu studentischen Filmen aus den Jahren 1985 bis 1999** enthalten. Johanna Drucker weist darauf hin, dass bei der Arbeit mit existierenden Daten danach gefragt werden sollte, wie vollständig diese Daten sind und wer diese wie erstellt hat. {cite}`d-Drucker_2021` Solche Datensätze enthalten nach Drucker selten Angaben darüber, wie sie entstanden sind – weder in einer möglichen zusätzlichen Dokumentation noch in den Metadaten. Daher sollte das den Daten zugrunde liegende Modell analysiert werden. Zielführende Fragen sind für einen Rückschluss auf das Modell z.B.: Welche Feldnamen wurden für die Charakterisierung einzelner Informationen verwendet? Welche Systeme zur Kategorisierung sind erkennbar? Wo fehlen Angaben?
3
3
4
4
## Analyse des Datenmodells
5
5
@@ -46,7 +46,7 @@ Feld "sonstige Person" in der Vollansicht eines Eintrags des Bibliothekskatalogs
46
46
```
47
47
48
48
### Titel, Zusatz, Personenangaben
49
-
In einem weiteren Feld wird der Titel des Films genannt. Im Feld Zusatz sind die Projektarten der studentischen Filme aufgeführt, z.B. "Übung", "Diplomfilm", "Hauptprüfungsfilm" oder "F1", "F2", "F3" - was ebenfalls spezifische Filmübungen aus dem Lehrplan der Hochschule sind. Gegebenenfalls werden die Übungen zusätzlich den Studiengängen zugeordnet, die hauptverantwortlich oder beteiligt waren. ({numref}`opac_titel`) Bei "Personenangaben" werden Einträge aus den Feldern "sonstige Personen" wiederholt, in der Regel die erste Zeile in Form der Regie und des entsprechenden Namens, gelegentlich finden sich mehrere Namensnennungen und Gewerke im selben Feld.
49
+
In einem weiteren Feld wird der Titel des Films genannt. Im Feld Zusatz sind die Projektarten der studentischen Filme aufgeführt, z.B. "Übung", "Diplomfilm", "Hauptprüfungsfilm" oder "F1", "F2", "F3" – was ebenfalls spezifische Filmübungen aus dem Lehrplan der Hochschule sind. Gegebenenfalls werden die Übungen zusätzlich den Studiengängen zugeordnet, die hauptverantwortlich oder beteiligt waren. ({numref}`opac_titel`) Bei "Personenangaben" werden Einträge aus den Feldern "sonstige Personen" wiederholt, in der Regel die erste Zeile in Form der Regie und des entsprechenden Namens, gelegentlich finden sich mehrere Namensnennungen und Gewerke im selben Feld.
@@ -73,7 +73,7 @@ alt: Darstellung des Ausschnitts einer Vollanzeige eines Einzeltitels im Katalog
73
73
Felder "Umfang/Format" und "Allgemeine Anmerkung" in der Vollansicht eines Eintrags des Bibliothekskatalogs
74
74
```
75
75
### Schlagwort, Stichwörter, Zusammenfassung
76
-
Die Einträge der Schlagworte im entsprechenden Feld folgen der <ahref="https://www.filmuniversitaet.de/fileadmin/user_upload/pdfs/bibliothek/schlagsys.pdf"class="external-link"target="_blank">Systematik</a> der Universitätsbibliothek. Es handelt sich um ein kontrolliertes Vokabular, da nur Begriffe vergeben werden können, die in der Liste aufgeführt sind. Anhand des Schlagworts wird auch die Gattung des Films charakterisiert - also Dokumentarfilm, Spielfilm oder Animationsfilm -, falls die Gattung bei der Eingabe erfasst wurde. Später sollen die Angaben zur Gattung ausgewertet werden. Im Datensatz müssen diese also wiederum als eigene, getrennte Zellen vorhanden sein.
76
+
Die Einträge der Schlagworte im entsprechenden Feld folgen der <ahref="https://www.filmuniversitaet.de/fileadmin/user_upload/pdfs/bibliothek/schlagsys.pdf"class="external-link"target="_blank">Systematik</a> der Universitätsbibliothek. Es handelt sich um ein kontrolliertes Vokabular, da nur Begriffe vergeben werden können, die in der Liste aufgeführt sind. Anhand des Schlagworts wird auch die Gattung des Films charakterisiert – also Dokumentarfilm, Spielfilm oder Animationsfilm –, falls die Gattung bei der Eingabe erfasst wurde. Später sollen die Angaben zur Gattung ausgewertet werden. Im Datensatz müssen diese also wiederum als eigene, getrennte Zellen vorhanden sein.
77
77
78
78
Im Gegensatz zum Schlagwort werden Stichwörter frei vergeben und folgen keinem festgelegten Vokabular. Durch Stichwörter werden der Inhalt, die Themen oder Motive eines Films charakterisiert. Aufgrund der freien Vergabe ist hier wieder der historische Kontext der Archivierung und die potenziell subjektive Bewertung zu berücksichtigen.
79
79
@@ -100,4 +100,4 @@ Die genauere Betrachtung des Datenmodells hat ebenfalls ergeben, dass die Daten
0 commit comments