Refine
Year of publication
- 2019 (3) (remove)
Document Type
- Conference Proceeding (2)
- Part of a Book (1)
Has Fulltext
- yes (3)
Is part of the Bibliography
- yes (3)
Keywords
- Deutsch (3)
- Indirekte Rede (2)
- Korpus <Linguistik> (2)
- Annotation (1)
- Automatische Sprachanalyse (1)
- Automatische Spracherkennung (1)
- Direkte Rede (1)
- Erlebte Rede (1)
- Redeeinleiter (1)
- Redewiedergabe (1)
Publicationstate
Reviewstate
- Peer-Review (2)
- (Verlags)-Lektorat (1)
In diesem Beitrag wird das Redewiedergabe-Korpus (RW-Korpus) vorgestellt, ein historisches Korpus fiktionaler und nicht-fiktionaler Texte, das eine detaillierte manuelle Annotation mit Redewiedergabeformen enthält. Das Korpus entsteht im Rahmen eines laufenden DFG-Projekts und ist noch nicht endgültig abgeschlossen, jedoch ist für Frühjahr 2019 ein Beta-Release geplant, welches der Forschungsgemeinschaft zur Verfügung gestellt wird. Das endgültige Release soll im Frühjahr 2020 erfolgen. Das RW-Korpus stellt eine neuartige Ressource für die Redewiedergabe-Forschung dar, die in dieser Detailliertheit für das Deutsche bisher nicht verfügbar ist, und kann sowohl für quantitative linguistische und literaturwissenschaftliche Untersuchungen als auch als Trainingsmaterial für maschinelles Lernen dienen.
In this paper, we present our work-inprogress to automatically identify free indirect representation (FI), a type of thought representation used in literary texts. With a deep learning approach using contextual string embeddings, we achieve f1 scores between 0.45 and 0.5 (sentence-based evaluation for the FI category) on two very different German corpora, a clear improvement on earlier attempts for this task. We show how consistently marked direct speech can help in this task. In our evaluation, we also consider human inter-annotator scores and thus address measures of certainty for this difficult phenomenon.