Refine
Year of publication
- 2020 (4) (remove)
Document Type
- Conference Proceeding (2)
- Part of a Book (1)
- Working Paper (1)
Has Fulltext
- yes (4)
Is part of the Bibliography
- yes (4)
Keywords
- Deutsch (3)
- Annotation (2)
- Einbettung <Linguistik> (1)
- Erzähltechnik (1)
- Gesprochene Sprache (1)
- Hochliteratur (1)
- Komposition <Wortbildung> (1)
- Korpus <Linguistik> (1)
- Nominalkompositum (1)
- Redeerwähnung (1)
Publicationstate
- Veröffentlichungsversion (4) (remove)
Reviewstate
- (Verlags)-Lektorat (2)
- Peer-Review (2)
Publisher
- CEUR-WS (1)
- Leibniz-Institut für Deutsche Sprache (IDS) (1)
- Pasithee (1)
- Zenodo (1)
We present recognizers for four very different types of speech, thought and writing representation (STWR) for German texts. The implementation is based on deep learning with two different customized contextual embeddings, namely FLAIR embeddings and BERT embeddings. This paper gives an evaluation of our recognizers with a particular focus on the differences in performance we observed between those two embeddings. FLAIR performed best for direct STWR (F1=0.85), BERT for indirect (F1=0.76) and free indirect (F1=0.59) STWR. For reported STWR, the comparison was inconclusive, but BERT gave the best average results and best individual model (F1=0.60). Our best recognizers, our customized language embeddings and most of our test and training data are freely available and can be found via www.redewiedergabe.de or at github.com/redewiedergabe.
Die vorgestellte Studie untersucht die Anteile unterschiedlicher Redewiedergabeformen im Vergleich zwischen zwei Literaturtypen von gegensätzlichen Enden des Spektrums: Hochliteratur – definiert als Werke, die auf der Auswahlliste von Literaturpreisen standen – und Heftromanen, massenproduzierten Erzählwerken, die zumeist über den Zeitschriftenhandel vertrieben werden und früher abwertend als „Romane der Unterschicht” (Nusser 1981) bezeichnet wurden. Unsere These ist, dass sich diese Literaturtypen hinsichtlich ihrer Erzählweise unterscheiden, und sich dies in den verwendeten Wiedergabeformen niederschlägt. Der Fokus der Untersuchung liegt auf der Dichotomie zwischen direkter und nicht-direkter Wiedergabe, die schon in der klassischen Rhetorik aufgemacht wurde.