Refine
Year of publication
- 2019 (2) (remove)
Document Type
Has Fulltext
- yes (2)
Is part of the Bibliography
- yes (2)
Keywords
- Algorithmus (1)
- Annotation (1)
- Automatische Spracherkennung (1)
- Computerlinguistik (1)
- Deutsch (1)
- Direkte Rede (1)
- Korpus <Linguistik> (1)
- Natürliche Sprache (1)
- Redewiedergabe (1)
- Text Mining (1)
Publicationstate
- Zweitveröffentlichung (2) (remove)
Reviewstate
- Peer-Review (2)
Publisher
- Zenodo (2)
In diesem Beitrag wird das Redewiedergabe-Korpus (RW-Korpus) vorgestellt, ein historisches Korpus fiktionaler und nicht-fiktionaler Texte, das eine detaillierte manuelle Annotation mit Redewiedergabeformen enthält. Das Korpus entsteht im Rahmen eines laufenden DFG-Projekts und ist noch nicht endgültig abgeschlossen, jedoch ist für Frühjahr 2019 ein Beta-Release geplant, welches der Forschungsgemeinschaft zur Verfügung gestellt wird. Das endgültige Release soll im Frühjahr 2020 erfolgen. Das RW-Korpus stellt eine neuartige Ressource für die Redewiedergabe-Forschung dar, die in dieser Detailliertheit für das Deutsche bisher nicht verfügbar ist, und kann sowohl für quantitative linguistische und literaturwissenschaftliche Untersuchungen als auch als Trainingsmaterial für maschinelles Lernen dienen.
This paper describes a rule-based approach to detect direct speech without the help of any quotation markers. As datasets fictional and non-fictional texts were used. Our evaluation shows that the results appear stable throughout different datasets in the fictional domain and are comparable to the results achieved in related work.