Das Redewiedergabe-Korpus. Eine neue Ressource
- In diesem Beitrag wird das Redewiedergabe-Korpus (RW-Korpus) vorgestellt, ein historisches Korpus fiktionaler und nicht-fiktionaler Texte, das eine detaillierte manuelle Annotation mit Redewiedergabeformen enthält. Das Korpus entsteht im Rahmen eines laufenden DFG-Projekts und ist noch nicht endgültig abgeschlossen, jedoch ist für Frühjahr 2019 ein Beta-Release geplant, welches der Forschungsgemeinschaft zur Verfügung gestellt wird. Das endgültige Release soll im Frühjahr 2020 erfolgen. Das RW-Korpus stellt eine neuartige Ressource für die Redewiedergabe-Forschung dar, die in dieser Detailliertheit für das Deutsche bisher nicht verfügbar ist, und kann sowohl für quantitative linguistische und literaturwissenschaftliche Untersuchungen als auch als Trainingsmaterial für maschinelles Lernen dienen.
Author: | Annelen BrunnerORCiDGND, Lukas Weimer, Ngoc Duyen Tanja TuORCiDGND, Stefan EngelbergORCiDGND, Fotis JannidisGND |
---|---|
URN: | urn:nbn:de:bsz:mh39-87710 |
DOI: | https://doi.org/10.5281/zenodo.2600812 |
ISBN: | 978-3-00-062166-6 |
Parent Title (German): | DHd 2019 Digital Humanities: multimedial & multimodal. Konferenzabstracts. 6. Tagung des Verbands Digital Humanities im deutschsprachigen Raum e.V., Frankfurt am Main, Mainz, 25.3.2019 – 29.3.2019 |
Publisher: | Zenodo |
Place of publication: | Frankfurt am Main |
Editor: | Patrick Sahle |
Document Type: | Conference Proceeding |
Language: | German |
Year of first Publication: | 2019 |
Date of Publication (online): | 2019/04/23 |
Publicationstate: | Zweitveröffentlichung |
Reviewstate: | Peer-Review |
GND Keyword: | Annotation; Automatische Spracherkennung; Deutsch; Korpus <Linguistik>; Redewiedergabe |
First Page: | 103 |
Last Page: | 106 |
DDC classes: | 400 Sprache / 400 Sprache, Linguistik |
Open Access?: | ja |
Leibniz-Classification: | Sprache, Linguistik |
Linguistics-Classification: | Computerlinguistik |
Program areas: | Lexik |
Licence (English): | ![]() |