POS-Tagging für Transkripte gesprochener Sprache. Entwicklung einer automatisierten Wortarten-Annotation am Beispiel des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK)
- Der Band leistet eine theoretisch begründete und empirisch validierte Entwicklung einer automatisierten Wortartenannotation (Part-of-Speech-Tagging) für Transkripte spontansprachlicher Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), das über die Datenbank für Gesprochenes Deutsch der Forschungsgemeinschaft öffentlich zugänglich ist. Dabei setzt er zwei Schwerpunkte: erstens die theoretische Aufarbeitung von Unterschieden von Transkripten gesprochener Sprache zu schriftsprachlichen Daten in Hinblick auf die Entwicklung eines Tagsets für das gesprochene Deutsch; zweitens die Darstellung der empirischen Arbeitsschritte zur Erstellung des automatisierten Part-of-Speech-Taggings, d. h. die Implementierung und Evaluierung für die Annotation des FOLK-Korpus. Der Band ist eine kritische Reflexion der Wortartentheorien im Spannungsfeld zwischen Theorie und datengeleiteter Arbeit. Er gibt Einblicke über die Korpusaufbereitung von Transkripten gesprochener Sprache und stellt diese in Bezug zu Theorien über die Eigenheiten gesprochener Sprache.
Author: | Swantje Westpfahl |
---|---|
DOI: | https://doi.org/10.2357/9783823393610 |
ISBN: | 978-3-8233-8361-1 |
ISBN: | 978-3-8233-9361-0 (pdf) |
Series (Serial Number): | Studien zur deutschen Sprache (83) |
Publisher: | Narr Francke Attempto |
Place of publication: | Tübingen |
Document Type: | Book |
Language: | German |
Year of first Publication: | 2020 |
Date of Publication (online): | 2020/03/03 |
Publicationstate: | Veröffentlichungsversion |
Reviewstate: | (Verlags)-Lektorat |
GND Keyword: | Annotation; Automatische Sprachanalyse; Deutsch; Gesprochene Sprache; Korpus <Linguistik>; Wortart |
Page Number: | 417 |
Note: | Mannheim, Univ., Diss., |
Note: | Gefördert durch den Open-Access-Monografienfonds der Leibniz-Gemeinschaft |
DDC classes: | 400 Sprache / 400 Sprache, Linguistik |
Open Access?: | ja |
Leibniz-Classification: | Sprache, Linguistik |
Linguistics-Classification: | Computerlinguistik |
Program areas: | Pragmatik |
Licence (English): | Creative Commons - Attribution-ShareAlike 4.0 International |