Diskursmarker aus korpuslinguistischer Sicht –POS-Annotation von Diskursmarkern in FOLK
- Wie können Diskursmarker in einem Korpus gesprochener Sprache auffindbar gemacht werden? Was ist Part-of-Speech-Tagging und wie funktioniert es? In diesem Artikel soll anhand der POS-Kategorie Diskursmarker dargestellt werden, wie für das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) ein Part-of-Speech-Tagging entwickelt wurde, das auf die Annotation typisch gesprochen-sprachlicher Phänomene ausgerichtet ist. Diskursmarker sollen dafür aus der Sicht maschineller Sprachverarbeitung dargestellt werden, d. h. wie eine POS-Kategorie Diskursmarker so definiert werden kann, dass sie automatisch annotiert werden kann. Schließlich soll gezeigt werden, wie man auch weitere Diskursmarker in der Datenbank auffinden kann
- How can discourse markers be identified for research in a corpus of transcripts of spoken language? What is part-of-speech tagging and how does it work? In this paper we show how part-of-speech tagging was developed for the Research and Teaching Corpus of Spoken German (FOLK) with respect to phenomena typical of spoken language and using discourse markers as an example. We present discourse markers from the perspective of machine learning, i.e. how the POS category of discourse marker can be defined in such a way that it can be annotated automatically by a POS tagger. Finally, this paper illustrates how discourse markers other than those annotated by the POS category can be found in the database.
Author: | Swantje Westpfahl |
---|---|
URN: | urn:nbn:de:bsz:mh39-62381 |
URL: | http://verlag-gespraechsforschung.de/2017/bluehdorn.html |
ISBN: | 978-3-936656-69-5 |
Parent Title (German): | Diskursmarker im Deutschen. Reflexionen und Analysen |
Publisher: | Verlag für Gesprächsforschung |
Place of publication: | Göttingen |
Editor: | Hardarik Blühdorn, Arnulf Deppermann, Henrike Helmer, Thomas Spranz-Fogasy |
Document Type: | Part of a Book |
Language: | German |
Year of first Publication: | 2017 |
Date of Publication (online): | 2017/06/29 |
Publicationstate: | Veröffentlichungsversion |
Reviewstate: | (Verlags)-Lektorat |
Tag: | Korpuslinguistik Part-of-Speech-Tagging |
GND Keyword: | Diskursmarker; Gesprochene Sprache; Korpus <Linguistik> |
First Page: | 285 |
Last Page: | 309 |
DDC classes: | 400 Sprache / 430 Deutsch |
Open Access?: | ja |
Leibniz-Classification: | Sprache, Linguistik |
Linguistics-Classification: | Gesprächsforschung / Gesprochene Sprache |
Linguistics-Classification: | Korpuslinguistik |
Program areas: | Pragmatik |
Licence (German): | Urheberrechtlich geschützt |