Volltext-Downloads (blau) und Frontdoor-Views (grau)

Diskursmarker aus korpuslinguistischer Sicht –POS-Annotation von Diskursmarkern in FOLK

  • Wie können Diskursmarker in einem Korpus gesprochener Sprache auffindbar gemacht werden? Was ist Part-of-Speech-Tagging und wie funktioniert es? In diesem Artikel soll anhand der POS-Kategorie Diskursmarker dargestellt werden, wie für das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) ein Part-of-Speech-Tagging entwickelt wurde, das auf die Annotation typisch gesprochen-sprachlicher Phänomene ausgerichtet ist. Diskursmarker sollen dafür aus der Sicht maschineller Sprachverarbeitung dargestellt werden, d. h. wie eine POS-Kategorie Diskursmarker so definiert werden kann, dass sie automatisch annotiert werden kann. Schließlich soll gezeigt werden, wie man auch weitere Diskursmarker in der Datenbank auffinden kann
  • How can discourse markers be identified for research in a corpus of transcripts of spoken language? What is part-of-speech tagging and how does it work? In this paper we show how part-of-speech tagging was developed for the Research and Teaching Corpus of Spoken German (FOLK) with respect to phenomena typical of spoken language and using discourse markers as an example. We present discourse markers from the perspective of machine learning, i.e. how the POS category of discourse marker can be defined in such a way that it can be annotated automatically by a POS tagger. Finally, this paper illustrates how discourse markers other than those annotated by the POS category can be found in the database.

Download full text files

Export metadata

Additional Services

Search Google Scholar


Author:Swantje Westpfahl
Parent Title (German):Diskursmarker im Deutschen. Reflexionen und Analysen
Publisher:Verlag für Gesprächsforschung
Place of publication:Göttingen
Editor:Hardarik Blühdorn, Arnulf Deppermann, Henrike Helmer, Thomas Spranz-Fogasy
Document Type:Part of a Book
Year of first Publication:2017
Date of Publication (online):2017/06/29
GND Keyword:Diskursmarker; Gesprochene Sprache; Korpus <Linguistik>
First Page:285
Last Page:309
DDC classes:400 Sprache / 430 Deutsch
Open Access?:ja
Leibniz-Classification:Sprache, Linguistik
Linguistics-Classification:Gesprächsforschung / Gesprochene Sprache
Program areas:Pragmatik
Licence (German):License LogoUrheberrechtlich geschützt