Refine
Year of publication
Document Type
- Part of a Book (41) (remove)
Has Fulltext
- yes (41)
Is part of the Bibliography
- yes (41) (remove)
Keywords
- Korpus <Linguistik> (26)
- Gesprochene Sprache (20)
- Deutsch (11)
- Annotation (7)
- Germanistik (4)
- Interaktion (4)
- Transkription (4)
- Forschungsdaten (3)
- Forschungsmethode (3)
- Kolonialismus (3)
Publicationstate
- Zweitveröffentlichung (17)
- Veröffentlichungsversion (12)
- Postprint (4)
Reviewstate
- (Verlags)-Lektorat (21)
- Peer-Review (8)
- (Verlags-)lektorat (1)
- Peer-review (1)
- Verlags-Lektorat (1)
Publisher
- de Gruyter (10)
- Cambridge Scholars Publ. (4)
- De Gruyter (4)
- Narr (3)
- Wilhelm Fink (3)
- Leibniz-Institut für Deutsche Sprache (IDS) (2)
- Springer (2)
- Austrian academy of sciences (1)
- Benjamins (1)
- European Language Resources Association (1)
Dieser Beitrag setzt sich mit Gesprächskorpora als einem besonderen Typus von Korpora gesprochener Sprache auseinander. Es werden zunächst wesentliche Eigenschaften solcher Korpora herausgearbeitet und einige der wichtigsten deutschsprachigen Gesprächskorpora vorgestellt. Der zweite Teil des Beitrags setzt sich dann mit dem Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) auseinander. FOLK hat sich zum Ziel gesetzt, ein wissenschaftsöffentliches Korpus von Interaktionsdaten aufzubauen, das methodisch und technisch dem aktuellen Forschungsstand entspricht. Die Herausforderungen, die sich beim Aufbau von FOLK in methodischer und korpustechnologischer Hinsicht stellen, werden in abschließenden Abschnitt diskutiert.
This article discusses questions concerning the creation, annotation and sharing of spoken language corpora. We use the Hamburg Map Task Corpus (HAMATAC), a small corpus in which advanced learners of German were recorded solving a map task, as an example to illustrate our main points. We first give an overview of the corpus creation and annotation process including recording, metadata documentation, transcription and semi-automatic annotation of the data. We then discuss the manual annotation of disfluencies as an example case in which many of the typical and challenging problems for data reuse – in particular the reliability of interpretative annotations – are revealed.
Einleitung
(2018)
Einleitung
(2023)
Einleitung
(2023)
Der Beitrag illustriert die Nutzung des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für interaktionslinguistische Fragestellungen anhand einer exemplarischen Studie. Zunächst werden die Stratifikation (Datenkomposition) des Korpus, das zugrundeliegende Datenmodell und dessen Annotationsebenen sowie Typen von Untersuchungsinteressen vorgestellt, für die das Korpus nutzbar ist. Im Hauptteil wird Schritt für Schritt anhand einer Studie zur Verwendung des Formats was heißt X in der sozialen Interaktion gezeigt, wie mit FOLK relevante Daten gefunden und analysiert werden können. Abschließend weisen wir auf einige Vorsichtsmaßnahmen bei der Benutzung des Korpus hin.