Zur Stratifikation des FOLK-Korpus: Konzeption und Strategien
- Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), zugänglich über die Datenbank für Gesprochenes Deutsch (DGD), strebt den Status eines Referenzkorpus für den aktuellen mündlichen Sprachgebrauch im deutschen Sprachraum an. Es enthält einen wachsenden Bestand von Audio- und Videoaufnahmen authentischer Gespräche aus verschiedenen Bereichen des gesellschaftlichen Lebens. Die Dokumentation und Repräsentation von Interaktions- und Sprecherinformationen sind bereits seit den Anfängen des Korpusaufbaus integrale Bestandteile von FOLK. Allerdings lag bislang kein ausgearbeitetes, empirisch erprobtes und vollständig in die Korpusinfrastruktur integrierbares Stratifikationskonzept vor. Mit dem vorliegenden Artikel wird ein solches Konzept vorgeschlagen. Es knüpft an frühere Konzeptionen an und wurde anhand der vorhandenen Daten überprüft, korrigiert und erweitert. Dieser Prozess verlief parallel zur Überarbeitung des XML-Schemas zur Metadatendokumentation, um die konkrete Implementierung vorzubereiten. Im Anschluss an eine Skizzierung genereller Aspekte des Korpusdesigns werden die stratifikationsleitenden und ergänzenden Parameter vorgestellt und erläutert. Abschließend werden Ansätze und Strategien zum Korpusausbau diskutiert.
- The Research and Teaching Corpus of Spoken German (FOLK), accessible via the Database for Spoken German (DGD), aims for the status of a reference corpus for spoken language in the German-speaking area. It contains a growing inventory of audio and video recordings of authentic conversations from various areas of social life. Since the beginning of the corpus construction, documentation and representation of information about interactions and participants have been integral components. A systematic stratification concept which is explicitly elaborated, tested and capable of being fully integrated is still lacking, though. The present paper will propose such a concept. It builds on previous conceptualizations and has been validated, corrected and expanded on the basis of the existing corpus data. This process took course in parallel with the revision of the XML-schema for metadata documentation in order to prepare for the concrete implementation. After a sketch of general aspects of the corpus design, stratification-leading and additional parameters will be presented and explained. Finally, approaches and strategies for further corpus developments are discussed.
Author: | Julia KaiserGND |
---|---|
URN: | urn:nbn:de:bsz:mh39-86682 |
URL: | http://www.gespraechsforschung-online.de/fileadmin/dateien/heft2018/px-kaiser.pdf |
ISSN: | 1617-1837 |
Parent Title (German): | Gesprächsforschung |
Publisher: | Verlag für Gesprächsforschung |
Place of publication: | Göttingen |
Document Type: | Article |
Language: | German |
Year of first Publication: | 2018 |
Date of Publication (online): | 2019/03/21 |
Publicationstate: | Zweitveröffentlichung |
Reviewstate: | Peer-Review |
Tag: | FOLK-Korpus; Korpusdesign |
GND Keyword: | Gegenwartssprache; Gesprochene Sprache; Konversationsanalyse; Korpus <Linguistik> |
Volume: | 19 |
First Page: | 515 |
Last Page: | 552 |
DDC classes: | 400 Sprache / 430 Deutsch |
Open Access?: | ja |
BDSL-Classification: | Sprache im 20. Jahrhundert. Gegenwartssprache |
Leibniz-Classification: | Sprache, Linguistik |
Linguistics-Classification: | Korpuslinguistik |
Licence (German): | ![]() |