Schriftliche und mündliche Korpora am IDS als Grundlage für die empirische Forschung
- Die Programmbereiche „Korpuslinguistik“ und „Mündliche Korpora“ haben am IDS die Aufgabe, Grundlagen für die empirische Erforschung der deutschen Sprache zu legen. Unter anderem sammeln und erstellen sie schriftliche und mündliche Korpora, bereiten sie für eine wissenschaftliche Nutzung auf und stellen sie über Web-Oberflächen (COSMAS, DGD2 demnächst KorAP) zur Verfügung. Unser Beitrag gibt zunächst einen Überblick über Entstehungsgeschichte und aktuellen Stand dieser Arbeiten. Mit einem Blick in die Zukunft widmen wir uns auch der Frage, ob und in welcher Weise das Schlagwort ,Big Data‘ für diese Arten linguistischer Ressourcen relevant ist. In Bezug auf die schriftlichen Korpora wird dabei insbesondere über die diesjährige DEREKo-Erweiterung um über 17 Milliarden Wörter und die damit verbundenen Arbeiten berichtet. In diesem Zusammenhang werden u.a. DeReKos Design, die zugrundeliegende Akquisitionsstrategie und Überlegungen zu Dispersion und Stratifizierbarkeit diskutiert. Die spezifischen Herausforderungen, die sich beim Aufbau eines großen Gesprächskorpus stellen, werden am Beispiel des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) diskutiert. Dabei steht außer Frage, dass angesichts des Aufwandes, den Feldzugang sowie Erschließung der im Feld gewonnenen Audio- und Videodaten bedeuten, vergleichbare Datenmengen und Wachstumsraten wie bei Textkorpora nicht zu erreichen sind. Für den Aufbau umfangreicher mündlicher Korpora ist daher die Entwicklung eines eigenen Methodeninstrumentariums notwendig.
Author: | Marc KupietzGND, Thomas SchmidtORCiDGND |
---|---|
URN: | urn:nbn:de:bsz:mh39-34824 |
URL: | http://www.degruyter.com/view/product/428467?rskey=lFmg76&result=1 |
ISBN: | 978-3-11-035881-0 |
Parent Title (German): | Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven |
Series (Serial Number): | Jahrbuch / Institut für Deutsche Sprache (2014) |
Publisher: | De Gruyter |
Place of publication: | Berlin [u.a.] |
Editor: | Ludwig M. Eichinger |
Document Type: | Part of a Book |
Language: | German |
Year of first Publication: | 2015 |
Date of Publication (online): | 2015/02/18 |
Reviewstate: | Verlags-Lektorat |
Tag: | Institut für Deutsche Sprache <Mannheim> |
GND Keyword: | Gesprochene Sprache; Korpus <Linguistik>; Textlinguistik |
First Page: | 297 |
Last Page: | 322 |
Note: | Dieser Beitrag ist aus urheberrechtlichen Gründen nicht frei zugänglich. |
DDC classes: | 400 Sprache / 430 Deutsch |
Open Access?: | nein |
Licence (German): | Urheberrechtlich geschützt |