Angebote zu den Korpora der deutschen Gegenwartsschriftsprache am Leibniz-Institut für Deutsche Sprache, Mannheim
- Korpora sind – als idealerweise digital verfüg- und auswertbare Sammlungen von Texten – eine wertvolle empirische Grundlage linguistischer Studien. Eigene Korpora aufzubauen ist, je nach Sprachausschnitt, mit unterschiedlichen Herausforderungen verbunden. Zu allen Texten sollten Metadaten zu den Textentstehungsbedingungen (Zeit, Quelle usw.) erhoben werden, um diese als Variablen in Auswertungen einbeziehen zu können. Andere Informationen wie etwa die Themenzugehörigkeit (oder Annotationen auch unterhalb der Textebene) sind auch hilfreich, in vielerlei Hinsicht aber schwieriger pauschal taxonomisch vorzugeben, geschweige denn, operationell zu ermitteln. Jenseits der »materiellen« Verfügbarkeit der Texte und der technischen Aufbereitung sind es das Urheberrecht, vor allem Lizenz- bzw. Nutzungsrechte, sowie ethische Verantwortung und Persönlichkeitsrechte, die beachtet werden müssen, auch um zu gewährleisten, dass die Daten für die Reproduktion der Studien Dritten rechtssicher zugänglich gemacht werden dürfen. Bevor für ein Vorhaben ein neues Korpus aufgebaut wird, sollte deshalb am besten geprüft werden, ob nicht ein geeignetes bereits zur Verfügung steht. Wenn ein Korpus aufgebaut wird, sollte für eine nachhaltige Aufbewahrung und Zugänglichmachung gesorgt und die Existenz an geeigneter Stelle dokumentiert werden.
Author: | Rainer PerkuhnGND |
---|---|
URN: | urn:nbn:de:bsz:mh39-110910 |
DOI: | https://doi.org/10.14220/mdge.2022.69.2.142 |
ISSN: | 2196-8756 |
Parent Title (German): | Mitteilungen des Deutschen Germanistenverbandes |
Publisher: | V&R Unipress |
Place of publication: | Göttingen |
Editor: | Michael Bender, Katharina Jacob |
Document Type: | Article |
Language: | German |
Year of first Publication: | 2022 |
Date of Publication (online): | 2022/06/17 |
Publishing Institution: | Leibniz-Institut für Deutsche Sprache (IDS) |
Publicationstate: | Zweitveröffentlichung |
Publicationstate: | Postprint |
Reviewstate: | (Verlags)-Lektorat |
GND Keyword: | Aufbereitung; Daten; Deutsch; Gegenwartssprache; Korpus <Linguistik>; Metadaten; Nutzungsrecht; Persönlichkeitsrecht; Schriftsprache; Urheberrecht; Verfügbarkeit |
Volume: | 69 |
Issue: | 2 |
First Page: | 142 |
Last Page: | 151 |
DDC classes: | 400 Sprache / 430 Deutsch / 430 Deutsch |
Open Access?: | ja |
BDSL-Classification: | Sprache im 20. Jahrhundert. Gegenwartssprache |
Leibniz-Classification: | Sprache, Linguistik |
Linguistics-Classification: | Korpuslinguistik |
Program areas: | S1: Korpuslinguistik |
Licence (German): | ![]() |