TY - JOUR U1 - Zeitschriftenartikel, wissenschaftlich - begutachtet (reviewed) A1 - Perkuhn, Rainer ED - Bender, Michael ED - Jacob, Katharina T1 - Angebote zu den Korpora der deutschen Gegenwartsschriftsprache am Leibniz-Institut für Deutsche Sprache, Mannheim JF - Mitteilungen des Deutschen Germanistenverbandes N2 - Korpora sind – als idealerweise digital verfüg- und auswertbare Sammlungen von Texten – eine wertvolle empirische Grundlage linguistischer Studien. Eigene Korpora aufzubauen ist, je nach Sprachausschnitt, mit unterschiedlichen Herausforderungen verbunden. Zu allen Texten sollten Metadaten zu den Textentstehungsbedingungen (Zeit, Quelle usw.) erhoben werden, um diese als Variablen in Auswertungen einbeziehen zu können. Andere Informationen wie etwa die Themenzugehörigkeit (oder Annotationen auch unterhalb der Textebene) sind auch hilfreich, in vielerlei Hinsicht aber schwieriger pauschal taxonomisch vorzugeben, geschweige denn, operationell zu ermitteln. Jenseits der »materiellen« Verfügbarkeit der Texte und der technischen Aufbereitung sind es das Urheberrecht, vor allem Lizenz- bzw. Nutzungsrechte, sowie ethische Verantwortung und Persönlichkeitsrechte, die beachtet werden müssen, auch um zu gewährleisten, dass die Daten für die Reproduktion der Studien Dritten rechtssicher zugänglich gemacht werden dürfen. Bevor für ein Vorhaben ein neues Korpus aufgebaut wird, sollte deshalb am besten geprüft werden, ob nicht ein geeignetes bereits zur Verfügung steht. Wenn ein Korpus aufgebaut wird, sollte für eine nachhaltige Aufbewahrung und Zugänglichmachung gesorgt und die Existenz an geeigneter Stelle dokumentiert werden. KW - Korpus KW - Deutsch KW - Schriftsprache KW - Gegenwartssprache KW - Metadaten KW - Verfügbarkeit KW - Aufbereitung KW - Urheberrecht KW - Nutzungsrecht KW - Persönlichkeitsrecht KW - Daten Y1 - 2022 UN - https://nbn-resolving.org/urn:nbn:de:bsz:mh39-110910 SN - 2196-8756 SS - 2196-8756 U6 - https://doi.org/10.14220/mdge.2022.69.2.142 DO - https://doi.org/10.14220/mdge.2022.69.2.142 VL - 69 IS - 2 SP - 142 EP - 151 PB - V&R Unipress CY - Göttingen ER -