@article{Perkuhn2022, author = {Rainer Perkuhn}, title = {Angebote zu den Korpora der deutschen Gegenwartsschriftsprache am Leibniz-Institut f{\"u}r Deutsche Sprache, Mannheim}, series = {Mitteilungen des Deutschen Germanistenverbandes}, volume = {69}, number = {2}, editor = {Michael Bender and Katharina Jacob}, publisher = {V\&R Unipress}, address = {G{\"o}ttingen}, issn = {2196-8756}, doi = {10.14220/mdge.2022.69.2.142}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:mh39-110910}, pages = {142 -- 151}, year = {2022}, abstract = {Korpora sind – als idealerweise digital verf{\"u}g- und auswertbare Sammlungen von Texten – eine wertvolle empirische Grundlage linguistischer Studien. Eigene Korpora aufzubauen ist, je nach Sprachausschnitt, mit unterschiedlichen Herausforderungen verbunden. Zu allen Texten sollten Metadaten zu den Textentstehungsbedingungen (Zeit, Quelle usw.) erhoben werden, um diese als Variablen in Auswertungen einbeziehen zu k{\"o}nnen. Andere Informationen wie etwa die Themenzugeh{\"o}rigkeit (oder Annotationen auch unterhalb der Textebene) sind auch hilfreich, in vielerlei Hinsicht aber schwieriger pauschal taxonomisch vorzugeben, geschweige denn, operationell zu ermitteln. Jenseits der »materiellen« Verf{\"u}gbarkeit der Texte und der technischen Aufbereitung sind es das Urheberrecht, vor allem Lizenz- bzw. Nutzungsrechte, sowie ethische Verantwortung und Pers{\"o}nlichkeitsrechte, die beachtet werden m{\"u}ssen, auch um zu gew{\"a}hrleisten, dass die Daten f{\"u}r die Reproduktion der Studien Dritten rechtssicher zug{\"a}nglich gemacht werden d{\"u}rfen. Bevor f{\"u}r ein Vorhaben ein neues Korpus aufgebaut wird, sollte deshalb am besten gepr{\"u}ft werden, ob nicht ein geeignetes bereits zur Verf{\"u}gung steht. Wenn ein Korpus aufgebaut wird, sollte f{\"u}r eine nachhaltige Aufbewahrung und Zug{\"a}nglichmachung gesorgt und die Existenz an geeigneter Stelle dokumentiert werden.}, language = {de} }