TY - CHAP U1 - Buchbeitrag A1 - Lüngen, Harald A1 - Kupietz, Marc ED - Marx, Konstanze ED - Lobin, Henning ED - Schmidt, Axel T1 - IBK- und Social Media-Korpora am Leibniz-Institut für Deutsche Sprache T2 - Deutsch in sozialen Medien: Interaktiv – multimodal – vielfältig N2 - Der Beitrag untersucht vorhandene Lösungen und neue Möglichkeiten des Korpusausbaus aus Social Media- und internetbasierter Kommunikation (IBK) für das Deutsche Referenzkorpus (DEREKO). DEREKO ist eine Sammlung gegenwartssprachlicher Schriftkorpora am IDS, die der sprachwissenschaftlichen Öffentlichkeit über die Korpusschnittstellen COSMAS II und KorAP angeboten wird. Anhand von Definitionen und Beispielen gehen wir zunächst auf die Extensionen und Überlappungen der Konzepte Social Media, Internetbasierte Kommunikation und Computer-mediated Communication ein. Wir betrachten die rechtlichen Voraussetzungen für einen Korpusausbau aus Sozialen Medien, die sich aus dem kürzlich in relevanten Punkten reformierten deutschen Urheberrecht, aus Persönlichkeitsrechten wie der europäischen Datenschutz-Grundverordnung ergeben und stellen Konsequenzen sowie mögliche und tatsächliche Umsetzungen dar. Der Aufbau von Social Media-Korpora in großen Textmengen unterliegt außerdem korpustechnologischen Herausforderungen, die für traditionelle Schriftkorpora als gelöst galten oder gar nicht erst bestanden. Wir berichten, wie Fragen der Datenaufbereitung, des Korpus-Encoding, der Anonymisierung oder der linguistischen Annotation von Social Media Korpora für DEREKO angegangen wurden und welche Herausforderungen noch bestehen. Wir betrachten die Korpuslandschaft verfügbarer deutschsprachiger IBK- und Social Media-Korpora und geben einen Überblick über den Bestand an IBK- und Social Media-Korpora und ihre Charakteristika (Chat-, Wiki Talk- und Forenkorpora) in DEREKO sowie von laufenden Projekten in diesem Bereich. Anhand korpuslinguistischer Mikro- und Makro-Analysen von Wikipedia-Diskussionen im Vergleich mit dem Gesamtbestand von DEREKO zeigen wir charakterisierende sprachliche Eigenschaften von Wikipedia-Diskussionen auf und bewerten ihren Status als Repräsentant von IBK-Korpora. T3 - Jahrbuch / Leibniz-Institut für Deutsche Sprache (IDS) - - 2019 KW - Deutsch KW - Soziale Medien KW - Leibniz-Institut für Deutsche Sprache (IDS) KW - Korpus KW - Internetkommunikation Y1 - 2020 UN - https://nbn-resolving.org/urn:nbn:de:bsz:mh39-97052 SN - 978-3-11-067886-4 SB - 978-3-11-067886-4 SN - 9783110679885 (Online) SB - 9783110679885 (Online) U6 - https://doi.org/10.1515/9783110679885-016 DO - https://doi.org/10.1515/9783110679885-016 SP - 319 EP - 342 PB - de Gruyter CY - Berlin [u.a.] ER -