TY - CHAP U1 - Buchbeitrag A1 - Rehbein, Ines A1 - Schalowski, Sören A1 - Wiese, Heike ED - Ruhi, Şükriye ED - Haugh, Michael ED - Schmidt, Thomas ED - Wörner, Kai T1 - Annotating Spoken Language T2 - Best Practices for Spoken Corpora in Linguistic Research KW - Gesprochene Sprache KW - Syntaktische Analyse KW - Korpus KW - Soziolekt KW - Kiezdeutsch Y1 - 2014 SN - 978-1-4438-6033-8 SB - 978-1-4438-6033-8 SP - 75 EP - 94 PB - Cambridge Scholars Publishing CY - Newcastle ER - TY - CHAP U1 - Konferenzveröffentlichung A1 - Rehbein, Ines A1 - Schalowski, Sören A1 - Wiese, Heike ED - Calzolari, Nicoletta ED - Choukri, Khalid ED - Declerck, Thierry ED - Loftsson, Hrafn ED - Maegaard, Bente ED - Mariani, Joseph ED - Moreno, Asuncion ED - Odijk, Jan ED - Piperidis, Stelios T1 - The KiezDeutsch Korpus (KiDKo) Release 1.0 T2 - Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14). May 26-31, 2014. Harpa Concert Hall and Conference Center. Reykjavik, Iceland N2 - This paper presents the first release of the KiezDeutsch Korpus (KiDKo), a new language resource with multiparty spoken dialogues of Kiezdeutsch, a newly emerging language variety spoken by adolescents from multi-ethnic urban areas in Germany. The first release of the corpus includes the transcriptions of the data as well as a normalisation layer and part-of-speech annotations. In the paper, we describe the main features of the new resource and then focus on automatic POS tagging of informal spoken language. Our tagger achieves an accuracy of nearly 97% on KiDKo. While we did not succeed in further improving the tagger using ensemble tagging, we present our approach to using the tagger ensembles for identifying error patterns in the automatically tagged data. KW - spoken language corpora KW - urban youth language KW - Kiezdeutsch KW - Gesprochene Sprache KW - Stadtmundart KW - Jugendsprache KW - Multikulturelle Gesellschaft KW - Korpus Y1 - 2014 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:mh39-55999 UN - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:mh39-55999 UR - www.lrec-conf.org/proceedings/lrec2014/index.html SN - 978-2-9517408-8-4 SB - 978-2-9517408-8-4 SP - 3927 EP - 3934 PB - European Language Resources Association CY - Paris ER - TY - JOUR U1 - Zeitschriftenartikel, wissenschaftlich - begutachtet (reviewed) A1 - Zimmer, Christian A1 - Wiese, Heike A1 - Simon, Horst J. A1 - Zappen-Thomson, Marianne A1 - Bracke, Yannic A1 - Stuhl, Britta A1 - Schmidt, Thomas ED - Henning, Lobin ED - Habermann, Mechthild T1 - Das Korpus Deutsch in Namibia (DNam): Eine Ressource für die Kontakt-, Variations- und Soziolinguistik JF - Deutsche Sprache N2 - Dieser Beitrag widmet sich der Beschreibung des Korpus Deutsch in Namibia (DNam), das über die Datenbank für Gesprochenes Deutsch (DGD) frei zugänglich ist. Bei diesem Korpus handelt es sich um eine neue digitale Ressource, die den Sprachgebrauch der deutschsprachigen Minderheit in Namibia sowie die zugehörigen Spracheinstellungen umfassend und systematisch dokumentiert. Wir beschreiben die Datenerhebung und die dabei angewandten Methoden (freie Gespräche, „Sprachsituationen“, semi-strukturierte Interviews), die Datenaufbereitung inklusive Transkription, Normalisierung und Tagging sowie die Eigenschaften des verfügbaren Korpus (Umfang, verfügbare Metadaten usw.) und einige grundlegende Funktionalitäten im Rahmen der DGD. Erste Forschungsergebnisse, die mithilfe der neuen Ressource erzielt wurden, veranschaulichen die vielseitige Nutzbarkeit des Korpus für Fragestellungen aus den Bereichen Kontakt-, Variations- und Soziolinguistik. N2 - This article describes the corpus Deutsch in Namibia (DNam, ‘German in Namibia’), which is openly accessible via the Datenbank für Gesprochenes Deutsch (DGD, ‘Database for Spoken German’). This corpus is a new digital resource which comprehensively and systematically documents the language use of the German- speaking minority in Namibia and the related attitudes towards language. We discuss the data collection and elicitation methods used (conversation groups, “language situations”, semi-structured interviews), the data processing, including transcription, normalisation and tagging, as well as the general characteristics of the corpus (size, available metadata etc.) and some basic functionalities available in the DGD. First research results based on this new empirical resource illustrate its value for studies on language contact, language variation and sociolinguistics. KW - Deutsch KW - Namibia KW - Soziolinguistik KW - Sprachgeographie KW - Korpus KW - Gesprochenes Deutsch KW - Deutsch in Namibia (DNam) Y1 - 2020 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:mh39-100570 UN - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:mh39-100570 SN - 1868-775X SS - 1868-775X VL - 48 IS - 3 SP - 210 EP - 232 S1 - 23 PB - Erich Schmidt CY - Berlin ER - TY - JOUR U1 - Zeitschriftenartikel, wissenschaftlich - begutachtet (reviewed) A1 - Wiese, Heike A1 - Rehbein, Ines ED - Hinskens, Frans ED - Guy, Gregory Riordan T1 - Coherence in new urban dialects: A case study JF - Lingua: Coherence, covariation and bricolage. Various approaches to the systematicity of language variation N2 - This paper investigates evidence for linguistic coherence in new urban dialects that evolved in multiethnic and multilingual urban neighbourhoods. We propose a view of coherence as an interpretation of empirical observations rather than something that would be ‘‘out there in the data’’, and argue that this interpretation should be based on evidence of systematic links between linguistic phenomena, as established by patterns of covariation between phenomena that can be shown to be related at linguistic levels. In a case study, we present results from qualitative and quantitative analyses for a set of phenomena that have been described for Kiezdeutsch, a new dialect from multilingual urban Germany. Qualitative analyses point to linguistic relationships between different phenomena and between pragmatic and linguistic levels. Quantitative analyses, based on corpus data from KiDKo (www.kiezdeutschkorpus.de), point to systematic advantages for the Kiezdeutsch data from a multiethnic and multilingual context provided by the main corpus (KiDKo/Mu), compared to complementary corpus data from a mostly monoethnic and monolingual (German) context (KiDKo/Mo). Taken together, this indicates patterns of covariation that support an interpretation of coherence for this new dialect: our findings point to an interconnected linguistic system, rather than to a mere accumulation of individual features. In addition to this internal coherence, the data also points to external coherence: Kiezdeutsch is not disconnected on the outside either, but fully integrated within the general domain of German, an integration that defies a distinction of ‘‘autochthonous’’ and ‘‘allochthonous’’ German, not only at the level of speakers, but also at the level of linguistic systems. KW - Covariation KW - Internal and external coherence KW - Urban dialects KW - Directive particles KW - Light verbs KW - Multikulturelle Gesellschaft KW - Gesprochenes Deutsch KW - Jugendsprache KW - Korpus KW - Partikel KW - Mundart KW - Mehrsprachigkeit Y1 - 2015 UN - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:mh39-101160 SN - 0024-3841 SS - 0024-3841 U6 - https://dx.doi.org/10.1016/j.lingua.2015.10.016 DO - https://dx.doi.org/10.1016/j.lingua.2015.10.016 VL - 2016 SP - 45 EP - 61 PB - Elsevier CY - Amsterdam ER - TY - CHAP U1 - Buchbeitrag A1 - Wiese, Heike T1 - Das Potenzial multiethnischer Sprechergemeinschaften T2 - Das Deutsch der Migranten N2 - Der Beitrag behandelt den Sprachgebrauch in multiethnischen Sprechergemeinschaften im urbanen Raum. Ich zeige, dass die Varietät, die sich hier entwickelt, als neuer Dialekt des Deutschen verstanden werden kann. Dieser Dialekt ist gekennzeichnet durch Charakteristika auf lexikalischer und grammatischer Ebene, die auf systematische Muster sprachlicher Variation und sprachlichen Wandels hinweisen, und erhält durch seine Sprechergemeinschaft mit vielen (aber nicht nur) mehrsprachigen Sprecher/inne/n eine besondere sprachliche Dynamik. Ich diskutiere zwei Beispiele, intensivierend gebrauchtes „voll“ und monomorphematisches, existenzanzeigendes „gib(t)s“, die die quantitative Expansion bzw. die Weiterentwicklung und den qualitativen Ausbau von Phänomenen illustrieren, die auch aus anderen Varietäten des Deutschen bekannt sind. Der multiethnische urbane Dialekt, der hier entsteht, spiegelt damit Entwicklungstendenzen des Deutschen wieder, die in einigen Fällen zusätzlich durch Sprachkontaktphänomene gestützt werden können. T3 - Jahrbuch / Institut für Deutsche Sprache - ~ 2012 KW - Stadtmundart KW - Mehrsprachigkeit KW - Sprachwandel KW - Sprachkontakt Y1 - 2013 U6 - https://dx.doi.org/10.1515/9783110307894.41 DO - https://dx.doi.org/10.1515/9783110307894.41 SP - 41 EP - 58 PB - de Gruyter CY - Berlin [u.a.] ER -