Refine
Document Type
- Article (2)
- Part of a Book (2)
- Conference Proceeding (1)
Has Fulltext
- yes (5)
Keywords
- Korpus <Linguistik> (4)
- Gesprochene Sprache (2)
- Gesprochenes Deutsch (2)
- Jugendsprache (2)
- Kiezdeutsch (2)
- Mehrsprachigkeit (2)
- Multikulturelle Gesellschaft (2)
- Stadtmundart (2)
- Covariation (1)
- Deutsch (1)
Publicationstate
Reviewstate
- (Verlags)-Lektorat (3)
- Peer-Review (1)
Publisher
This paper investigates evidence for linguistic coherence in new urban dialects that evolved in multiethnic and multilingual urban neighbourhoods. We propose a view of coherence as an interpretation of empirical observations rather than something that would be ‘‘out there in the data’’, and argue that this interpretation should be based on evidence of systematic links between linguistic phenomena, as established by patterns of covariation between phenomena that can be shown to be related at linguistic levels. In a case study, we present results from qualitative and quantitative analyses for a set of phenomena that have been described for Kiezdeutsch, a new dialect from multilingual urban Germany. Qualitative analyses point to linguistic relationships between different phenomena and between pragmatic and linguistic levels. Quantitative analyses, based on corpus data from KiDKo (www.kiezdeutschkorpus.de), point to systematic advantages for the Kiezdeutsch data from a multiethnic and multilingual context provided by the main corpus (KiDKo/Mu), compared to complementary corpus data from a mostly monoethnic and monolingual (German) context (KiDKo/Mo). Taken together, this indicates patterns of covariation that support an interpretation of coherence for this new dialect: our findings point to an interconnected linguistic system, rather than to a mere accumulation of individual features. In addition to this internal coherence, the data also points to external coherence: Kiezdeutsch is not disconnected on the outside either, but fully integrated within the general domain of German, an integration that defies a distinction of ‘‘autochthonous’’ and ‘‘allochthonous’’ German, not only at the level of speakers, but also at the level of linguistic systems.
Dieser Beitrag widmet sich der Beschreibung des Korpus Deutsch in Namibia (DNam), das über die Datenbank für Gesprochenes Deutsch (DGD) frei zugänglich ist. Bei diesem Korpus handelt es sich um eine neue digitale Ressource, die den Sprachgebrauch der deutschsprachigen Minderheit in Namibia sowie die zugehörigen Spracheinstellungen umfassend und systematisch dokumentiert. Wir beschreiben die Datenerhebung und die dabei angewandten Methoden (freie Gespräche, „Sprachsituationen“, semi-strukturierte Interviews), die Datenaufbereitung inklusive Transkription, Normalisierung und Tagging sowie die Eigenschaften des verfügbaren Korpus (Umfang, verfügbare Metadaten usw.) und einige grundlegende Funktionalitäten im Rahmen der DGD. Erste Forschungsergebnisse, die mithilfe der neuen Ressource erzielt wurden, veranschaulichen die vielseitige Nutzbarkeit des Korpus für Fragestellungen aus den Bereichen Kontakt-, Variations-
und Soziolinguistik.
Annotating Spoken Language
(2014)
Der Beitrag behandelt den Sprachgebrauch in multiethnischen Sprechergemeinschaften im urbanen Raum. Ich zeige, dass die Varietät, die sich hier entwickelt, als neuer Dialekt des Deutschen verstanden werden kann. Dieser Dialekt ist gekennzeichnet durch Charakteristika auf lexikalischer und grammatischer Ebene, die auf systematische Muster sprachlicher Variation und sprachlichen Wandels hinweisen, und erhält durch seine Sprechergemeinschaft mit vielen (aber nicht nur) mehrsprachigen Sprecher/inne/n eine besondere sprachliche Dynamik. Ich diskutiere zwei Beispiele, intensivierend gebrauchtes „voll“ und monomorphematisches, existenzanzeigendes „gib(t)s“, die die quantitative Expansion bzw. die Weiterentwicklung und den qualitativen Ausbau von Phänomenen illustrieren, die auch aus anderen Varietäten des Deutschen bekannt sind. Der multiethnische urbane Dialekt, der hier entsteht, spiegelt damit Entwicklungstendenzen des Deutschen wieder, die in einigen Fällen zusätzlich durch Sprachkontaktphänomene gestützt werden können.
This paper presents the first release of the KiezDeutsch Korpus (KiDKo), a new language resource with multiparty spoken dialogues of Kiezdeutsch, a newly emerging language variety spoken by adolescents from multi-ethnic urban areas in Germany. The first release of the corpus includes the transcriptions of the data as well as a normalisation layer and part-of-speech annotations. In the paper, we describe the main features of the new resource and then focus on automatic POS tagging of informal spoken language. Our tagger achieves an accuracy of nearly 97% on KiDKo. While we did not succeed in further improving the tagger using ensemble tagging, we present our approach to using the tagger ensembles for identifying error patterns in the automatically tagged data.