Refine
Document Type
- Part of a Book (2)
- Conference Proceeding (1)
Has Fulltext
- yes (3)
Is part of the Bibliography
- no (3)
Keywords
- Gesprochene Sprache (2)
- Kiezdeutsch (2)
- Korpus <Linguistik> (2)
- Stadtmundart (2)
- Jugendsprache (1)
- Mehrsprachigkeit (1)
- Multikulturelle Gesellschaft (1)
- Soziolekt (1)
- Sprachkontakt (1)
- Sprachwandel (1)
Publicationstate
- Veröffentlichungsversion (3) (remove)
Reviewstate
Publisher
Annotating Spoken Language
(2014)
Der Beitrag behandelt den Sprachgebrauch in multiethnischen Sprechergemeinschaften im urbanen Raum. Ich zeige, dass die Varietät, die sich hier entwickelt, als neuer Dialekt des Deutschen verstanden werden kann. Dieser Dialekt ist gekennzeichnet durch Charakteristika auf lexikalischer und grammatischer Ebene, die auf systematische Muster sprachlicher Variation und sprachlichen Wandels hinweisen, und erhält durch seine Sprechergemeinschaft mit vielen (aber nicht nur) mehrsprachigen Sprecher/inne/n eine besondere sprachliche Dynamik. Ich diskutiere zwei Beispiele, intensivierend gebrauchtes „voll“ und monomorphematisches, existenzanzeigendes „gib(t)s“, die die quantitative Expansion bzw. die Weiterentwicklung und den qualitativen Ausbau von Phänomenen illustrieren, die auch aus anderen Varietäten des Deutschen bekannt sind. Der multiethnische urbane Dialekt, der hier entsteht, spiegelt damit Entwicklungstendenzen des Deutschen wieder, die in einigen Fällen zusätzlich durch Sprachkontaktphänomene gestützt werden können.
This paper presents the first release of the KiezDeutsch Korpus (KiDKo), a new language resource with multiparty spoken dialogues of Kiezdeutsch, a newly emerging language variety spoken by adolescents from multi-ethnic urban areas in Germany. The first release of the corpus includes the transcriptions of the data as well as a normalisation layer and part-of-speech annotations. In the paper, we describe the main features of the new resource and then focus on automatic POS tagging of informal spoken language. Our tagger achieves an accuracy of nearly 97% on KiDKo. While we did not succeed in further improving the tagger using ensemble tagging, we present our approach to using the tagger ensembles for identifying error patterns in the automatically tagged data.