Refine
Document Type
- Part of a Book (1)
- Conference Proceeding (1)
Has Fulltext
- yes (2)
Is part of the Bibliography
- no (2)
Keywords
- Multikulturelle Gesellschaft (2) (remove)
Publicationstate
- Veröffentlichungsversion (2) (remove)
Reviewstate
Publisher
This paper presents the first release of the KiezDeutsch Korpus (KiDKo), a new language resource with multiparty spoken dialogues of Kiezdeutsch, a newly emerging language variety spoken by adolescents from multi-ethnic urban areas in Germany. The first release of the corpus includes the transcriptions of the data as well as a normalisation layer and part-of-speech annotations. In the paper, we describe the main features of the new resource and then focus on automatic POS tagging of informal spoken language. Our tagger achieves an accuracy of nearly 97% on KiDKo. While we did not succeed in further improving the tagger using ensemble tagging, we present our approach to using the tagger ensembles for identifying error patterns in the automatically tagged data.
In unserem Beitrag beschäftigen wir uns mit einer Gruppe jugendlicher Migrantinnen türkischer Herkunft und ihrem sprachlich-kommunikativen Verhalten. Die Gruppe hat ein weites sprachliches Repertoire, zu dem neben standardnahem Deutsch und dialektalem Türkisch vor allem sprachliche Mischungen gehören. Die Präferenz für Mischungen hängt vor allem mit der sozialen Identität und der Selbstpositionierung der Sprecherinnen in Relation zur türkischen Migrantenpopulation einerseits und der deutschen Gesellschaft andererseits zusammen. Mischungen können, je nach sozialer Orientierung, die die Jugendlichen entwickeln und nach Lebenskontexten, in denen sie sich bewegen, an bestimmte Lebensphasen und Gesprächskonstellationen gebunden sein oder sie können soziolektale Qualität erhalten.