The NottdeuYTSch Corpus: a corpus of German-language YouTube comments
- This paper introduces the Nottinghamer Korpus deutscher YouTube-Sprache (‘The Nottingham German YouTube Language Corpus’ - or NottDeuYTSch corpus). The corpus comprises over 33 million words, taken from roughly 3 million YouTube comments published between 2008 and 2018, written by a young, German-speaking demographic. The NottDeuYTSch corpus provides an authentic and representative linguistic snapshot of young German speakers and offers significant opportunities for in-depth research in several linguistic fields, such as lexis, morphology, syntax, orthography, multilingualism, and conversational and discursive analysis.
- In diesem Beitrag wird das Nottinghamer Korpus deutscher YouTube-Sprache (das NottDeuYTSch-Korpus) vorgestellt. Das Korpus hat eine Größe von über 33 Millionen Wörtern, die aus etwa 3 Millionen YouTube-Kommentaren gesammelt wurden. Die Kommentare wurden zwischen 2008 und 2018 veröffentlicht und wurden von einer Gruppe von überwiegend jungen Deutschsprachigen geschrieben. Das NottDeuYTSch-Korpus bietet einen authentischen und repräsentativen sprachlichen Schnappschuss junger Deutschsprachiger und ermöglicht umfangreiche Forschungsmöglichkeiten in verschiedenen linguistischen Bereichen wie Lexik, Morphologie, Syntax, Orthografie, Multilingualismus, sowie Gesprächs- und Diskursanalyse.
Author: | Louis CotgroveORCiDGND |
---|---|
URN: | urn:nbn:de:bsz:mh39-124170 |
DOI: | https://doi.org/10.48694/kordaf.3841 |
ISSN: | 2749-4411 |
Parent Title (German): | Korpora Deutsch als Fremdsprache |
Publisher: | Universitäts- und Landesbibliothek Darmstadt |
Place of publication: | Darmstadt |
Document Type: | Article |
Language: | English |
Year of first Publication: | 2023 |
Date of Publication (online): | 2024/01/02 |
Publishing Institution: | Leibniz-Institut für Deutsche Sprache (IDS) |
Publicationstate: | Veröffentlichungsversion |
Reviewstate: | Peer-Review |
Tag: | Deutsch; Digitale Kommunikation; Jugendsprache; Korpuslinguistik; Multilingualismus; NottDeuYTSch-Korpus CMC; German; YouTube; corpus linguistics; multilingualism; online language; youth language |
GND Keyword: | Computerunterstützte Kommunikation; Deutsch; Jugendsprache; Kommunikation; Korpus <Linguistik>; Mehrsprachigkeit; YouTube |
Volume: | 3 |
Issue: | 2 |
First Page: | 225 |
Last Page: | 229 |
DDC classes: | 400 Sprache / 400 Sprache, Linguistik |
Open Access?: | ja |
Leibniz-Classification: | Sprache, Linguistik |
Linguistics-Classification: | Korpuslinguistik |
Program areas: | L3: Lexik empirisch und digital |
Licence (English): | Creative Commons - Attribution 4.0 International |