The IVK-Ler corpus of adolescent foreign-language learners of German
- This paper presents the IVK-Ler corpus, a longitudinal, annotated learner corpus of weekly writings produced by a group of 18 adolescents in a preparatory class. The corpus consists of 117 student texts collected between 2020 and 2021 and has a structure layered by student and text number. It includes metadata that enables researchers to analyze and track individual student progress in terms of syntactic competence and literacy. The annotation schema, manual and automatic annotation processes, and corpus representation are described in detail. The corpus currently includes target hypotheses and gold standard part-of-speech tags. Future work could include additional annotation layers for topological fields and dependency relations, as well as semantic and discourse annotations to make the corpus usable for tasks beyond syntactic evaluations.
- Dieser Artikel präsentiert das IVK-Ler Korpus, ein longitudinal annotiertes Lernkorpus von wöchentlichen Aufsätzen, produziert von einer Gruppe von 18 Jugendlichen in einer Vorbereitungsklasse. Das Korpus besteht aus 117 Schülertexten, die zwischen 2020 und 2021 gesammelt wurden und hat eine Struktur, die nach Schüler und Textnummer geordnet ist. Es enthält Metadaten, die Forscher ermöglichen, den individuellen Fortschritt der Schüler hinsichtlich syntaktischer Kompetenz und Literacy zu analysieren und zu verfolgen. Das Annotation-Schema, die manuellen und automatischen Annotation-Prozesse sowie die Korpus-Darstellung werden detailliert beschrieben. Das Korpus enthält derzeit Zielhypothesen und Goldstandard-POS-Tags. Zukünftige Erweiterungen könnten zusätzliche Annotation-Schichten für topologische Felder und Abhängigkeitsbeziehungen sowie semantische und Diskurs-Annotationen beinhalten, um das Korpus für Aufgaben jenseits syntaktischer Bewertungen nutzbar zu machen.
Author: | Alexandra Pushkina, Erhard HinrichsORCiDGND |
---|---|
URN: | urn:nbn:de:bsz:mh39-121566 |
DOI: | https://doi.org/10.24053/9783823396109 |
ISBN: | 978-3-8233-8610-0 |
ISSN: | 0949-409X |
Parent Title (German): | Korpusgestützte Sprachanalyse. Grundlagen, Anwendungen und Analysen |
Series (Serial Number): | Studien zur deutschen Sprache (88) |
Publisher: | Narr Francke Attempto |
Place of publication: | Tübingen |
Editor: | Michael Beißwenger, Eva Gredel, Lothar Lemnitzer, Roman Schneider |
Document Type: | Part of a Book |
Language: | English |
Year of first Publication: | 2023 |
Date of Publication (online): | 2023/10/06 |
Publishing Institution: | Leibniz-Institut für Deutsche Sprache (IDS) [Zweitveröffentlichung] |
Publicationstate: | Zweitveröffentlichung |
Reviewstate: | (Verlags)-Lektorat |
Tag: | IVK-Ler corpus of German; annotation schema; learner corpus of adolescent; longitudinal study; metadata analysis; syntactic competence |
GND Keyword: | Annotation; Jugendlicher; Korpus <Linguistik>; Schüler; Syntax |
First Page: | 87 |
Last Page: | 104 |
DDC classes: | 400 Sprache / 400 Sprache, Linguistik |
Open Access?: | ja |
Leibniz-Classification: | Sprache, Linguistik |
Linguistics-Classification: | Korpuslinguistik |
Program areas: | S2: Forschungskoordination und –infrastrukturen |
Licence (German): | Urheberrechtlich geschützt |