Volltext-Downloads (blau) und Frontdoor-Views (grau)

The IVK-Ler corpus of adolescent foreign-language learners of German

  • This paper presents the IVK-Ler corpus, a longitudinal, annotated learner corpus of weekly writings produced by a group of 18 adolescents in a preparatory class. The corpus consists of 117 student texts collected between 2020 and 2021 and has a structure layered by student and text number. It includes metadata that enables researchers to analyze and track individual student progress in terms of syntactic competence and literacy. The annotation schema, manual and automatic annotation processes, and corpus representation are described in detail. The corpus currently includes target hypotheses and gold standard part-of-speech tags. Future work could include additional annotation layers for topological fields and dependency relations, as well as semantic and discourse annotations to make the corpus usable for tasks beyond syntactic evaluations.
  • Dieser Artikel präsentiert das IVK-Ler Korpus, ein longitudinal annotiertes Lernkorpus von wöchentlichen Aufsätzen, produziert von einer Gruppe von 18 Jugendlichen in einer Vorbereitungsklasse. Das Korpus besteht aus 117 Schülertexten, die zwischen 2020 und 2021 gesammelt wurden und hat eine Struktur, die nach Schüler und Textnummer geordnet ist. Es enthält Metadaten, die Forscher ermöglichen, den individuellen Fortschritt der Schüler hinsichtlich syntaktischer Kompetenz und Literacy zu analysieren und zu verfolgen. Das Annotation-Schema, die manuellen und automatischen Annotation-Prozesse sowie die Korpus-Darstellung werden detailliert beschrieben. Das Korpus enthält derzeit Zielhypothesen und Goldstandard-POS-Tags. Zukünftige Erweiterungen könnten zusätzliche Annotation-Schichten für topologische Felder und Abhängigkeitsbeziehungen sowie semantische und Diskurs-Annotationen beinhalten, um das Korpus für Aufgaben jenseits syntaktischer Bewertungen nutzbar zu machen.

This document is embargoed until:

2024/11/01

Export metadata

Statistics

frontdoor_oas
Metadaten
Author:Alexandra Pushkina, Erhard HinrichsORCiDGND
URN:urn:nbn:de:bsz:mh39-121566
DOI:https://doi.org/10.24053/9783823396109
ISBN:978-3-8233-8610-0
ISSN:0949-409X
Parent Title (German):Korpusgestützte Sprachanalyse. Grundlagen, Anwendungen und Analysen
Series (Serial Number):Studien zur deutschen Sprache (88)
Publisher:Narr Francke Attempto
Place of publication:Tübingen
Editor:Michael Beißwenger, Eva Gredel, Lothar Lemnitzer, Roman Schneider
Document Type:Part of a Book
Language:English
Year of first Publication:2023
Date of Publication (online):2023/10/06
Publishing Institution:Leibniz-Institut für Deutsche Sprache (IDS) [Zweitveröffentlichung]
Publicationstate:Zweitveröffentlichung
Reviewstate:(Verlags)-Lektorat
Tag:IVK-Ler corpus of German; annotation schema; learner corpus of adolescent; longitudinal study; metadata analysis; syntactic competence
GND Keyword:Annotation; Jugendlicher; Korpus <Linguistik>; Schüler; Syntax
First Page:87
Last Page:104
DDC classes:400 Sprache / 400 Sprache, Linguistik
Open Access?:ja
Leibniz-Classification:Sprache, Linguistik
Linguistics-Classification:Korpuslinguistik
Program areas:S2: Forschungskoordination und –infrastrukturen
Licence (German):License LogoUrheberrechtlich geschützt