@incollection{Luedeling2018, author = {Anke L{\"u}deling}, title = {Das Zusammenspiel von qualitativen und quantitativen Methoden in der Korpuslinguistik}, series = {Sprachkorpora. Datenmengen und Erkenntnisfortschritt}, editor = {Werner Kallmeyer and Gisela Zifonun}, publisher = {de Gruyter}, address = {Berlin [u.a.]}, doi = {10.1515/9783110439083-004}, pages = {28 -- 48}, year = {2018}, abstract = {Es gibt viele linguistische Forschungsfragen, f{\"u}r deren Beantwortung man Korpusdaten qualitativ und quantitativ auswerten m{\"o}chte. Beide Auswertungsmethoden k{\"o}nnen sich auf den Korpustext, aber auch auf Annotationsebenen beziehen. Jede Art von Annotation, also Kategorisierung, stellt einen kontrollierten und notwendigen Informationsverlust dar. Das bedeutet, dass jede Art von Kategorisierung auch eine Interpretation der Daten ist. In den meisten gro{\"s}en Korpora wird zu jeder vorgesehenen Annotationsebene, wie z. B. Wortart-Ebene oder Lemma-Ebene, genau eine Interpretation angeboten. In den letzten Jahren haben sich neben den gro{\"s}en, ,,flach“ annotierten Korpora Korpusmodelle herausgebildet, mit denen man konfligierende Informationen kodieren kann, die so genannten Mehrebenen-Modelle (multilevel standoff corpora), in denen alle Annotationsebenen unabh{\"a}ngig vom Text gespeichert werden und nur auf bestimmte Textanker verweisen. Ich argumentiere anhand der Fehlerannotation in einem Lernerkorpus daf{\"u}r, dass zumindest Korpora, in denen es stark variierende Annotationsbed{\"u}rfnisse und umstrittene Analysen geben kann, davon profitieren, in Mehrebenen-Modellen kodiert zu werden.}, language = {de} }