OPUS 4 | Search

82 search hits

1 to 10

Sort by

Zur variationslinguistischen Analyse regionalsprachlicher Korpora (2007)

Im Beitrag werden korpuslinguistische Aspekte und Fragestellungen aus variationslinguistischer Perspektive diskutiert, wobei der Fokus auf der Analyse regionalsprachlicher Daten und Korpora des Deutschen liegt. Unter Regionalsprache wird hier der areal gebundene, sprechsprachliche Gesamtbereich „unterhalb“ der normierten Standardsprache verstanden, der sich von den lokalen Basisdialekten über Varietäten bzw. Sprechlagen des mittleren Bereichs bis hin zum standardnächsten Pol der Regionalsprache (Regionalakzent oder Regionalstandard) erstreckt. Am Beginn des Beitrags steht ein Überblick über Datenklassen, die als empirische Grundlage für regionalsprachliche Fragestellungen herangezogen werden können. Eine Präsentation regionalsprachlicher Korpora, die auf den vorgestellten Datenklassen aufbauen, schließt sich an, wobei hier lediglich einige ausgewählte, online zugängliche Korpora Berücksichtigung finden (können). In einem nächsten Schritt werden die vorgestellten Korpora zur konkreten variationslinguistischen Analyse von zwei regionalsprachlichen Phänomenen aus dem lautlichen („g-Spirantisierung“) bzw. grammatischen Bereich („Rezipientenpassiv“) herangezogen und auf ihre Ergiebigkeit geprüft.

Why is it so difficult to compare treebanks? TIGER and TüBa-D/Z revisited (2007)

Rehbein, Ines ; van Genabith, Josef

This paper is a contribution to the ongoing discussion on treebank annotation schemes and their impact on PCFG parsing results. We provide a thorough comparison of two German treebanks: the TIGER treebank and the TüBa-D/Z. We use simple statistics on sentence length and vocabulary size, and more refined methods such as perplexity and its correlation with PCFG parsing results, as well as a Principal Components Analysis. Finally we present a qualitative evaluation of a set of 100 sentences from the TüBa- D/Z, manually annotated in the TIGER as well as in the TüBa-D/Z annotation scheme, and show that even the existence of a parallel subcorpus does not support a straightforward and easy comparison of both annotation schemes.

Vorwort (2007)

Kallmeyer, Werner ; Zifonun, Gisela

Von der Forschung zur Praxis: Vom Projekt "Kommunikation in Migrantenkindergruppen" zu "Förderprogrammen für Migrantenkinder" (2007)

Keim, Inken

Von "Aquajogging" bis "Zickenalarm". Neuer Wortschatz im Deutschen seit den 90er Jahren im Spiegel des ersten größeren Neologismenwörterbuches (2007)

Steffens, Doris

Verdeckte Fremdheit bei russlanddeutschen Aussiedlern. Zur kommunikativen Wirkungsentfaltung einer problematischen Identitätslage (2007)

Reitemeier, Ulrich

Unscharfe Konturen - Sprachpolitik und Sprachpflege in Deutschland (2007)

Stickel, Gerhard

Two semi-mathematical asides on Menzerath-Altmanns law (2007)

Meyer, Peter

Treebank Annotation Schemes and Parser Evaluation for German (2007)

Rehbein, Ines ; van Genabith, Josef

Recent studies focussed on the question whether less-configurational languages like German are harder to parse than English, or whether the lower parsing scores are an artefact of treebank encoding schemes and data structures, as claimed by Kübler et al. (2006). This claim is based on the assumption that PARSEVAL metrics fully reflect parse quality across treebank encoding schemes. In this paper we present new experiments to test this claim. We use the PARSEVAL metric, the Leaf-Ancestor metric as well as a dependency-based evaluation, and present novel approaches measuring the effect of controlled error insertion on treebank trees and parser output. We also provide extensive past-parsing crosstreebank conversion. The results of the experiments show that, contrary to Kübler et al. (2006), the question whether or not German is harder to parse than English remains undecided.

Thesen zur Struktur einer Grammatik der gesprochenen Sprache (2007)

Fiehler, Reinhard

1 to 10

Open Access

Refine

Author

Year of publication

Document Type

Language

Has Fulltext

Is part of the Bibliography

Keywords

Publicationstate

Reviewstate

Publisher

82 search hits