Refine
Document Type
- Article (9) (remove)
Has Fulltext
- yes (9) (remove)
Keywords
- Deutsch (9) (remove)
Publicationstate
- Veröffentlichungsversion (8)
- Postprint (1)
Reviewstate
- Verlags-Lektorat (9) (remove)
Automatic recognition of speech, thought, and writing representation in German narrative texts
(2013)
This article presents the main results of a project, which explored ways to recognize and classify a narrative feature—speech, thought, and writing representation (ST&WR)—automatically, using surface information and methods of computational linguistics. The task was to detect and distinguish four types—direct, free indirect, indirect, and reported ST&WR—in a corpus of manually annotated German narrative texts. Rule-based as well as machine-learning methods were tested and compared. The results were best for recognizing direct ST&WR (best F1 score: 0.87), followed by indirect (0.71), reported (0.58), and finally free indirect ST&WR (0.40). The rule-based approach worked best for ST&WR types with clear patterns, like indirect and marked direct ST&WR, and often gave the most accurate results. Machine learning was most successful for types without clear indicators, like free indirect ST&WR, and proved more stable. When looking at the percentage of ST&WR in a text, the results of machine-learning methods always correlated best with the results of manual annotation. Creating a union or intersection of the results of the two approaches did not lead to striking improvements. A stricter definition of ST&WR, which excluded borderline cases, made the task harder and led to worse results for both approaches.
Will man im Deutschen einen andauernden, noch im Verlauf befindlichen Vorgang (z. B. den, dass Sie gerade diese Zeilen lesen) ausdrücken, könnte es standardsprachlich von Ihnen als Leser dieser kleinen Sprachbetrachtung z. B. heissen: Sie sind gerade dabei zu lesen. Oder: Sie sind beim Lesen. Oder: Genau in diesem Moment lesen Sie. In der gesprochenen Sprache (und nicht nur dort) kann man aber auch hören (bzw. lesen): Sie sind gerade am Lesen. Dieser letzte Satz interessiert uns hier, denn an ihm scheiden sich die Geister. Vielen Sprechern gilt diese so genannte Verlaufsform nicht als standard-sprachlich korrekt, sie ordnen sie der regionalen (nämlich insbesondere westdeutschen) Umgangssprache zu und würden sie des-halb im geschriebenen Deutsch vermeiden. Anderen wiederum ist die Verlaufsform völlig vertraut, sie bewerten sie nicht als ungrammatisch oder falsch und zögern auch nicht, sie im schriftlichen Kontext zu verwenden. Auch die Grammatiken zum Gegenwartsdeutschen sind sich in der Beurteilung dieser Ausdrucksweise nicht einig. Im Folgenden will ich zunächst die Verlaufsform in ihrer Bildungs-und Verwendungsweise vorstellen, diesen Befund mit dem Beleg-material in der DUDEN-Sprachkartei und einer anderen Datenbank zum Gegenwartsdeutschen vergleichen, einen Blick auf die sich wandelnde Einschätzung dieses Phänomens in der DUDEN-Grammatik werfen und schliesslich erläutern, wie die Dudenredaktion Sätze wie Sie sind gerade am Lesen heute bewertet.
Ein vergleichender Blick auf die Buchstabenverteilung im Anlaut und im Auslaut von Rufnamen, Familiennamen und Appellativa zeigt, dass die Rufnamen hinsichtlich ihrer Anlaut- und Auslautstruktur besonders distinkt sind. Familiennamen hingegen zeigen sowohl Charakteristika der alphabetischen Verteilung von Appellativen wie von Rufnamen, sind also weniger distinkt, durch die Mischung dieser Charakteristika aber auch als Gruppe gekennzeichnet.
Sprachkritik, dahinsickernd
(2007)
Three popular collections of essays concerning correct language use in German are reviewed from a linguist’s point of view. It is claimed that the overall picture of language that Sick conveys to the layperson is inadequate; in addition, the author fails to reflect explicitly on the purpose and consequences of his prescriptive approach to language use.
Zum sogenannten Absentiv
(2013)