L2: Lexikalische Syntagmatik
Refine
Document Type
- Part of a Book (14)
- Article (9)
- Conference Proceeding (5)
- Book (2)
- Review (2)
- Other (1)
- Part of Periodical (1)
- Report (1)
- Working Paper (1)
Is part of the Bibliography
- yes (36)
Keywords
- Deutsch (14)
- Korpus <Linguistik> (9)
- Wortbildung (7)
- Phraseologie (5)
- Annotation (4)
- Argumentstruktur (4)
- Grammatik (4)
- Komposition <Wortbildung> (4)
- Morphologie <Linguistik> (4)
- Wortverbindung (4)
Publicationstate
- Veröffentlichungsversion (22)
- Zweitveröffentlichung (11)
- Postprint (4)
Reviewstate
- (Verlags)-Lektorat (19)
- Peer-Review (14)
Publisher
- Leibniz-Institut für Deutsche Sprache (IDS) (4)
- Zenodo (4)
- de Gruyter (4)
- Peter Lang (3)
- Stauffenburg (3)
- IDS-Verlag (2)
- Universität Siegen (2)
- Buske (1)
- CEUR-WS (1)
- Dudenverlag (1)
Projektvorstellung – Redewiedergabe. Eine literatur- und sprachwissenschaftliche Korpusanalyse
(2018)
Das laufende DFG-Projekt „Redewiedergabe“ stellt einen Anwendungsfall quantitativer Sprach-und Literaturwissenschaft dar und beschäftigt sich mit dem Phänomen „Redewiedergabe“ auf der Grundlage großer Datenmengen. Zu diesem Zweck wird zum einen ein Korpus manuell mit Redewiedergabeformen annotiert, zum anderen werden Verfahren zur automatischen Erkennung des Phänomens entwickelt. Ziel ist es, Forschungsfragen nach der Entwicklung von Redewiedergabe vor allem im 19. Jahrhundert zu beantworten.
We present recognizers for four very different types of speech, thought and writing representation (STWR) for German texts. The implementation is based on deep learning with two different customized contextual embeddings, namely FLAIR embeddings and BERT embeddings. This paper gives an evaluation of our recognizers with a particular focus on the differences in performance we observed between those two embeddings. FLAIR performed best for direct STWR (F1=0.85), BERT for indirect (F1=0.76) and free indirect (F1=0.59) STWR. For reported STWR, the comparison was inconclusive, but BERT gave the best average results and best individual model (F1=0.60). Our best recognizers, our customized language embeddings and most of our test and training data are freely available and can be found via www.redewiedergabe.de or at github.com/redewiedergabe.
Die vorgestellte Studie untersucht die Anteile unterschiedlicher Redewiedergabeformen im Vergleich zwischen zwei Literaturtypen von gegensätzlichen Enden des Spektrums: Hochliteratur – definiert als Werke, die auf der Auswahlliste von Literaturpreisen standen – und Heftromanen, massenproduzierten Erzählwerken, die zumeist über den Zeitschriftenhandel vertrieben werden und früher abwertend als „Romane der Unterschicht” (Nusser 1981) bezeichnet wurden. Unsere These ist, dass sich diese Literaturtypen hinsichtlich ihrer Erzählweise unterscheiden, und sich dies in den verwendeten Wiedergabeformen niederschlägt. Der Fokus der Untersuchung liegt auf der Dichotomie zwischen direkter und nicht-direkter Wiedergabe, die schon in der klassischen Rhetorik aufgemacht wurde.
Corpus REDEWIEDERGABE
(2020)
This article presents the corpus REDEWIEDERGABE, a German-language historical corpus with detailed annotations for speech, thought and writing representation (ST&WR). With approximately 490,000 tokens, it is the largest resource of its kind. It can be used to answer literary and linguistic research questions and serve as training material for machine learning. This paper describes the composition of the corpus and the annotation structure, discusses some methodological decisions and gives basic statistics about the forms of ST&WR found in this corpus.
Objekte der Begeisterung
(2020)
We present a construction-based approach to German prepositional object (I’O) constructions occurring with the verb begeistern ,to thrill'. Traditionally, the preposition in such structures is analysed as a meaningless object marker that is lexically selected by the governing verb and not subject to variation. Drawing on a corpus study in the German reference corpus DeReKo, we show that our target verb occurs with four different PO prepositions (für ,lor‘,« ׳? ,at', von ,front' and über ,over‘) that can be analysed as markers o f schematic argument structure constructions in the Construction Grammar sense. We show that each construction comes with its own meaning and semantically coherent predicate restrictions. We argue that purely valency-based (lexical) approaches to argument structure fail to capture these generalisations. On the other hand, purely schema-based (constructionist) approaches to argument structure face the complcmentary problem o f accommodating item-specific restrictions and exceptions to the generalisations they embody. We suggest that the necessary synthesis can be formulated within an account that recognises both generalised constructions and item-specific valency properties.