400 Sprache, Linguistik
Refine
Year of publication
Document Type
- Part of a Book (17)
- Article (3)
- Conference Proceeding (3)
- Book (1)
Keywords
- Phraseologie (24) (remove)
Publicationstate
Reviewstate
- (Verlags)-Lektorat (18)
- Peer-Review (6)
Publisher
Der Beitrag skizziert die Genese und Komplexität des Konzepts ‚Usuelle Wortverbindung‘ (UWV) vor dem Hintergrund der korpuslinguistischen Wende. Die Möglichkeit, sprachliche Massendaten untersuchen zu können, erbrachte neue Einsichten in Hinblick auf Status, Form, Funktion, Festigkeit und Variabilität dieser zentralen Wortschatzeinheiten – gleichzeitig aber auch in Hinblick auf ihre Unschärfen und vielfachen Überlappungen. Eine der folgenreichsten Erkenntnisse ist, dass UWVs auf vorgeprägten Schemata und Mustern basieren und in ein komplexes Netz von Ausdrücken ähnlicher Art eingebettet sind. Für die Aneignung sprachlichen Wissens ist das Verstehen solcher primär funktionalen Musterbildungen elementar.
Im Folgenden werden wir uns überwiegend mit der syntaktischen Realisierung der Intensivierung auseinandersetzen, wobei die morphologische anhand des Phänomens der Komposition nicht unkommentiert bleiben wird. Im Vordergrund unserer Analyse stehen überwiegend Fälle lexikalischer und se-mantischer bzw. funktionaler Divergenz zwischen dem Deutschen und dem Italienischen. Die von uns analysierten komparativen Phraseologismen wurden anhand einer Suche in ein- und zweisprachigen Wörterbüchern des Deutschen und des Italienischen ausgewählt. Unser Beitrag ist wie folgt strukturiert: Kapitel 2 gibt einen Überblick über die komparative Phrasem-Konstruktion aus kontrastiver Sicht: Es werden ihre strukturellen (morphosyntaktischen), semantischen und pragmatischen Hauptmerkmale beschrieben. Aufgrund ihrer Frequenz wird überwiegend auf die Subtypen mit einem Verb (Kap. 2.1.) und einem prädikativen Adjektiv (2.2.) als tertium comparations eingegangen. Da die Beziehung zwischen Metapher und Vergleich sehr eng ist, werden in Kapitel 3 die Analogien und Unterschiede zwischen diesen rhetorischen Figuren kurz skizziert. Kapitel 4 ist der interlingualen Analyse der phraseologischen Einheiten gewidmet, bei denen dasselbe Konzept im Deutschen und im Italienischen entweder durch einen (lexikalisierten) Vergleich oder durch eine (lexikalisierte) Metapher realisiert wird. Wie zu sehen sein wird, kann man außerdem intralingual manchmal auch die Kookkurrenz beider sprachlichen Formen feststellen. In Kapitel 5 wird der Objektbereich der komparativen Phrasem-Konstruktionen aus konstruktionsgrammatischer Sicht vertieft, wobei vor allem auf Hierarchisierungen von Konstruktionen, Vererbungsrelationen, Produktivität, kognitive Verfestigung (entrenchment) und Emergenzphänomene eingegangen wird.
Funktion
(2018)
Frame
(2018)
figurative Bedeutung
(2018)
In order to differentiate between figurative and literal usage of verb-noun combinations for the shared task on the disambiguation of German Verbal Idioms issued for KONVENS 2021, we apply and extend an approach originally developed for detecting idioms in a dataset consisting of random ngram samples. The classification is done by implementing a rather shallow, statistics-based pipeline without intensive preprocessing and examinations on the morphosyntactic and semantic level. We describe the overall approach, the differences between the original dataset and the dataset of the KONVENS task, provide experimental classification results, and analyse the individual contributions of our feature sets.
Diese Monografie setzt sich neu mit Sprachanfragen auseinander. Mit einem kleinen, aber aussagekräftigen Korpus von rund 300 schriftlichen Anfragen zwischen 1997 und 2022 fokussiert sie sich durch viele Detailanalysen auf den Charakter der Anfragenden und die Charakteristik der Anfragen: Wer sind die Anfragenden? Wen fragen sie? Wie fragen sie? Was fragen sie? Warum fragen sie? Und wie hängt all das zusammen?
Die Monografie versteht sich als Anregung vor allem für größer angelegte Studien mit einem größeren, repräsentativen Korpus. Darüber hinaus kann sie Ideengeber sein etwa für soziolinguistische Studien zur Persönlichkeit von Sprachanfragenden, für Studien zum Laiendiskurs über Sprache, zu muttersprachlichen versus nichtmuttersprachlichen Interessen oder zu angefragten Themen: Welche Aspekte der Themen werden erfragt; welche sind relevant, welche sind brisant?
The paper describes an online German-Russian database for phraseological constructions (PhC), or syntactic idioms. It is a linguistic phenomenon representing a stable multi-word form that usually contains some auxiliary words (“anchors”) and partially opens up empty spaces (“slots”) which are filled directly in spoken language by various lexemes or combinations of lexemes (“fillers”, or “slot fillers”). Linguists from several German institutions are currently working on the database. The PhCs selected for the database have to meet special criteria. The database is a manual that combines scientific descriptions, a thesaurus and a bilingual dictionary. The database is designed as an active aid for text production in the respective foreign language; it is also a manual for language researchers and for translators. Apart from that, it can serve as a basis for extensions for other language pairs. The aim of the project is to record and to describe 300 PhC before the database is published. Our objective is to enable foreign language learners to use the syntactic idioms correctly in the texts they produce rather than create a big-sized database. The paper describes some issues related to the creation of the database, namely objectives and target groups, material and methods, microstructure of the database article and some others.
The automatic recognition of idioms poses a challenging problem for NLP applications. Whereas native speakers can intuitively handle multiword expressions whose compositional meanings are hard to trace back to individual word semantics, there is still ample scope for improvement regarding computational approaches. We assume that idiomatic constructions can be characterized by gradual intensities of semantic non-compositionality, formal fixedness, and unusual usage context, and introduce a number of measures for these characteristics, comprising count-based and predictive collocation measures together with measures of context (un)similarity. We evaluate our approach on a manually labelled gold standard, derived from a corpus of German pop lyrics. To this end, we apply a Random Forest classifier to analyze the individual contribution of features for automatically detecting idioms, and study the trade-off between recall and precision. Finally, we evaluate the classifier on an independent dataset of idioms extracted from a list of Wikipedia idioms, achieving state-of-the art accuracy.