Refine
Year of publication
Document Type
- Part of a Book (4)
- Article (3)
- Conference Proceeding (2)
- Book (1)
Has Fulltext
- yes (10)
Keywords
- Syntagma (10) (remove)
Publicationstate
- Veröffentlichungsversion (10) (remove)
Reviewstate
We present the use of count-based and predictive language models for exploring language use in the German Reference Corpus DeReKo. For collocation analysis along the syntagmatic axis we employ traditional association measures based on co-occurrence counts as well as predictive association measures derived from the output weights of skipgram word embeddings. For inspecting the semantic neighbourhood of words along the paradigmatic axis we visualize the high dimensional word embeddings in two dimensions using t-stochastic neighbourhood embeddings. Together, these visualizations provide a complementary, explorative approach to analysing very large corpora in addition to corpus querying. Moreover, we discuss count-based and predictive models w.r.t. scalability and maintainability in very large corpora.
Korpora und Fremdsprachendidaktik haben – auch jenseits des angeleiteten oder selbstgesteuerten Arbeitens an den Daten – Berührungspunkte mit langer Tradition, durchaus mit nicht-digitalen Ausläufern, deren korpuslinguistische Dimensionen erst in den letzten Jahrzehnten erschlossen wurden. Worthäufigkeitszählungen, auch vergleichend, in beliebig großen oder auf bestimmte Bedürfnisse zugeschnittenen Datensammlungen lassen sich mit weiteren Metriken verknüpfen, die eine differenzierte Bewertung für die didaktische Relevanz ermöglichen. Kollokations-/Kookkurrenzanalysen helfen, typische Formulierungsmuster zu ermitteln. Dieser Beitrag stellt zunächst diese beiden Herangehensweisen dar. Das Manko der getrennten Betrachtung ist, dass keine der beiden isoliert ausreicht, um die Angemessenheit von Formulierungen zu bewerten hinsichtlich muttersprachlicher Natürlichkeit und Weiterentwicklung des Lernstands. Als Abhilfe wird eine Verknüpfung skizziert, die beide Perspektiven zusammenbringt.
Die Analyse sprachlicher Massendaten zeigt, wie zentral mehr oder weniger feste Wortverbindungen als Lexikoneinheiten für die Sprachkompetenz sind. Der Beitrag geht zunächst kurz auf aktuelle Entwicklungen in der Phraseologie ein: eine Abkehr von der starken Betonung des Idiosynkratischen einerseits und die Hinwendung zum Vorgeprägten andererseits. Wir führen hierzu den Terminus‚ lexikalisch geprägte Muster‘ (LGM) ein. In einer Detailanalyse beschäftigen wir uns mit satzwertigen Wortverbindungen im Spannungsfeld zwischen ausgeprägter Lexikalisierung, die auf eine gesonderte kognitive Verankerung hindeutet, und der Konstitution abstrakter Spruchmuster als LGM-Subtyp. Im zweiten Teil zeigen wir, wie usuelle Wortverbindungen innerhalb von Phrasenkomposita zur Lexembildung beitragen.
Grammatik ohne Wörter?
(2011)
Am Beispiel des Deutschen wird gezeigt, dass verschiedene Strategien, die traditionelle Unterscheidung zwischen Wörtern und Syntagmen so zu modifizieren, dass sie die sehr differenzierten Daten vollständig, detailliert und widerspruchsfrei erfasst, zur inhaltlichen Entleerung dieser Unterscheidung führen und sie damit letztlich überflüssig machen. Das gilt sowohl für die populäre Aufspaltung von Wort vs. Syntagma in mehrere spezifischere Kategorienpaare (phonologisches Wort vs. phonologisches Syntagma, graphematisches Wort vs. graphematisches Syntagma usw.) als auch für ihre Umdeutung als Prototypen- oder Default-Kategorien. Allerdings kann man an der Unterscheidung zwischen Wörtern und Syntagmen festhalten, wenn man Einschränkungen der Vollständigkeit, Detailtreue oder Widerspruchsfreiheit in Kauf nimmt (wie in der linguistischen Praxis oft unumgänglich). Diese Überlegungen übertragen sich auf die auf Wort vs. Syntagma beruhenden Abgrenzungen linguistischer Teilgebiete, wie Syntax vs. Morphologie vs. Phraseologie, z.T. auch Grammatik vs. Lexikon.
Gegenstand dieser Arbeit sind syntagmatische Verwendungsmuster in einsprachigen deutschen Wörterbüchern. Es wurden zehn einsprachige deutsche Wörterbücher (darunter Allgemeine Bedeutungswörterbücher, Lernerwörterbücher und auf Syntagmen fokussierte Spezialwörterbücher) und die darin befindlichen syntagmatischen Verwendungsmuster untersucht. Dabei wurde der Frage nachgegangen, wie in einsprachigen deutschen Wörterbüchern der syntagmatische Kontext eines Wortes berücksichtigt und in lexikografischer Hinsicht umgesetzt wird. Die typografischen Besonderheiten von jedem untersuchten Werk – gedruckt wie online publiziert – wurden herausgearbeitet. Dies wurde anhand von Syntagmen aus 30 Wortartikeln, die den Wortarten Nomen, Verben und Adjektive zugeordnet sind, systematisch beleuchtet.
This paper presents some theoretical and methodological foundations of the research project DICONALE, which concerns the development of an online dictionary of verbal lexemes with a special conceptual-onomasiological access and a paradigmatic structure in response to studies which have shown that conventional dictionaries (both monolingual and bilingual), do not satisfy the specific needs of users involved in the production of texts in foreign language.
Typische Verwendungen
(2005)
This paper shows how corpora and related tools can be used to analyse and present significant colligational patterns lexicographically. In German, patterns such as das nötige Wissen vermitteln and sein Wissen unter Beweis stellen play a vital role when learning the language, as they exhibit relevant idiomatic usage and lexical and syntactic rules of combination. Each item has specific semantic and grammatical functions and particular preferences with respect to position and distribution. An analysis of adjectives, for example, identifies preferences in adverbial, attributive, or predicative functions.
Traditionally, corpus analyses of syntagmatic constructions have not been conducted for lexicographic purposes. This paper shows how to utilise corpora to extract and examine typical syntagms and how the results of such an analysis are documented systematically in ELEXIKO, a large-scale corpus-based Internet reference work of German. It also demonstrates how this dictionary accounts for the lexical and grammatical interplay between units in a syntagm and how authentic corpus material and complementary prose-style usage notes are a useful guide to text production or reception.