Refine
Year of publication
Document Type
- Part of a Book (34) (remove)
Language
- German (34) (remove)
Has Fulltext
- yes (34)
Keywords
- Deutsch (23)
- Korpus <Linguistik> (18)
- Wortverbindung (17)
- Phraseologismus (8)
- Kollokation (7)
- Distribution <Linguistik> (5)
- Phraseologie (5)
- Kookkurrenzanalyse (3)
- Mehrworteinheit (3)
- Automatische Sprachanalyse (2)
Publicationstate
Reviewstate
- (Verlags)-Lektorat (27)
- Peer-Review (1)
Publisher
- Narr (4)
- Narr Francke Attempto (4)
- de Gruyter (4)
- Stauffenburg (3)
- Dudenverlag (2)
- Lang (2)
- Niemeyer (2)
- Univ. Karlova, Filozifická Fak. (2)
- Westdeutscher Verlag (2)
- De Gruyter (1)
Der Beitrag zeigt, auf welch grundlegende Weise das Paradigma der Corpus-Driven-Linguistics (CDL) die linguistische Beschreibung sprachlichen Usus auf der Basis mathematisch-statistischer Clusteringverfahren bestimmt. Es soll deutlich werden, wie sich diese Prämissen im Forschungsschwerpunkt zur linguistischen Systematisierung und Interpretation von Kookkurrenzdaten manifestieren.
Der Vortrag sollte als ein Diskussionsangebot dazu verstanden werden, welche linguistischen Fragestellungen und Probleme lohnend sein können, im Kontext der wissenschaftlichen Diskussion um sprachliche Phänomene vor, während und nach der Wende und im vereinigten Deutschland auf der Basis umfangreicher Recherchen und Analysen untersucht zu werden. Als empirische Grundlage der Überlegungen dient dabei das "Wende-Korpus", das im vergangenen Jahr in gemeinsamer Arbeit des Zentralinstituts für Sprachwissenschaft Berlin und des Instituts für deutsche Sprache Mannheim aufgebaut wurde. Das Korpus dokumentiert in seiner Komplexität sehr plastisch die dramatischen Veränderungen des Herbstes 1989 und des Jahres 1990.
Der Beitrag zeigt, wie die im korpuslinguistischen Gesamtkonzept des Instituts für Deutsche Sprache entwickelten und in der praktischen Korpusarbeit konsequent umgesetzten Prinzipien sowie die entsprechenden automatischen Methoden der Korpuserschließung und -analyse für die linguistische Forschung und die Lexikografie fruchtbar gemacht werden können. Im Mittelpunkt steht dabei das Erklärungspotenzial der statistischen Kookkurrenzanalyse, einer automatischen Korpusanalysemethode, die einen sinnvollen Zugang zu sprachlichen Massendaten und damit zu sprachlichem Usus eröffnet. Die Anwendung dieser Methode ermöglicht darüber hinaus die Erfassung, Verifizierung und lexikografische Beschreibung usueller Wortverbindungen auf einer umfassenden empirischen Basis. Es wird grundsätzlich zwischen dem statistisch erhobenen Kookkurrenzpotenzial, also der berechneten lexikalischen Kohäsion zwischen sprachlichen Entitäten, und der nachgelagerten linguistischen Interpretation unterschieden. Die automatische Analyse bringt Kookkurrenzcluster hervor, die nicht nur binäre Relationen zwischen einem Bezugswort und einem Kookkurrenzpartner abbilden, sondern multiple Strukturen konstituieren können. Diese Cluster fungieren als „Bausteine der Kommunikation“ und weisen Evidenzen für verschiedenste sprachliche Informationen auf. So können sie semantische und pragmatische Aspektuierungen des Wortgebrauchs, formelhafte Ausprägungen oder auch idiomatische Gebundenheiten indizieren. Schließlich wird in einem Ausblick dargestellt, wie diese Methoden im elexiko-Modul ‚Usuelle Wortverbindungen‘ zur systematischen lexikografischen Erfassung und Beschreibung üblicher Wortverbindungen des Deutschen eingesetzt werden. Ziel ist es, ein korpusbasiertes elektronisches ‚Mehrwortlexikon‘ für das Deutsche zu erstellen und gleichzeitig neue Einblicke in die Kohäsions- und damit auch in Vernetzungsphänomene des deutschen Wortschatzes zu erlangen.
COOCCURRENCE ANALYSIS SEEN CONTRASTIVELY
On applying collocational patterning in bilingual lexicography - some examples from the large German-Czech academic dictionary
This paper resumes some of thoughts presented in the study by C. Belica and K. Steyer in this volume. It shows how bilingual lexicographers can take advantage of the cooccurrence analysis results when dealing with German-Czech contrast and structuring word configurations in an entry. They also sketch the corpus data in a form of structural types based on the collocational patterns and stress the importance of cooccurrence analysis for an enlarged offer of equivalents. They plead for more consideration of the syntactic variability. They argue that the cooccurrence analysis used for both German and for Czech should be an important step.
CONTRIBUTIONS TO THE STUDY OF GERMAN USAGE A CORPUS-BASED APPROACH
This paper outlines some basic assumptions and principles underlying the corpus linguistics research and some application domains at the Institute for German Language in Mannheim. We briefly address three complementary but closely related tasks: first, the acquisition of very large corpora, second, the research on statistical methods for automatically extracting information about associations between word configurations, and, third, meeting the challenge of understanding the explanatory power of such methods both in theoretical linguistics and in other fields such as second language acquisition or lexicography. We argue that a systematic statistical analysis of huge bodies of text can reveal substantial insights into the language usage und change, far beyond just collocational patterning.
Der Beitrag stellt Arbeiten des Projekts Usuelle Wortverbindungen am Institut für Deutsche Sprache (IDS) in Mannheim vor. Im Mittelpunkt stehen dabei neue Perspektiven, die sich für die elektronische Phraseographie aus der korpusanalytischen Auswertung sprachlicher Massendaten ergeben. Eine wichtige Methode ist die statistische Kookkurrenzanalyse, die u.a. dazu dient, feste Wortverbindungen zu extrahieren und typische Kontexte vorzustrukturieren. Auf dieser Basis lässt sich der tatsächliche Gebrauch fester Wortverbindungen in einer quantitativ und qualitativ neuen Dimension erfassen und lexikografisch beschreiben. Die heutigen technologischen Möglichkeiten können des Weiteren für neue und differenziertere Präsentationsformen angepasst an unterschiedliche Rezeptionsbedürfnisse genutzt werden. Das UWV-Projekt beschreitet auch im Bereich der Internet-Lexikografie neue Wege, was anhand ausgewählter Beispiele gezeigt wird.
In der Geschichte der Sprachwissenschaft hat das Lexikon in unterschiedlichem Maße Aufmerksamkeit erfahren. In jüngerer Zeit ist es vor allem durch die Verfügbarkeit sprachlicher Massendaten und die Entwicklung von Methoden zu ihrer Analyse wieder stärker ins Zentrum des Interesses gerückt. Dies hat aber nicht nur unseren Blick für lexikalische Phänomene geschärft, sondern hat gegenwärtig auch einen profunden Einfluss auf die Entstehung neuer Sprachtheorien, beginnend bei Fragen nach der Natur lexikalischen Wissens bis hin zur Auflösung der Lexikon-Grammatik-Dichotomie. Das Institut für Deutsche Sprache hat diese Entwicklungen zum Anlass genommen, sein aktuelles Jahrbuch in Anknüpfung an die Jahrestagung 2017 – „Wortschätze: Dynamik, Muster, Komplexität“ – der Theorie des Lexikons und den Methoden seiner Erforschung zu widmen.
Der Beitrag diskutiert ausgehend von einem historischen Sprachbeispiel die Korrelation zwischen lexikalisierten Wortverbindungen, die durch bestimmte außersprachliche Faktoren zu solchen geworden sind, und Wortschatzeinheiten ähnlicher Art, die ihrerseits Muster konstituieren. Es wird gezeigt, dass unauffällige Syntagmen zu verfestigten Wortschatzeinheiten werden können, dass dies aber gleichzeitig nicht im luftleeren Formulierungsraum geschieht. Vielmehr liegt auch hier syntagmatische Musterhaftigkeit in einem Netz graduell verfestigter Einheiten des Lexikons zugrunde. Solche Netze sind immer durch fragmentarischen Gebrauch und Überlappung von spezifischen Komponenten geprägt. Je nach Kommunikationssituation und -bedürfnissen werden Teilstrukturen fokussiert und aktualisiert, während andere im Hintergrund bleiben.
In diesem Beitrag sollen Ergebnisse einer Untersuchung zu Reformulierungen im öffentlichen Diskurs erörtert werden. Im Mittelpunkt stehen Reformulierungsrelationen, die sich über mehrere zumeist schriftliche Kommunikationsakte hinweg konstituieren und einen intertextuellen Zusammenhang zwischen Texten hersteilen. Den Kern des empirischen Materials, auf dem diese Studie basiert, bilden rund 80 Texte aus Tageszeitungen (Ost/West), die auf ein und denselben Originaltext (Regierungserklärung des DDR-Ministerpräsidenten Lothar de Maiziere nach den Volkskammerwahlen vom 18. März 1990) Bezug nehmen. Ein weiterer Teil der Textbelege stammt aus dem Korpus des Instituts für deutsche Sprache (Mannheim) zur Sprache der Wende (WKD/WKB), das in den Jahren 1990/91 im Projekt "Gesamtdeutsche Korpusinitiative" zusammengestellt und dokumentiert wurde.
Der Beitrag diskutiert linguistische Fragestellungen und Probleme, die sich aus dem Projekt "Gesamtdeutsche Korpusinitiative" ergeben. Ausgangspunkt der Überlegungen ist die Frage, welchen Nutzen das Wendekorpus als Kern und eine weiterzuführende Dokumentation der deutschen Gegenwartssprache für sprachwissenschaftliche Analysen bringen könnte. Im Zentrum der Untersuchungen steht das Spannungsverhältnis zwischen Kontinuität, Variation und wirklichem Wandel der Sprachverwendung. Dabei schließt sich an übergreifende, sich von Einzelphänomenen lösende Aussagen zur Sprache der Wende (Abschnitt I.) die exemplarische Vorführung von Kontinuität und Dynamik sprachlicher Strukturen an Textausschnitten aus dem Wendekorpus an (Abschnitt II.).
Die Analyse sprachlicher Massendaten zeigt, wie zentral mehr oder weniger feste Wortverbindungen als Lexikoneinheiten für die Sprachkompetenz sind. Der Beitrag geht zunächst kurz auf aktuelle Entwicklungen in der Phraseologie ein: eine Abkehr von der starken Betonung des Idiosynkratischen einerseits und die Hinwendung zum Vorgeprägten andererseits. Wir führen hierzu den Terminus‚ lexikalisch geprägte Muster‘ (LGM) ein. In einer Detailanalyse beschäftigen wir uns mit satzwertigen Wortverbindungen im Spannungsfeld zwischen ausgeprägter Lexikalisierung, die auf eine gesonderte kognitive Verankerung hindeutet, und der Konstitution abstrakter Spruchmuster als LGM-Subtyp. Im zweiten Teil zeigen wir, wie usuelle Wortverbindungen innerhalb von Phrasenkomposita zur Lexembildung beitragen.
Dieser Artikel fasst wichtige Aspekte der vom Projekt ‘Usuelle Wortverbindungen’ (UWV) erarbeiteten
Konzeption für die korpusbasierte lexikografische Beschreibung von Wortverbindungen in OWID zusammen. Der Schwerpunkt in diesem Teilprojekt liegt auf der lexikografischen Beschreibung des typischen Gebrauchs von usuellen Wortverbindungen auf der Basis eines sehr großen Korpus des Deutschen. Zur differenzierten Untersuchung des Sprachgebrauchs werden korpusanalytische Methoden herangezogen und die Ergebnisse in einem nutzerfreundlichen Hypertextformat präsentiert. Zudem ist es ein Ziel, die sprachliche Vielfalt, die in den Korpora gerade auch in Bezug auf Wortverbindungen zu finden ist, durch eine große Menge authentischer Korpusbelege angemessen darzustellen.
Von der sprachlichen Oberfläche zum Muster. Zur qualitativen Interpretation syntagmatischer Profile
(2011)
This paper discusses a corpus-driven approach to the study of multi-word expressions (MWE) (in our terminology: Usuelle Wortverbindungen UWV). Our approach is based on collocation data and syntagmatic profiles. Several interpretative Steps lead from the language surface structure to MWE to more abstract multi-word patterns (MWP). MWP contain fixed components as well as slots, which are filled by elements with similar semantic or pragmatic characteristics. Like simple MWE, MWP can be considered units of the lexicon and patterns of language use with a holistic meaning and function. The formation of patterns, the semantic and pragmatic characteristics of the fillers and the restrictions on usage cannot be described by rules or language competence alone, but require bottom-up analysis on the basis of very large Corpora.
Vorwort
(2004)
Vorwort
(2018)
This paper shows how a corpus-driven approach leads to a new perspective on central issues of phraseology and on lexicographical applications. It argues that a data-driven pattem search (applying Statistical methods), an a posteriori interpretation of the data and a user oriented documentation of the usage of multi-word units (e. g. in lexicographical articles) constitute a step-by-step process where each step has its own informational value and useflilness. The description of multi-word units (Usuelle Wortverbindungen) presented in this paper focuses on the second Step, the high quality analysis and interpretation of collocation data, exemplified by the fields of multi-word units centered around the word formslIdee/Ideenl(idea/ideas).