Refine
Year of publication
Document Type
- Part of a Book (65)
- Article (39)
- Other (21)
- Book (16)
- Conference Proceeding (10)
- Review (7)
- Doctoral Thesis (2)
- Part of Periodical (2)
Language
- German (129)
- English (30)
- Portuguese (2)
- Russian (1)
Keywords
- Grammatik (162) (remove)
Publicationstate
- Veröffentlichungsversion (162) (remove)
Reviewstate
Publisher
The main objective of this article is to describe the current activities at the Mannheim Institute for German Language regarding the implementation of a domain-specific ontology for German grammar. We differentiate ontology bases from ontology management Systems, point out the benefits of database-driven Solutions, and go Step by Step through all phases of the ontology lifecycle. In Order to demonstrate the practical use of our approach, we outline the interface between our ontology and the grammis web Information System, and compare the ontology-based retrieval mechanism with traditional full text search.
The present paper examines the relationship between pragmatics, semantics and grammar as subdisciplines of linguistics from three different perspectives. The first section gives a historical survey of their development during the 20th century and classifies linguistic schools according to their interest in different fields of research. The second part presents a systematic model of the field of objects to be investigated by linguistics, aiming at a more precise delimitation of its subdisciplines. Finally, in the third section, the division of labour between pragmatics, semantics and grammar is discussed in the light of the concrete example of verb valence.
This paper aims to describe different patterns of syntactic extensions of turns-at-talk in mundane conversations in Czech. Within interactional linguistics, same-speaker continuations of possibly complete syntactic structures have been described for typologically diverse languages, but have not yet been investigated for Slavic languages. Based on previously established descriptions of various types of extensions (Vorreiter 2003; Couper-Kuhlen & Ono 2007), our initial description shall therefore contribute to the cross-linguistic exploration of this phenomenon. While all previously described forms for continuing a turn-constructional unit seem to exist in Czech, some grammatical features of this language (especially free word order and strong case morphology) may lead to problems in distinguishing specific types of syntactic extensions. Consequently, this type of language allows for critically evaluating the cross-linguistic validity of the different categories and underlines the necessity of analysing syntactic phenomena within their specific action contexts.
This paper presents ongoing research which is embedded in an empirical-linguistic research program, set out to devise viable research strategies for developing an explanatory theory of grammar as a psychological and social phenomenon. As this phenomenon cannot be studied directly, the program attempts to approach it indirectly through its correlates in language corpora, which is justified by referring to the core tenets of Emergent Grammar. The guiding principle for identifying such corpus correlates of grammatical regularities is to imitate the psychological processes underlying the emergent nature of these regularities. While previous work in this program focused on syntagmatic structures, the current paper goes one step further by investigating schematic structures that involve paradigmatic variation. It introduces and explores a general strategy by which corpus correlates of such structures may be uncovered, and it further outlines how these correlates may be used to study the nature of the psychologically real schematic structures.
„Bausteine einer Korpusgrammatik des Deutschen“ ist eine neue Schriftenreihe, die am Leibniz-Institut für Deutsche Sprache in Mannheim (IDS) entsteht. Sie setzt sich zum Ziel, mit korpuslinguistischen Methoden die Vielfalt und Variabilität der deutschen Grammatik in großer Detailschärfe zu erfassen und gleichzeitig für die Validierbarkeit der Ergebnisse zu sorgen. Die erste Ausgabe enthält eine Einführung in die Reihe sowie vier als Kapitel einer neuen Grammatik gestaltete Texte: 1. Grundlegende Aspekte der Wortbildung, 2. Bau von und Umbau zu Adverbien, 3. Starke vs. schwache Flexion aufeinanderfolgender attributiver Adjektive und 4. Reihenfolge attributiver Adjektive. Die Ausgabe ist mit einer interaktiven Datenbank zu attributiven Adjektiven verknüpft.
„Bausteine einer Korpusgrammatik des Deutschen“ ist eine Schriftenreihe, die am Leibniz-Institut für Deutsche Sprache in Mannheim (IDS) entsteht. Sie setzt sich zum Ziel, mit korpuslinguistischen Methoden die Vielfalt und Variabilität der deutschen Grammatik in großer Detailschärfe zu erfas-sen und gleichzeitig für die Validierbarkeit der Ergebnisse zu sorgen. Der zweite Band enthält eine kurze Einleitung und vier als Kapitel einer neuen Grammatik gestaltete Texte: 1. Determination in der Nominalphrase – ein Überblick, 2. Syntaktische Funktionen von Nominalphrasen und Funktio-nen der Kasus, 3. Stellung des adnominalen Genitivs und 4. Genitiv- und von-Attribute: Bestimmung des Variationsbereichs. Der Band ist mit zum Download verfügbaren Datensätzen zu Nominalphrasen sowie Genitiv- und von-Attributen verknüpft.
This paper presents C-WEP, the Collection of Writing Errors by Professionals Writers of German. It currently consists of 245 sentences with grammatical errors. All sentences are taken from published texts. All authors are professional writers with high skill levels with respect to German, the genres, and the topics. The purpose of this collection is to provide seeds for more sophisticated writing support tools as only a very small proportion of those errors can be detected by state-of-the-art checkers. C-WEP is annotated on various levels and freely available.
Das "Verzeichnis grundlegender grammatischer Fachbegriffe" 2019. Anliegen, Konzeption, Perspektiven
(2020)
Das Deutsche ist eine der am besten erforschten Sprachen der Welt; weniger bekannt ist, welche Gemeinsamkeiten es mit den europäischen Nachbarsprachen teilt und wo seine Besonderheiten liegen.
Die insgesamt acht Kapitel des Buches stellen prägnant und anhand von anschaulichen Beispielen Wortschatz und Grammatik des Deutschen vor. Dabei verhilft ein Vergleich mit den Optionen etwa im Englischen, Französischen, Polnischen, Ungarischen oder anderen europäischen Sprachen zu einem verschärften Blick. Ausgangspunkt ist dabei ein kurzer Abriss der Facetten von Sprache allgemein sowie die Herleitung der grundlegenden Sprachfunktionen aus einer handlungsbezogenen Perspektive. Die folgenden Kapitel stehen unter Motti wie: „Das Verb – Zeiten, Modi, Szenarios und Inszenierungen“, „Der nominale Bereich – die vielerlei Arten, Gegenstände zu konstruieren“ oder „Der Text – wenn wir kohärent und dabei narrativ oder argumentativ werden“. Das letzte Kapitel trägt den Titel: „Das Deutsche – auf dem Weg zu einem Sprachporträt“.
Das Buch soll Sprachinteressierten auch ohne linguistische Fachkenntnisse einen neuen Zugang zu unserer Muttersprache erschließen und die Sensibilität für die sprachliche Verbundenheit auf unserem Kontinent trotz aller Vielfalt stärken.
- Grammatik anschaulich und konkret
- Innovativer Blick auf das Deutsche im Kreis europäischer Sprachen
- Kurzweilige Einführung für Sprachinteressierte auch ohne linguistische Fachkenntnisse
Thema dieses Beitrags sind die komplexen Nominalphrasen im Deutschen, die von außen gesehen unter Umständen monströs anmuten. Ein besonderes, wohl bekanntes Problem bieten dabei sogenannte erweiterte vorangestellte Attribute. Die Komplexitäten geben u.A. zu folgenden Fragen Anlass: Inwiefern lässt sich die ‚Ausuferung‘ der deutschen Nominalphrase funktional begründen? Falls es ein Rationales hinter den Komplexitäten gibt, wie lösen dann Sprachen, die entsprechende Ausbaumöglichkeiten nicht besitzen, die einschlägigen funktionalen Aufgaben? Hier soll primär die erste Frage diskutiert werden anhand von authentischen Text(ausschnitt)en, die das Zusammenspiel zwischen vorangestellten und nachgestellten ‚Erweiterungen‘ der Nominalphrase – Relativsätze eingeschlossen – wie auch die Funktion sogenannter nichtrestriktiver Attribute im Diskurs veranschaulichen können; die zweite Frage wird in relevanten Zusammenhängen mit berücksichtigt.
In der Datenbank zum Datensatz attributive_Adjektive_1.csv finden sich 1.598 Belege zu artikellosen Nominalphrasen mit je zwei attributiven Adjektiven im Dativ Singular Maskulinum oder Neutrum.
Die Datenbank attributive Adjektive enthält zu jedem Beleg neben dem Satzkontext eine Reihe von Annotationen. Dazu gehören Metadaten wie Register und regionale Zuordnung sowie Annotationen zur Phonologie, Morphosyntax, Semantik und Frequenz. Anhand dieser Annotationen lassen sich Hypothesen zur Adjektivflexion und -reihenfolge überprüfen. Nach einer Auswahl aus diesen Annotationen können Sie hier suchen. Alternativ können Sie unter „Download“ das gesamte Suchergebnis mit allen Annotationen und inklusive aller Belege, die bei der Untersuchung von Adjektivflexion und -reihenfolge als Fehlbelege eingestuft worden sind, herunterladen.
Der Datensatz enthält 10.113 Korpusbelege für Konstruktionen, in denen ein Substantiv mit einem dass-Satz oder einem zu-Infinitiv auftritt (das Versprechen, dass man sich irgendwann wiedersieht vs. das Versprechen, sich irgendwann wiederzusehen).
Die Daten wurden erhoben aus:
1. dem Korpusgrammatik-Untersuchungskorpus (Bubenhofer et al. 2014), basierend auf dem Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010, 2018), Release 2017-II.
2. dem Subkorpus “Forum” des DECOW16B-Webkorpus (Schäfer & Bildhauer 2012).
Der Datensatz enthält 16.604 Korpusbelege aus Nominalphrasen mit Genitiv- und von-Attributen (die Ideen zahlreicher Kinder, die Ideen von zahlreichen Kindern), wobei die Genitivattribute prä- oder postnominal erscheinen können (Mannheims Sehenswürdigkeiten, die Sehenswürdigkeiten Mannheims).
Für jeden Beleg sind Informationen zu Land, Dekade und Medium enthalten. Hinzu kommen Angaben zu Kopf- und/oder Attributslemma (z. B. Namentyp, Flexionsklasse), Gesamtphrase (z. B. Definitheit, Kasus) und Attributsphrase (z. B. Kasusdistinktion, Länge). Zahlreiche Sonderfälle sind ebenfalls annotiert (z. B. Genitiv bei nichtflektiertem Adjektiv wie Gebäck Mannheimer Bäckereien, Phrasen mit adjektivisch flektierendem Attributsnomen wie die Ideen Jugendlicher, die Ideen von Jugendlichen).
Datensatz Nominalphrasen
(2021)
Der Datensatz Nominalphrasen enthält Belege zu nichtpronominalen (d.h. vollen, lexikalischen) Nominalphrasen (NPs) mit einem Substantiv oder einer Nominalisierung als Kopf. Jeder Beleg ist in Bezug auf eine Reihe linguistisch relevanter Merkmale annotiert. Insgesamt enthält der Datensatz 8.137 Belegstellen. Nach dem Aussortieren von Fehlbelegen (siehe Spalten „valide“ und „nicht-valide_Begründung“) bleiben noch 7.813 einschlägige Belege. Die Suchanfrage erfolgte über das Kopfnomen; für Details zur Datenerhebung siehe Weber (2021a). Das Kopfnomen erscheint in der Spalte „Kopf_der_NP“. In manchen Fällen besteht die NP nur aus dem Kopfnomen, in den meisten Fällen geht sie aber darüber hinaus; sie erstreckt sich dann auf einen Teil des vorangehenden Kontexts (Spalte „Satzkontext_vor_Beleg“) und/oder des nachfolgenden Kontexts („Satzkontext_nach_Beleg“). Der Datensatz dient der Untersuchung der syntaktischen Funktionen von NPs (Weber 2021a) und der Determination in der NP (Weber 2021b).
Datensatz Schwache Maskulina
(2023)
Der Datensatz enthält eine Sammlung von 1.156 Substantiven (mit wenigen Ausnahmen Maskulina), die sich im Korpusgrammatik-Untersuchungskorpus (Bubenhofer et al. 2014), basierend auf dem Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010, 2018), Release 2017-II, unmittelbar nach einem Beleg für die Akkusativ- oder Dativform des unbestimmten Artikels ( einen / einem ) mindestens einmal mit der “schwachen” Endung -(e)n belegen lassen (z.B. einen Aktivisten , einem Autoren ). Einzelheiten zur Datenerhebung in Weber & Hansen (2023).
Der Datensatz enthält 409 Korpusbelege aus Nominalphrasen mit eingebetteten Genitivattributen, die wiederum ein eingebettetes Genitivattribut aufweisen (Petras Nachfolgers Beisein). Die Belege sind danach klassifiziert, ob die erste eingebettete Nominalphrase vor oder hinter dem Kopfnomen der Gesamtnominalphrase steht (Petras Nachfolgers Beisein vs. Beisein Petras Nachfolgers) und ob die erste eingebettete Nominalphrase neben einem Genitiv noch ein Adjektiv enthält (Beisein Petras direkten Nachfolgers). Für jeden Beleg werden zudem die Lemmas der drei Nomen in ihrer Einbettungsreihenfolge angegeben. Darüber hinaus sind Metadaten (Land, Jahr) enthalten.
Der Datensatz enthält die Gesamtheit der relevanten Belege aus dem KoGra-Untersuchungskorpus mit den im Folgenden aufgeführten Strukturen. Die Abfragen für die vier Strukturtypen führten zu 15.875 potenziellen Belegen, von denen sich bei manueller Durchsicht 409 als tatsächliche Nominalphrasen mit zweifach eingebetteten Genitivattributen erwiesen.
Der Datensatz dient der Untersuchung der Sonderfälle des Genitivattributs (Kopf 2021).
We present a language learning application that relies on grammars to model the learning outcome. Based on this concept we can provide a powerful framework for language learning exercises with an intuitive user interface and a high reliability. Currently the application aims to augment existing language classes and support students by improving the learner attitude and the general learning outcome. Extensions beyond that scope are promising and likely to be added in the future.
Dieses Kapitel gibt einen Überblick über das Inventar der Ausdrücke, die zur Kategorie der Determinierer gezählt werden bzw. zumindest als Kandidaten für diese Kategorie gehandelt werden. Es untersucht ihre grammatischen Eigenschaften und überprüft ihren Determiniererstatus anhand einschlägiger morpho-syntaktischer Kriterien.
Deutsch als Fremdsprache und die Grammatik des Deutschen. Über die Fruchtbarkeit des fremden Blicks
(2000)
Leitfrage des Beitrags ist: Was kann der Blick von außen, insbesondere der Blick aus der Perspektive europäischer Sprachen für die grammatische Beschreibung des Deutschen erbringen? Als Exemplifikationsbereich im Für und Wider wird die Grammatik der Pronomina herangezogen, primär die der Personal- und Reflexivpronomina. Dieser Beispielbereich geht ebenso wie das Vortragsthema insgesamt auf das Projekt „Grammatik des Deutschen im europäischen Vergleich“ (GDE) zurück, an dem derzeit in der Abteilung Grammatik des IDS gearbeitet wird. Dreh- und Angelpunkt aller sprachvergleichenden Unternehmungen ist die Frage nach dem tertium comparationis. Es wird dafür plädiert, ‚funktionale Domänen‘ als Anfangstertium zu bestimmen. Diese dienen als Einstieg in eine Methodologie der fortschreitenden Form- und Funktionsdifferenzierung'. Der erhoffte Mehrwert für unser Wissen über das Deutsche - so die These - verteilt sich auf die allgemeine Sprachtypologie und auf den Vergleich mit europäischen „Nah“- Sprachen. Der Blick auf das typologische Spektrum insgesamt sensibilisiert für Fakten, die im europäischen Raum nur indirekten Niederschlag haben. Der Kontrast mit Sprachen wie dem Polnischen, Ungarischen usw. bringt auch dort, wo große Übereinstimmung zu bestehen scheint, die nötige Feindifferenzierung und schärft den Blick für die Besonderheiten im Detail. Pronominale Beispiele für die Fallstricke der einzelsprachlichen Grammatik, etwa Formen von Über- und Untergeneralisierung, sollen das Plädoyer für eine Europäisierung der Grammatik abrunden.
Die Sorge um die deutsche Sprache füllt Säle. Wer Sprachdummheiten anmahnt, kann sich des Beifalls jener sicher sein, die sich sprachlich überlegen sehen. Selten wird die Frage gestellt, welchen Status grammatische Regeln haben. Tatsächlich ist keineswegs klar, was als korrektes Deutsch gelten kann. Wie ist das Deutsche zu fassen? Wer bestimmt, was als korrekt gelten soll? Die 44. Jahrestagung des Instituts für Deutsche Sprache suchte zur Klärung solcher Fragen beizutragen. Der vorliegende Band dokumentiert, wie die deutsche Grammatik im Spannungsfeld von Regel, Norm und Sprachgebrauch auf der Tagung aufgearbeitet wurde: Zunächst stehen die theoretischen Aspekte der Problematik auf dem Prüfstand. Danach werden grammatische Normen und der Umgang mit diesen in der Öffentlichkeit fokussiert. Im nächsten Themenblock stehen grammatische Variation in ihrem Verhältnis zur Norm und konkrete Phänomene der Morphologie, Syntax und Prosodie zur Diskussion. Die Betrachtung des Grammatikunterrichts und der Grammatikschreibung vervollständigt das Bild, das durch einen Blick auf die Normativität in Frankreich zusätzlich in einen größeren Kontext gestellt wird. Der Band schließt mit einer Zusammenfassung der Podiumsdiskussion, welche den Schlusspunkt der Tagung bildete.
Die Formen der Sprache und die Prozesse des Verstehens. Textverstehen aus grammatischer Sicht
(2006)
Was tragen grammatische Formen zum Textverstehen bei, und wie können sie das? Diese Fragen berühren verschiedene Probleme: Grammatik konkretisiert sich in einem abstrakten Regelsystem, Verstehen in situationsbezogenen individuellen Handlungen. Grammatische Formen stellen überwiegend keine eigenständigen Zeichen, sondern Eigenschaften von Zeichen dar. In diesem Beitrag wird das Thema vor einem pragmatischen Hintergrund behandelt: Verstehen wird aufgefasst als eine konstruktive, auf Schlussfolgerungen gestützte Tätigkeit; Grammatik wird darin nicht primär als etwas benutzt, was selbst einen Zeicheninhalt hat, sondern als Steuerungsmittel beim Verstehen. Der Beitrag der Grammatik im Zusammenwirken der verschiedenen Inputs beim Verstehen wird anhand von Kategorien wie Tempus, Modus, Thema-Rhema-Gliederung, strukturelle Eigenschaften von Sätzen und im Kontrast zur Kohärenzbildung im Text erörtert.
Handschrift ist ein alltägliches Phänomen – sie begegnet uns in der Schule, auf Einkaufszetteln oder auch als Unterschrift. Über die grammatischen und insbesondere die graphematischen Grundlagen der Handschrift wissen wir allerdings nur wenig. Dabei bieten Handschriften mehr Variationsmöglichkeiten als etwa Druckschriften und können deshalb mehr grammatische Strukturen sichtbar machen, als dies in gedruckten Texten der Fall ist.
Die vorliegende Untersuchung zeigt, dass strukturelle Eigenheiten einer Handschrift oft mit grammatischen Eigenheiten zusammenfallen, etwa durch die Markierung komplexer Grapheme, Silben-, Morphem- und Fußgrenzen oder auch durch die Auszeichnung bestimmter Buchstabenformen wie ‹e›, wenn es mit Schwa korrespondiert. Dazu werden Abituraufsätze untersucht, graphetisch und grammatisch annotiert und ausgewertet.
Einführung
(1998)
Einleitung
(2020)
A corpus-based academic grammar of German is an enormous undertaking, especially if it aims at using state-of-the-art methodology while ensuring that its study results are verifiable. The Bausteine-series, which is being developed at the Leibniz Institute for the German Language (IDS), presents individual “building blocks” for such a grammar. In addition to the peer-reviewed texts, the series publishes the results of statistical analyses and, for selected topics, the underlying data sets.
Einleitung
(2012)
Einleitung
(2021)
Mit dem zweiten Band werden vier neue „Bausteine“ zu einer korpuslinguistisch fundierten Grammatik des Deutschen vorgelegt. Sie behandeln die Bereiche Determination, syntaktische Funktionen der Nominalphrase und Attribution. Dem Fachpublikum werden zugleich die analysierten Sprachdaten und vertiefende Zusatzuntersuchungen zugänglich gemacht.
Einleitung
(2017)
Einleitung
(2019)
Endungsvariation
(2014)
The paper describes preliminary studies regarding the usage of Example-Based Querying for specialist corpora. We outline an infrastructure for its application within the linguistic domain. Example-Based Querying deals with retrieval situations where users would like to explore large collections of specialist texts semantically, but are unable to explicitly name the linguistic phenomenon they look for. As a way out, the proposed framework allows them to input prototypical everyday language examples or cases of doubt, which are automatically processed by CRF and linked to appropriate linguistic texts in the corpus.
In this paper, we present our approach to automatically extracting German terminology in the domain of grammar using texts from the online information system grammis as our corpus. We analyze existing repositories of German grammatical terminology and develop Part-of-speech patterns for our extraction thereby showing the importance of unigrams in this domain. We contrast the results of the automatic extraction with a manually extracted standard. By comparing the performance of well-known statistical measures, we show how measures based on corpus comparison outperform alternative methods.
Seit Mitte der 1990er Jahre wird am Institut für deutsche Sprache (IDS) in Mannheim erforscht, wie der hochkomplexe Gegenstandsbereich „Grammatik“ unter Ausnutzung hypertextueller Navigationsstrukturen wissenschaftlich fundiert und anschaulich vermittelt werden kann. Eine zentrale Bedeutung kommt folglich einer konsistenten, theorieübergreifenden Vernetzung sämtlicher Textinhalte zu. Um eine automatisierbare Bezugnahme zwischen mit unterschiedlichem terminologischem Vokabular formulierten, aber das gleiche sprachliche Phänomen beschreibenden Inhalten zu befördern, bildet eine onomasiologisch konzipierte Terminologiedatenbank das Rückgrat des Online-Systems. Der Beitrag beschreibt Konzeption und Aufbau der skizzierten linguistischen Fachterminologie.
Recent years have seen a growing interest in grammatical variation, a core explanandum of grammatical theory. The present volume explores questions that are fundamental to this line of research: First, the question of whether variation can always and completely be explained by intra- or extra-linguistic predictors, or whether there is a certain amount of unpredictable – or ‘free’ – grammatical variation. Second, the question of what implications the (in-)existence of free variation would hold for our theoretical models and the empirical study of grammar. The volume provides the first dedicated book-length treatment of this long-standing topic. Following an introductory chapter by the editors, it contains ten case studies on potentially free variation in morphology and syntax drawn from Germanic, Romance, Uralic and Mayan.