Refine
Year of publication
Document Type
- Part of a Book (65) (remove)
Has Fulltext
- yes (65)
Keywords
- Grammatik (65) (remove)
Publicationstate
- Veröffentlichungsversion (65) (remove)
Reviewstate
- (Verlags)-Lektorat (54)
- Peer-Review (6)
- Verlags-Lektorat (4)
- (Verlags-)Lektorat (1)
Publisher
- Narr (18)
- de Gruyter (15)
- Heidelberg University Publishing (9)
- Lang (3)
- Benjamins (2)
- DAAD (2)
- European language resources association (ELRA) (2)
- Academia (1)
- De Gruyter (1)
- Dudenverlag (1)
The main objective of this article is to describe the current activities at the Mannheim Institute for German Language regarding the implementation of a domain-specific ontology for German grammar. We differentiate ontology bases from ontology management Systems, point out the benefits of database-driven Solutions, and go Step by Step through all phases of the ontology lifecycle. In Order to demonstrate the practical use of our approach, we outline the interface between our ontology and the grammis web Information System, and compare the ontology-based retrieval mechanism with traditional full text search.
This paper presents ongoing research which is embedded in an empirical-linguistic research program, set out to devise viable research strategies for developing an explanatory theory of grammar as a psychological and social phenomenon. As this phenomenon cannot be studied directly, the program attempts to approach it indirectly through its correlates in language corpora, which is justified by referring to the core tenets of Emergent Grammar. The guiding principle for identifying such corpus correlates of grammatical regularities is to imitate the psychological processes underlying the emergent nature of these regularities. While previous work in this program focused on syntagmatic structures, the current paper goes one step further by investigating schematic structures that involve paradigmatic variation. It introduces and explores a general strategy by which corpus correlates of such structures may be uncovered, and it further outlines how these correlates may be used to study the nature of the psychologically real schematic structures.
Thema dieses Beitrags sind die komplexen Nominalphrasen im Deutschen, die von außen gesehen unter Umständen monströs anmuten. Ein besonderes, wohl bekanntes Problem bieten dabei sogenannte erweiterte vorangestellte Attribute. Die Komplexitäten geben u.A. zu folgenden Fragen Anlass: Inwiefern lässt sich die ‚Ausuferung‘ der deutschen Nominalphrase funktional begründen? Falls es ein Rationales hinter den Komplexitäten gibt, wie lösen dann Sprachen, die entsprechende Ausbaumöglichkeiten nicht besitzen, die einschlägigen funktionalen Aufgaben? Hier soll primär die erste Frage diskutiert werden anhand von authentischen Text(ausschnitt)en, die das Zusammenspiel zwischen vorangestellten und nachgestellten ‚Erweiterungen‘ der Nominalphrase – Relativsätze eingeschlossen – wie auch die Funktion sogenannter nichtrestriktiver Attribute im Diskurs veranschaulichen können; die zweite Frage wird in relevanten Zusammenhängen mit berücksichtigt.
Dieses Kapitel gibt einen Überblick über das Inventar der Ausdrücke, die zur Kategorie der Determinierer gezählt werden bzw. zumindest als Kandidaten für diese Kategorie gehandelt werden. Es untersucht ihre grammatischen Eigenschaften und überprüft ihren Determiniererstatus anhand einschlägiger morpho-syntaktischer Kriterien.
Leitfrage des Beitrags ist: Was kann der Blick von außen, insbesondere der Blick aus der Perspektive europäischer Sprachen für die grammatische Beschreibung des Deutschen erbringen? Als Exemplifikationsbereich im Für und Wider wird die Grammatik der Pronomina herangezogen, primär die der Personal- und Reflexivpronomina. Dieser Beispielbereich geht ebenso wie das Vortragsthema insgesamt auf das Projekt „Grammatik des Deutschen im europäischen Vergleich“ (GDE) zurück, an dem derzeit in der Abteilung Grammatik des IDS gearbeitet wird. Dreh- und Angelpunkt aller sprachvergleichenden Unternehmungen ist die Frage nach dem tertium comparationis. Es wird dafür plädiert, ‚funktionale Domänen‘ als Anfangstertium zu bestimmen. Diese dienen als Einstieg in eine Methodologie der fortschreitenden Form- und Funktionsdifferenzierung'. Der erhoffte Mehrwert für unser Wissen über das Deutsche - so die These - verteilt sich auf die allgemeine Sprachtypologie und auf den Vergleich mit europäischen „Nah“- Sprachen. Der Blick auf das typologische Spektrum insgesamt sensibilisiert für Fakten, die im europäischen Raum nur indirekten Niederschlag haben. Der Kontrast mit Sprachen wie dem Polnischen, Ungarischen usw. bringt auch dort, wo große Übereinstimmung zu bestehen scheint, die nötige Feindifferenzierung und schärft den Blick für die Besonderheiten im Detail. Pronominale Beispiele für die Fallstricke der einzelsprachlichen Grammatik, etwa Formen von Über- und Untergeneralisierung, sollen das Plädoyer für eine Europäisierung der Grammatik abrunden.
Die Formen der Sprache und die Prozesse des Verstehens. Textverstehen aus grammatischer Sicht
(2006)
Was tragen grammatische Formen zum Textverstehen bei, und wie können sie das? Diese Fragen berühren verschiedene Probleme: Grammatik konkretisiert sich in einem abstrakten Regelsystem, Verstehen in situationsbezogenen individuellen Handlungen. Grammatische Formen stellen überwiegend keine eigenständigen Zeichen, sondern Eigenschaften von Zeichen dar. In diesem Beitrag wird das Thema vor einem pragmatischen Hintergrund behandelt: Verstehen wird aufgefasst als eine konstruktive, auf Schlussfolgerungen gestützte Tätigkeit; Grammatik wird darin nicht primär als etwas benutzt, was selbst einen Zeicheninhalt hat, sondern als Steuerungsmittel beim Verstehen. Der Beitrag der Grammatik im Zusammenwirken der verschiedenen Inputs beim Verstehen wird anhand von Kategorien wie Tempus, Modus, Thema-Rhema-Gliederung, strukturelle Eigenschaften von Sätzen und im Kontrast zur Kohärenzbildung im Text erörtert.
Einführung
(1998)
Einleitung
(2020)
A corpus-based academic grammar of German is an enormous undertaking, especially if it aims at using state-of-the-art methodology while ensuring that its study results are verifiable. The Bausteine-series, which is being developed at the Leibniz Institute for the German Language (IDS), presents individual “building blocks” for such a grammar. In addition to the peer-reviewed texts, the series publishes the results of statistical analyses and, for selected topics, the underlying data sets.
Einleitung
(2012)
Einleitung
(2021)
Mit dem zweiten Band werden vier neue „Bausteine“ zu einer korpuslinguistisch fundierten Grammatik des Deutschen vorgelegt. Sie behandeln die Bereiche Determination, syntaktische Funktionen der Nominalphrase und Attribution. Dem Fachpublikum werden zugleich die analysierten Sprachdaten und vertiefende Zusatzuntersuchungen zugänglich gemacht.
Einleitung
(2017)
Einleitung
(2019)
The paper describes preliminary studies regarding the usage of Example-Based Querying for specialist corpora. We outline an infrastructure for its application within the linguistic domain. Example-Based Querying deals with retrieval situations where users would like to explore large collections of specialist texts semantically, but are unable to explicitly name the linguistic phenomenon they look for. As a way out, the proposed framework allows them to input prototypical everyday language examples or cases of doubt, which are automatically processed by CRF and linked to appropriate linguistic texts in the corpus.
In this paper, we present our approach to automatically extracting German terminology in the domain of grammar using texts from the online information system grammis as our corpus. We analyze existing repositories of German grammatical terminology and develop Part-of-speech patterns for our extraction thereby showing the importance of unigrams in this domain. We contrast the results of the automatic extraction with a manually extracted standard. By comparing the performance of well-known statistical measures, we show how measures based on corpus comparison outperform alternative methods.
Complement phrases are essential for constructing well-formed sentences in German. Identifying verb complements and categorizing complement classes is challenging even for linguists who are specialized in the field of verb valency. Against this background, we introduce an ML-based algorithm which is able to identify and classify complement phrases of any German verb in any written sentence context. We use a large training set consisting of example sentences from a valency dictionary, enriched with POS tagging, and the ML-based technique of Conditional Random Fields (CRF) to generate the classification models.
Dieses Kapitel untersucht das Verhältnis von Genitivattributen und Präpositionalattributen mit von im Deutschen datenbasiert. Im Zentrum steht dabei die Frage danach, unter welchen Bedingungen die beiden Konstruktionen miteinander variieren können. Neben funktionaler Äquivalenz, die z. B. bei von-Attributen mit starker lokativischer oder ablativischer Semantik nicht gegeben ist, stellt dabei auch das Vorhandensein flektierender Elemente in der Attributsphase eine wichtige Voraussetzung dar.
Gesprochene Sprache
(2005)
In recent years, the availability of large annotated and searchable corpora, together with a new interest in the empirical foundation and validation of linguistic theory and description, has sparked a surge of novel and interesting work using corpus-based methods to study the grammar of natural languages. However, a look at relevant current research on the grammar of the Germanic, Romance, and Slavic languages reveals a variety of different theoretical approaches and empirical foci, which can be traced back to different philological and linguistic traditions. Still, this current state of affairs should not be seen as an obstacle but as an ideal basis for a fruitful exchange of ideas between different research paradigms.
Grammatik
(2005)
Das Projekt „Grammatik des Deutschen im europäischen Vergleich“, das derzeit am Institut für Deutsche Sprache in Mannheim durchgeführt wird, soll durch die Berücksichtigung sprachtypologischer und im europäischen Rahmen kontrastiver Einsichten einen innovativen Zugang zur Grammatik des Deutschen erschließen. Die Berücksichtigung dieser grammatischen Außenperspektive soll auch als Grundlegung für anwendungsbezogene Grammatiken im Bereich Deutsch als Fremdsprache genutzt werden können. Die Erkenntnis der „arealen Typologie“, daß viele europäische Sprachen, unabhängig von ihrer genetischen Zugehörigkeit, grammatische Gemeinsamkeiten aufweisen, kann das europäische Sprachenbewußtsein und damit die kulturelle Identität fördern; in diesen kulturpolitischen Kontext ist auch das IDS-Projekt zu stellen. Die Konzeption des Projekts mit den zentralen Beschreibungskategorien funktionale Domäne’ und ,Varianzparameter’ wird vorgestellt und an Phänomenen aus dem gegenwärtigen Arbeitsschwerpunkt „Grammatik des Nominals“ erläutert.
Klassen von Komplementen
(1997)
Vorgestellt werden Ziele und erste Ergebnisse des Projektes „Univerbierung“ am Institut für Deutsche Sprache. Das Projekt untersucht in verschiedenen Korpora, ob sich Prozesse der Univerbierung quantitativ belegen lassen. In Form von Univerbierungsprofilen sollen Univerbierungsverläufe dargestellt werden, d.h. die quantitativen Veränderungen, die zeitlich im Verhältnis der Getrennt- und Zusammenschreibungen eintreten (Kap. 1 und 2). Zugleich wird dabei methodologisch reflektiert, ob und inwieweit diese Korpora für solche Untersuchungen geeignet sind (Kap. 3). Exemplarisch werden einige Univerbierungsprofile vorgestellt (Kap. 4). Es handelt sich zum einen um Beispiele, bei denen sich die Normlage im Zuge der Rechtschreibreform nicht geändert hat, und zum anderen um solche, bei denen sie im Untersuchungszeitraum (1985-2008) verändert wurde. Die Untersuchungen zielen in der Perspektive darauf ab, Faktoren herauszuarbeiten, die Univerbierungsprozesse fördern bzw. hemmen, und aufzuklären, was Schreiber(-innen) als ein Wort gilt. Dies kann dazu beitragen, empirisch gestützt Komponenten des Wortkonzepts zu ermitteln (Kap. 5).
Von Grammatikern erwartet man Auskunft darüber, wie man zu reden und zu schreiben hat, eine Erwartung, die sich auf die Annahme stutzt, es stehe grundsätzlich immer schon fest, was in Sprachen wie etwa dem Deutschen als korrekt gelten kann. Tatsächlich kann jedoch nicht einmal davon ausgegangen werden, dass es so etwas wie das Deutsche als eindeutig bestimmten Gegenstand gibt. Alles, was als Deutsch zu fassen ist, sind ungezählte schriftliche und - sofern aufgezeichnet - mündliche Äußerungen. Bis vor wenigen Jahren waren diese Daten praktisch nur unzureichend zu nutzen, weshalb Grammatikern wenig anderes übrig blieb, als auf der schmalen Basis durch Introspektion gewonnener Daten Simulationen eines allgemeinen Sprachgebrauchs zu entwickeln. Mit der Verfügung über riesige Korpora maschinenlesbarer Texte haben sich die Voraussetzungen für die Untersuchung grammatischer Strukturen entscheidend verändert. Für die Grammatikforschung ergaben sich damit neue Perspektiven: zum einen ein radikaler Bruch mit der Tradition grammatischer Analysen, der weitgehend auf eine statistische Auswertung von Kookkurrenzen setzt, zum andern - weniger radikal, mehr traditionsverbunden - die Möglichkeit, konventionell kompetenzgestutzt erarbeitete Regelhypothesen anhand von Daten zu validieren, wie sie in sehr großen Textkorpora vorliegen und dem, was als Deutsch gelten kann, so nah kommen, wie dies irgend erreichbar ist, da sie durchweg in dem Bemühen zustande kamen, sich korrekt auszudrucken.
Thema des Beitrags ist der Einsatz des Dudenkorpus in der Zusammenarbeit von Grammatikautoren und Dudenredaktion. Das annotierte Korpus und die Recherchemöglichkeiten, die es bietet, werden anhand aktueller Beispiele aus der Werkstatt einer Dudenredakteurin beschrieben. Einen Schwerpunkt bildet neben einfachen Vergleichen zwischen zwei oder drei morphologischen Varianten die komplexere Frage, ob temporales wo (der Zeitpunkt, wo; jetzt, wo) in der Dudengrammatik weiterhin als standardsprachlich bezeichnet werden soll. Zugleich wird versucht, die Attraktivität alternativer Konstruktionen (der Zeitpunkt, zu dem; jetzt, da) für Schreibende und Lesende zu messen. Diese ‘Alternativen’ verhalten sich jedoch keineswegs wie die eingangs erwähnten morphologischen Varianten zueinander – zu unterschiedlich sind semantische und syntaktische Leistungen, zu unterschiedlich die Restriktionen, die für ihre Verwendung im Satz gelten, zu unterschiedlich sind schließlich die untersuchten Texte, aus denen die mittels Hochrechnung ausgewerteten über 30 000 Sätze stammen. Zur Diskussion steht, welche Konsequenzen in einer Grammatik für ein breites Publikum zu ziehen sind. Diese Frage wird für die ‘Wortgrammatik’ anders beantwortet als für die ‘Regelgrammatik’.
In der Geschichte der Sprachwissenschaft hat das Lexikon in unterschiedlichem Maße Aufmerksamkeit erfahren. In jüngerer Zeit ist es vor allem durch die Verfügbarkeit sprachlicher Massendaten und die Entwicklung von Methoden zu ihrer Analyse wieder stärker ins Zentrum des Interesses gerückt. Dies hat aber nicht nur unseren Blick für lexikalische Phänomene geschärft, sondern hat gegenwärtig auch einen profunden Einfluss auf die Entstehung neuer Sprachtheorien, beginnend bei Fragen nach der Natur lexikalischen Wissens bis hin zur Auflösung der Lexikon-Grammatik-Dichotomie. Das Institut für Deutsche Sprache hat diese Entwicklungen zum Anlass genommen, sein aktuelles Jahrbuch in Anknüpfung an die Jahrestagung 2017 – „Wortschätze: Dynamik, Muster, Komplexität“ – der Theorie des Lexikons und den Methoden seiner Erforschung zu widmen.
Notions such as “corpus-driven” versus “theory-driven” bring into focus the specific role of corpora in linguistic research. As for phonology with its intrinsic focus on abstract categorical representation, there is a question of how a strictly corpus-driven approach can yield insight into relevant structures. Here we argue for a more theory-driven approach to phonology based on the concept of a phonological grammar in terms of interacting constraints. Empirical validation of such grammars comes from the potential convergence of the evidence from various sources including typological data, neutralization patterns, and in particular patterns observed in the creative use of language such as acronym formation, loanword adaptation, poetry, and speech errors. Further empirical validation concerns specific predictions regarding phonetic differences among opposition members, paradigm uniformity effects, and phonetic implementation in given segmental and prosodic contexts. Corpora in the narrowest sense (i.e. “raw” data consisting of spontaneous speech produced in natural settings) are useful for testing these predictions, but even here, special purpose-built corpora are often necessary.
In diesem Aufsatz diskutiere ich drei syntaktische Phänomene, die für die Grammatikforschung von zentraler Bedeutung sind. Ich zeige, dass Introspektion als Stütze von Theorien nicht ausreicht und entwickle Korpusanfragen für die diskutierten Fälle. Der Aufsatz schließt mit Anmerkungen zu den Grenzen der Korpuslinguistik.
Richtiges Deutsch?
(2009)