Refine
Year of publication
- 2020 (23) (remove)
Document Type
- Part of a Book (13)
- Book (3)
- Article (2)
- Review (2)
- Conference Proceeding (1)
- Doctoral Thesis (1)
- Other (1)
Keywords
- Grammatik (23) (remove)
Publicationstate
- Zweitveröffentlichung (10)
- Veröffentlichungsversion (8)
- Postprint (1)
Reviewstate
Publisher
Blogg Dir deinen Urlaub nach Tunesien! Zur Erläuterung des Musters [VImp PROPReflexivDat NPAkk]
(2020)
In diesem Beitrag soll das Muster [VImp PROPReflexivDat NPAkk] semantisch und syntaktisch erläutert werden. Dieses Muster, das semantisch mit Verben des Erwerbens wie anschaffen korreliert, wird auch im Zusammenhang mit Kommunikationsverben wie bloggen und facebooken sowie mit dem Kontaktverb rubbeln belegt. Mithilfe des Konzeptes der Koerzion bzw. der semantischen Anpassung soll das Kovorkommen des erwänhten Musters mit diesen Verben beschrieben und erklärt werden. Als empirische Quelle dient das Korpus für das Deutsche 2012 und 2014 aus den Corpora from the Web. Die vorliegende Untersuchung ist im Rahmen meiner Dissertationsarbeit zum Thema Argumentstruktur und Bedeutung medialer Kommunikationsverben des Deutschen und des Spanischen im Sprachvergleich durchgeführt worden.
Das Theonym Gott für den christlichen Gott weist im Frühneuhochdeutschen eine Reihe ungewöhnlicher grammatischer Eigenschaften auf, die in diesem Beitrag korpusbasiert untersucht werden. Zum einen hat es sich von seiner appellativischen Herkunft emanzipiert, wie beispielsweise am fehlenden Artikel deutlich wird, zum anderen nutzt es aber das für einen Namen ungewöhnliche es-Flexiv im Genitiv (Pauls, Gottes) und tritt, wie unbelebte Appellative, als Genitivattribut dominant nachgestellt auf (Haus __ Gottes). In der Schreibung bildet sich die Doppelmajuskel <GOtt> heraus, die es bis ins 18. Jh. visuell von der übrigen Lexik abhebt. Damit weist das Theonym im Frühneuhochdeutschen eine Sondergrammatik auf, in abgeschwächter Form besteht sie bis heute fort. Der Beitrag argumentiert dafür, dass es sich um ein Resultat besonderer kommunikativer Relevanz handelt.
In this paper we investigate the problem of grammar inference from a different perspective. The common approach is to try to infer a grammar directly from example sentences, which either requires a large training set or suffers from bad accuracy. We instead view it as a problem of grammar restriction or sub-grammar extraction. We start from a large-scale resource grammar and a small number of examples, and find a sub-grammar that still covers all the examples. To do this we formulate the problem as a constraint satisfaction problem, and use an existing constraint solver to find the optimal grammar. We have made experiments with English, Finnish, German, Swedish and Spanish, which show that 10–20 examples are often sufficient to learn an interesting domain grammar. Possible applications include computer-assisted language learning, domain-specific dialogue systems, computer games, Q/A-systems, and others.
This thesis describes work in three areas: grammar engineering, computer-assisted language learning and grammar learning. These three parts are connected by the concept of a grammar-based language learning application. Two types of grammars are of concern. The first we call resource grammars, extensive descriptions a natural languages. Part I focuses on this kind of grammars. The other are domain-specific or application-specific grammars. These grammars only describe a fragment of natural language that is determined by the domain of a certain application. Domain-specific grammars are relevant for Part II and Part III. Another important distinction is between humans learning a new natural language using computational grammars (Part II) and computers learning grammars from example sentences (Part III). Part I of this thesis focuses on grammar engineering and grammar testing. It describes the development and evaluation of a computational resource grammar for Latin. Latin is known for its rich morphology and free word order, both have to be handled in a computationally efficient way. A special focus is on methods how computational grammars can be evaluated using corpus data. Such an evaluation is presented for the Latin resource grammar. Part II, the central part, describes a computer-assisted language learning application based on domain-specific grammars. The language learning application demonstrates how computational grammars can be used to guide the user input and how language learning exercises can be modeled as grammars. This allows us to put computational grammars in the center of the design of language learning exercises used to help humans learn new languages. Part III, the final part, is dedicated to a method to learn domain- or application-specific grammars based on a wide-coverage grammar and small sets of example sentences. Here a computer is learning a grammar for a fragment of a natural language from example sentences, potentially without any additional human intervention. These learned grammars can be based e.g. on the Latin resource grammar described in Part II and used as domain-specific lesson grammars in the language learning application described Part II.
Die Wörterbücher zur Sprach- und Kommunikationswissenschaft sind eine Fachwörterbuchreihe, die für 25 Bände geplant ist und in der aktuell ca. 12.000 Artikel online stehen. WSK-1 wird in zwei Teilbänden (Formenlehre, Syntax) von Stefan J. Schierholz und Pál Uzonyi herausgegeben. Es handelt sich um ein alphabetisches und teilbilingualisiertes terminologisches Fachwörterbuch, das als Adressaten in erster Linie Studierende sieht und bei der Textrezeption und fachbezogenen Informationen behilflich sein soll. Von insgesamt ca. geplanten 4500 Artikeln sind über 4000 Artikel bereits online erschienen.
Im Folgenden werden die konzeptuelle Ordnung der Termini, die unterschiedlichen Artikeltypen (Synopse-, Einzel-, Verweisartikel), die Verweisstrukturen (uni-, bidirektional; Synonyme, Antonyme, inhaltlich-thematische Verweisungen, Mehrworttermini), die Abbildung der kognitiven Strukturen des Fachwissens, die Lernkomponenet des Bandes sowie der Artikelaufbau vorgestellt.
Ein multilinguales linguistisches Begriffssystem wird in Form einer Datenbank implementiert, die dem Benutzer den semasiologischen und onomasiologischen Zugriff erlaubt, ihn also zu einem gegebenen Terminus den Begriff und seine Definition und zu einem gegebenen Begriff die Termini in den beteiligten Sprachen finden lässt. Die Mehrfachzuordnung von Begriffen zu Termini ist dabei auf interlingualer Ebene nicht wesentlich verschieden von der Situation in einer monolingualen Ontologie. Für die Normierung einer interlingualen Ontologie werden Grundsätze zur Bildung von Begriffen und von Termini vorgeschlagen. Zwischen den Begriffen bestehen eine Menge von vordefinierten konzeptuellen Relationen, die sie in systematische Beziehungen zueinander setzen und es sowohl dem Verwalter ermöglichen, das System konsistent zu halten, als auch dem Benutzer, im Begriffssystem zu navigieren.
Der Beitrag bespricht in Abgrenzung zum vorherrschenden onomasiologischen Paradigma der Terminologielehre die Vor- und Nachteile einer semasiologischen Terminologiearbeit und -modelierung. Hierbei wird davon ausgegeangen, dass terminologische Einheiten diskursiv konstituiert werden und dass aus einer relationalen Beschreibung semasiologisch verstandener terminologischer Einheiten eine begriffsorientierte Beschreibung emergent hervorgeht. Zu diesem Zweck empfiehlt der Beitrag ein Prinzip der Zeichenorientierung, mit dem zudem die theoretische Beschreibung von terminologiestrukturierenden Beziehungstypen vereinheitlicht werden kann.
Die Terminologielehre(speziell die Terminologielehre nach Eugen Wüster)liefert eine Basis und Methoden für terminologische Anwendungen in der Praxis. Viele Unternehmen und Institutionen richten ihr Terminologiemanagement danach aus. Nach einer kurzen Vorstellung der entsprechenden Ziele und Prozesse werden wichtige Typen von Begriffssystemen dargestellt, und es wird aufgezeigt, welche positiven Effekte das Erarbeiten von Begriffssystemen auf die Qualität der Terminologiearbeit hat. Als nächster inhaltlicher Schwerpunkt werden Möglichkeiten und Besonderheiten der Terminologieverwaltung unter besonderer Berücksichtigung der Eintragsmodellierung in terminologischen Datenbanken erörtert. Den Abschluss der Betrachtungen bildet die Zusammenführung der zwei Bereiche: Welche Optionen stehen für die Repräsentation von Begriffssystemen in Terminologieverwaltungssystemen zur Verfügung bzw. können dort umgesetzt werden?
Effiziertes Objekt
(2020)
affiziertes Objekt
(2020)
„Bausteine einer Korpusgrammatik des Deutschen“ ist eine neue Schriftenreihe, die am Leibniz-Institut für Deutsche Sprache in Mannheim (IDS) entsteht. Sie setzt sich zum Ziel, mit korpuslinguistischen Methoden die Vielfalt und Variabilität der deutschen Grammatik in großer Detailschärfe zu erfassen und gleichzeitig für die Validierbarkeit der Ergebnisse zu sorgen. Die erste Ausgabe enthält eine Einführung in die Reihe sowie vier als Kapitel einer neuen Grammatik gestaltete Texte: 1. Grundlegende Aspekte der Wortbildung, 2. Bau von und Umbau zu Adverbien, 3. Starke vs. schwache Flexion aufeinanderfolgender attributiver Adjektive und 4. Reihenfolge attributiver Adjektive. Die Ausgabe ist mit einer interaktiven Datenbank zu attributiven Adjektiven verknüpft.
Einleitung
(2020)
A corpus-based academic grammar of German is an enormous undertaking, especially if it aims at using state-of-the-art methodology while ensuring that its study results are verifiable. The Bausteine-series, which is being developed at the Leibniz Institute for the German Language (IDS), presents individual “building blocks” for such a grammar. In addition to the peer-reviewed texts, the series publishes the results of statistical analyses and, for selected topics, the underlying data sets.
In our paper, we present a case study on the quality of concept relations in the manually developed terminological resource of grammis, an information system on German grammar. We assess a SKOS representation of the resource using the tool qSKOS, create a typology of the issues identified by the tool, and conduct a qualitative analysis of selected cases. We identify and discuss aspects that can motivate quality issues and uncover that ill-formed relations are frequently indicative of deeper issues in the data model. Finally, we outline how these findings can inform improvements in our resource’s data model, discussing implications for the machine readability of terminological data.
Das "Verzeichnis grundlegender grammatischer Fachbegriffe" 2019. Anliegen, Konzeption, Perspektiven
(2020)
Terminologiearbeit im wirtschaftlichen Kontext geht von zwei Arbeitsphasen aus: einer umfassenden deskriptiven Phase, in der die Begriffsstruktur und der aktuelle Terminologiegebrauch erfasst, aber noch nicht bewertet werden, sowie einer präskriptiven Phase, in der der eigentliche Standardisierungseingriff erfolgt. In der Praxis wird die deskriptive Phase oft reduziert und der Schwerpunkt unmittelbar auf die Präskription gelegt. In unserem Beitrag diskutieren wir das Potenzial, das eine ausführliche deskriptive Terminologiearbeit zur Verbesserung der Wissenskommunikation im Rahmen des Wissensmanagements birgt. Am Beispiel eines wissenschaftlichen Projektes im Bereich Grammatik des Deutschen zeigen wir, wie diese eng an der Theorie orientierte Ausgestaltung der Deskription in der Praxis aussieht, welche Herausforderungen sie mit sich bringt und wie ihre Ergebnisse das Wissensmanagement unterstützen können.
Gegenstand dieses Beitrags ist die Entwicklung des graphentheoretischen Analysetools Laniakea, das zur Visualisierung von Phänomenen und Veränderungen in terminologischen Netzwerken entwickelt wurde. Wir führen theoretische Grundlagen, Designentscheidungen und technische Details der Implementierung des Tools aus. Darüber hinaus wird auch eine Beschreibung von Erfahrungen im Fokus des Beitrages stehen, die bei der Anwendung von Laniakea bei der Überarbeitung der terminologischen Ressourcen des Grammatischen Informationssystems grammis, gesammelt wurden.