Refine
Year of publication
Document Type
- Part of a Book (2541)
- Article (732)
- Book (260)
- Conference Proceeding (137)
- Review (65)
- Other (54)
- Working Paper (24)
- Part of Periodical (15)
- Report (5)
- Course Material (1)
Language
- German (3361)
- English (410)
- Russian (24)
- Multiple languages (13)
- French (10)
- Spanish (9)
- Portuguese (4)
- Italian (2)
- Dutch (1)
- Norwegian (1)
Keywords
- Deutsch (1651)
- Korpus <Linguistik> (404)
- Sprachgebrauch (187)
- Grammatik (180)
- Konversationsanalyse (164)
- Linguistik (153)
- Wörterbuch (152)
- Gesprochene Sprache (148)
- Kommunikation (129)
- Sprache (124)
Publicationstate
- Veröffentlichungsversion (2490)
- Zweitveröffentlichung (1161)
- Postprint (176)
- Erstveröffentlichung (3)
- Ahead of Print (1)
- Verlagsveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (3836) (remove)
Publisher
- de Gruyter (1007)
- Institut für Deutsche Sprache (304)
- Narr (279)
- Leibniz-Institut für Deutsche Sprache (IDS) (156)
- Narr Francke Attempto (126)
- Lang (120)
- Niemeyer (115)
- Stauffenburg (57)
- IDS-Verlag (51)
- Winter (51)
Neologie und Korpus
(1998)
Das in der Germanistik lange vernachlässigte Thema der Neologie und des lexikalischen Wandels wird in theoretischen, methodologischen und praktischen Aspekten beleuchtet. Es wird gezeigt, welchen Beitrag die Korpuslinguistik bei der Objektivierung des Bedeutungswechsels bereits vorhandener lexikalischer Ausdrücke leisten kann und welche Relevanzkriterien für die lexikographische Bearbeitung erfüllt sein müssen.
Introduction
(2012)
Erpresserbriefe werden häufig mit elliptischen Formulierungen verbunden, welche durch ausgeschnittene, auf einem Stück Papier aufgeklebte Buchstaben realisiert werden. Betrachtet man allerdings authentische Erpresserbriefe, stellt man fest, dass viele wie ein Geschäftsbrief aussehen und verwaltungssprachliche Elemente aufweisen. Welche Formen der Verwaltungssprache sind das und warum werden diese in Schreiben illegalen Charakters verwendet? Der vorliegende Beitrag befasst sich mit diesen Fragestellungen. Anhand einer Stichprobe aus der Tatschreibensammlung des BKA werden Formen der Verwaltungssprache in Erpresserbriefen empirisch untersucht, Erklärungsansätze entwickelt und deren Relevanz für die Autorenerkennung erläutert.
Das kontrastive Verbvalenzwörterbuch Spanisch - Deutsch (Diccionario contrastivo de valencias verbales español - alemán DCVVEA) liefert eine Beschreibung der kombinatorischen Möglichkeiten von über hundert hochfrequenten Verben des Spanischen und ihrer deutschen Äquivalente und macht präzise Angaben zu ihren semantischen und syntagmatischen Eigenschaften. Die Abgrenzung von Bedeutungsvarianten für die polysemen spanischen Lemmata geht zum einen von vorliegenden lexikographische Beschreibungen aus, die an die Zielsetzungen des DCVVEA angepasst wurden, und stützt sich zum anderen auf das empirische Datenmaterial, das die syntaktische Datenbank Base de datos sintácticos del español actual (BDS) zur Verfügung stellt. Die BDS wurde von WissenschaftlerInnen der USC unter der Leitung von Guillermo Rojo erstellt und enthält die Ergebnisse der syntaktischen Analyse von etwa 160.000 Sätzen aus einem Textkorpus der spanischen Gegenwartssprache, ARTHUS (Archivo de textos hispánicos de la Universidad de Santiago de Compostela).
Das DCVVEA ist ein syntagmatisches Wörterbuch mit alphabetischer Struktur und Spanisch als Metasprache. Die Einträge beziehen sich auf die einzelnen Bedeutungsvarianten eines spanischen Verbs und werden mit authentischen Beispielen belegt. Den spanischen Verbvarianten werden deutsche Verben zugeordnet, die zu ihnen in einer vollständigen oder partiellen Äquivalenzrelation stehen. Die Ermittlung dieser Äquivalente stützt sich auf die Übersetzung der Korpusbeispiele. Die Valenzbeschreibung der spanischen und der deutschen Verbvarianten enthält funktionale, kategoriale und semantische Angaben zu den einzelnen Verbaktanten und explizite Hinweise auf kontrastiv relevante Unterschiede zwischen den Einheiten beider Sprachen.
In this paper, we present first results of training a classifier for discriminating Russian texts into different levels of difficulty. For the classification we considered both surface-oriented features adopted from readability assessments and more linguistically informed, positional features to classify texts into two levels of difficulty. This text classification is the main focus of our Levelled Study Corpus of Russian (LeStCoR), in which we aim to build a corpus adapted for language learning purposes – selecting simpler texts for beginner second language learners and more complex texts for advanced learners. The most discriminative feature in our pilot study was a lexical feature that approximates accessibility of the vocabulary by the second language learner in terms of the proportion of familiar words in the texts. The best feature setting achieved an accuracy of 0.91 on a pilot corpus of 209 texts.
Einleitung
(2012)
Ausgehend von der Einsicht, dass Wortbedeutungen (Sememe) als strukturierte Komplexe semantischer Merkmale (SM oder Seme) aufgefasst werden können, wurden in den zurückliegenden Jahren verschiedene Ermittlungs- und Beschreibungsmethoden für die Wortbedeutung vorgeschlagen. Im Folgenden soll sowohl prinzipiell als auch am Beispiel erörtert werden, welche Möglichkeiten und Grenzen sich gegenwärtig für die lexikographische Nutzung der semantischen Merkmal- oder Komponentenanalysen (SMA) bei der Bedeutungserklärung in Gebrauchswörterbüchern der deutschen Gegenwartssprache abzeichnen.
We discovered several recurring errors in the current version of the Europarl Corpus originating both from the web site of the European Parliament and the corpus compilation based thereon. The most frequent error was incompletely extracted metadata leaving non-textual fragments within the textual parts of the corpus files. This is, on average, the case for every second speaker change. We not only cleaned the Europarl Corpus by correcting several kinds of errors, but also aligned the speakers’ contributions of all available languages and compiled every- thing into a new XML-structured corpus. This facilitates a more sophisticated selection of data, e.g. querying the corpus for speeches by speakers of a particular political group or in particular language combinations.
Based on specific linguistic landmarks in the speech signal, this study investigates pitch level and pitch span differences in English, German, Bulgarian and Polish. The analysis is based on 22 speakers per language (11 males and 11 females). Linear mixed models were computed that include various linguistic measures of pitch level and span, revealing characteristic differences across languages and between language groups. Pitch level appeared to have significantly higher values for the female speakers in the Slavic than the Germanic group. The male speakers showed slightly different results, with only the Polish speakers displaying significantly higher mean values for pitch level than the German males. Overall, the results show that the Slavic speakers tend to have a wider pitch span than the German speakers. But for the linguistic measure, namely for span between the initial peaks and the non-prominent valleys, we only find the difference between Polish and German speakers. We found a flatter intonation contour in German than in Polish, Bulgarian and English male and female speakers and differences in the frequency of the landmarks between languages. Concerning “speaker liveliness” we found that the speakers from the Slavic group are significantly livelier than the speakers from the Germanic group.
This study investigates cross-language differences in pitch range and variation in four languages from two language groups: English and German (Germanic) and Bulgarian and Polish (Slavic). The analysis is based on large multi-speaker corpora (48 speakers for Polish, 60 for each of the other three languages). Linear mixed models were computed that include various distributional measures of pitch level, span and variation, revealing characteristic differences across languages and between language groups. A classification experiment based on the relevant parameter measures (span, kurtosis and skewness values for pitch distributions for each speaker) succeeded in separating the language groups.
Zur Kontextualisierung von sozialen Kategorien und Stereotypen in der sprachlichen Interaktion
(1995)
Wortbegriff und Orthographie
(1980)
TEI Feature Structures as a Representation Format for Multiple Annotation and Generic XML Documents
(2009)
Feature structures are mathematical entities (rooted labeled directed acyclic graphs) that can be represented as graph displays, attribute value matrices or as XML adhering to the constraints of a specialized TEI tag set. We demonstrate that this latter ISO-standardized format can be used as an integrative storage and exchange format for sets of multiple annotation XML documents. This specific domain of application is rooted in the approach of multiple annotations, which marks a possible solution for XML-compliant markup in scenarios with conflicting annotation hierarchies. A more extreme proposal consists in the possible use as a meta-representation format for generic XML documents. For both scenarios our strategy concerning pertinent feature structure representations is grounded on the XDM (XQuery 1.0 and XPath 2.0 Data Model). The ubiquitous hierarchical and sequential relationships within XML documents are represented by specific features that take ordered list values. The mapping to the TEI feature structure format has been implemented in the form of an XSLT 2.0 stylesheet. It can be characterized as exploiting aspects of both the push and pull processing paradigm as appropriate. An indexing mechanism is provided with regard to the multiple annotation documents scenario. Hence, implicit links concerning identical primary data are made explicit in the result format. In comparison to alternative representations, the TEI-based format does well in many respects, since it is both integrative and well-formed XML. However, the result documents tend to grow very large depending on the size of the input documents and their respective markup structure. This may also be considered as a downside regarding the proposed use for generic XML documents. On the positive side, it may be possible to achieve a hookup to methods and applications that have been developed for feature structure representations in the fields of (computational) linguistics and knowledge representation.
Zur Semantik kausaler Satzverbindungen: Integration, Fokussierung, Definitheit und modale Umgebung
(2005)
Die geltende Regelung der Getrennt- und Zusammenschreibung und Ansatzpunkte zu ihrer Vereinfachung
(1975)
Der vorliegende Beitrag untersucht die grammatische Realisierung satzförmiger und satzwertiger Verbgruppen- und Satzadverbialia im Deutschen im Vergleich mit den romanischen Sprachen Italienisch und Portugiesisch (schwerpunktmäßig in der brasilianischen Varietät). Solche Adverbialia können formal recht unterschiedlich realisiert werden. Für das Deutsche sind finite, subjunktor-eingeleitete adverbiale Nebensätze typisch. Seltener sind uneingeleitete finite Nebensätze, Partizipialgruppen und durch eine Präposition eingeleitete Infinitivgruppen. In den romanischen Sprachen werden Gerundial-, Partizipial- und Infinitivgruppen deutlich häufiger als Adverbialia genutzt. Anders als im Deutschen können sie auch eigene Subjekte haben, wodurch sie finiten Nebensätzen ähnlicher werden.
The aim of this study is to select and formulate criteria for the assessment of tools and exercises that are using computer-assisted pronunciation training (CAPT). We examined ten different CAPT tools selected on the basis of an informal questionnaire among 10 colleagues working in a German-French CAPT project. Although the applied assessment must still be regarded as informal, and although the selected CAPT tools might not be an optimal sample for representing the state of the art, the results clearly show that there is a lot to improve regarding the clarity of instruction, the quality of exercises, the robustness of the diagnosis, the clarity and appropriateness of scoring, the diversity of feedback methods, the assumed benefit for various types of users as well as the usage of ASR. Despite various good approaches regarding graphics and game-like exercises there are obviously missing links between the pedagogical expertise in phonetic training on the one hand, and software development including usability engineering on the other.
Einführung in die Bände
(2002)
Zu den sprachwissenschaftlichen Grundlagen der Getrennt- und Zusammenschreibung (GZS) im Deutschen
(1986)
Der Aufsatz wendet sich einem von der germanistischen Linguistik besonders ungenügend behandelten Bereich der deutschen Orthographie zu (1.). Nach der Charakterisierung des Gegenstandsbereiches der GZS wird als deren zentrale Problematik das Gegenüber von Wortgruppe und Zusammensetzung herausgestellt (2.). Orientier! an diesen beiden — durch ihre wesentlichen Merkmale für die deutsche Gegenwartssprache bestimmten — Kategorien wird mit Hilfe des Prinzips von Zentrum und Peripherie für die einzelnen in Bezug auf die GZS relevanten Wortartkombinationen eine Skala ihrer orthographischen Problemhaftigkeit abgeleitet (3.). Der-als besonders problemträchtig erkannte verbale Bereich wird in seiner Spezifik genauer betrachtet (4.), und schließlich wird an Beispielen der Kombination Adjektiv + Verb die Notwendigkeit der Aufhellung und der Beachtung der sprachwissenschaftlichen Grundlagen bei Kodifizierungen im Wörterverzeichnis nachgewiesen (5. u. 6.).
Die germanistische Linguistik wendet in jüngster Zeit Fragen des Wortschatzes - seiner Herausbildung, seiner Entwicklung, seiner Verwendung, seiner Kodifikation - verstärkt ihre Aufmerksamkeit zu. In diesem Zusammenhang gewinnt auch die wissenschaftliche Beschäftigung mit der Neologie und mit der Neologismenlexikographie innerhalb der Germanistik an Bedeutung. Das ist vor allem deshalb zu begrüßen, weil die germanistische Sprachwissenschaft der Erforschung und Erfassung lexikalischer Innovationen in der Vergangenheit nicht in dem Maße gerecht geworden ist, das der gesellschaftlichen Bedeutung dieses Wortschatzbereiches und dem Widerhall, den das Thema in der interessierten Öffentlichkeit seit langem findet, entsprechen würde.
Einem bisher nicht in angemessener Weise gelösten Teilproblem - der lexikographischen Darstellung DDR-spezifischer Neologismen - wollen wir diesen Beitrag widmen.
Neologismen als Forschungsgegenstand - Aktuelle Aufgaben und Ziele der Neologismenlexikographie
(1991)
Wörterbuchvorwörter
(1989)
In this paper, we provide an analysis of temporality in Hausa (Chadic, Afro-Asiatic). By testing the hypothesis of covert tense (Matthewson 2006) against empirical data, we show that Hausa is genuinely tenseless in the sense that the grammar does not restrict the relation between reference time and utterance time. Rather, temporal reference is pragmatically inferred from aspectual and contextual information. We also argue that future time reference in Hausa is realized as a combination of a modal operator and a prospective aspect, thus involving the modal meaning components of intention and prediction as well as event time shifting.
Komplex-Anaphern (Schwarz-Friesel/Consten/Marx 2004; Consten 2004; abstract object anaphora, Asher 1993,2000) sind Nominalphrasen, die sich auf satzwertige Antezedenten beziehen und die dort ausgedrückten Sachverhalte zu einem einheitlichen Diskursobjekt zusammenfassen (vgl. Fraurud 1992). Wir beschreiben diesen anaphorischen Komplexbildungsprozess mit Hilfe ontologischer Kategorien und geben damit Ansätze für ein Verstehensmodell, das durch Integration semantischer und konzeptueller Prozesse die Referenzialisierung (und ggf. Desambiguierung) von Komplexanaphern erklärt.
Wer eine korpusgestützte Untersuchung anstellt, ist zu Recht stolz auf hohe Belegzahlen und statistische Aussagekraft. Aber auch das Seltene und das Einzigartige hat einen Reiz, und darauf konzentrieren sich die folgenden Recherchen und Vorschläge. Selbst das Nichtvorhandene kann morgen schon belegbar sein - zum Beispiel Pluralformen zu Lemmata, die in Wörterbüchern Grammatikangaben wie „ohne Plural“ erhalten. Am Beispiel von Pluralformen besonders zu Feminina mit Derivationssuffix -heit/-(ig)keit werden unterschiedliche Möglichkeiten diskutiert, wie man mit dem Seltenen, mit dem Einzigartigen und mit dem Nichtvorhandenen oder Noch-nicht-Nachweisbaren in der Lexikografie und in sprachtechnologischen Anwendungen umgehen kann. Für Anregungen und Korrekturen danke ich herzlich Vilmos Ágel, Peter Eisenberg, Peter Gallmann, Klaus Mackowiak, Damaris Nübling, Werner Scholze-Stubenrecht, Anatol Stefanowitsch und Lutz Wind. Die Idee zu diesem Versuch gab mir die Mitarbeit an der 7. Auflage des Duden-Universalwörterbuchs, DDUW (2011), unter der Leitung von Werner Scholze-Stubenrecht, und am Vollformenprojekt meiner Kollegen aus der Duden-Sprachtechnologie.
This paper provides a lexicalist formal description of preposition-pronoun contraction (PPC) in Polish, using the theoretical framework of HPSG. Considering the behaviour of PPC with respect to the prosodic, categorial, syntactic and semantic properties, the assumption can be made that each PPC is a morphological unit with prepositional status. The crucial difference between a PPC and a typical preposition consists, besides the phonological form, in the valence properties. While a typical preposition realizes its complement externally via general constraints on phrase structure, the realization of a PPC argument is effected internally by virtue of its lexical entry. Here, we will provide the appropriate implicational lexical constraints that license both typical Ps and PPCs.
Vorwort
(2014)
This paper presents a thorough examination of the validity of three evaluation measures on parser output. We assess parser performance of an unlexicalised probabilistic parser trained on two German treebanks with different annotation schemes and evaluate parsing results using the PARSEVAL metric, the Leaf-Ancestor metric and a dependency-based evaluation. We reject the claim that the TüBa-D/Z annotation scheme is more adequate then the TIGER scheme for PCFG parsing and show that PARSEVAL should not be used to compare parser performance for parsers trained on treebanks with different annotation schemes. An analysis of specific error types indicates that the dependency-based evaluation is most appropriate to reflect parse quality.
Lexikalisch-semantische Graduonymie. Eine empirisch basierte Arbeit zur lexikalischen Semantik
(2016)
Diese Arbeit befasst sich mit der Problematik gradueller Bedeutungsbeziehungen in der Sprache. Sie verfolgt das Ziel, die aufgrund der graduellen Opposition in Paradigmen formierten Wörter als eigenständigen Relationstyp der lexikalischen Semantik zu unterscheiden, ihn theoretisch herauszuarbeiten und empirisch zu fundieren. Diese Relation wird analog der terminologischen Tradition der "-nymie"-Relationen als Graduonymie bezeichnet. Mit verschiedenen empirischen Methoden wie der webbasierten Sprecherbefragung, Korpusanalysen, systematischen Tests und Kontrastierung mit dem Usbekischen werden die Validität und Stabilität der Daten überprüft und somit Erkenntnisse zum Phänomen der Graduonymie gewonnen. Dies bildet den Kernpunkt der Untersuchung. Dabei werden unterschiedliche Aspekte der Graduonymie betrachtet und analysiert. Der Vergleich der Methoden eröffnet neue Perspektiven auf die semantischen Relationen, die Vorgehensweise hat sich methodisch als erfolgreich erwiesen. Die Ergebnisse der Arbeit erbringen interessante Einsichten nicht nur in den Phänomenbereich der Graduonymie, sondern ergänzen den aktuellen Stand der lexikalischen Semantik sowohl in theoretischer Hinsicht als auch durch die methodenpluralistische Behandlung semantischer Relationen.
Der Beitrag will mit einem lexikologisch-lexikografischen Projekt des IDS bekannt machen, in dem seit 1997 Neulexeme und Neubedeutungen der Neunzigerjahre erforscht werden, soweit sie sich im allgemeinsprachlichen Teil des Wortschatzes der deutschen Standardsprache etabliert haben. Das Ziel des Projektes ist die lexikografische Beschreibung und Dokumentation von rund 1000 ausgewählten Neologismen. Dieses Unternehmen ist zugleich Pilotprojekt für die Präsentation lexikografischer Informationen als elektronische Datenbank im Rahmen des im Aufbau befindlichen lexikalisch-lexikologischen, korpusbasierten Informationssystems LEKSIS des IDS. Erste Arbeitserfahrungen mit diesem System werden anhand des Beispiels Shareholdervalue mitgeteilt.
Der Beitrag ist der jüngsten abgeschlossenen Phase deutscher Zeit- und Sprachgeschichte gewidmet - der Wendezeit 1989/90. Unter Bezugnahme auf ein im IDS kürzlich beendetes Projekt wird anhand von Beispielen demonstriert, dass durch die Untersuchung von sogenannten Schlüsselwörtern im öffentlichen Sprachgebrauch der Wendezeit das Verständnis für das Denken und Handeln der gesellschaftlich wirksamen Kräfte jener Zeit vertieft werden kann, dass Zeitgeschichte gleichsam im Spiegel von Schlüsselwörtern erfahren werden kann. Als Beispiel dienen die Bezeichnung die Wende und eine Gruppe von Bezeichnungen, mit denen eine kritische Einstellung zur Art und Weise der Behandlung der DDR-Bürger durch das alte DDR-System und durch die Bundesrepublik ausgedrückt wird (Bevormundung, Gängelei, Entmündigung u. a.).
Dieser Beitrag nimmt Bezug auf ein lexikologisches Arbeitsprojekt des Instituts für deutsche Sprache (Mannheim) und will einen Einblick in die Voraussetzungen und Ziele dieses Vorhabens sowie in die Arbeitsweise der Projektmitarbeiter geben. Dabei soll Aspekten der Korpus- und Computernutzung in den einzelnen Arbeitsetappen besondere Aufmerksamkeit gelten.
Analog zu dem verbalen Bereich weist auch die nominale Domäne eine Reihe semantisch-syntaktischer Regularitäten und Restriktionen bezüglich ihrer internen Struktur auf. Als signifikante Parallelen zwischen Nominalstrukturen und Sätzen gelten Kontroll-, Bindungs- als auch Passivisierungsverhalten. Der Schwerpunkt des in der letzten Phase des Projekts B8 des SFB 340 entwickelten Nominalphrasenfragments liegt auf der Ausarbeitung einer Analyse für komplexe Nominalstrukturen, der eine bestimmte Menge empirisch basierter Generalisierungen zugrunde liegen. Neben der Behandlung der Kongruenzphänomene innerhalb der Nominalphrase, steht die Beschreibung der Argumentstruktur deutscher Nomina im Mittelpunkt. Das Ziel ist, eine solche Analyse zu entwickeln, die ohne leere Elemente und Spuren innerhalb der NP auskommt und eine gute Basis für Erweiterungsmöglichkeiten darstellen kann. Das Papier soll einen Überblick über die empirischen und theoretischen Annahmen geben, die der hier vorgestellten Analyse zugrunde liegen und einige ausgewählte Phänomene aus dem Nominalphrasenbereich im HPSG-Formalismus zu skizzieren. Im ersten Abschnitt wird eine Taxonomie der deutschen Nomina hinsichtlich ihrer Valenzeigenschaften vorgestellt. Im Mittelpunkt des Interesses stehen dabei Nomina mit einer Argumentstruktur. Weiterhin werden die Genitiv-NPn behandelt. Diskutiert werden insbesondere der kategoriale Status und die syntaktische Funktion der pränominalen Genitive. In Kapitel Analyse wird eine HPSG-Analyse deutscher NPn vorgeschlagen, die der Implementierung der Nominalsyntax im Projekt B8 zugrunde liegt.
Die Gründerjahre des IDS
(2007)
Ziel des Beitrags ist es, zwei Frauengruppen aus einem innerstädtischen Gebiet Mannheims auf Gemeinsamkeiten und Unterschiede im Umgang mit territorialen Ansprüchen hin zu untersuchen und die Unterschiede inbezug auf die weite oder enge Definition von Territorien, die Art und Weise der Aushandlung territorialer Grenzen und der Durchsetzung territorialer Ansprüche als Merkmale des kommunikativen Stils der Gruppen zu beschreiben. Obwohl eine Reihe von Alltagsroutinen in beiden Gruppen auf den ersten Blick sehr ähnlich sind, unterschieden sich die Gruppen in der Definition ihrer Sozialbeziehungen erheblich.
Sprachvariation bei Polizeinotrufen in Südbaden. Eine Fallstudie im Rahmen des Notruf-Pilotprojekts
(2006)
This paper provides a treatment of Polish Plural Comitative Constructions in the paradigm of HPSG in the tradition of Pollard and Sag (1994). Plural Comitative Constructions (PCCs) have previously been treated in terms of coordination, complementation and adjunction. The objective of this paper is to show that PCCs are neither instances of typical coordinate structures nor of typical complement or adjunct structures. It thus appears difficult to properly describe them by means of the standard principles of syntax and semantics. The analysis proposed in this paper accounts for the syntactic and semantic properties of PCCs in Polish by assuming an adjunction-based syntactic structure for PCCs, and by treating the indexical information provided by PCCs not as subject to any inheritance or composition, but as a result of applying a set of principles on number, gender and person resolution that also hold for ordinary coordinate structures.
In this paper, semantic aspects of P1N1P2 word sequences will be discussed. Based on syntactic analysis of Trawinski (2003), which assumes prepositions heading P1N1P2NP combinations to be able to raise and realize syntactically complements of their arguments, we will investigate whether semantic representation of these expressions can be considered as an instance of the combinatorics semantics. We will investigate three German PPs involving expressions under consideration with respect to two criteria of internal semantic regularity adopted from Sailer (2000) and we will observe that the discussed expressions are not uniform with regard to the semantic properties. While the logical form of some of them can be computed by means of ordinary translations and a set of standard derivational operations, the other require additional handling methods. However, there are approaches available within the HPSG paradigm that are suited to account for these data. Here, we will briefly present the external selection approach of Soehn (2003) and the phrasal lexical entries approach of Sailer (2000) and we will show how they interact with the syntactic approach of Trawinski (2003).
Many modern languages commonly use expressions that seem unpredictable regarding standard grammar regularities. Among these expressions, sequences consisting of a preposition, a noun, another preposition, and another noun are particularly frequent. The issue of these expressions, usually termed in linguistic literature as "complex prepositions", "phrasal prepositions" or "preposition-like word formations", can certainly be considered to be a cross-linguistic problem (On "complex prepositions" in German and in other languages see (Benes 1974), (Buscha 1984)}, (Lindqvist 1994), (Meibauer 1995), (Quirk and Mulholland 1964), (Wollmann 1996). In this paper, I will focus exclusively on German data, because they provide very explicit and convincing linguistic evidence which motivates and supports my approach. However, I assert that the analysis proposed here for German can also be applied to other languages such as Polish or English.
One of the most popular techniques used in HPSG-based studies to describe linguistic phenomena is the raising mechanism. Besides ordinary raising verbs or adjectives, this tool has been applied for handling verbal complexes and discontinuous constituents, among other phenomena. In this paper, a new application for raising within the HPSG paradigm will be discussed, thereby investigating data from the prepositional domain. We will analyze linguistic properties of word combinations in German consisting of a preposition, a noun, and another preposition (such as auf Grund von (‘by virtue of’)), thus arguing that raising is the most appropriate method for satisfactorily describing the crucial syntactic features which are typical for those expressions. The objective of this paper is thus to demonstrate the efficiency of the raising mechanism as used in HPSG, and therefore, to emphasize the importance of designing a satisfactory uniform theory of raising within this grammar framework.
In this paper, we will investigate a cross-linguistic phenomenon referred to as complex prepositions (CPs), which is a frequent type of multiword expressions (MWEs) in many languages. Based on empirical data, we will point out the problems of the traditional treatment of CPs as complex lexical categories, and, thus, propose an analysis using the formal paradigm of the HPSG in the tradition of (Pollard and Sag, 1994). Our objective is to provide an approach to CPs which (1) convincingly explains empirical data, (2) is consistent with the underlying formal framework and does not require any extensions or modification of the existing description apparatus, (3) is computationally tractable.
Einleitung
(2008)
Ungeachtet der seit einem Jahrzehnt florierenden wissenschaftlichen Beschäftigung mit Problemen der Lexikographie, für die dieses Symposium ein weiteres Zeugnis ist, sind Auskünfte und Berichte über konkrete Wörterbuchpläne noch immer selten. Dabei sind solcherart Informationen nicht nur von ganz natürlichem Interesse für alle praktisch oder/und theoretisch mit dem Gegenstand Wörterbuch Befassten, sondern es bietet sich auch - besonders, wenn sie auf Diskussionsforen wie diesem vorgestellt werden - die einzigartige Möglichkeit der Rückkopplung noch vor Beginn der eigentlichen Erarbeitung bzw. in deren Anfangsphase. Dadurch, daß die zurückkommenden kritischen Bemerkungen und sonstigen Anregungen in die abschließenden Überlegungen zum betreffenden Wörterbuchplan einbezogen werden, kann sich das frühzeitige Offenlegen des Planes vor einem kompetenten Publikum durchaus auch für das Projekt selbst als nützlich erweisen.
Mit diesem doppelten Ziel - Informationsvermittlung und entsprechendes Feedback - wollen wir im Folgenden skizzenhaft den Plan eines Wörterbuches vorstellen, das in den nächsten Jahren am Zentralinstitut für Sprachwissenschaft der Akademie der Wissenschaften der DDR erarbeitet werden wird. Dem Thema des Beitrages entsprechend werden drei Schwerpunkte gesetzt:
1. werden der Charakter und die spezifische Funktion des geplanten Wörterbuches Umrissen, 2. sollen die daraus erwachsenden Grundsätze seiner inhaltlichen Gestaltung und 3- schließlich solche der formal-lexikographischen Umsetzung erläutert werden; zur Illustration dienen Musterartikel zur Wortfamilie Disko (4.).
Neologismen im allgemeinen Wörterbuch oder Neologismenwörterbuch? Zur Lexikographie von Neologismen
(1997)
This paper focuses on aspects of the licensing of adverbial noun phrases (AdvNPs) in the HPSG grammar framework. In the first part, empirical issues will be discussed. A number of AdvNPs will be examined with respect to various linguistic phenomena in order to find out to what extent AdvNPs share syntactic and semantic properties with non-adverbial NPs. Based on empirical generalizations, a lexical constraint for licensing both AdvNPs and non-adverbial NPs will be provided. Further on, problems of structural licensing of phrases containing AdvNPs that arise within the standard HPSG framework of Pollard and Sag (1994) will be pointed out, and a possible solution will be proposed. The objective is to provide a constraint-based treatment of NPs which describes non-redundantly both their adverbial and non-adverbial usages. The analysis proposed in this paper applies lexical and phrasal implicational constraints and does not require any radical modifications or extensions of the standard HPSG geometry of Pollard and Sag (1994).
Since adverbial NPs have particularly high frequency and a wide spectrum of uses in inflectional languages such as Polish, we will take Polish data into consideration.
Following a welcome in Lithuanian and English to the guests and members on the occa- sion of the 10"’ anniversary of EFNIL, the history of this European language Organization is sketched. A brief survey of the sociolinguistic themes treated at previous Conferences and the state of the inajor projects is given, followed by an introduction (in German) to the general topic of the present Conference. The importance that translation and interpretation have for European language diversity and the individual national languages beside foreign language education of all Europeans is being stressed.
Was haben Sapir-Whorf, feministische Linguistik und bay(e)risch vs. bairisch miteinander zu tun?
(2005)
In diesem Beitrag soll gezeigt werden, was der kleine orthographische, aber große semantische Unterschied zwischen bay(e)risch ,Bayern bzw. das Gebiet Bayerns betreffend’ und bairisch ,die bairischen Dialekte betreffend’ mit den Aussagen der Sapir-Whorf-Hypothese zu tun hat und welche praktischen Konsequenzen sich daraus ergeben. Als Tertium comparationis wird dabei auf die feministische Linguistik zurückgegriffen und auf deren Annahme, dass die gesellschaftliche Benachteiligung der Frauen sich auch in der Sprache ausdrücke, sich darin festige und durch sprachliche Änderungen diese Benachteiligung auch wieder abgebaut werden könne.
Intensivinterview
(1982)
Germanisten aus dem Sprachinland sind auch an der Außenansicht ihres sprachlichen Gegenstands interessiert. Um einen Eindruck von Ansichten der deutschen Sprache aus Perspektiven des Sprachauslands zu gewinnen, wurden Mitglieder des Internationalen Wissenschaftlichen Rats des 1DS gebeten, Einstellungen und (stereotype) Meinungen mitzuteilen, die in ihren Ländern zur deutschen Sprache und zu den Deutschen verbreitet sind. Die Ergebnisse dieser kleinen Umfrage werden zusammenfassend vorgestellt und kommentiert. Insgesamt ist das Bild, das sich dabei vom Deutschen und seinen Sprechern ergibt, wenig erfreulich. Auch einige alte Vorurteile erweisen sich als beständig. Aber es gibt auch ermutigende Relativierungen einiger negativer Bewertungen und einige bemerkenswert positive Ausnahmen.
Αυοιγμα / Opening
(2011)
Moderm European Science and culture evolved in the process of emancipation of various national languages from medieval Latin. At present, this development from monolingualism to multilingualism seems to be reversed in several scientific disciplines and in higher education. The former linguistic diversity turns gradually into a modern monolingualism of scientific English, especially in the natural and some social sciences. A short-term consequence is that researchers and Professors with other first languages need extra time and sometimes money to prepare their publications and lectures in English. Long-term consequences are, among others, that all languages exept English are devaluated as media of science and learning and, thus, a diglossia might develop if only English be used for the important domains and other languages be limited to the domains of private communication and folklore. The way out can only be through a cultivation of at least bilingualism of researchers, Professors, and their students in the natural sciences and trilingualism in social sciences and the humanities.
La langue allemande
(1999)
Neologismen im GWDS
(2005)
Recent studies focussed on the question whether less-configurational languages like German are harder to parse than English, or whether the lower parsing scores are an artefact of treebank encoding schemes and data structures, as claimed by Kübler et al. (2006). This claim is based on the assumption that PARSEVAL metrics fully reflect parse quality across treebank encoding schemes. In this paper we present new experiments to test this claim. We use the PARSEVAL metric, the Leaf-Ancestor metric as well as a dependency-based evaluation, and present novel approaches measuring the effect of controlled error insertion on treebank trees and parser output. We also provide extensive past-parsing crosstreebank conversion. The results of the experiments show that, contrary to Kübler et al. (2006), the question whether or not German is harder to parse than English remains undecided.
This paper discusses the behaviour of German particle verbs formed by two-way prepositions in combination with pleonastic PPs including the verb particle as a preposition. These particle verbs have a characteristic feature: some of them license directional prepositional phrases in the accusative, some only allow for locative PPs in the dative, and some particle verbs can occur with PPs in the accusative and in the dative. Directional particle verbs together with directional PPs present an additional problem: the particle and the preposition in the PP seem to provide redundant information. The paper gives an overview of the semantic verb classes influencing this phenomenon, based on corpus data, and explains the underlying reasons for the behaviour of the particle verbs. We also show how the restrictions on particle verbs and pleonastic PPs can be expressed in a grammar theory like Lexical Functional Grammar (LFG).
How to Compare Treebanks
(2008)
Recent years have seen an increasing interest in developing standards for linguistic annotation, with a focus on the interoperability of the resources. This effort, however, requires a profound knowledge of the advantages and disadvantages of linguistic annotation schemes in order to avoid importing the flaws and weaknesses of existing encoding schemes into the new standards. This paper addresses the question how to compare syntactically annotated corpora and gain insights into the usefulness of specific design decisions. We present an exhaustive evaluation of two German treebanks with crucially different encoding schemes. We evaluate three different parsers trained on the two treebanks and compare results using EVALB, the Leaf-Ancestor metric, and a dependency-based evaluation. Furthermore, we present TePaCoC, a new testsuite for the evaluation of parsers on complex German grammatical constructions. The testsuite provides a well thought-out error classification, which enables us to compare parser output for parsers trained on treebanks with different encoding schemes and provides interesting insights into the impact of treebank annotation schemes on specific constructions like PP attachment or non-constituent coordination.
We present data-driven methods for the acquisition of LFG resources from two German treebanks. We discuss problems specific to semi-free word order languages as well as problems arising from the data structures determined by the design of the different treebanks. We compare two ways of encoding semi-free word order, as done in the two German treebanks, and argue that the design of the TiGer treebank is more adequate for the acquisition of LFG resources. Furthermore, we describe an architecture for LFG grammar acquisition for German, based on the two German treebanks, and compare our results with a hand-crafted German LFG grammar.