Refine
Year of publication
- 2008 (90) (remove)
Document Type
- Part of a Book (65)
- Article (11)
- Book (7)
- Conference Proceeding (7)
Keywords
- Deutsch (31)
- Korpus <Linguistik> (12)
- Wörterbuch (7)
- Gesprochene Sprache (5)
- Rumänisch (5)
- Dependenzgrammatik (4)
- Deutschland <DDR> (4)
- Kontrastive Grammatik (4)
- Semantik (4)
- Adelung, Johann Christoph (3)
Publicationstate
- Veröffentlichungsversion (74)
- Zweitveröffentlichung (14)
- Postprint (2)
Reviewstate
- (Verlags)-Lektorat (90) (remove)
Publisher
- de Gruyter (19)
- Narr (9)
- iudicium (7)
- Lang (4)
- BBAW (3)
- European Language Resources Association (ELRA) (3)
- Olms (3)
- Stauffenburg (3)
- University of Oulu (3)
- Benjamins (2)
One of the most popular techniques used in HPSG-based studies to describe linguistic phenomena is the raising mechanism. Besides ordinary raising verbs or adjectives, this tool has been applied for handling verbal complexes and discontinuous constituents, among other phenomena. In this paper, a new application for raising within the HPSG paradigm will be discussed, thereby investigating data from the prepositional domain. We will analyze linguistic properties of word combinations in German consisting of a preposition, a noun, and another preposition (such as auf Grund von (‘by virtue of’)), thus arguing that raising is the most appropriate method for satisfactorily describing the crucial syntactic features which are typical for those expressions. The objective of this paper is thus to demonstrate the efficiency of the raising mechanism as used in HPSG, and therefore, to emphasize the importance of designing a satisfactory uniform theory of raising within this grammar framework.
Lexical chaining has become an important part of many NLP tasks. However, the goodness of a chaining process and hence its annotation output depends on the quality of the chaining resource. Therefore, a framework for chaining is needed which integrates divergent resources in order to balance their deficits and to compare their strengths and weaknesses. In this paper we present an application that incorporates the framework of a meta model of lexical chaining exemplified on three resources and its generalized exchange format.
Anakoluthe dependenziell
(2008)
Der vorliegende Band enthält die Beiträge eines Kolloquiums am Institut für Deutsche Sprache, Mannheim, in dem das komplexe und moderne Werk sowie das systematische Arbeiten Johann Christoph Adelungs gewürdigt wurde. Die Beiträger und Beiträgerinnen des Bandes stellen das kulturgeschichtliche Denken Adelungs, sein lexikographisches Werk, seine grammatischen, orthographischen und stilistischen Arbeiten unter spezifischen Fragestellungen dar: Adelungs durch Herder inspiriertes Verständnis von Kulturgeschichte bildet gleichsam das Prinzip seiner Arbeit. In Beispielen wird die Adelung-Rezeption beschrieben ebenso wie die Bedeutung seines Werks für heutige sprachhistorische Forschung. Dass Adelung mit seinen Arbeiten in Spannungsfelder einzuordnen ist, machen diejenigen Beiträge deutlich, die ihn als Traditionalisten und als Vertreter der beginnenden Moderne zeigen, als Sprachgelehrten mit präskriptiven und deskriptiven Anliegen, als konservativen Denker und Aufklärer zugleich. Insgesamt gibt dieser Band einen Überblick über die Komplexität von Adelungs Schaffen und über den Stand der Forschung.
Die Sprachfähigkeit als Gattungsmerkmal des homo sapiens erzeugt Zeichen, durch die linear akustische Signale mit begrifflich strukturierten Umwelterfahrungen verbunden werden. Diese Verbindung beruht weder (ikonisch) auf Ähnlichkeit noch (indexikalisch) auf direktem Situationsbezug, sondern ist (symbolisch) konventionell begründet. Sie ermöglicht durch freie Kombination die Bildung komplexer Zeichen. Damit sind entscheidende Eigenschaften der Sprache gegeben. Einerseits sind sprachliche Ausdrücke über alle Erfahrungsbereiche möglich, natürliche Sprachen sind unbegrenzt und vollständig, andererseits sind sie zwangsläufig abstrakt, sie können nur den klassifizierend begrifflichen Aspekt der Erfahrungswelt wiedergeben. Diese Begrenztheit liegt innerhalb der Sprache selbst. Zugleich ist durch die Möglichkeit, über alles, also auch über Sprache zu sprechen, die Basis für Reflexion und explizite Bewusstheit, also Selbstbewusstsein gegeben. - Das Ineinandergreifen der verschiedenen Aspekte wird abschließend an Brentanos Wiegenlied demonstriert.
Bestandsaufnahme
(2008)
Die „Kontrastive Grammatik deutsch-rumänisch" war kein singuläres Ereignis. Sie ist ein zwar nicht zwangsläufiges, aber doch konsequentes Glied in einer Entwicklung, die um 1970 begann und heute einen erheblichen Teil der germanistischen Linguistik prägt. Es ist schon der Mühe wert, diese Entwicklung nachzuzeichnen. Dabei liegen drei Dimensionen nahe: Sprachtheorie, grammatische Beschreibungen und Wörterbücher.
Die Bibliografie des Projekts "Deutsch in Russland" enthält 359 Titel, von denen zwei Drittel auf Russisch sind. Die Inhalte der meisten russischsprachigen Veröffentlichungen werden im Text der Bibliografie kurz zusammengefasst. In der Einführung finden sich einige Anmerkungen zum Forschungsstand nach 1990 und eine Beschreibung der Titelinhalte.
Mit dieser Auswahl von 21 Beiträgen Manfred W. Hellmanns zum sprachlichen Ost-West-Problem wird der interessierten Öffentlichkeit ein umfassender und fundierter Überblick über einen spannenden Aspekt der deutschen Nachkriegsentwicklung gegeben. Sowohl die sprachlichen Differenzen im geteilten Deutschland als auch der Sprachgebrauch während und nach der Wende bis in die jüngste Zeit sind Gegenstand dieser methodisch wie thematisch maßstabsetzenden Untersuchungen aus 35 Jahren.
Im Teilprojekt CI “SemDok” der DFG-Forschergruppe Texttechnologische Informationsmodellierung wurde ein Textparser für Diskursstrukturen wissenschaftlicher Zeitschriftenartikel nach der Rhetorical Structure Theory entwickelt. Die wesentlichen konzeptuellen und technischen Merkmale des Chart-Parsers und die sich daraus ergebenden Parametrisierungsmöglichkeiten für Parsing-Experimente werden beschrieben. Zudem wird HPVtz., ein Tool für die Visualisierung von Parsing-Ergebnissen (RST-Bäume in einer XML-Anwendung) und die Navigation in ihnen, vorgestellt.
Das Institut für Deutsche Sprache ist eines der Gründungsmitglieder der „Europäischen Föderation nationaler Sprachinstitutionen", zu der die Sprachakademien und zentralen Sprachinstitute aus den Staaten der Europäischen Union gehören. Sie wird meist abkürzend E1N1I genannt mit dem Akronym ihres englischen Namens: „European Federation of National Institutions for Language“ (Näheres unter <www.efnil.org>). Auf ihrer Jahreskonferenz in Riga 2007 beschloss die Generalversammlung von EFNIL eine Resolution, die den sprachpolitisch zuständigen Stellen der EU und der Mitgliedsstaaten vorgelegt worden ist. Sie liegt inzwischen in allen 23 offiziellen Sprachen der Union vor. Der Beitrag gibt die deutsche Fassung wieder.
Digital Text Collections, Linguistic Research Data, and Mashups: Notes on the Legal Situation
(2008)
Comprehensive data repositories are an essential part of practically all research carried out in the digital humanities nowadays. For example, library science, literary studies, and computational and corpus linguistics strongly depend on online archives that are highly sustainable and that contain not only digitized texts but also audio and video data as well as additional information such as metadata and arbitrary annotations. Current Web technologies, especially those that are related to what is commonly referred to as the Web 2.0, provide a number of novel functions such as multiuser editing or the inclusion of third-party content and applications that are also highly attractive for research applications in the areas mentioned above. Hand in hand with this development goes a high degree of legal uncertainty. The special nature of the data entails that, in quite a few cases, there are multiple holders of personal rights (mostly copyright) to different layers of data that often have different origins. This article discusses the legal problems of multiple authorships in private, commercial, and research environments. We also introduce significant differences between European and U.S. law with regard to the handling of this kind of data for scientific purposes.
Discourse metaphors
(2008)
The article introduces the notion of discourse metaphor, relatively stable metaphorical mappings that function as a key framing device within a particular discourse over a certain period of time. Discourse metaphors are illustrated by case studies from three lines of research: on the cultural imprint of metaphors, on the negotiation of metaphors and on cross-linguistic occurrence. The source concepts of discourse metaphors refer to phenomenologically salient real or fictitious objects that are part of interactional space (i.e., can be pointed at, like MACHINES or HOUSES) and/or occupy an important place in cultural imagination. Discourse metaphors change both over time and across the discourses where they are used. The implications of focussing on different types of source domains for our thinking about the embodiment and sociocultural situatedness of metaphor is discussed, with particular reference to recent developments in Conceptual Metaphor Theory. Research on discourse suggests that situatedness is a crucial factor in the functioning and dynamics of metaphor.
E-VALBU: Advanced SQL/XML processing of dictionary data using an object-relational XML database
(2008)
Contemporary practical lexicography uses a wide range of advanced technological aids,most prominently database systems for the administration of dictionary content. Since XML has become a de facto standard for the coding of lexicographic articles, integrated markup functionality – such as query, update, or transformation of instances – is of particular importance. Even the multi-channel distribution of dictionary data benefits from powerful XML database services. Exemplified by E-VALBU, the most comprehensive electronic dictionary on German verb valency, we outline an integrated approach for advanced XML storing and processing within an object-relational database, and for a public retrieval frontend using Web Services and AJAX technology.
Einleitung
(2008)
elexiko ist ein Online-Wörterbuch zum Gegenwartsdeutschen, das korpusbasiert und modular erarbeitet wird. Ein Schwerpunkt liegt dabei auf der ausführlichen korpusbasierten Beschreibung der Bedeutung und Verwendung sprachlicher Ausdrücke sowie ihrer Vernetzung untereinander. Die Präsentation des Wörterbuchs soll insbesondere zeigen, wie Korpusdaten in den Wortartikeln aufbereitet werden und wie elexiko genutzt werden kann, um lexikalisches Wissen in verschiedenen Benutzungssituationen aus den Wortartikeln zu gewinnen.
Electronic corpora play an ever growing role in lexicography. On the one hand, new access to linguistic usage is made possible through the use of text corpora and intelligent corpus-based query tools; however, the final results are still interpreted and described by lexicographers. In this case corpora are used for data acquisition. On the other hand, there are also projects that provide purely automatically acquired data in the form of "dictionaries". Lexicographers play only a minor role here. This latter type of corpus use creates a completely new kind of electronic dictionary. This article addresses the questions as to what extent these dictionaries differ from lexicographic tradition and whether they must be considered in metalexicography. Starting from previously compiled electronic dictionary typologies, we try to supplement the formulation of lexicographic data as a distinguishing feature. Finally, based on the findings of the project elexiko (Institute for the German Language - IDS), we demonstrate that the distinction between electronic versus man-made lexicographic data is also relevant to lexicographical practice.
Europäische Hochsprachen in der Klemme. Zwischen globalem Englisch, Dialekten und Regionalsprachen
(2008)
Starting from declarations of the EU, the value of European languages and their diversity according to their different territorial, social, and legal extensions are discussed. The Standard varieties of the various languages are emphasized as being especially important for national and European language policies and for individual language cultivation. They contributed and may continue to contribute more than other language varieties to the cultural wealth of Europe. On the other hand, their development is especially impaired by the increasing use of ‘global' English. The increasing tendency toward a diaglossia (English plus one other language) and the use of languages within the institutions of the EU are discussed. In conclusion, it is argued that although tolerance is necessary, it is not sufficient for a thriving further development of the European linguistic diversity.
The multiple gradations of German strong verbs are but manifestations of a rather uncomplicated system. There is a small number of ways to make up ablaut forms; these types of formation are identifiable in formal terms and, what is more, they have definite functions as morphological markers. Using classifications of stem forms according to quality, complexity and quantity of vowels, three types of operations involved in ablaut formation are identified. Ablaut always includes a change of quality type or a change of complexity type, and in addition it may include a change of quantity type. Ablaut forms are clearly distinguished as against bases (and against each other): their vocalism meets a defined standard of dissimilarity. On this basis, gradations are collected into inflectional classes that are defined in strictly synchronic terms. These classes continue the historical seven classes known from reference grammars. For the majority of strong verbs, membership in these classes (and thus ablaut) is predictable.
In usage-based Construction Grammar, grammatical structure is assumed to ‘sedimenl’ from concrete linguistic experience as an automatic by-product o f repeated similar categorisation judgments (a process known as schematisation). At the same time, there is functional pressure on prospective inputs to such schematisations to retain or develop specialised properties that differentiate them from their near neighbours, i.e. other stored units in the constructicon (Goldberg: 1995). Moreover, Speakers are not assumed to necessarily extract all possible generalisations from their input. Using the example o f a group of German support verb constructions, the present study outlines a corpus-linguistic approach to identifying those Schemas that really seem to be formed by Speakers, and how they can be kept apart from mere potential generalisations.
The research project “German Today” aims to determine the amount of regional variation in (near-)standard German spoken by young and older educated adults and to identify and locate regional features. To this end, we compile an areally extensive corpus of read and spontaneous German speech. Secondary school students and 50-to-60-year-old locals are recorded in 160 cities throughout the German speaking area of Europe. All participants read a number of short texts and a word list, name pictures, translate words and sentences from English, answer questions in a sociobiographic interview, and take part in a map task experiment. The resulting corpus comprises over 1000 hours of speech, which is transcribed orthographically. Automatically derived broad phonetic transcriptions, selective manual narrow phonetic transcriptions, and variationalist annotations are added. Focussing on phonetic variation we aim to show to what extent national or regional standards exist in spoken German. Furthermore, the linguistic variation due to different contextual styles (read vs. spontaneous speech) shall be analysed. Finally, the corpus enables us to investigate whether linguistic change has occurred in spoken (near-)standard German.
In literalen Gesellschaften umfasst das Sprachvermögen sowohl das Sprechen wie auch das Schreiben. Dies gilt für die Muttersprache ebenso wie für Fremdsprachen. Sprechen und Schreiben sind dabei recht unterschiedliche Tätigkeiten, so dass zu erwarten wäre, dass sie im Fremdsprachen- wie auch im DaF-Unterricht zu gleichen Anteilen berücksichtigt werden. Die Unterrichtspraxis zeigt jedoch, dass die Schriftsprache dominant vertreten ist und die gesprochene Sprache ein Schattendasein führt. In diesem Beitrag benenne ich fünf Gründe, warum die gesprochene Sprache in dieser Weise im Hintergrund steht und ein sperriger, schwer zu handhabender Gegenstand ist (Abschnitt 2). Im Anschluss versuche ich zu verdeutlichen, wie weitreichend die Unterschiede zwischen gesprochener und geschriebener Sprache sind (Abschnitt 3). Abschließend formuliere ich einige Konsequenzen, die sich hieraus für den Fremdsprachen- und DaF-Unterricht ergeben, und plädiere dafür, sich die Schwierigkeiten, die mit einer Berücksichtigung der gesprochenen Sprache verbunden sind, bewusst zu machen und sich ihnen zu stellen, denn gesprochene Sprache ist m.E.ein unverzichtbarer Bestandteil des fremdsprachlichen Unterrichts.
How to Compare Treebanks
(2008)
Recent years have seen an increasing interest in developing standards for linguistic annotation, with a focus on the interoperability of the resources. This effort, however, requires a profound knowledge of the advantages and disadvantages of linguistic annotation schemes in order to avoid importing the flaws and weaknesses of existing encoding schemes into the new standards. This paper addresses the question how to compare syntactically annotated corpora and gain insights into the usefulness of specific design decisions. We present an exhaustive evaluation of two German treebanks with crucially different encoding schemes. We evaluate three different parsers trained on the two treebanks and compare results using EVALB, the Leaf-Ancestor metric, and a dependency-based evaluation. Furthermore, we present TePaCoC, a new testsuite for the evaluation of parsers on complex German grammatical constructions. The testsuite provides a well thought-out error classification, which enables us to compare parser output for parsers trained on treebanks with different encoding schemes and provides interesting insights into the impact of treebank annotation schemes on specific constructions like PP attachment or non-constituent coordination.
Idiom-Modifikationen aus kognitiver Perspektive zu beschreiben heißt in erster Linie, die allgemeinen Mechanismen, die die betreffenden Variationsmöglichkeiten bzw. -restriktionen steuern, aufzudecken. Ich gehe von der Hypothese aus, dass die Durchführung jeder konkreten Modifikation der Idiomstruktur nur dann zu standardmäßig akzeptablen Ergebnissen führt, wenn bestimmte Bedingungen eingehalten werden. Bei der Verletzung dieser Bedingungen entstehen entweder fehlerhafte Ausdrücke oder innovative, oft wortspielerische Abwandlungen des betreffenden Idioms. Das Modifikationsverhalten der Idiome richtet sich also nicht ausschließlich nach dem Usus, sondern stellt ein in hohem Grade regelgeleitetes semantisch basiertes Phänomen dar. Die entsprechenden Restriktionen sind folglich nicht völlig arbiträr, sondern in bestimmtem Maße prognostizierbar. Dies schließt jedoch nicht aus, dass in manchen Fällen nur der Usus über die Akzeptabilität der jeweiligen Modifikation entscheidet. Diese vor allem in der Tradition der kognitiven Phraseologieforschung postulierten Prinzipien wurden hier am Beispiel des Adjektiv-Einschubs überprüft und fanden ihre Bestätigung.
Im letzten Drittel des 20. Jahrhunderts hat sich aus der Überlagerung des ‚linguistic turn‘ und des ,cultural turn‘ in den Geistes- und Sozialwissenschaften eine neuartige Sensibilisiertheit auf Sprache herausgebildet, die zudem stark erkenntnistheoretisch sowie konstruktivistisch geprägt ist. Sprache erscheint als Mittel der Formung von Wissen, von Erfahrung und Gedächtnis; Kultur erscheint als ein „Bedeutungsgewebe“ (Geertz) bzw. als ,Text‘, dem gegenüber eine interpretative Haltung angemessen ist.
Diese semiotische und latent statisch-monologistische Perspektive auf Kultur ist zu ergänzen um eine kommunikative und entsprechend dynamisch-dialogistische. Sowohl Kultur als auch Gesellschaft sind an Kommunikation gebunden und interdependent mit ihr, außerhalb von Kommunikation sind sie nicht existent. Gleichzeitig ist aber auch Kommunikation, sind die kommunikativen Praktiken einer Gesellschaft ebenso wie ihre kommunikativen Normen und Ideale kulturell geprägt und damit auch historisch veränderbar. Die Analyse kommunikativer Praktiken ist deshalb immer auch Kulturanalyse, ihre Geschichte - nicht zuletzt die Geschichte kommunikativer Ideale - ist Teil von Kulturgeschichte. Gegen Ende meines Beitrags versuche ich deshalb anhand dreier historischer Skizzen aufzuzeigen, welche Fragen sich im Rahmen einer Ideen- und Kulturgeschichte von Kommunikation stellen und welche Antworten sich finden lassen.
Ausgangspunkt ist die z. B. von Hawkins und König vertretene These, kontrastive Grammatikschreibung sei das ,Komplement‘ der Typologie, die auf dem Hintergrund des Projekts „Grammatik des Deutschen im europäischen Vergleich" einer kritischen Prüfung und Modifikation unterzogen wird. Als Exemplifikation werden zwei Phänomenbereiche der deutschen und der rumänischen Grammatik, vor allem nach Maßgabe ihrer Darstellung in der deutsch-rumänisch kontrastiven Grammatik, vergleichend untersucht: die Kategorie des Genus und die Markierung syntaktischer Funktionen durch Kasusdifferenzierung oder andere Mittel, insbesondere die ,differentielle Objektmarkierung'. In beiden Fällen kann gezeigt werden, dass typologische Generalisierungen, etwa die mögliche Struktur von Genussystemen oder Hierarchien wie die Belebtheits- und die Definitheitshierarchie betreffend, dem kontrastiven Vergleich zu mehr Erklärungskraft verhelfen.
COOCCURRENCE ANALYSIS SEEN CONTRASTIVELY
On applying collocational patterning in bilingual lexicography - some examples from the large German-Czech academic dictionary
This paper resumes some of thoughts presented in the study by C. Belica and K. Steyer in this volume. It shows how bilingual lexicographers can take advantage of the cooccurrence analysis results when dealing with German-Czech contrast and structuring word configurations in an entry. They also sketch the corpus data in a form of structural types based on the collocational patterns and stress the importance of cooccurrence analysis for an enlarged offer of equivalents. They plead for more consideration of the syntactic variability. They argue that the cooccurrence analysis used for both German and for Czech should be an important step.
CONTRIBUTIONS TO THE STUDY OF GERMAN USAGE A CORPUS-BASED APPROACH
This paper outlines some basic assumptions and principles underlying the corpus linguistics research and some application domains at the Institute for German Language in Mannheim. We briefly address three complementary but closely related tasks: first, the acquisition of very large corpora, second, the research on statistical methods for automatically extracting information about associations between word configurations, and, third, meeting the challenge of understanding the explanatory power of such methods both in theoretical linguistics and in other fields such as second language acquisition or lexicography. We argue that a systematic statistical analysis of huge bodies of text can reveal substantial insights into the language usage und change, far beyond just collocational patterning.
Lehren und Lernen von Verben, Adjektiven und Substantiven ... Ein nimmerendender Diskussionsstoff
(2008)
Lexicography
(2008)
Unser Wortschatz repräsentiert, was Menschen alleine und im sozialen Miteinander an Handlungen, Institutionen sowie an Ideen und Erkenntnissen hervorbringen. In historischer Perspektive wird der Wortschatz, wie er in sprachlichen Quellen überliefert ist, zum kulturellen Gedächtnis einer bestimmten Sprechergruppe, einer Gesellschaft, einer Nation. Voraussetzung für alle fachhistorischen Auswertungen und Aussagen ist das lexikalische Verständnis eines Quellentextes. Hilfestellung dazu bietet die historische Lexikographie und ist somit der Dokumentation und der semantischen Beschreibung des Wortschatzes die elementare wissenschaftliche Grundlagendisziplin für alle historischen Wissenschaften.
Im Zentrum des Beitrags stehen zehn Thesen zum Verhältnis von Sprachwissenschaft, Kognitionswissenschaft und Kulturwissenschaft. Diese Thesen knüpfen an an die kulturwissenschaftliche Semantik, wie sie etwa in der Begriffsgeschichte nach dem Muster Reinhart Kosellecks (für das Großlexikon „Geschichtliche Grundbegriffe“) oder in der (inner- und außerlinguistischen) Diskursanalyse nach dem Diskurskonzept von Michel Foucault entwickelt worden ist. Ein weiterer Anknüpfungspunkt der angestrebten Konvergenz sprach-, kognitions- und kulturwissenschaftlicher Theorie- und Methodenbildung ist das Problem des Textverstehens (und der epistemischen Voraussetzungen eines adäquaten Textverstehens), wie es sich in solchen gesellschaftlichen Text- und Kommunikationsbereichen zeigt, die auf einer extrem voraussetzungsvollen epistemischen Ausgangssituation aufbauen.
Im Beitrag soll eine theoretische und methodische Perspektive aufgezeigt werden, die - ebenso an eine „Diskursanalyse nach Foucault“ anknüpfend wie an Ansätze aus der linguistischen und kognitionswissenschaftlichen Frame-Analyse - letztlich zu einer Art „Linguistischen (oder besser: linguistisch begründeten) Epistemologie“ führen kann, und damit zu einem Forschungsansatz, in dem Interessen der Linguistik, der Kulturwissenschaften wie der Kognitionswissenschaften gleichermaßen zum Tragen kommen können.