Refine
Year of publication
- 2010 (88) (remove)
Document Type
- Article (34)
- Part of a Book (26)
- Conference Proceeding (11)
- Book (9)
- Part of Periodical (4)
- Contribution to a Periodical (2)
- Other (1)
- Working Paper (1)
Is part of the Bibliography
- no (88)
Keywords
- Deutsch (88) (remove)
Publicationstate
- Veröffentlichungsversion (30)
- Zweitveröffentlichung (5)
- Postprint (3)
Reviewstate
- (Verlags)-Lektorat (22)
- Peer-Review (12)
- Verlags-Lektorat (2)
- Peer-review (1)
Publisher
- Institut für Deutsche Sprache (21)
- de Gruyter (9)
- Narr (5)
- Lang (4)
- Winter (4)
- Dudenverlag (3)
- Benjamins (2)
- Francke (2)
- Fryske Akademy (2)
- Schmidt (2)
In der vorliegenden Arbeit wird mit ethnografischen, gesprächsanalytischen und gesprächsrhetorischen Methoden der kommunikative Sozialstil der "emanzipatorischen Migranten" untersucht. Ein wesentliches Kennzeichen dieses Milieus von Migranten der zweiten Generation ist, dass seine Akteure offensiv und provokativ mit Rassismen umgehen und sich nicht ethnisch (als "Türken", "Italiener", "Griechen" etc.) definieren. Des Weiteren betrachten sie - neben der dominanten Verwendung des Deutschen als gruppeninterner Kommunikationssprache - (deutschtürkisches) Code-switching und Code-mixing als wichtigen Ausdruck ihrer migrantischen Identität.
Da Potenziale und Konturen von Stilen erst im Kontrast eindeutig hervortreten, werden diese Befunde mit der kommunikativen Praxis einer anderen Sozialwelt von Migranten der zweiten Generation verglichen, derjenigen der "akademischen Europatürken". Hierbei zeigt sich, dass dieses sich ethnisch und als "Elite" der türkischen Migranten definierende Milieu moderat auf Diskriminierungen reagiert und deutsch-türkische Sprachvariation als Ausdruck von "Halbsprachigkeit" ablehnt.
This paper describes general requirements for evaluating and documenting NLP tools with a focus on morphological analysers and the design of a Gold Standard. It is argued that any evaluation must be measurable and documentation thereof must be made accessible for any user of the tool. The documentation must be of a kind that it enables the user to compare different tools offering the same service, hence the descriptions must contain measurable values. A Gold Standard presents a vital part of any measurable evaluation process, therefore, the corpus-based design of a Gold Standard, its creation and problems that occur are reported upon here. Our project concentrates on SMOR, a morphological analyser for German that is to be offered as a web-service. We not only utilize this analyser for designing the Gold Standard, but also evaluate the tool itself at the same time. Note that the project is ongoing, therefore, we cannot present final results.
Corpus-based identification and disambiguation of reading indicators for German nominalizations
(2010)
Corpus data is often structurally and lexically ambiguous; corpus extraction methodologies thus must be made aware of ambiguities. Therefore, given an extraction task, all relevant ambiguities must be identified. To resolve these ambiguities, contextual data responsible for one or another reading is to be considered. In the context of our present work, German -ung-nominalizations and their sortal readings are under examination. A number of these nominalizations may be read as an event or a result, depending on the semantic group they belong to. Here, we concentrate on nominalizations of verbs of saying (henceforth: "verba dicendi"), identify their context partners and their influence on the sortal reading of the nominalizations in question. We present a tool which calculates the sortal reading of such nominalizations and thus may improve not only corpus extraction, but also e.g. machine translation. Lastly, we describe successful attempts to identify the correct sortal reading, conclusions and future work.
Nach einem kurzen Überblick über die heutige sprachökologische Situation in Lettland möchte ich dabei auf die Rolle der deutschen Sprache in verschiedenen Bereichen der lettischen Gesellschaft eingehen. Komplettiert wird der Überblick über die deutsche Sprache im heutigen Lettland durch einige Überlegungen zu Maßnahmen, die die Situation zugunsten des Deutschen ändern könnten.
Dieser Beitrag gibt einen Überblick über CoDII, die Collection of Distributionally Idiosyncratic Items. CoDII ist eine elektronische Sammlung verschiedener Untergruppen lexikalischer Elemente, die sich durch idiosynkratische Distribution auszeichnen. Das bedeutet, dass sich die Verteilung dieser Lexeme im Text nicht alleine aufgrund ihrer syntaktischen Kategorie Vorhersagen lässt. Die Methoden, die in der Entwicklung von CoDII angewandt werden, greifen über traditionelle Fachgrenzen hinaus und umfassen Korpuslinguistik, Computerlinguistik, Phraseologie und theoretische Sprachwissenschaft. Ein wichtiger Schwerpunkt unserer Diskussion liegt auf der Darstellung, inwiefern die in CoDII gesammelten, annotierten und unter anderem mit Suchwerkzeugen abfragbaren Daten dazu beitragen können, die linguistische Theoriebildung durch die Bereitstellung sorgfältig aufbereiteter Datensammlungen bei der Überprüfung ihrer Datengrundlage zu unterstützen.
To reach even language users not acquainted to the use of grammars the Institut für Deutsche Sprache in Mannheim (Germany) looked for new ways to handle grammatical problems. Instead of confronting users with abstractions frequent difficulties of German grammar are introduced in form of exemplary questions like „Which form should be used or preferred: Anfang dieses Jahre or Anfang diesen Jahres? Looking through the long list of such questions even laymen may find solutions of grammatical problems they might not be able to formulate as such.
Grammatiktheoretische Forschung, das hat die jüngste IDS-Jahrestagung wieder einmal plastisch vor Augen geführt, muss gedacht werden als zähes Ringen zweier grundsätzlich antagonistischer Prinzipien: Der reichhaltigen Fülle sprachlicher Okkurrenzen, deren gründlicher Auslotung ein beträchtlicher Teil der gegenwärtigen sprachtheoretisch und sprachtechnologisch ausgerichteten Anstrengung gewidmet ist, muss stets der Versuch gegenüberstehen, diese überbordende Varianz abstrahierend und generalisierend einzudämmen – ohne dabei die empirischen Befunde übermäßig und unzulässig zu nivellieren.
DIL is a bilingual (German-Italian) online dictionary of linguistics. It is still under construction and contains 240 lemmas belonging to the subfield of “German as a Foreign Language”, but other subfields are in preparation. DIL is an open dictionary; participation of experts from various subfields is welcome. The dictionary is intended for a user group with different levels of knowledge, therefore it is a multifunctional dictionary. An analysis of existing dictionaries, either in their online or written form, was essential in order to make important decisions for the macro- or microstructure of DIL; the results are discussed. Criteria for the selection of entries and an example of an entry conclude the article.
Grammars even trying to be as comprehensible as possible hardly avoid using technical terms unknown to novices. To overcome these inconveniencies, the grammatical information system grammis of the Institut für Deutsche Sprache incorporated a glossary specialized on terms used within the system. This glossary - actually named Grammatische Grundbegriffe (elementary terms of grammar) and tied by hyperlinks to technical terms in the core grammar' of grammis - offers short and simple explanations mainly by means of exemplification. The idea is to provide the users with provisional understanding to get along while following the main themes they are interested in. Explicitly, the glossary is not a stand-alone dictionary of grammatical terms, and it should not be regarded as one.
„An den Ufern der Havel lebte, um die Mitte des sechzehnten Jahrhunderts, ein Roßhändler, namens Michael Kohlhaas, Sohn eines Schulmeisters, einer der rechtschaffensten zugleich und entsetzlichsten Menschen seiner Zeit.“
So beginnt einer der besten Meister der deutschen Syntax Heinrich von Kleist vor zweihundert Jahren seine berühmte Novelle „Michael Kohlhaas“, die ihren Ursprung nach Angaben des Autors in einer alten Chronik aus dem 16. Jh. hat. Dieser Satz besteht aus dem zweiwertigen Verb „leben“ und drei Satzgliedern: Lokalbestimmung „An den Ufern der Havel“, Temporalbestimmung „um die Mitte des sechzehnten Jahrhunderts“ und Subjekt „ein Roßhändler, namens Michael Kohlhaas, Sohn eines Schulmeisters, einer der rechtschaffensten zugleich und entsetzlichsten Menschen seiner Zeit“. Da der Autor über ein Ereignis aus der Vergangenheit berichtet, nennt er, wie heute in der Zeitung üblich, gleich am Anfang den Ort, den Zeitpunkt und den Hauptakteur des Geschehens. Wir erfahren, dass der Hauptakteur „ein Roßhändler, namens Michael Kohlhaas“ ist und dazu noch einige Informationen aus seiner Biografie, mit denen bei den Lesern das Interesse an der Novelle erweckt werden sollte: „einer der rechtschaffensten zugleich und entsetzlichsten Menschen seiner Zeit“. Dass der „Roßhändler“ „Michael Kohlhaas“ heißt, wissen wir aufgrund der Bedeutung des Wörtchens namens, das diese zwei Nominalphrasen verbindet (oder auch trennt). Und um dieses Wörtchen geht es in diesem Text.
The possibility to search electronically very large corpora of texts has opened up ways in which we can truly evaluate the rules through which grammarians have tried and continue to try to simulate natural languages. However, the possibility to handle incredibly large amounts of texts might lead to problems with the assessment of certain phenomena that are hardly ever represented in those corpora and yet, have always been regarded as grammatically correct elements of a given language. In German, typical phenomena of this kind are forms like betrögest or erwögest, i.e. second person singular of the so-called strong verbs in the subjunctive mood. Should we see them merely as grammarians’ inventions? Before doing so, we should reconsider the nature of these phenomena. They may appear to be isolated word forms but, in fact, are compact realizations of syntactic constructions, and it is the frequency of these constructions that should be evaluated, not the frequency of their specific realizations.
Der Beitrag beschäftigt sich aus einer linguistisch-gesprächsanalytischen Sicht mit einem in Beratungsgesprächen und verwandten Formen helfender Interaktionen strukturell verankerten Interaktionsproblem. Es geht um sprachlich-interaktive Verfahren der Überwindung von Perspektivendivergenzen zwischen Ratgebern und Ratsuchenden. Anhand eines Beispielfalles soll analysiert werden, wie in der Phase der Sondierung und Entwicklung einer Problemsicht durch die professionelle Beraterin bei ihrer Adressatin Widerstand gegen eine Perspektivenübernahme deutlich wird, den die Beraterin wiederum mit manifester Perspektivenarbeit zu überwinden versucht. Es gelingt ihr, mit relativ eindringlichen Mitteln die Ratsuchende dazu zu bringen, sich zumindest situativ auf die suggestiv und nachdrücklich angebotene Perspektive einzulassen. Kernstück dieses Vorgehens der Beraterin ist das Einführen und Durchspielen eines in der Erlebniswelt der Ratsuchenden verankerten kritischen Szenarios. Dabei agiert die Beraterin zunächst selber in der Rolle der Ratsuchenden, lässt dann diese fortsetzen und gibt ihr eine Fokussierung des „wunden Punkts“ vor. Dieser Vorgang ist aufschlussreich für Perspektivenarbeit im Gespräch und liefert wichtige Beobachtungen für eine Typologie von Perspektivierungsverfahren.
Der Beitrag gibt einen Überblick über die Entwicklung und die Aufgaben des Fachverbandes Deutsch als Fremdsprache (FaDaF) seit seiner Gründung 1989/90. Er zeigt dabei die Entwicklungslinien des Verbandes auf, der als Nachfolge-Organisation des Arbeitskreises Deutsch als Fremdsprache beim DAAD (AkDaF) dessen Aufgaben übernommen, fortgeführt und weiter entwickelt hat.
Neben kurzen Bestandsaufnahmen vom Status der Prosodie in Grammatiken und in DaF-Didaktiken und -Lehrwerken wird Prosodie näher bestimmt und ihre wichtigsten Eigenschaften und Funktionen in Wort, Ausspruch und Gespräch beschrieben. Im Weiteren wird vor allem die bedeutungsgestaltende Funktion der Prosodie herausgearbeitet. Aus phonologischer Sicht sehen wir die Informationsstruktur als zentral für die Vermittlung der Prosodie an. Anhand von Akzentgruppe und Intonationsphrase wird ihre Rolle bei der rhythmischen Gliederung von Aussprüchen vorgestellt. Als weiteres Beispiel für die kommunikative Funktion von Prosodie wird ihre Rolle beim Ausdruck von Emotion behandelt.
Das kontrastive Verbvalenzwörterbuch Spanisch - Deutsch (Diccionario contrastivo de valencias verbales español - alemán DCVVEA) liefert eine Beschreibung der kombinatorischen Möglichkeiten von über hundert hochfrequenten Verben des Spanischen und ihrer deutschen Äquivalente und macht präzise Angaben zu ihren semantischen und syntagmatischen Eigenschaften. Die Abgrenzung von Bedeutungsvarianten für die polysemen spanischen Lemmata geht zum einen von vorliegenden lexikographische Beschreibungen aus, die an die Zielsetzungen des DCVVEA angepasst wurden, und stützt sich zum anderen auf das empirische Datenmaterial, das die syntaktische Datenbank Base de datos sintácticos del español actual (BDS) zur Verfügung stellt. Die BDS wurde von WissenschaftlerInnen der USC unter der Leitung von Guillermo Rojo erstellt und enthält die Ergebnisse der syntaktischen Analyse von etwa 160.000 Sätzen aus einem Textkorpus der spanischen Gegenwartssprache, ARTHUS (Archivo de textos hispánicos de la Universidad de Santiago de Compostela).
Das DCVVEA ist ein syntagmatisches Wörterbuch mit alphabetischer Struktur und Spanisch als Metasprache. Die Einträge beziehen sich auf die einzelnen Bedeutungsvarianten eines spanischen Verbs und werden mit authentischen Beispielen belegt. Den spanischen Verbvarianten werden deutsche Verben zugeordnet, die zu ihnen in einer vollständigen oder partiellen Äquivalenzrelation stehen. Die Ermittlung dieser Äquivalente stützt sich auf die Übersetzung der Korpusbeispiele. Die Valenzbeschreibung der spanischen und der deutschen Verbvarianten enthält funktionale, kategoriale und semantische Angaben zu den einzelnen Verbaktanten und explizite Hinweise auf kontrastiv relevante Unterschiede zwischen den Einheiten beider Sprachen.
Aktuelle Regionalsprachforschung zum Deutschen. Das IDS-Projekt Variation des gesprochenen Deutsch
(2010)
This paper shows how corpora and related tools can be used to analyse and present significant colligational patterns lexicographically. In German, patterns such as das nötige Wissen vermitteln and sein Wissen unter Beweis stellen play a vital role when learning the language, as they exhibit relevant idiomatic usage and lexical and syntactic rules of combination. Each item has specific semantic and grammatical functions and particular preferences with respect to position and distribution. An analysis of adjectives, for example, identifies preferences in adverbial, attributive, or predicative functions.
Traditionally, corpus analyses of syntagmatic constructions have not been conducted for lexicographic purposes. This paper shows how to utilise corpora to extract and examine typical syntagms and how the results of such an analysis are documented systematically in ELEXIKO, a large-scale corpus-based Internet reference work of German. It also demonstrates how this dictionary accounts for the lexical and grammatical interplay between units in a syntagm and how authentic corpus material and complementary prose-style usage notes are a useful guide to text production or reception.
Der Beitrag stellt Arbeiten des Projekts Usuelle Wortverbindungen am Institut für Deutsche Sprache (IDS) in Mannheim vor. Im Mittelpunkt stehen dabei neue Perspektiven, die sich für die elektronische Phraseographie aus der korpusanalytischen Auswertung sprachlicher Massendaten ergeben. Eine wichtige Methode ist die statistische Kookkurrenzanalyse, die u.a. dazu dient, feste Wortverbindungen zu extrahieren und typische Kontexte vorzustrukturieren. Auf dieser Basis lässt sich der tatsächliche Gebrauch fester Wortverbindungen in einer quantitativ und qualitativ neuen Dimension erfassen und lexikografisch beschreiben. Die heutigen technologischen Möglichkeiten können des Weiteren für neue und differenziertere Präsentationsformen angepasst an unterschiedliche Rezeptionsbedürfnisse genutzt werden. Das UWV-Projekt beschreitet auch im Bereich der Internet-Lexikografie neue Wege, was anhand ausgewählter Beispiele gezeigt wird.
Some grammatical phenomena that only seldom appear in the corpora of written language often coincide with Speakers' uncertainty about a given form's grammatical Status. Such display of uncertainty is often subject to prescriptive criticism, which pays little attention to actual usage. However, thorough and discriminating corpus analyses can help in a proper description of various low-frequency phenomena and in situating them more adequately in the grammatical System, against the background of different contexts, communicative situations, and language varieties. To exemplify this potential, this study examines three linguistic phenomena in German, using a corpus-based approach: the dative singular ending -e, the construction aus aller Herren Länder, which lacks the dative plural ending -t and the non-standard preterite form frug. The results can be seen as a contribution to a more precise grammatical description on the one hand and, on the other, as a basis for an improved, more usage-oriented approach in providing practical advice to language users.
Von Bush administration zu Kohl-Regierung: Englische Einflüsse auf deutsche Nominalkonstruktionen?
(2010)
In diesem Beitrag wird eine neue, funktional motivierte Systematik für den adnominalen Genitiv und entsprechende von-Phrasen, die zusammenfassend als ‘possessive Attribute’ bezeichnet werden, entwickelt. Sie beruht auf Erkenntnissen aus der sprachtypologischen Forschung und dem Vergleich mit anderen, vor allem germanischen Sprachen. Der Beschreibungsrahmen für die NP mit der übergreifenden ‘funktionalen Domäne’ der Referenz und den zugehörigen Subdomänen wird vorgestellt. Possessive Attribute können als eine Ausdrucksform der Subdomäne Modifikation bestimmt werden. Es wird gezeigt, dass possessive Attribute verschiedene funktionale Typen der Modifikation realisieren können: referentiell-verankernde (der Hut meiner Schwester), qualitative (ein Autor deutscher Herkunft) und klassifikatorische (ein Mann der Tat). Auch randständige possessive Attribute wie der ‘Teilungsgenitiv’ (eine Tasse heißen Tees) und der Identitätsgenitiv (das Laster der Unbescheidenheit) werden berücksichtigt. Die neue Ordnung possessiver Attribute nach funktionalen Subdomänen ist der traditionellen Einteilung vorzuziehen, insofern als sie lediglich Grundunterscheidungen gemäß dem referenzsemantischen Status des Modifikators (begrifflich versus referentiell) und nach dem Beitrag des Modifikators zur Bedeutungskomposition der NP (verankernd versus qualitativ bzw. klassifikatorisch) berücksichtigt. Zudem ist sie durch Testverfahren wie den Pronominalisierungstest abgesichert.
In this paper we outline our corpus-driven approach to detecting, describing and presenting multi- word expressions (MWEs). Our goal is to treat MWEs in a way that gives credit to their flexible nature and their role in language use. The bases of our research are a very large corpus and a Statistical method of collocation analysis. The rich empirical data is interpreted linguistically in a structured way which captures the interrelations, patterns and types of variances of MWEs. Several levels of abstraction build on each other: surface patterns, lexical realizations (LRs), MWEs and MWE patterns. Generalizations are made in a controlled way and in adherence to corpus evidence. The results are published online in a hypertext format.
Vorwort
(2010)
Der Beitrag führt in das Themenheft der Zeitschrift Deutsche Sprache 2/2010 ein. Dieses Themenheft versammelt vier Beiträge zu einem zentralen Thema der deutschen Grammatik und Textlinguistik: der Form und Funktion von Attributionsstrukturen in der Nominalphrase. Gemeinsam ist allen Beiträgen der kontrastive und/oder funktional-typologische Zugang zu diesem Thema; Unterschiede bestehen in Bezug auf die untersuchten Attributtypen (Adjektiv-, Genitiv-, Präpositional- und Partizipialattribute), den methodischen Zugriff auf die Daten, die theoretischen Fragestellungen sowie die jeweiligen Vergleichssprachen (Niederländisch, Dänisch, Norwegisch, Englisch). Alle Beiträge dokumentieren das in den letzten Jahren wieder erstarkte Interesse an sprachvergleichenden Untersuchungen, das sich auch in entsprechenden themenspezifischen Konferenzen und Forschungsprojekten im In- und Ausland niederschlägt.
In this feasibility study we aim at contributing at the practical use of domain ontologies for hypertext classification by introducing an algorithm generating potential keywords. The algorithm uses structural markup information and lemmatized word lists as well as a domain ontology on linguistics. We present the calculation and ranking of keyword candidates based on ontology relationships, word position, frequency information, and statistical significance as evidenced by log-likelihood tests. Finally, the results of our machine-driven classification are validated empirically against manually assigned keywords.
As the nature of negative polarity items (NPIs) and their licensing contexts is still under much debate, a broad empirical basis is an important cornerstone to support further insights in this area of research. The work discussed in this paper is intended as a contribution to realizing this objective. The authors briefly introduce the phenomenon of NPIs and outline major theories about their licensing and also various licensing contexts before discussing our major topics: Firstly, a corpus-based retrieval method for NPI candidates is described that ranks the candidates according to their distributional dependence on the licensing contexts. Our method extracts single-word candidates and is extended to also capture multi-word candidates. The basic idea for automatically collecting NPI candidates from a large corpus is that an NPI behaves like a kind of collocate to its licensing contexts. Manual inspection and interpretation of the candidate lists identify the actual NPIs. Secondly, an online repository for NPIs and other items that show distributional idiosyncrasies is presented, which offers an empirical database for further (theoretical) research on these items in a sustainable way.
The Online-Wortschatz-Informationssystem Deutsch (OWID Online German Lexical Information System) is a lexicographic Internet portal for various electronic dictionary resources that are being compiled at the Institute for the German Language (Institut für Deutsche Sprache, IDS). The main emphasis of OWID is on academic lexicographic resources of contemporary German. Presently, the following dictionaries are included in OWID: a dictionary of contemporary German called elexiko, a dictionary of neologisms, a small dictionary of collocations, and a discourse dictionary covering the lexemes that establish the discourse about “guilt” in the early post-war era 1945-1955. In the near future (2010/2011), several additional dictionaries will be published in OWID: a Textbook of German Communication Verbs, a Valency Dictionary of German Verbs, two further discourse dictionaries – one about the “democracy” discourse around 1968, the other covering the keywords of the German reunification 1989/1990. Moreover, 300 entries from a corpus-based project on proverbs will be integrated into OWID. Thereby, OWID is a constantly growing resource for academic lexicographic work of the German language.
Altogether, OWID is a special kind of dictionary portal owing to its content and its design, namely the integration of the various dictionaries, the access possibilities and the presentation features. With OWID, we try to establish a dictionary net where the different resources are jointly accessible not only by headwords, but also on the microstructural level. Prerequisite for these common access- and navigation-possibilities across the various dictionaries is the same concept for the lexicographic data model which we put into practice in OWID. Data from all dictionaries in OWID are structured according to a tailor-made, fine-granular, XML-based data model. In this data model, similar content is modelled similarly, dictionary related differences are preserved.
The main tasks for the future are to enhance OWID with further dictionary resources, to improve the inner access structures so that they exhaust the possibilities of the data model, and to customize the layout of the dictionaries as well as the search options according to the user’s needs
Antonymy is a relation of lexical opposition which is generally considered to involve (i) the presence of a scale along which a particular property may be graded, and hence both (ii) gradability of the corresponding lexical items and (iii) typical entailment relations. Like other types of lexical opposites, antonyms typically differ only minimally: while denoting opposing poles on the relevant dimension of difference, they are similar with respect to other components of meaning. This paper presents examples of antonymy from the domain of speech act verbs which either lack some of these typical attributes or show problems in the application of these. It discusses several different proposals for the classification of these atypical examples.
Bestimmte adsubstantivisch verwendete Demonstrativa verfügen – über die deiktische und phorische hinaus – über eine so genannte anamnestische Gebrauchsweise. Diese Verwendung wird in der Literatur häufig vernachlässigt, obwohl sie nach mehreren Autoren (z.B. Diessel, Himmelmann) den Ausgangspunkt der Grammatikalisierung der Demonstrativa bildet. Im vorliegenden Aufsatz wird einerseits nachgeprüft, ob und inwieweit die in der einschlägigen Literatur beschriebenen allgemeinen Charakteristika der anamnestischen Demonstrativa für das Deutsche und das Ungarische zutreffen. Andererseits werden auch die Eigenschaften der indefiniten Gegenstücke der anamnestischen Demonstrativa in beiden Vergleichssprachen anhand von Korpusbeispielen untersucht. Zum Schluss wird auch auf die möglichen Grammatikalisierungswege der Demonstrativa eingegangen.
This paper discusses the advantages and disadvantages of the combination of automated information and lexicographically interpreted information in online dictionaries, namely elexiko, a hypertext dictionary and lexical data information system of contemporary German (http://www.owid.de/ elexiko_/index.html), and DWDS, a digital dictionary of 20,h century German (http://www.dwds.de). Examples of automatically derived information (e.g. automatically extracted citations from the underlying corpus, lists on paradigmatic relations) and lexicographically compiled information (e.g. information on paradigmatic partners) are provided and evaluated, reflecting on the need to develop guidelines as to how computerised information and lexicographically interpreted information may be combined profitably in online reference works.
Eine der linguistischen Teildisziplinen, in der schon seit vielen Jahren korpusgestützt gearbeitet wird, ist die Lexikografie. Wörterbücher sind lange vor der Entstehung großer elektronischer Textsammlungen mit den entsprechenden Korpusrecherche- und -analysewerkzeugen auf der Basis von umfänglichen Belegsammlungen entstanden, die nach dem Verständnis vieler Lexikografen das Korpus (bzw. die Primärquelle) des Wörterbuches darstellen. Noch heute arbeiten verschiedene Großwörterbücher (z. B. das Oxford English Dictionary) am Ausbau ihrer Belegsammlungen und benutzen diese neben zum Teil eigens aufgebauten elektronischen Wörterbuchkorpora im engeren Sinn. Welche Chancen und Probleme sich bei korpusgestützter Arbeit an Wörterbücher ergeben, wird in diesem Beitrag an deutschsprachigen Online-Wörterbüchern aufgezeigt, wobei zunächst einige Definitionen erarbeitet werden müssen. Ein kurzer Ausblick auf die Auswirkungen korpusgestützter Arbeit an Online-Nachschlagewerken auf den lexikografischen Prozess schließt diesen Beitrag ab.
Ĉlánek popisuje lingvistické prostředky oznaĉující a popisující proţívání a emoce v němĉině. V první ĉásti jsou představeny konceptualizace proţívání a emocí, druhá ĉást popisuje detailně lingvistické prostředky. Poslední ĉást se zabývá některými problémy spojenými s vytvořením lexikonu emoĉních slov.
Is it possible to undo or reverse language attrition? In other words, has there been, in the case of attrition, a permanent change with respect to the speaker's L1 knowledge, or do we only see temporary effects on the control of that knowledge? It is proposed here that the concept of attrition should include the temporary loss of language skills since it is, so far, not clear whether or to what extent once-acquired linguistic abilities can be permanently lost at all, particularly with respect to an L1. A reversal in the development of attrition after renewed contact with the L1 can support the claim that a decrease in L1 proficiency can be TEMPORARY, and that it is the ACCESSIBILITY of items and structures that is affected by attrition rather than the L1 knowledge (competence) itself. Our primary research interest in the present study is to analyze what skills and features are recoverable and what phenomena persist, (possibly) indicating permanent loss.
Der Autor möchte mit seinem Beitrag zeigen, in welcher Weise die aktuellen Korpus-Projekte und Datenbankentwicklungen in der Abteilung Pragmatik des Instituts für Deutsche Sprache Mannheim (IDS) Fragestellungen und Forschungspraktiken der Gesprächsanalyse bedienen. Abschließend stelle er die Entwicklungsarbeit an der Nachfolge-Version 2.0 der Datenbank Gesprochenes Deutsch für die gegenwärtig angebotene Version vor.
^This paper describes DeReKo (Deutsches Referenzkorpus), the Archive of General Reference Corpora of Contemporary Written German at the Institut für Deutsche Sprache (IDS) in Mannheim, and the rationale behind its development. We discuss its design, its legal background, how to access it, available metadata, linguistic annotation layers, underlying standards, ongoing developments, and aspects of using the archive for empirical linguistic research. The focus of the paper is on the advantages of DEREKO’s design as a primordial sample from which virtual corpora can be drawn for the specific purposes of individual studies. Both concepts, primordial sample and virtual corpus are explained and illustrated in detail. Furthermore, we describe in more detail how DEREKO deals with the fact that all its texts are subject to third parties’ intellectual property rights, and how it deals with the issue of replicability, which is particularly challenging given DEREKO’s dynamic growth and the possibility to construct from it an open number of virtual corpora.
Computerlinguistik
(2010)
Gefrorener und fließender Text : Unterschiede in der Motiviertheit substantivischer Komposita
(2010)
Die lexikographische Behandlung von Argumentstrukturvarianten in Valenz- und Lernerwörterbüchern
(2010)
The transition between phases of activities is a practical problem which participants in an interaction have to deal with routinely. In meetings, the sequence of phases of activity is often outlined by a written agenda. However, transitions still have to be accomplished by local interactional work of the participants. In a detailed conversation analytic case study based on video-data, it is shown how participants collaboratively accomplish an emergent interactional state of affairs (a break-like activity) which differs widely from the state of affairs which was projected by awritten agenda (the next presentation), although in doing so, the participants still show their continuous orientation to the agenda. The paper argues that the reconstruction of emergent developments in interaction calls for a multimodal analysis of interaction, because the fine-grained multimodal co-ordination of bodily and verbal resources provides for opportunities of sequentially motivated, relevant next actions. These, however, can amount to emergent activity sequences, which may be at odds with the activity types which are projected by an interactional agenda or expected on behalf of some institutional routine.
The paper reports on a dictionary of German loanwords in the languages of the South Pacific that is compiled at the Institut für Deutsche Sprache in Mannheim. The loanwords described in this dictionary mainly result from language contact between 1884 and 1914, when the German empire was in possession of large areas of the South Pacific where overall more than 700 indigenous languages were spoken. The dictionary is designed as an electronic XML-based resource from which an internet dictionary and a printed dictionary can be derived. Its printed version is intended as an ‘inverted loanword dictionary’, that is, a dictionary that – in contrast to the usual praxis in loanword lexicography – lemmatizes the words of a source language that have been borrowed by other languages. Each of the loanwords will be described with respect to its form and meaning and the contact situation in which it was borrowed. Among the outer texts of the dictionary are (i) a list of all sources with bibliographic and archival information, (ii) a commentary on each source, (iii) a short history of the language contact with German for each target language, and perhaps (iv) facsimiles of source texts.The dictionary is supposed to (i) help to reconstruct the history of language contact of the source language, (ii) provide evidence for the cultural contact between the populations speaking the source and the target languages, (iii) enable linguistic theories about the systematic changes of the semantic, morphosyntactic, or phonological lexical properties of the source language when its words are borrowed into genetically and typologically different languages, and (iv) establish a thoroughly described case for testing typological theories of borrowing.
Standardly, verb-first (V1) conditionals are considered to be mere variants of wenn-conditionals; accordingly, left-peripheral V1-clauses are analyzed as embedded into the prefields of declarative apodosis clauses, just like their V-end counterparts. We challenge this view, proposing instead that dependent V1-clauses are syntactically unembedded/unintegrated, and, consequently, that postposed declarative apodosis clauses are either V2-declaratives with prefield ellipsis or V1-declaratives. We argue our case by presenting evidence that (i) wenn-clauses differ considerably from V1-clauses in semantic distribution, (ii) unlike wenn-clauses, V1-clauses do not meet the criteria for syntactic embedding, (iii) the alternatives entailed by (ii) for the structural analysis of a postposed apodosis both have empirical support. As for a syntactic analysis of V1-structures suited to these findings, we argue that a CP adjunction analysis is currently the best option available. We also point out connections between the semantic restrictions on V1-conditionals and the semantics of V1-interrogatives that are suggestive of a common semantic core, which raises hope that our background vision (ultimately, all dependent V-to-C clauses are semantically licensed substitutes for genuine subordinates) may also be true for V1-clauses.
Was denken die Menschen in Deutschland über sprachliche Fragen? Wie stehen sie zur deutschen Sprache, was denken sie über ihre Dialekte? Was denken sie über andere Sprachen? Und wie hängen ihre Meinungen zu sprachlichen Dingen mit ihren sonstigen Einstellungen oder auch mit bestimmten demographischen Faktoren zusammen? Diese Fragen sind Gegenstand des Forschungsprojekts „Erkundung und Analyse aktueller Spracheinstellungen in Deutschland“, dessen zentrale Datengrundlage mit diesem Band zugänglich gemacht wird. Das Projekt ist ein interdisziplinäres Gemeinschaftsprojekt des Instituts für Deutsche Sprache und des Lehrstuhls für Sozialpsychologie der Universität Mannheim in Verbindung mit dem Deutschen Sprachrat.
Die vorliegende Arbeit basiert auf zwei Korpusrecherchen und -analysen, die im Rahmen meiner Magisterarbeit durchgeführt wurden. Die Ergebnisse wurden überarbeitet und die neueste Forschungsliteratur eingebracht. Die Untersuchung verfolgt im Wesentlichen zwei Ziele: Zum einen soll zunächst durch einen historischen Rückblick die Frage geklärt werden, inwiefern die Vorwürfe von Sprachverfall und Kulturverlust beim gegenwärtigen Apostrophgebrauch gerechtfertigt sind. Lassen sich heutige Verwendungsweisen des Apostrophs bereits seit dem 15. Jahrhundert in früheren Grammatiken und anderen Werken, die sich mit der Orthographie beschäftigen, wiederfinden und wie sahen damalige Rechtschreibempfehlungen und Regelungen aus? Zum anderen wird in der linguistischen Forschung der Apostroph in funktionaler Hinsicht nicht nur auf das Anzeigen von Elisionen beschränkt, sondern durchaus als „uneindeutiges Zeichen“ (Maas 2003, S. 230) beschrieben, das nicht nur als Auslassungszeichen sondern auch als Grenzzeichen fungieren kann, um Morphem- oder Lexemgrenzen anzuzeigen. Daher soll als zweites Ziel die Mono- bzw. Multifunktionalität des Apostrophs in der deutschen Gegenwartssprache genauer untersucht werden. Dafür wurden in sämtlichen Ausgaben einer Tageszeitung über einen Monat hinweg systematisch sämtliche Apostrophsetzungen recherchiert und analysiert.
This article is concerned with the use of speech variation in a classroom in south-west Germany. It shows how a teacher uses dialect-standard variation as a resource for carrying out different tasks. An analysis of the variational practices of the teacher reveals two different code-alternating procedures with different functional scopes. On the one hand, the teacher uses code-shifting along a continuum of standard forms, especially to draw attention to relevant aspects of the instructional activities, and to guide participation in the unfolding discourse. On the other hand, she uses the context-cueing function of code-switching between standard and dialect, especially to locally manage the key of interaction (interaction modalities). It is shown that, for the teacher analysed, switching to dialect is a methodological resource which matches the intricate pedagogical tasks involved in the evaluation moves which follow pupils' 'troublesome' answers.
In her overview, Margret Selting makes the case for the claim that dealing with authentic conversation necessarily lies at the heart of an interactionallinguistic approach to prosody (see Selting this volume, Section 3.3). However, collecting and transcribing corpora of authentic interaction is a time-consuming enterprise. This fact often severely restricts what the individual researcher is able to do in terms of analysis within the scope of his or her resources. Still, for dealing with many of the desiderata Margret Selting points out in Section 5 of her extensive overview, the use of larger corpora seems to be required. In this commenting paper, I want to argue that future progress in research on prosody in interaction will essentially rest on the availability and use of large public corpora. After reviewing arguments for and against the use of public corpora, I will discuss some upshots regarding corpus design and issues of transcription of public corpora.
Am 11. Juni 2010 versammelte sich eine große Schar von Freunden, Kollegen und Mitarbeitern in Mannheim, um den Direktor des IDS, Prof. Dr. Dr. h.c. mult. Ludwig M. Eichinger aus Anlass seines 60. Geburtstags mit einem Festkolloquium unter dem Titel „Wanderjahre“ zu ehren. Damit sollten die wissenschaftlichen Stationen und zentralen Forschungsthemen des Jubilars dokumentiert werden, der seit nunmehr acht Jahren die Geschicke des Instituts lenkt.
Am 27. und 28. November 2009 fand im Institut für Deutsche Sprache nach einigen bilateralen Treffen das 1. „Arbeitstreffen videobasierte Unterrichtsanalyse“ statt. Das Treffen brachte unter dem thematischen Fokus „Unterricht“ unterschiedliche Kompetenzen zusammen: Zum einen Wissenschaftler, die aus einer multimodalen Sicht auf Interaktion ein besonderes Interesse an Unterricht als einer gesellschaftlich außerordentlich wichtigen Kommunikationssituation haben, zum anderen Lehrer, die, als konkret im Unterricht Handelnde, ein Interesse an der wissenschaftlichen Untersuchung ihres professionellen Verhaltens in diesem Handlungsfeld haben, wie auch Didaktiker, die aus ihrer Perspektive in der Lage sind, beide Seiten in reflektierter Weise zu verbinden und hinsichtlich ihrer Synergie zu befragen.
Die deutsche Sprache ist im Jahr 2010 nicht nur das Thema einer Kampagne des Auswärtigen Amtes, in der das Deutsche zur Sprache der Ideen erklärt wird,ihr Wohlergehen scheint den Deutschen insgesamt am Herzen zu liegen. Das hat sich unter anderem bei einer Umfrage herausgestellt, die vom IDS für den Deutschen Sprachrat durchgeführt wurde. Nicht nur schätzen die Sprecher des Deutschen in der Mehrheit ihre Sprache, sie halten auch Sorgfalt beim Sprechen und Schreiben für erstrebenswert und finden, dass man mehr für die deutsche Sprache tun solle, vor allem die Schule stehe dabei in der Pflicht. Dass das Auswärtige Amt ein Jahr der deutschen Sprache mit dem Motto „Sprache der Ideen“ ausruft, passt gut in diesen Kontext. Immerhin hatten die Befragten unserer Umfrage neben den Schulen, wenn auch mit weitem Abstand, die Politik als eine Instanz genannt, die das ihre zu Erhalt und Förderung des Deutschen tun solle.
Knapp drei Jahrzehnte währte die deutsche Kolonialzeit. Als die Deutschen 1884 anfingen, Teile Afrikas(Kamerun, Togo, Deutsch-Ostafrika, Deutsch-Südwestafrika), Asiens (Kiautschou) und Ozeaniens (Deutsch-Neuguinea einschließlich Mikronesien, Samoa)zu kolonisieren, waren sie mit einer Vielzahl von „exotischen“ Kulturen und Sprachen konfrontiert – deutlich über 1000 verschiedene Sprachen dürften es insgesamt gewesen sein. Die Forschung zu den vielfältigen sprachlichen Aspekten der Auseinandersetzung steckt allerdings noch in den Anfängen. Um daran etwas zu ändern, hat unter dem Titel „Sprachkontakt und Sprachwissenschaft in den früheren deutschen Kolonien“ am 30. September und 1. Oktober 2010 die mittlerweile zweite Tagung zu „Deutschlands Koloniallinguistik“ stattgefunden, Gastgeber war dieses Mal das Institut für Deutsche Sprache in Mannheim.
Wenn in jüngster Zeit von Grammatiktheorie die Rede ist, fällt früher oder später meistens der Begriff „Konstruktionsgrammatik“. Gemeint sind mit diesem Sammelbegriff Alternativen zu den syntaktozentrischen Sprachtheorien der letzten Jahrzehnte mit ihrer restriktiven Unterscheidung von sprachlichen Einheiten (Wortschatz) und sprachlichen Regeln (Grammatik). Was sich hinter solchen konstruktionsgrammatischen „Trends“ verbirgt, und ob es nicht vielleicht sogar Alternativen zu dieser Alternative gibt, wurde anlässlich der 46. Jahrestagung des IDS drei Tage lang unter dem Titel „Sprachliches Wissen zwischen Lexikon und Grammatik“ diskutiert.
Zum 80. Geburtstag wird er im Börsenblatt für den deutschen Buchhandel 1981 deutscher „Sprachzuchtmeister“ genannt und mit Konrad Duden verglichen (Herrmann 2003, Sp. 1138). Im Werbedeutsch der Antiquariate taucht die Benennung „Schatzmeister der deutschen Sprache“ auf. Im Jahr 1969 wird er zum Ehrenmitglied des Vereins Deutscher Ingenieure (VDI) ernannt, nachdem er zuvor, 1966, die VDI-Ehrenmünze erhalten hat (Herrmann 2003, Sp. 1137). Sein „Neues Deutsches Wörterbuch“, das 1952 erscheint, seit der 3. Auflage 1955 den Titel „Deutsches Wörterbuch“ führt, wird 2006 in 13. Auflage verlegt, „Unreformiert, undeformiert“ – wie die Bauchbinde ausweist. Wer ist dieser Lutz Mackensen (1901-1992) – der (angebliche) Konrad Duden der 2. Hälfte des 20. Jahrhunderts, der den deutschen Sprachschatz, also den Wortschatz seiner Zeit, (mit)verwaltet und Sprachzucht ausübt, indem er eine alphabetische und grammatisch-semantische Ordnung über die Wörter der deutschen Hoch- und Schriftsprache legt?
Das IDS, insbesondere der Programmbereich Korpuslinguistik, bekommt häufig Anfragen zum Wortbestand der deutschen Sprache, sei es, welche Wörter besonders häufig sind, sei es, nach (Listen von) Wörtern mit bestimmten Eigenschaften. Zu dem Themenschwerpunkt „häufigkeitsbasierte Wortlisten“ wurde unter dem Schlagwort DeReWo eine Plattform eingerichtet, auf der Erkenntnisse und Ergebnisse zu diesem Bereich erarbeitet und veröffentlicht werden (<www.ids-mannheim.de/kl/projekte/methode/derewo.html>). Die Frage nach dem „längsten Wort der deutschen Sprache“ hat zwar gewisse Berührungspunkte zu diesem Schwerpunkt, sie hebt sich aber doch ein wenig ab. Deshalb soll sie an dieser Stelle in Form eines fiktiven Gesprächs thematisiert werden (auch wenn eine konkrete Anfrage für eine Kindersendung den Anlass geliefert hat).
The evolution of computer technologies and the introduction of the World Wide Web (WWW) have substantially changed the way scientific articles and books are published today. Besides writing for "traditional" print media, more and more authors decide to reach a larger audience and to decrease distribution time by offering their works on the internet. The electronic medium not only facilitates the spread of information, it also adds new value by extending the possibilities of knowledge retrieval. Of course the same is true for structured data collections like scientific glossaries, dictionaries or bibliographies. They particularly profit from the web when being accessible via user-friendly and effective frontends. The following chapters deal with the transformation of the Bibliography of German Grammar (“Bibliografie zur deutschen Grammatik”) from a data pool primarly used for print publishing to a relational database application offering a basis for media-independent distribution. Starting with a short description of the beginnings of the bibliography, the focus of this article lies on the explanation of our current database design as well as on the presentation of the web-based user interface.
Onlinewörterbücher in der Wörterbuchkritik : ein Evaluationsraster mit 39 Beurteilungskriterien
(2010)
Im Rahmen dieses Aufsatzes wird erstmals der Versuch eines möglichst umfassenden und dem neuen Wörterbuchtypus der Onlinewörterbücher (OWB) angepassten Kriterienkatalogs zur Wörterbuchkritik vorgestellt. Greifen doch hier nicht in vollem Umfang die – wenn auch wahrlich gut ausgearbeiteten – Evaluationsraster für Printwörterbücher. Denn: „The Internet will ultimately influence lexicography, along with all fields of knowlegde.“ (Carr 1997, S. 219). Es ergeben sich folglich für OWB eine Reihe von Mehrwerten: ‘Hypertext’ verändert den gesamten strukturellen Aufbau von Texten, bricht deren Linearität auf, fragmentiert Texte in kleinere Informationseinheiten und stellt diese in ein Netz aus Knoten und Links, durch das sich der Leser seinen eigenen Weg bahnt (Huber 2003, S. 15, 45; Kuhlen 1991, S. 20f., 124; Storrer 2000a, S. 213ff.). Diese "Interaktivität" ermöglicht die Manipulierbarkeit von Hypertexten, eine Eigenschaft, welche Benutzern durch die Möglichkeit, eigene Lesewege einzuschlagen, eine aktivere Rolle bei der Rezeption zuweist (Kuhlen 1991, S. 12ff.; Sager 2000, S. 589). "Multimedia" als weiterer Mehrwert erlaubt außerdem die Implementierung von Text, Bildern und weiteren neuen Formen der Informationsvermittlung wie Film, Ton, Animation und Simulation (Sager 2000, S. 588f.). Ergo hat sich im Rahmen des Wechsels vom Printwörterbuch zum OWB nicht nur ein Wandel des Mediums vollzogen (Abschied vom eigentlichen Buch), sondern auch eine Wandlung innerhalb der Textsorte Wörterbuch als Nachschlagewerk. Dieser Veränderung muss in einigen Punkten eine Modifizierung oder auch Augmentation der Bewertungskriterien folgen. Dies gilt es im Rahmen des neuen Kriterienkatalogs zu verdeutlichen.
Die Rolle des für die Entwicklung der modernen europäischen Sprachen entscheidenden Neulatein, sein zurückverweisender Beitrag zur sprachlichen Erneuerung von Latein und entlehntem Griechisch einerseits, sein zukunftweisender Beitrag zur sprachlichen Neuerung andererseits – eben durch diesen Prozess von „Reinigung und Fixierung“ auf einer in gewissem Maße normierten Basis, dann durch die einschneidend systemerweiternde Etablierung von Graecolatein und neoklassischer Lehn-Wortbildung – sollte am Beispiel der "itis"-Lehnwörter und der Lehn-Wortbildungsprodukte mit -itis dargestellt werden. Mit ihren fachsprachlichen Teilen versteht sich die Arbeit auch als kleine Teiluntersuchung zur Bedeutung des Latein auf allen seinen Sprachstufen für die Vermittlung von Wortschatz und Wissen der griechischen Antike.