Refine
Year of publication
- 2010 (88) (remove)
Document Type
- Article (34)
- Part of a Book (26)
- Conference Proceeding (11)
- Book (9)
- Part of Periodical (4)
- Contribution to a Periodical (2)
- Other (1)
- Working Paper (1)
Is part of the Bibliography
- no (88)
Keywords
- Deutsch (88) (remove)
Publicationstate
- Veröffentlichungsversion (30)
- Zweitveröffentlichung (5)
- Postprint (3)
Reviewstate
- (Verlags)-Lektorat (22)
- Peer-Review (12)
- Verlags-Lektorat (2)
- Peer-review (1)
Publisher
- Institut für Deutsche Sprache (21)
- de Gruyter (9)
- Narr (5)
- Lang (4)
- Winter (4)
- Dudenverlag (3)
- Benjamins (2)
- Francke (2)
- Fryske Akademy (2)
- Schmidt (2)
In der vorliegenden Arbeit wird mit ethnografischen, gesprächsanalytischen und gesprächsrhetorischen Methoden der kommunikative Sozialstil der "emanzipatorischen Migranten" untersucht. Ein wesentliches Kennzeichen dieses Milieus von Migranten der zweiten Generation ist, dass seine Akteure offensiv und provokativ mit Rassismen umgehen und sich nicht ethnisch (als "Türken", "Italiener", "Griechen" etc.) definieren. Des Weiteren betrachten sie - neben der dominanten Verwendung des Deutschen als gruppeninterner Kommunikationssprache - (deutschtürkisches) Code-switching und Code-mixing als wichtigen Ausdruck ihrer migrantischen Identität.
Da Potenziale und Konturen von Stilen erst im Kontrast eindeutig hervortreten, werden diese Befunde mit der kommunikativen Praxis einer anderen Sozialwelt von Migranten der zweiten Generation verglichen, derjenigen der "akademischen Europatürken". Hierbei zeigt sich, dass dieses sich ethnisch und als "Elite" der türkischen Migranten definierende Milieu moderat auf Diskriminierungen reagiert und deutsch-türkische Sprachvariation als Ausdruck von "Halbsprachigkeit" ablehnt.
This paper describes general requirements for evaluating and documenting NLP tools with a focus on morphological analysers and the design of a Gold Standard. It is argued that any evaluation must be measurable and documentation thereof must be made accessible for any user of the tool. The documentation must be of a kind that it enables the user to compare different tools offering the same service, hence the descriptions must contain measurable values. A Gold Standard presents a vital part of any measurable evaluation process, therefore, the corpus-based design of a Gold Standard, its creation and problems that occur are reported upon here. Our project concentrates on SMOR, a morphological analyser for German that is to be offered as a web-service. We not only utilize this analyser for designing the Gold Standard, but also evaluate the tool itself at the same time. Note that the project is ongoing, therefore, we cannot present final results.
Corpus-based identification and disambiguation of reading indicators for German nominalizations
(2010)
Corpus data is often structurally and lexically ambiguous; corpus extraction methodologies thus must be made aware of ambiguities. Therefore, given an extraction task, all relevant ambiguities must be identified. To resolve these ambiguities, contextual data responsible for one or another reading is to be considered. In the context of our present work, German -ung-nominalizations and their sortal readings are under examination. A number of these nominalizations may be read as an event or a result, depending on the semantic group they belong to. Here, we concentrate on nominalizations of verbs of saying (henceforth: "verba dicendi"), identify their context partners and their influence on the sortal reading of the nominalizations in question. We present a tool which calculates the sortal reading of such nominalizations and thus may improve not only corpus extraction, but also e.g. machine translation. Lastly, we describe successful attempts to identify the correct sortal reading, conclusions and future work.
Nach einem kurzen Überblick über die heutige sprachökologische Situation in Lettland möchte ich dabei auf die Rolle der deutschen Sprache in verschiedenen Bereichen der lettischen Gesellschaft eingehen. Komplettiert wird der Überblick über die deutsche Sprache im heutigen Lettland durch einige Überlegungen zu Maßnahmen, die die Situation zugunsten des Deutschen ändern könnten.
Dieser Beitrag gibt einen Überblick über CoDII, die Collection of Distributionally Idiosyncratic Items. CoDII ist eine elektronische Sammlung verschiedener Untergruppen lexikalischer Elemente, die sich durch idiosynkratische Distribution auszeichnen. Das bedeutet, dass sich die Verteilung dieser Lexeme im Text nicht alleine aufgrund ihrer syntaktischen Kategorie Vorhersagen lässt. Die Methoden, die in der Entwicklung von CoDII angewandt werden, greifen über traditionelle Fachgrenzen hinaus und umfassen Korpuslinguistik, Computerlinguistik, Phraseologie und theoretische Sprachwissenschaft. Ein wichtiger Schwerpunkt unserer Diskussion liegt auf der Darstellung, inwiefern die in CoDII gesammelten, annotierten und unter anderem mit Suchwerkzeugen abfragbaren Daten dazu beitragen können, die linguistische Theoriebildung durch die Bereitstellung sorgfältig aufbereiteter Datensammlungen bei der Überprüfung ihrer Datengrundlage zu unterstützen.
To reach even language users not acquainted to the use of grammars the Institut für Deutsche Sprache in Mannheim (Germany) looked for new ways to handle grammatical problems. Instead of confronting users with abstractions frequent difficulties of German grammar are introduced in form of exemplary questions like „Which form should be used or preferred: Anfang dieses Jahre or Anfang diesen Jahres? Looking through the long list of such questions even laymen may find solutions of grammatical problems they might not be able to formulate as such.
Grammatiktheoretische Forschung, das hat die jüngste IDS-Jahrestagung wieder einmal plastisch vor Augen geführt, muss gedacht werden als zähes Ringen zweier grundsätzlich antagonistischer Prinzipien: Der reichhaltigen Fülle sprachlicher Okkurrenzen, deren gründlicher Auslotung ein beträchtlicher Teil der gegenwärtigen sprachtheoretisch und sprachtechnologisch ausgerichteten Anstrengung gewidmet ist, muss stets der Versuch gegenüberstehen, diese überbordende Varianz abstrahierend und generalisierend einzudämmen – ohne dabei die empirischen Befunde übermäßig und unzulässig zu nivellieren.
DIL is a bilingual (German-Italian) online dictionary of linguistics. It is still under construction and contains 240 lemmas belonging to the subfield of “German as a Foreign Language”, but other subfields are in preparation. DIL is an open dictionary; participation of experts from various subfields is welcome. The dictionary is intended for a user group with different levels of knowledge, therefore it is a multifunctional dictionary. An analysis of existing dictionaries, either in their online or written form, was essential in order to make important decisions for the macro- or microstructure of DIL; the results are discussed. Criteria for the selection of entries and an example of an entry conclude the article.
Grammars even trying to be as comprehensible as possible hardly avoid using technical terms unknown to novices. To overcome these inconveniencies, the grammatical information system grammis of the Institut für Deutsche Sprache incorporated a glossary specialized on terms used within the system. This glossary - actually named Grammatische Grundbegriffe (elementary terms of grammar) and tied by hyperlinks to technical terms in the core grammar' of grammis - offers short and simple explanations mainly by means of exemplification. The idea is to provide the users with provisional understanding to get along while following the main themes they are interested in. Explicitly, the glossary is not a stand-alone dictionary of grammatical terms, and it should not be regarded as one.
„An den Ufern der Havel lebte, um die Mitte des sechzehnten Jahrhunderts, ein Roßhändler, namens Michael Kohlhaas, Sohn eines Schulmeisters, einer der rechtschaffensten zugleich und entsetzlichsten Menschen seiner Zeit.“
So beginnt einer der besten Meister der deutschen Syntax Heinrich von Kleist vor zweihundert Jahren seine berühmte Novelle „Michael Kohlhaas“, die ihren Ursprung nach Angaben des Autors in einer alten Chronik aus dem 16. Jh. hat. Dieser Satz besteht aus dem zweiwertigen Verb „leben“ und drei Satzgliedern: Lokalbestimmung „An den Ufern der Havel“, Temporalbestimmung „um die Mitte des sechzehnten Jahrhunderts“ und Subjekt „ein Roßhändler, namens Michael Kohlhaas, Sohn eines Schulmeisters, einer der rechtschaffensten zugleich und entsetzlichsten Menschen seiner Zeit“. Da der Autor über ein Ereignis aus der Vergangenheit berichtet, nennt er, wie heute in der Zeitung üblich, gleich am Anfang den Ort, den Zeitpunkt und den Hauptakteur des Geschehens. Wir erfahren, dass der Hauptakteur „ein Roßhändler, namens Michael Kohlhaas“ ist und dazu noch einige Informationen aus seiner Biografie, mit denen bei den Lesern das Interesse an der Novelle erweckt werden sollte: „einer der rechtschaffensten zugleich und entsetzlichsten Menschen seiner Zeit“. Dass der „Roßhändler“ „Michael Kohlhaas“ heißt, wissen wir aufgrund der Bedeutung des Wörtchens namens, das diese zwei Nominalphrasen verbindet (oder auch trennt). Und um dieses Wörtchen geht es in diesem Text.
The possibility to search electronically very large corpora of texts has opened up ways in which we can truly evaluate the rules through which grammarians have tried and continue to try to simulate natural languages. However, the possibility to handle incredibly large amounts of texts might lead to problems with the assessment of certain phenomena that are hardly ever represented in those corpora and yet, have always been regarded as grammatically correct elements of a given language. In German, typical phenomena of this kind are forms like betrögest or erwögest, i.e. second person singular of the so-called strong verbs in the subjunctive mood. Should we see them merely as grammarians’ inventions? Before doing so, we should reconsider the nature of these phenomena. They may appear to be isolated word forms but, in fact, are compact realizations of syntactic constructions, and it is the frequency of these constructions that should be evaluated, not the frequency of their specific realizations.
Der Beitrag beschäftigt sich aus einer linguistisch-gesprächsanalytischen Sicht mit einem in Beratungsgesprächen und verwandten Formen helfender Interaktionen strukturell verankerten Interaktionsproblem. Es geht um sprachlich-interaktive Verfahren der Überwindung von Perspektivendivergenzen zwischen Ratgebern und Ratsuchenden. Anhand eines Beispielfalles soll analysiert werden, wie in der Phase der Sondierung und Entwicklung einer Problemsicht durch die professionelle Beraterin bei ihrer Adressatin Widerstand gegen eine Perspektivenübernahme deutlich wird, den die Beraterin wiederum mit manifester Perspektivenarbeit zu überwinden versucht. Es gelingt ihr, mit relativ eindringlichen Mitteln die Ratsuchende dazu zu bringen, sich zumindest situativ auf die suggestiv und nachdrücklich angebotene Perspektive einzulassen. Kernstück dieses Vorgehens der Beraterin ist das Einführen und Durchspielen eines in der Erlebniswelt der Ratsuchenden verankerten kritischen Szenarios. Dabei agiert die Beraterin zunächst selber in der Rolle der Ratsuchenden, lässt dann diese fortsetzen und gibt ihr eine Fokussierung des „wunden Punkts“ vor. Dieser Vorgang ist aufschlussreich für Perspektivenarbeit im Gespräch und liefert wichtige Beobachtungen für eine Typologie von Perspektivierungsverfahren.
Der Beitrag gibt einen Überblick über die Entwicklung und die Aufgaben des Fachverbandes Deutsch als Fremdsprache (FaDaF) seit seiner Gründung 1989/90. Er zeigt dabei die Entwicklungslinien des Verbandes auf, der als Nachfolge-Organisation des Arbeitskreises Deutsch als Fremdsprache beim DAAD (AkDaF) dessen Aufgaben übernommen, fortgeführt und weiter entwickelt hat.
Neben kurzen Bestandsaufnahmen vom Status der Prosodie in Grammatiken und in DaF-Didaktiken und -Lehrwerken wird Prosodie näher bestimmt und ihre wichtigsten Eigenschaften und Funktionen in Wort, Ausspruch und Gespräch beschrieben. Im Weiteren wird vor allem die bedeutungsgestaltende Funktion der Prosodie herausgearbeitet. Aus phonologischer Sicht sehen wir die Informationsstruktur als zentral für die Vermittlung der Prosodie an. Anhand von Akzentgruppe und Intonationsphrase wird ihre Rolle bei der rhythmischen Gliederung von Aussprüchen vorgestellt. Als weiteres Beispiel für die kommunikative Funktion von Prosodie wird ihre Rolle beim Ausdruck von Emotion behandelt.
Das kontrastive Verbvalenzwörterbuch Spanisch - Deutsch (Diccionario contrastivo de valencias verbales español - alemán DCVVEA) liefert eine Beschreibung der kombinatorischen Möglichkeiten von über hundert hochfrequenten Verben des Spanischen und ihrer deutschen Äquivalente und macht präzise Angaben zu ihren semantischen und syntagmatischen Eigenschaften. Die Abgrenzung von Bedeutungsvarianten für die polysemen spanischen Lemmata geht zum einen von vorliegenden lexikographische Beschreibungen aus, die an die Zielsetzungen des DCVVEA angepasst wurden, und stützt sich zum anderen auf das empirische Datenmaterial, das die syntaktische Datenbank Base de datos sintácticos del español actual (BDS) zur Verfügung stellt. Die BDS wurde von WissenschaftlerInnen der USC unter der Leitung von Guillermo Rojo erstellt und enthält die Ergebnisse der syntaktischen Analyse von etwa 160.000 Sätzen aus einem Textkorpus der spanischen Gegenwartssprache, ARTHUS (Archivo de textos hispánicos de la Universidad de Santiago de Compostela).
Das DCVVEA ist ein syntagmatisches Wörterbuch mit alphabetischer Struktur und Spanisch als Metasprache. Die Einträge beziehen sich auf die einzelnen Bedeutungsvarianten eines spanischen Verbs und werden mit authentischen Beispielen belegt. Den spanischen Verbvarianten werden deutsche Verben zugeordnet, die zu ihnen in einer vollständigen oder partiellen Äquivalenzrelation stehen. Die Ermittlung dieser Äquivalente stützt sich auf die Übersetzung der Korpusbeispiele. Die Valenzbeschreibung der spanischen und der deutschen Verbvarianten enthält funktionale, kategoriale und semantische Angaben zu den einzelnen Verbaktanten und explizite Hinweise auf kontrastiv relevante Unterschiede zwischen den Einheiten beider Sprachen.
Aktuelle Regionalsprachforschung zum Deutschen. Das IDS-Projekt Variation des gesprochenen Deutsch
(2010)
This paper shows how corpora and related tools can be used to analyse and present significant colligational patterns lexicographically. In German, patterns such as das nötige Wissen vermitteln and sein Wissen unter Beweis stellen play a vital role when learning the language, as they exhibit relevant idiomatic usage and lexical and syntactic rules of combination. Each item has specific semantic and grammatical functions and particular preferences with respect to position and distribution. An analysis of adjectives, for example, identifies preferences in adverbial, attributive, or predicative functions.
Traditionally, corpus analyses of syntagmatic constructions have not been conducted for lexicographic purposes. This paper shows how to utilise corpora to extract and examine typical syntagms and how the results of such an analysis are documented systematically in ELEXIKO, a large-scale corpus-based Internet reference work of German. It also demonstrates how this dictionary accounts for the lexical and grammatical interplay between units in a syntagm and how authentic corpus material and complementary prose-style usage notes are a useful guide to text production or reception.
Der Beitrag stellt Arbeiten des Projekts Usuelle Wortverbindungen am Institut für Deutsche Sprache (IDS) in Mannheim vor. Im Mittelpunkt stehen dabei neue Perspektiven, die sich für die elektronische Phraseographie aus der korpusanalytischen Auswertung sprachlicher Massendaten ergeben. Eine wichtige Methode ist die statistische Kookkurrenzanalyse, die u.a. dazu dient, feste Wortverbindungen zu extrahieren und typische Kontexte vorzustrukturieren. Auf dieser Basis lässt sich der tatsächliche Gebrauch fester Wortverbindungen in einer quantitativ und qualitativ neuen Dimension erfassen und lexikografisch beschreiben. Die heutigen technologischen Möglichkeiten können des Weiteren für neue und differenziertere Präsentationsformen angepasst an unterschiedliche Rezeptionsbedürfnisse genutzt werden. Das UWV-Projekt beschreitet auch im Bereich der Internet-Lexikografie neue Wege, was anhand ausgewählter Beispiele gezeigt wird.
Some grammatical phenomena that only seldom appear in the corpora of written language often coincide with Speakers' uncertainty about a given form's grammatical Status. Such display of uncertainty is often subject to prescriptive criticism, which pays little attention to actual usage. However, thorough and discriminating corpus analyses can help in a proper description of various low-frequency phenomena and in situating them more adequately in the grammatical System, against the background of different contexts, communicative situations, and language varieties. To exemplify this potential, this study examines three linguistic phenomena in German, using a corpus-based approach: the dative singular ending -e, the construction aus aller Herren Länder, which lacks the dative plural ending -t and the non-standard preterite form frug. The results can be seen as a contribution to a more precise grammatical description on the one hand and, on the other, as a basis for an improved, more usage-oriented approach in providing practical advice to language users.
Von Bush administration zu Kohl-Regierung: Englische Einflüsse auf deutsche Nominalkonstruktionen?
(2010)
In diesem Beitrag wird eine neue, funktional motivierte Systematik für den adnominalen Genitiv und entsprechende von-Phrasen, die zusammenfassend als ‘possessive Attribute’ bezeichnet werden, entwickelt. Sie beruht auf Erkenntnissen aus der sprachtypologischen Forschung und dem Vergleich mit anderen, vor allem germanischen Sprachen. Der Beschreibungsrahmen für die NP mit der übergreifenden ‘funktionalen Domäne’ der Referenz und den zugehörigen Subdomänen wird vorgestellt. Possessive Attribute können als eine Ausdrucksform der Subdomäne Modifikation bestimmt werden. Es wird gezeigt, dass possessive Attribute verschiedene funktionale Typen der Modifikation realisieren können: referentiell-verankernde (der Hut meiner Schwester), qualitative (ein Autor deutscher Herkunft) und klassifikatorische (ein Mann der Tat). Auch randständige possessive Attribute wie der ‘Teilungsgenitiv’ (eine Tasse heißen Tees) und der Identitätsgenitiv (das Laster der Unbescheidenheit) werden berücksichtigt. Die neue Ordnung possessiver Attribute nach funktionalen Subdomänen ist der traditionellen Einteilung vorzuziehen, insofern als sie lediglich Grundunterscheidungen gemäß dem referenzsemantischen Status des Modifikators (begrifflich versus referentiell) und nach dem Beitrag des Modifikators zur Bedeutungskomposition der NP (verankernd versus qualitativ bzw. klassifikatorisch) berücksichtigt. Zudem ist sie durch Testverfahren wie den Pronominalisierungstest abgesichert.
In this paper we outline our corpus-driven approach to detecting, describing and presenting multi- word expressions (MWEs). Our goal is to treat MWEs in a way that gives credit to their flexible nature and their role in language use. The bases of our research are a very large corpus and a Statistical method of collocation analysis. The rich empirical data is interpreted linguistically in a structured way which captures the interrelations, patterns and types of variances of MWEs. Several levels of abstraction build on each other: surface patterns, lexical realizations (LRs), MWEs and MWE patterns. Generalizations are made in a controlled way and in adherence to corpus evidence. The results are published online in a hypertext format.
Vorwort
(2010)
Der Beitrag führt in das Themenheft der Zeitschrift Deutsche Sprache 2/2010 ein. Dieses Themenheft versammelt vier Beiträge zu einem zentralen Thema der deutschen Grammatik und Textlinguistik: der Form und Funktion von Attributionsstrukturen in der Nominalphrase. Gemeinsam ist allen Beiträgen der kontrastive und/oder funktional-typologische Zugang zu diesem Thema; Unterschiede bestehen in Bezug auf die untersuchten Attributtypen (Adjektiv-, Genitiv-, Präpositional- und Partizipialattribute), den methodischen Zugriff auf die Daten, die theoretischen Fragestellungen sowie die jeweiligen Vergleichssprachen (Niederländisch, Dänisch, Norwegisch, Englisch). Alle Beiträge dokumentieren das in den letzten Jahren wieder erstarkte Interesse an sprachvergleichenden Untersuchungen, das sich auch in entsprechenden themenspezifischen Konferenzen und Forschungsprojekten im In- und Ausland niederschlägt.
In this feasibility study we aim at contributing at the practical use of domain ontologies for hypertext classification by introducing an algorithm generating potential keywords. The algorithm uses structural markup information and lemmatized word lists as well as a domain ontology on linguistics. We present the calculation and ranking of keyword candidates based on ontology relationships, word position, frequency information, and statistical significance as evidenced by log-likelihood tests. Finally, the results of our machine-driven classification are validated empirically against manually assigned keywords.
As the nature of negative polarity items (NPIs) and their licensing contexts is still under much debate, a broad empirical basis is an important cornerstone to support further insights in this area of research. The work discussed in this paper is intended as a contribution to realizing this objective. The authors briefly introduce the phenomenon of NPIs and outline major theories about their licensing and also various licensing contexts before discussing our major topics: Firstly, a corpus-based retrieval method for NPI candidates is described that ranks the candidates according to their distributional dependence on the licensing contexts. Our method extracts single-word candidates and is extended to also capture multi-word candidates. The basic idea for automatically collecting NPI candidates from a large corpus is that an NPI behaves like a kind of collocate to its licensing contexts. Manual inspection and interpretation of the candidate lists identify the actual NPIs. Secondly, an online repository for NPIs and other items that show distributional idiosyncrasies is presented, which offers an empirical database for further (theoretical) research on these items in a sustainable way.
The Online-Wortschatz-Informationssystem Deutsch (OWID Online German Lexical Information System) is a lexicographic Internet portal for various electronic dictionary resources that are being compiled at the Institute for the German Language (Institut für Deutsche Sprache, IDS). The main emphasis of OWID is on academic lexicographic resources of contemporary German. Presently, the following dictionaries are included in OWID: a dictionary of contemporary German called elexiko, a dictionary of neologisms, a small dictionary of collocations, and a discourse dictionary covering the lexemes that establish the discourse about “guilt” in the early post-war era 1945-1955. In the near future (2010/2011), several additional dictionaries will be published in OWID: a Textbook of German Communication Verbs, a Valency Dictionary of German Verbs, two further discourse dictionaries – one about the “democracy” discourse around 1968, the other covering the keywords of the German reunification 1989/1990. Moreover, 300 entries from a corpus-based project on proverbs will be integrated into OWID. Thereby, OWID is a constantly growing resource for academic lexicographic work of the German language.
Altogether, OWID is a special kind of dictionary portal owing to its content and its design, namely the integration of the various dictionaries, the access possibilities and the presentation features. With OWID, we try to establish a dictionary net where the different resources are jointly accessible not only by headwords, but also on the microstructural level. Prerequisite for these common access- and navigation-possibilities across the various dictionaries is the same concept for the lexicographic data model which we put into practice in OWID. Data from all dictionaries in OWID are structured according to a tailor-made, fine-granular, XML-based data model. In this data model, similar content is modelled similarly, dictionary related differences are preserved.
The main tasks for the future are to enhance OWID with further dictionary resources, to improve the inner access structures so that they exhaust the possibilities of the data model, and to customize the layout of the dictionaries as well as the search options according to the user’s needs
Antonymy is a relation of lexical opposition which is generally considered to involve (i) the presence of a scale along which a particular property may be graded, and hence both (ii) gradability of the corresponding lexical items and (iii) typical entailment relations. Like other types of lexical opposites, antonyms typically differ only minimally: while denoting opposing poles on the relevant dimension of difference, they are similar with respect to other components of meaning. This paper presents examples of antonymy from the domain of speech act verbs which either lack some of these typical attributes or show problems in the application of these. It discusses several different proposals for the classification of these atypical examples.
Bestimmte adsubstantivisch verwendete Demonstrativa verfügen – über die deiktische und phorische hinaus – über eine so genannte anamnestische Gebrauchsweise. Diese Verwendung wird in der Literatur häufig vernachlässigt, obwohl sie nach mehreren Autoren (z.B. Diessel, Himmelmann) den Ausgangspunkt der Grammatikalisierung der Demonstrativa bildet. Im vorliegenden Aufsatz wird einerseits nachgeprüft, ob und inwieweit die in der einschlägigen Literatur beschriebenen allgemeinen Charakteristika der anamnestischen Demonstrativa für das Deutsche und das Ungarische zutreffen. Andererseits werden auch die Eigenschaften der indefiniten Gegenstücke der anamnestischen Demonstrativa in beiden Vergleichssprachen anhand von Korpusbeispielen untersucht. Zum Schluss wird auch auf die möglichen Grammatikalisierungswege der Demonstrativa eingegangen.
This paper discusses the advantages and disadvantages of the combination of automated information and lexicographically interpreted information in online dictionaries, namely elexiko, a hypertext dictionary and lexical data information system of contemporary German (http://www.owid.de/ elexiko_/index.html), and DWDS, a digital dictionary of 20,h century German (http://www.dwds.de). Examples of automatically derived information (e.g. automatically extracted citations from the underlying corpus, lists on paradigmatic relations) and lexicographically compiled information (e.g. information on paradigmatic partners) are provided and evaluated, reflecting on the need to develop guidelines as to how computerised information and lexicographically interpreted information may be combined profitably in online reference works.
Eine der linguistischen Teildisziplinen, in der schon seit vielen Jahren korpusgestützt gearbeitet wird, ist die Lexikografie. Wörterbücher sind lange vor der Entstehung großer elektronischer Textsammlungen mit den entsprechenden Korpusrecherche- und -analysewerkzeugen auf der Basis von umfänglichen Belegsammlungen entstanden, die nach dem Verständnis vieler Lexikografen das Korpus (bzw. die Primärquelle) des Wörterbuches darstellen. Noch heute arbeiten verschiedene Großwörterbücher (z. B. das Oxford English Dictionary) am Ausbau ihrer Belegsammlungen und benutzen diese neben zum Teil eigens aufgebauten elektronischen Wörterbuchkorpora im engeren Sinn. Welche Chancen und Probleme sich bei korpusgestützter Arbeit an Wörterbücher ergeben, wird in diesem Beitrag an deutschsprachigen Online-Wörterbüchern aufgezeigt, wobei zunächst einige Definitionen erarbeitet werden müssen. Ein kurzer Ausblick auf die Auswirkungen korpusgestützter Arbeit an Online-Nachschlagewerken auf den lexikografischen Prozess schließt diesen Beitrag ab.
Ĉlánek popisuje lingvistické prostředky oznaĉující a popisující proţívání a emoce v němĉině. V první ĉásti jsou představeny konceptualizace proţívání a emocí, druhá ĉást popisuje detailně lingvistické prostředky. Poslední ĉást se zabývá některými problémy spojenými s vytvořením lexikonu emoĉních slov.
Is it possible to undo or reverse language attrition? In other words, has there been, in the case of attrition, a permanent change with respect to the speaker's L1 knowledge, or do we only see temporary effects on the control of that knowledge? It is proposed here that the concept of attrition should include the temporary loss of language skills since it is, so far, not clear whether or to what extent once-acquired linguistic abilities can be permanently lost at all, particularly with respect to an L1. A reversal in the development of attrition after renewed contact with the L1 can support the claim that a decrease in L1 proficiency can be TEMPORARY, and that it is the ACCESSIBILITY of items and structures that is affected by attrition rather than the L1 knowledge (competence) itself. Our primary research interest in the present study is to analyze what skills and features are recoverable and what phenomena persist, (possibly) indicating permanent loss.
Der Autor möchte mit seinem Beitrag zeigen, in welcher Weise die aktuellen Korpus-Projekte und Datenbankentwicklungen in der Abteilung Pragmatik des Instituts für Deutsche Sprache Mannheim (IDS) Fragestellungen und Forschungspraktiken der Gesprächsanalyse bedienen. Abschließend stelle er die Entwicklungsarbeit an der Nachfolge-Version 2.0 der Datenbank Gesprochenes Deutsch für die gegenwärtig angebotene Version vor.
^This paper describes DeReKo (Deutsches Referenzkorpus), the Archive of General Reference Corpora of Contemporary Written German at the Institut für Deutsche Sprache (IDS) in Mannheim, and the rationale behind its development. We discuss its design, its legal background, how to access it, available metadata, linguistic annotation layers, underlying standards, ongoing developments, and aspects of using the archive for empirical linguistic research. The focus of the paper is on the advantages of DEREKO’s design as a primordial sample from which virtual corpora can be drawn for the specific purposes of individual studies. Both concepts, primordial sample and virtual corpus are explained and illustrated in detail. Furthermore, we describe in more detail how DEREKO deals with the fact that all its texts are subject to third parties’ intellectual property rights, and how it deals with the issue of replicability, which is particularly challenging given DEREKO’s dynamic growth and the possibility to construct from it an open number of virtual corpora.