Refine
Year of publication
- 2010 (86) (remove)
Document Type
- Article (34)
- Part of a Book (26)
- Conference Proceeding (11)
- Book (8)
- Part of Periodical (4)
- Contribution to a Periodical (2)
- Working Paper (1)
Has Fulltext
- yes (86) (remove)
Is part of the Bibliography
- no (86)
Keywords
- Deutsch (86) (remove)
Publicationstate
- Veröffentlichungsversion (29)
- Zweitveröffentlichung (5)
- Postprint (3)
Reviewstate
- (Verlags)-Lektorat (21)
- Peer-Review (12)
- Verlags-Lektorat (2)
- Peer-review (1)
Publisher
- Institut für Deutsche Sprache (21)
- de Gruyter (9)
- Lang (4)
- Narr (4)
- Winter (4)
- Dudenverlag (3)
- Benjamins (2)
- Francke (2)
- Fryske Akademy (2)
- Schmidt (2)
In der vorliegenden Arbeit wird mit ethnografischen, gesprächsanalytischen und gesprächsrhetorischen Methoden der kommunikative Sozialstil der "emanzipatorischen Migranten" untersucht. Ein wesentliches Kennzeichen dieses Milieus von Migranten der zweiten Generation ist, dass seine Akteure offensiv und provokativ mit Rassismen umgehen und sich nicht ethnisch (als "Türken", "Italiener", "Griechen" etc.) definieren. Des Weiteren betrachten sie - neben der dominanten Verwendung des Deutschen als gruppeninterner Kommunikationssprache - (deutschtürkisches) Code-switching und Code-mixing als wichtigen Ausdruck ihrer migrantischen Identität.
Da Potenziale und Konturen von Stilen erst im Kontrast eindeutig hervortreten, werden diese Befunde mit der kommunikativen Praxis einer anderen Sozialwelt von Migranten der zweiten Generation verglichen, derjenigen der "akademischen Europatürken". Hierbei zeigt sich, dass dieses sich ethnisch und als "Elite" der türkischen Migranten definierende Milieu moderat auf Diskriminierungen reagiert und deutsch-türkische Sprachvariation als Ausdruck von "Halbsprachigkeit" ablehnt.
This paper describes general requirements for evaluating and documenting NLP tools with a focus on morphological analysers and the design of a Gold Standard. It is argued that any evaluation must be measurable and documentation thereof must be made accessible for any user of the tool. The documentation must be of a kind that it enables the user to compare different tools offering the same service, hence the descriptions must contain measurable values. A Gold Standard presents a vital part of any measurable evaluation process, therefore, the corpus-based design of a Gold Standard, its creation and problems that occur are reported upon here. Our project concentrates on SMOR, a morphological analyser for German that is to be offered as a web-service. We not only utilize this analyser for designing the Gold Standard, but also evaluate the tool itself at the same time. Note that the project is ongoing, therefore, we cannot present final results.
Corpus-based identification and disambiguation of reading indicators for German nominalizations
(2010)
Corpus data is often structurally and lexically ambiguous; corpus extraction methodologies thus must be made aware of ambiguities. Therefore, given an extraction task, all relevant ambiguities must be identified. To resolve these ambiguities, contextual data responsible for one or another reading is to be considered. In the context of our present work, German -ung-nominalizations and their sortal readings are under examination. A number of these nominalizations may be read as an event or a result, depending on the semantic group they belong to. Here, we concentrate on nominalizations of verbs of saying (henceforth: "verba dicendi"), identify their context partners and their influence on the sortal reading of the nominalizations in question. We present a tool which calculates the sortal reading of such nominalizations and thus may improve not only corpus extraction, but also e.g. machine translation. Lastly, we describe successful attempts to identify the correct sortal reading, conclusions and future work.
Nach einem kurzen Überblick über die heutige sprachökologische Situation in Lettland möchte ich dabei auf die Rolle der deutschen Sprache in verschiedenen Bereichen der lettischen Gesellschaft eingehen. Komplettiert wird der Überblick über die deutsche Sprache im heutigen Lettland durch einige Überlegungen zu Maßnahmen, die die Situation zugunsten des Deutschen ändern könnten.
Dieser Beitrag gibt einen Überblick über CoDII, die Collection of Distributionally Idiosyncratic Items. CoDII ist eine elektronische Sammlung verschiedener Untergruppen lexikalischer Elemente, die sich durch idiosynkratische Distribution auszeichnen. Das bedeutet, dass sich die Verteilung dieser Lexeme im Text nicht alleine aufgrund ihrer syntaktischen Kategorie Vorhersagen lässt. Die Methoden, die in der Entwicklung von CoDII angewandt werden, greifen über traditionelle Fachgrenzen hinaus und umfassen Korpuslinguistik, Computerlinguistik, Phraseologie und theoretische Sprachwissenschaft. Ein wichtiger Schwerpunkt unserer Diskussion liegt auf der Darstellung, inwiefern die in CoDII gesammelten, annotierten und unter anderem mit Suchwerkzeugen abfragbaren Daten dazu beitragen können, die linguistische Theoriebildung durch die Bereitstellung sorgfältig aufbereiteter Datensammlungen bei der Überprüfung ihrer Datengrundlage zu unterstützen.
To reach even language users not acquainted to the use of grammars the Institut für Deutsche Sprache in Mannheim (Germany) looked for new ways to handle grammatical problems. Instead of confronting users with abstractions frequent difficulties of German grammar are introduced in form of exemplary questions like „Which form should be used or preferred: Anfang dieses Jahre or Anfang diesen Jahres? Looking through the long list of such questions even laymen may find solutions of grammatical problems they might not be able to formulate as such.
Grammatiktheoretische Forschung, das hat die jüngste IDS-Jahrestagung wieder einmal plastisch vor Augen geführt, muss gedacht werden als zähes Ringen zweier grundsätzlich antagonistischer Prinzipien: Der reichhaltigen Fülle sprachlicher Okkurrenzen, deren gründlicher Auslotung ein beträchtlicher Teil der gegenwärtigen sprachtheoretisch und sprachtechnologisch ausgerichteten Anstrengung gewidmet ist, muss stets der Versuch gegenüberstehen, diese überbordende Varianz abstrahierend und generalisierend einzudämmen – ohne dabei die empirischen Befunde übermäßig und unzulässig zu nivellieren.
DIL is a bilingual (German-Italian) online dictionary of linguistics. It is still under construction and contains 240 lemmas belonging to the subfield of “German as a Foreign Language”, but other subfields are in preparation. DIL is an open dictionary; participation of experts from various subfields is welcome. The dictionary is intended for a user group with different levels of knowledge, therefore it is a multifunctional dictionary. An analysis of existing dictionaries, either in their online or written form, was essential in order to make important decisions for the macro- or microstructure of DIL; the results are discussed. Criteria for the selection of entries and an example of an entry conclude the article.
Grammars even trying to be as comprehensible as possible hardly avoid using technical terms unknown to novices. To overcome these inconveniencies, the grammatical information system grammis of the Institut für Deutsche Sprache incorporated a glossary specialized on terms used within the system. This glossary - actually named Grammatische Grundbegriffe (elementary terms of grammar) and tied by hyperlinks to technical terms in the core grammar' of grammis - offers short and simple explanations mainly by means of exemplification. The idea is to provide the users with provisional understanding to get along while following the main themes they are interested in. Explicitly, the glossary is not a stand-alone dictionary of grammatical terms, and it should not be regarded as one.
„An den Ufern der Havel lebte, um die Mitte des sechzehnten Jahrhunderts, ein Roßhändler, namens Michael Kohlhaas, Sohn eines Schulmeisters, einer der rechtschaffensten zugleich und entsetzlichsten Menschen seiner Zeit.“
So beginnt einer der besten Meister der deutschen Syntax Heinrich von Kleist vor zweihundert Jahren seine berühmte Novelle „Michael Kohlhaas“, die ihren Ursprung nach Angaben des Autors in einer alten Chronik aus dem 16. Jh. hat. Dieser Satz besteht aus dem zweiwertigen Verb „leben“ und drei Satzgliedern: Lokalbestimmung „An den Ufern der Havel“, Temporalbestimmung „um die Mitte des sechzehnten Jahrhunderts“ und Subjekt „ein Roßhändler, namens Michael Kohlhaas, Sohn eines Schulmeisters, einer der rechtschaffensten zugleich und entsetzlichsten Menschen seiner Zeit“. Da der Autor über ein Ereignis aus der Vergangenheit berichtet, nennt er, wie heute in der Zeitung üblich, gleich am Anfang den Ort, den Zeitpunkt und den Hauptakteur des Geschehens. Wir erfahren, dass der Hauptakteur „ein Roßhändler, namens Michael Kohlhaas“ ist und dazu noch einige Informationen aus seiner Biografie, mit denen bei den Lesern das Interesse an der Novelle erweckt werden sollte: „einer der rechtschaffensten zugleich und entsetzlichsten Menschen seiner Zeit“. Dass der „Roßhändler“ „Michael Kohlhaas“ heißt, wissen wir aufgrund der Bedeutung des Wörtchens namens, das diese zwei Nominalphrasen verbindet (oder auch trennt). Und um dieses Wörtchen geht es in diesem Text.