Refine
Year of publication
- 2007 (185) (remove)
Document Type
- Part of a Book (75)
- Article (63)
- Conference Proceeding (21)
- Book (16)
- Part of Periodical (6)
- Contribution to a Periodical (1)
- Master's Thesis (1)
- Preprint (1)
- Report (1)
Language
- German (146)
- English (37)
- Norwegian (1)
- Portuguese (1)
Keywords
- Deutsch (97)
- Korpus <Linguistik> (34)
- Konversationsanalyse (15)
- Gesprochene Sprache (11)
- Sprachgeschichte (9)
- Computerlinguistik (8)
- Grammatik (8)
- Semantik (8)
- Sprachpflege (7)
- Verb (7)
Publicationstate
- Veröffentlichungsversion (82)
- Zweitveröffentlichung (16)
- Postprint (11)
Reviewstate
Publisher
- de Gruyter (34)
- Narr (29)
- Institut für Deutsche Sprache (22)
- Equinox (4)
- Benjamins (3)
- Lang (3)
- Niemeyer (3)
- University of Birmingham (3)
- University of Illinois (3)
- Association for Computational Linguistics (2)
In diesem Beitrag wird untersucht, wie mithilfe korpuslinguistischer Verfahren Erkenntnisse über den Aufbau von Bedeutungsparaphrasen in Wörterbüchern gewonnen werden können. Diese Erkenntnisse sollen dazu genutzt werden, den Aufbau von Bedeutungsparaphrasen in Wörterbüchern umfassend und systematisch zu beschreiben, z.B. im Hinblick auf eine Optimierung der Bedeutungsparaphrasen für so genannte elektronische Wörterbücher oder für die Extraktion lexikalisch-semantischer Information für NLP-Zwecke.
Modalpartikel
(2007)
Der vorliegende Aufsatz hat zwei Ziele. Zum einen untersucht er die syntaktische, prosodischinformationsstrukturelle und semantisch-pragmatische Vielfalt adnominaler Relativsätze des Gegenwartsdeutschen anhand von vier Dimensionen der Nähe und Ferne zwischen Bezugsnominale und Relativsatz: Kontaktstellung vs. Distanzstellung, hypotaktischer vs. parataktischer Anknüpfung, unselbständiger vs. selbständiger Phrasierung und Restriktivität vs. Appositivität. In der Relativsatz-Literatur finden sich zahlreiche Thesen über Beschränkungen in der Kombinierbarkeit dieser Eigenschaften. Kaum eine davon hält jedoch einer genaueren Überprüfung stand, sodass der Aufsatz zu dem Fazit gelangt, dass deutsche Relativsätze wesentlich mehr Variation zulassen, als üblicherweise angenommen wird. Zweitens untersucht der Aufsatz eingehender die Opposition zwischen restriktiven und appositiven Relativsätzen. Auch über diese wichtige Unterscheidung sind zahlreiche Annahmen in Umlauf, die sich als revisionsbedürftig erweisen. Es wird gezeigt, dass zwei weit verbreitete Unterscheidungskriterien nur bedingt anwendbar bzw. operationalisierbar sind: die Einschränkung des Referenzbereichs durch restriktive Relativsätze und das unterschiedliche Skopusverhalten. Stattdessen wird auf Unterscheidungskriterien gesetzt, die bisher eher wenig beachtet wurden: die Referentialität des Relativpronomens und die Deskriptivität des Bezugsnominales. Diese werden als entscheidende Faktoren für die semantische Interpretation von Relativsätzen herausgestellt. Appositive Interpretation von Relativsätzen ist möglich, wenn ihr Relativpronomen referentiell gedeutet werden kann. Restriktive Interpretation von Relativsätzen ist möglich, wenn das Bezugsnominale eine deskriptive Komponente enthält. Sind beide Bedingungen erfüllt, so kann ein Relativsatz auf beide Arten gelesen werden. Dann muss pragmatisch zwischen den Interpretationsmöglichkeiten ausgewählt werden.
Syntactic negation and particularly the position of the negative particle nicht are challenging themes not only for learners of German as a foreign language, but also for teachers and researchers of the grammar of German. This paper gives an overview of recent studies related to negation in Modern German. In its main part, it presents results of empirical research on the relationship between syntax and prosody in the field of negation.
Auf sprachvergleichende Untersuchungen wirken sich gerade bei den Konzessivverknüpfungen die teilweise sehr unterschiedlichen einzelsprachlichen Darstellungstraditionen unvorteilhaft aus, weil sie den Blick auf ein mögliches tertium comparationis verstellen. Dies betrifft auch den Vergleich zwischen dem Deutschen und dem Russischen. Der vorliegende Aufsatz gibt einen Überblick über die Konzessivkonnektoren dieser beiden Sprachen, wobei die semantischen, syntaktischen und morphologischen Ähnlichkeiten zwischen den betreffenden Sprachmitteln besonders hervorgehoben werden. Damit wird eine Vergleichsbasis erarbeitet, die für zukünftige Detail-Untersuchungen als Ausgangspunkt dienen kann.
Statistische Methoden finden derzeit in der Sprachtechnologie vielfache Verwendung. Ein Grundgedanke dabei ist das Trainieren von Programmen auf große Mengen von Daten. Für das Trainieren von statistischen Sprachmodellen gilt zur Zeit das Motto „Je mehr Daten desto besser“. In unserem System zur maschinellen Übersetzung sehen wir eine fast konstante qualitative Verbesserung (gemessen als BLEU-Score) mit jeder Verdoppelung der monolingualen Trainingsdatenmenge. Selbst bei Mengen von ca. 20 Milliarden Wörtern aus Nachrichtentexten und ca. 200 Milliarden Wörtern aus Webseiten ist kein Abflachen der Lernkurve in Sicht.
Dieser Artikel gibt kurze Einführungen in statistische maschinelle Übersetzung, die Evaluation von Übersetzungen mit dem BLEU-Score, und in statistische Sprachmodelle. Wir zeigen, welch starken Einfluß die Größe der Trainingsdaten des Sprachmodells auf die Übersetzungsqualität hat. Danach wird die Speicherung großer Datenmengen, das Trainieren in einer parallelen Architektur und die effiziente Verwendung der bis zu 1 Terabyte großen Modelle in der maschinellen Übersetzung beschrieben.
Intensitätspartikeln
(2007)
We present an XML-based metadata standard for the documentation of speech and multimedia corpora that was developed at the Institute for German Language (IDS) in Mannheim, Germany. The IDS is one of the major institutions providing German speech and language corpora to researchers. These corpora stem from many different sources and were previously documented in a rather heterogeneous fashion using a variety of data models and formats. In order to unify the documentation for existing and future corpora, the IDS- internal Archive for Spoken German collaborated with several projects and developed a set of standardised XML metadata schemas. These XML schemas build on existing internal and external documentation schemas (such as IMDI) and take into account the workflow of speech corpus production. In order to minimise redundancy, separate schemas were designed for projects, speakers, recording sessions, and entire corpora. The resulting schemas are tested in ongoing speech and multi-media projects at the IDS and are regularly revised. They are accompanied by element definitions, guidelines, and examples. In addition, a mapping to IMDI will be provided.
We present a corpus-driven approach to the study of multi-word expressions, which constitute a significant part of. As a data basis, we use collocation profiles computed from DeReKo (Deutsches Referenzkorpus), the largest available collection of written German which has approximately two billion word tokens and is located at the Institute for the German Language (IDS). We employ a strongly usage-based approach to multi-word expressions, which we think of as conventionalised patterns in language use that manifest themselves in recurrent syntagmatic patterns of words. They are defined by their distinct function in language. To find multi-word expressions, we allow ourselves to be guided by corpus data and statistical evidence as much as possible, making interpretative steps carefully and in a monitored fashion. We develop a procedure of interpretation that leads us from the evidence of collocation profiles to a collection of recurrent word patterns and finally to multi-word expressions. When building up a collection of multi-word expressions in this fashion, it becomes clear that the expressions can be defined on different levels of generalisation and are interrelated in various ways. This will be reflected in the documentation and presentation of the findings. We are planning to add annotation in a way that allows grouping the multi-word expressions according to different features and to add links between them to reflect their relationships, thus constructing a network of multi-word expressions.
An der Friedrich-Alexander-Universität Erlangen-Nürnberg fand vom 4. April bis zum 7. April 2005 die Tagung Valency:Valenz. Theoretical, descriptive and cognitive issues statt. Für die Organisierung der Veranstaltung zeichneten Thomas Herbst und Katrin Götz vom Institut für Anglistik und Amerikanistik verantwortlich. Die beiden Organisatoren luden zu einer Tagung ein, die möglichst viele Aspekte des Themas Valenz umfassen sollte. So wurden u.a. lexikografische, kontrastive, kognitive und computerlinguistische Herangehensweisen angesprochen. Die Tagung war vorwiegend englischsprachig, was aber germanistisch orientierte Fragestellungen nicht ausschloss.
In this contribution we present some work of the R&D European project “LIRICS” and of the ISO/TC 37/SC 4 committee related to the topic of interoperability and re-use of language resources. We introduce some basic mechanisms of the standardization work in ISO and describe in more details the general approach on how to cope with the annotation of language data within ISO.
Wer sich mit grammatischen Phänomenen historischer Sprachstufen beschäftigt, kann seine empirischen Daten bekanntermaßen nicht auf der Grundlage von Sprecherurteilen gewinnen, sondern muss zunächst Korpusrecherchen betreiben. Die Größe des auszuwählenden Korpus ist sehr stark phänomenabhängig: So reicht es im Bereich der Syntax in der Regel nicht aus, kleinere Textausschnitte aus verschiedenen Textquellen zu einem Korpus zusammenzufügen, vielmehr müssen vollständige Texte nicht nur nach raum-zeitlichen Koordinaten, sondern auch textsortenabhängig ausgewählt werden, um ein repräsentatives Korpus für eine spezifische Sprachstufe zu erstellen. Da eine manuelle Sichtung dieser doch recht großen Korpora sich sehr zeitaufwändig gestaltet, bietet sich gerade im Bereich der historischen Syntax der Einsatz von syntaktisch annotierten, digitalen Korpora an. Im folgenden Beitrag wird der Aufbau einer solchen Baumbank für das Frühneuhochdeutsche einschließlich der verfügbaren Recherchemöglichkeiten vorgestellt.
Playing with the voice of the other : stylized kanaksprak in conversations among German adolescents
(2007)
This paper argues for the need of training doctors in order to improve their skills of listening to patients and of conducting the interaction with them. It argues for applied discourse analysis as an approach to medical discourse which provides for the soundest empirical basis for developing training schedules. The article shortly reviews the basic procedures and stocks of knowledge which are proper to applied discourse analysis. It then turns to the improvement of doctors' skills of active listening to the patient of and analyzing his/her communicative displays, e.g. regarding emotions, subjective theories of illness and identity concerns of his/her sufferings. Finally, aspects of the improvement for doctors' communicative skills are discussed, e.g. enhancing the comprehensibility of doctors' turns at talk, the management of the patients' participation in medical dialogue and the formulation of questions.
Dieses Buch stellt die Gesprächsanalyse als Methodik zur Erforschung linguistischer Fragestellungen dar. Ihr Ziel ist die umfassende Analyse sprachlicher Phänomene in ihren formalen, funktionalen und kontextuellen Dimensionen. Grundlegende Eigenschaften der verbalen Interaktion werden zunächst auf ihre sprachtheoretischen Konsequenzen befragt. Sodann werden aus ihnen methodologische Prinzipien für die Erhebung und Analyse von Gesprächskorpora entwickelt. Das methodische Vorgehen wird an einer grammatischen und einer semantischen Fragestellung demonstriert. Untersucht werden freie Infinitivkonstruktionen im gesprochenen Deutsch und die Effekte von Kontrastierungsaktivitäten auf die Semantik von Ausdrücken im Gespräch. Theoretische Basis bildet hier die Integration der Gesprächsanalyse mit der construction grammar und der kognitiven Linguistik.
Adjektiv (und Adkopula)
(2007)
In dem vorliegenden Beitrag wird dargelegt, welche Mittel der Wortbildung und der Entlehnung im Deutschen genutzt werden, um den Anforderungen einer modernen Lebenswelt sprachlich gerecht zu werden. Dabei wird von den Wortschatzentwicklungen der 1990er Jahre ausgegangen, die in dem am Institut flir Deutsche Sprache erarbeiteten Neologismenwörterbuch dokumentiert sind. Es zeigt sich, dass die Veränderungen im Wortschatz an erster Stelle die Wortart Substantiv betreffen, dass aber auch bei Adjektiv und Verb Veränderungen festzustellen sind, die alle davon zeugen, dass das Deutsche mit Adaptation seiner gut aus gebauten Wortbildungsmittel auf den verstärkten Einfluss von Entlehnungen aus dem Englischen reagiert. Die traditionell vorhandenen Mittel zeigen im Hinblick darauf einen Grad an Flexibilität, der bei einer getrennten Betrachtung der Phänomene Entlehnung und Wortbildung nicht sichtbar wird.
Das Deutsche gilt als prototypisches Beispiel für eine Sprache, die von einer plurizentrischen Sprachkultur getragen wird. Im Gegensatz zu monozentrischen Sprachen, bei denen ein zentraler Raum oder eine zentrale Institution das Muster bilden und bestimmen, was als sprachlicher Standard zu gelten hat, gilt es in plurizentrischen Sprachkulturen, einen Ausgleich zwischen den Ansprüchen verschiedener kultureller Zentren zu finden. Das Deutsche, so wie wir es kennen, geht als ganzes auf einen solchen Ausgleich zurück. Er sollte zunächst die Verständlichkeit von Druckwerken sichern. Und noch heute schlagen sich solche Differenzen in den Eigenheiten der verschiedenen deutschsprachigen Staaten nieder. Das hat zur Folge, dass jetzt auch diskutiert wird, wie viel von der sichtbaren Variation auf historisch-politische Unterteilungen zurückgeht („plurinational“), und wie viel das Erbe der traditionellen Dialekträume darstellt („polyareal“).
Die diesjährige Arbeitstagung, die zum vierten Mal vom Institut für Deutsche Sprache (IDS) in Mannheim veranstaltet wurde, hatte sich das Ziel gesetzt, eine Standortbestimmung der Gesprächsforschung vorzunehmen und Gelegenheit zur Reflektion ihrer "Aufgaben, Desiderate und Perspektiven" (so der Untertitel des Tagungsthemas "Gesprächsforschung") zu bieten. Bei den vielfältigen Forschungsinteressen am sprachlich-kommunikativen Handeln, bei den neuen technischen Möglichkeiten der Videoaufzeichnung und der computergestützten Verfügbarmachung von Gesprächsdaten und auch vor dem Hintergrund des Generationenwechsels, der sich derzeit in der Gesprächsforschung vollzieht, war das ein passendes wie auch dringlich erscheinendes Tagungsthema. Dies wurde durch die bisher höchste Teilnehmerzahl (120), einen relativ hohen Anteil von Gästen aus dem Ausland und durch eine größere Zahl jüngerer Teilnehmer und Vortragender bestätigt. Wie sich an der Liste der Referenten der 13. Arbeitstagung darüber hinaus zeigt, hat sich die in ihren Anfängen als Gelegenheit zur Diskussion von Forschungsproblemen und zur gemeinsamen Analyse von Daten gestaltete Arbeitstagung inzwischen zu dem zentralen Forum der Gesprächsforschungs-Community in Deutschland entwickelt.
In diesem Beitrag versuchen wir darzulegen, unter welchen Umständen introspektive Urteile objektive, quantifizierbare, und empirisch adäquate linguistische Daten sein können. Dazu skizzieren wir, wie die Resultate unserer experimentell erhobenen, relativen Urteilsstudien aussehen, und argumentieren, dass sie eine unverzichtbare Evidenzquelle für die Syntax bilden, weil sie Einsichten in die Architektur der Grammatik erlauben, die mit anderen Mitteln nicht möglich sind.
Auf der Grandlage eines Drei-Generationen-Modells (Jugend, mittlere Generation, Alter) wird dargestellt, welche Anlässe es für alte Menschen zur Kommunikation mit Angehörigen der eigenen wie auch der anderen Generationen gibt. Dabei wird nach familiären, institutionellen und freien Kommunikationssituationen differenziert. Jede Konstellation wird in Hinblick auf Quantität und Qualität der Kommunikation sowie auf mögliche Erschwernisse und Probleme, insbesondere auch als Folge von körperlichen Gebrechen, charakterisiert. Auf diese Weise entsteht ein Bild des „kommunikativen Haushalts“ (Luckmann) der älteren Generation, das auf Schwachstellen hin überprüft wird. In einem letzten Schritt wird skizziert, welche Möglichkeiten zur Intensivierung der intra- wie der intergenerationellen Kommunikation bestehen.
Bei diesem Beitrag handelt es sich um den Eröffnungsvortrag im Rahmen der 35. Jahrestagung Deutsch als Fremdsprache des Fachverbandes Deutsch als Fremdsprache (FaDaF) vom 31. Mai bis 2. Juni 2007 an der Freien Universität Berlin zum Rahmenthema »Auf neuen Wegen. Deutsch als Fremdsprache in Forschung und Praxis«.
Gesprächstraining
(2007)
FnhdC/HTML und FnhdC/S
(2007)
This paper aims to address these problems by dealing with theoretical and methodological questions concerning the national effects of the Bologna Process and the role national factors play in determining the impact of these effects. Altogether the purpose of the paper is to serve as a starting point for future research – both as a guide for systematic and comparative empirical work on higher education, but also for further theoretical and methodological reasoning concerning research on (higher) education policy. As higher education research so far particularly lacks an approach allowing for a competitive and systematic falsification of theoretical arguments by clearly indicating testable and specific hypothesis as well as variables behind the research design (Goedegebuure/Vught 1996) we propose to fall back on neighbouring disciplines, namely social science to improve and enhance the analysis (Slaughter 2001: 398; Altbach 2002: 154; Teichler 1996a: 433, 2005: 448). Several strands of research have to be considered – namely literature on Europeanization as well as insights and approaches of studies dealing with cross-national policy convergence. Taking into account the non-obligatory and mainly intergovernmental character of the Bologna Process the main focus of the paper is on factors related to the effects of transnational communication. The inherent goal is to extend the research agenda on higher education (McLendon 2003: 184ff) and to leave behind the restriction of to analyse only a few cases by striving for a research design that allows for systematic testing and sufficient explanations of cross-national policy convergence at the interface between the Bologna Process and domestic factors.
Den Schwerpunkt des Neuen im "Weiteren" bildet die Darstellung der Kombinemgeschichte im Deutschen, d.h. die Darstellung von Herausbildung, Integration und historischer Entwicklung des deutschen Interkombinems -esk. Ein "Chronologisches Register" deutscher Lehnwörter mit dem Segment |esk| und deutscher Lehn-Wortbildungsprodukte mit dem Lehnsuffix -esk ergänzt nicht nur die Artikelposition "Geschichtliche Entwicklung". Es verweist auch auf ein seinerseits chronologisch angelegtes "Wörterbuch" mit Artikeln und Dokumentationsteilen zu Wortaufkommen und Wortgeschichte wiederum von Lehnwörtern (wie "grotesk", "moresk") und Lehn-Wortbildungsprodukten (wie "hippiesk", "humoresk", "kafkaesk"). Die mit dem Kombinem -esk teilsynonymen Wortbildungseinheiten sind auswahlhaft im "Semantischen Paradigma" aufgeführt und unter bestimmten Aspekten -esk gegenübergestellt, aber nicht im eigentlichen Sinne behandelt (-artig, -haft, -isch). Im direkten Vergleich mit -esk ist hier auf Einzelprobleme verwiesen. Eine Ausnahme innerhalb des "Semantischen Paradigmas" bildet das teilsynonyme Lehnsyntagma à la, das eine eigenständige, wiederum historisch-entwicklungsbezogene, dokumentationsgestützte Darstellung erfahren hat. Ein nicht zufälliger Anhang schließt sich der wortgeschichtlich 'merkwürdigen' -esk-Kombination "gigantesk" an. Die in diesem Anhang behandelten, letztlich auf griechisch "Gígas", "Gígantos" zurückgehenden Lehnkombineme und semi-selbstständigen entlehnten Einheiten (gigant(o)-, giganto-, giga-, gigas, gigas-, giganteus) sind - mit Wortartikeln und Belegteilen - ebenfalls in ihrer Geschichte dargestellt.
Den Schwerpunkt des Neuen im "Weiteren" bildet die Darstellung der Kombinemgeschichte im Deutschen, d.h. die Darstellung von Herausbildung, Integration und historischer Entwicklung des deutschen Interkombinems -esk. Ein "Chronologisches Register" deutscher Lehnwörter mit dem Segment |esk| und deutscher Lehn-Wortbildungsprodukte mit dem Lehnsuffix -esk ergänzt nicht nur die Artikelposition "Geschichtliche Entwicklung". Es verweist auch auf ein seinerseits chronologisch angelegtes "Wörterbuch" mit Artikeln und Dokumentationsteilen zu Wortaufkommen und Wortgeschichte wiederum von Lehnwörtern (wie grotesk, moresk) und Lehn-Wortbildungsprodukten (wie hippiesk, humoresk, kafkaesk). Die mit dem Kombinem -esk teilsynonymen Wortbildungseinheiten sind auswahlhaft im "Semantischen Paradigma" aufgeführt und unter bestimmten Aspekten -esk gegenübergestellt, aber nicht im eigentlichen Sinne behandelt (-artig, -haft, -isch). Im direkten Vergleich mit -esk ist hier auf Einzelprobleme verwiesen. Eine Ausnahme innerhalb des "Semantischen Paradigmas" bildet das teilsynonyme Lehnsyntagma à la, das eine eigenständige, wiederum historisch-entwicklungsbezogene, dokumentationsgestützte Darstellung erfahren hat. Ein nicht zufälliger Anhang schließt sich der wortgeschichtlich 'merkwürdigen' -esk-Kombination gigantesk an. Die in diesem Anhang behandelten, letztlich auf griechisch Gígas, Gígantos zurückgehenden Lehnkombineme und semi-selbstständigen entlehnten Einheiten (gigant(o)-, giganto-, giga-, ...gigas, gigas-, ...giganteus) sind - mit Wortartikeln und Belegteilen - ebenfalls in ihrer Geschichte dargestellt.
ln diesem Beitrag sollen anhand von Materialien aus Gesprächskorpora des IDS Schwierigkeiten und Möglichkeiten der maschinellen Recherche vorgeführt werden. Grundlage dafür sind Gesprächstranskripte, die in digitaler Form vorliegen und in einem System mit Rechercheprozeduren zugreifbar sind. Mit diesem Ziel wird auf Rechercheverfahren zurückgegriffen, die in den 1990er Jahren in einem Projekt SHRGF.S im IDS als Anwendung der COSMAS-Technologie auf Gesprächskorpora entwickelt wurden. Die hier gegebenen Recherchemöglichkeiten werden an einem Auswahlkorpus von Gesprächstranskripten mit einem Gesamtumfang von 87.629 laufenden Wörtern versuchsweise angewendet und in ihren Beschränkungen und ihrer Fruchtbarkeit für explorative Untersuchungen betrachtet. Damit soll ein Beitrag zur Klärung der Frage geleistet werden, welche Recherchemöglichkeiten aus einer gesprächsanalytischen Perspektive vorstellbar und erwünscht sind und insofern bei der weiteren korpustechnologischen Entwicklung berücksichtigt werden sollten.
Vorwort
(2007)
Der Projektbericht stellt Ergebnisse des Teilprojekts "Erstellung eines Netzwerkes zur wissenschaftlichen Kooperation mit Russland" im Rahmen des Gesamtprojektes "Deutsch in Russland" vor. Das Teilprojekt beschäftigte sich mit der Erstellung eines weitflächigen Netzwerkes zur wissenschaftlichen Kooperation mit Russland. Zu diesem Zweck wurden im Oktober und Dezember 2006 Erkundungsreisen nach Russland unternommen und mit Wissenschaftlern vor Ort Kontakte geknüpft. Besucht wurden vor allem die Regionen, in denen heute noch die russlanddeutsche Bevölkerung stark vertreten ist und ihre Dialekte und Sprache an den Universitäten untersucht werden
Für diese Sammlung wurden relevante Publikationen zum Thema "Deutsche Sprach- und Dialektforschung in Russland nach 1990" ausgewählt und ins Deutsche übersetzt. In der Sammlung von Übersetzungstexten sind verschiedene Forschungsrichtungen vorhanden. Die Einleitung informiert näher über Aufbau und Themen der Sammlung. Jeder Übersetzung geht ein Kurzkommentar zum Inhalt voran.
Formen und Funktionen von Ethnolekten in multilingualen Lebenswelten - am Beispiel von Mannheim
(2007)
In this paper, I present some aspects of a youth group’s construction of a communicative style and show how the group’s stylistic repertoire changes over the course of their growing into adulthood. My paper is based on an ethnographic case study of a group of Turkish girls, the ‘Powergirls’, who grew up in a typical Turkish migrant neighborhood in the inner city of Mannheim, Germany. The aim of the case study was, on the basis of biographical interviews with group members and long-term observation of group interactions, to reconstruct the formation of an ethnically defined ‘ghetto’-clique and its style of communication and to describe the group’s development into educated, modern, German-Turkish young women. In this process, a change in the group’s stylistic repertoire could be observed.
Sprachliche Varianz und sprachliche Virtuosität türkisch-stämmiger Ghetto-Jugendlicher in Mannheim
(2007)
Der Beitrag gibt auf der Basis eines exemplarischen Falles Einblick in die Lebenswelt und in die kommunikativen Praktiken von türkischstämmigen, schulisch wenig erfolgreichen Migrantenjugendlichen, die aus der Sicht der deutschen Gesellschaft als „soziale Problemfalle“ charakterisiert werden. Er beschreibt auf der Basis natürlichen Gesprächsmaterials das sprachlich-kommunikative Repertoire eines ausgewählten Jugendlichen und filtert vor dem Hintergrund des regionalen Gebrauchsstandard die Merkmale heraus, die seine Sprechweise ‘fremd’ erscheinen lassen. Anhand ausgewählter Gesprächssequenzen werden charakteristische Variationsmuster dargestellt und die diskursiven, interaktiven und sozialen Funktionen sprachlicher Variation rekonstruiert. Die ethnografische und gesprächsanalytisch-linguistische Analyse führt zu dem Schluss, dass der geringe schulisch-berufliche Status des Jugendlichen in keiner sozial angemessenen Relation zu seinen hohen sprachlich-kommunikativen Fähigkeiten steht.
Deutsches Fremdwörterbuch R-Z: Rückblick und Ausblick. Zum Gedenken an Gerhard Strauß (1941-2006)
(2007)
Dieser Beitrag gliedert sich in zwei Teile. Der erste ist ein Rückblick auf das Deutsche Fremdwörterbuch in seinem (wörterbuch-)geschichtlichen Kontext, auf seine Entstehung und seine Fertigstellung im Institut für Deutsche Sprache (IDS). Der zweite ist ein eher persönlich gefärbter Ausblick auf die Lexikologie und Lexikographie des Fremdworts im Deutschen, der auf meinen während der Fertigstellung des Fremdwörterbuchs gemachten Erfahrungen beruht. Er geht exemplarisch auf zwei Fragenkomplexe näher ein, die nach meiner Überzeugung bei fundierten und sachgemäßen historischen Untersuchungen zum deutschen Fremdwort mitberücksichtigt werden müssen.
In diesem Beitrag geht es einerseits um eine Definition dessen, was korpusgestützte Lexikographie ist, und andererseits um eine Bestandsaufnahme der gegenwärtigen Praxis korpusgestützter Lexikographie. Dabei wird ein Schwerpunkt gelegt auf allgemeinsprachige Wörterbücher der Gegenwartssprache, deren Inhalt die Beschreibung von Bedeutung und Verwendung von Lexemen ist. Außerdem liegt die Einschätzung zugrunde, dass die Auswertung elektronischer Korpora die Wörterbucharbeit weitgehend positiv beeinflusst und verändert, vorausgesetzt, dass zugrunde gelegte Korpus wurde für das geplante Wörterbuch so gut wie möglich in Umfang und Zusammensetzung eingerichtet.
The project elexiko compiles an extensive, monolingual dictionary of Contemporary German. This contribution deals with the grammatical data in this dictionary; it is not only described how these are arranged content-wise depending on corpus data, but also how they were modelled.
Das Projekt elexiko erarbeitet ein umfangreiches, einsprachiges Wörterbuch des Gegenwartsdeutschen. In diesem Beitrag geht es um die grammatischen Angaben in diesem Wörterbuch; es wird nicht nur erläutert, wie diese inhaltlich in Abhängigkeit vom Prinzip der Korpusbasiertheit gestaltet sind, sondern auch, wie sie modelliert wurden.
Deutscher Wortschatz im Internet: Das Informationssystem elexiko und sein Modulprojekt Neologismen
(2007)
Der Beitrag bearbeitet (professionelles) Handeln in Sitzungen des Gemeinderats einer kleinstädtischen Kommune in Südwestdeutschland. Die Analyse konzentriert sich auf einen längeren Redebeitrag, der kommunalpolitische Professionalität nicht im unauffälligen Vollzug zeigt, sondern Probleme einer Verwaltungsangestellten bei der lokal gebundenen Bearbeitung ihrer Aufgabe, eine Bekanntgabe zu machen. Die dabei produzierte Äußerungsstruktur zeigt Spuren einer Orientierungsirritation, die insbesondere zu Beginn des Redebeitrags als Konflikt zwischen der Arbeit an der Herstellung von Gemeinschaft und der Orientierung an der Aufgabe des Informierens fassbar wird.
The research project “German Today” aims to determine the amount of regional variation in (near-) standard German spoken by young and older educated adults, and to identify and locate the regional features. To this end, an extensive corpus of read and spontaneous speech is currently being compiled. German is a so-called pluricentric language. With our corpus we aim to determine whether national or regional standards really exist. Furthermore, the linguistic variation due to different contextual styles (read vs. spontaneous speech) shall be analysed. Finally, the corpus will enable us to investigate whether linguistic change has occurred in the domain of the German standard language. The main focus of all research questions is on phonetic variation (lexical variation is only of minor interest). Read and spontaneous speech of four secondary school students (aged seventeen to twenty) and two fifty- to sixt-year-olds is recorded in 160 cities throughout the German-speaking area of Europe. All participants read a number of short texts and word lists, name pictures, translate from English, and take part in a sociobiographic interview and a map task experiment. The resulting corpus will comprise over 1000 hours of orthographically and (in part) phonetically transcribed speech.
In dieser Arbeit wird die adjektivische -(e)st-Form als originäre Steigerungsform (Elativ) betrachtet, die in Phrasen mit Definitartikel (als Superlativ) auch zum Vergleich dient. Abweichungen von dieser Normaldistribution, nämlich definite Nominalphrasen mit elativischer -(e)st-Form sowie superlativische Nominalphrasen mit "Null-Artikel" werden hinsichtlich grammatischer, semantischer und pragmatischer Vorkommensbedingungen erläutert.
This paper describes an approach to modelling a general-language wordnet, GermaNet, and a domain-specific wordnet, TermNet, in the web ontology language OWL. While the modelling process for GermaNet adopts relevant recommendations with respect to the English Princeton WordNet, for Term-Net an alternative modelling concept is developed that considers the special characteristics of domain-specific terminologies. We present a proposal for linking a general-language wordnet and a terminological wordnet within the framework of OWL and on this basis discuss problems and alternative modelling approaches.
In this article, we discuss the meaning and use of positional verbs in the South-Caucasian language Laz. Positional verbs are defined as those verbs which — in combination with one of several locational verbal prefixes (preverbs) — may appear in the basic construction that functions as an answer to a “where” question, the so-called basic locative construction (BLC). Within this class of verbs, we pay particular attention to those positionals which are used regularly in our data to describe the configuration of inanimate movable objects. Laz is shown to be a multiverb language, i.e., a language that uses a comparatively large set of verbs in the BLC. The fourteen verbs in question are PRV-dgun ‘stand’, PRV-ren ‘stand’, PRV-zun ‘lie’, PRV-xen ‘sit, stay’, PRV-bɣun ‘be located as mass’, PRV-mpiy ‘be spread’, PRV-sun ‘be smeared’, PRV-tun ‘cover’, PRV-bun ‘hang’, PRV-nʒoy ‘stick, be stuck’, PRV-n un ‘be dipped’, PRV- abun ‘stick to, be sticky’, PRV- orun ‘be bound’, PRV-gzun ‘burn’. The semantics and the use of these verbs are described in some detail including nontypical configurations, which trigger variation among speakers due to alternative categorizations and prototype effects.
In this paper we will investigate the meaning and use of positional verbs in colloquial Standard German. Positional verbs are defined as those verbs which may appear in the basic construction that functions as an answer to a “where”-question, the so-called Basic Locative Construction (BLC). Within this class of verbs, we focus on those positionals which are used to describe the configuration of inanimate movable objects. We will demonstrate that German exhibits the characteristics of a positional (or “multiverb”) language, i.e., a language that uses a comparatively large set of verbs in the BLC. The ten positionals used most frequently in our data are stehen ‘stand’, liegen ‘lie’, hängen ‘hang’, lehnen ‘lean’, stecken ‘be in tight fit, be stuck’, klemmen ‘be stuck, be jammed’, kleben ‘stick by means of glue’, haften ‘adhere’, schwimmen ‘be afloat in liquid’, and schweben ‘be afloat’. We will identify the conditions under which the positional verbs are used and provide a semantic characterization for each of them, paying particular attention to alternative categorizations, fuzzy boundaries and prototype effects.
Der Begriff und die Rolle von Daten in einer Wissenschaft hängen eng mit ihrem Selbstverständnis zusammen. Als erstes ist zu überlegen, inwiefern Linguistik eine empirische Wissenschaft ist und also von Daten abhängt.
Während in den Philologien ein Korpus die Grundlage einer Disziplin abgibt, die ohne es nicht bestünde, ist in der Linguistik ein Korpus nur ein Weg, an Daten zu kommen. Hier ist zu diskutieren, welche relativen Meriten die alternativen Wege im Hinblick auf die angestrebten Ziele haben.
Während manches auf uns gekommene Korpus seine Sprache sicher nicht angemessen repräsentiert, könnte eine heute von Linguisten erstellte Dokumentation diesen Anspruch im Prinzip einlösen. Hier stellt sich die Frage, ob das - angesichts des infiniten Charakters der Sprache - überhaupt möglich ist und in wieweit die Repräsentativität wieder von den angestrebten Zielen abhängt.
Dies sind alles Fragen linguistischer Methodologie. Eine Zeitlang hat man in der Linguistik geglaubt, ohne Methodologie zu Theorien gelangen zu können. Seit sich das als irrig herausgestellt hat, ist die Entwicklung von Methoden ein fühlbares Desiderat geworden. Wie man repräsentative Daten erhebt, wie man ein Korpus zusammenstellt und nutzt, wie man eine Sprache dokumentiert, sind alles Fragen, die eigentlich in die Alltagsroutine einer Wissenschaft fallen müssten. Dass sie noch weitgehend ungeklärt sind, ist ein Symptom dafür, dass die Linguistik noch keine erwachsene Wissenschaft ist.
Grundlage dieses Artikels* 1 ist das Verbundprojekt „Nachhaltigkeit linguistischer Daten“ der drei Sonderforschungsbereiche 441, 538 und 632, dessen Ziel es ist, Lösungen für die nachhaltige Verfügbarkeit der an den SFBs vorhandenen Korpora zu entwickeln. Ein zentraler Aspekt betrifft die Klärung der Rechtslage für die Nutzung und Weitergabe linguistischer Ressourcen, die durch das Urheber- sowie das Datenschutzrecht geschützt sind. Eine als indifferent wahrgenommene rechtliche Situation wird in der Praxis oft als das entscheidende Hindernis für die Weitergabe linguistischer Daten angeführt. Tatsächlich jedoch sind Nutzung und Weitergabe von Daten zu wissenschaftlichen Zwecken normativ geregelt. Problematisch ist oftmals die Einordnung der speziellen linguistischen Daten als Schutzgegenstand sowie die Tatsache, dass an linguistische Daten und Datensammlungen aufgrund ihrer komplexen und vielschichtigen Beschaffenheit durchaus mehrere Urheber Rechte besitzen können, die sich auf verschiedene Inhalte beziehen. Der Beitrag gibt einen Überblick über das geltende Recht sowie die juristischen und natürlichen Personen, die potentiell Rechte an linguistisch aufbereiteten Datenkollektionen besitzen. Es ist nicht Gegenstand dieses Artikels, rechtsverbindliche Aussagen zu treffen, die auf eine Nutzung und Weitergabe jedweder Daten angewandt werden. Der Artikel orientiert sich in seiner Struktur und thematischen Tiefe bewusst nicht an einem juristischen Publikum, sondern beschreibt die Problematik aus geisteswissenschaftlicher Perspektive. Zusammen mit einem Überblick über das vom Umgang mit linguistischen Datensammlungen betroffene Recht, das Urheberrechtsgesetz (Abschnitt 1) und das Bundesdatenschutzgesetz (Abschnitt 2), wird in den jeweiligen Abschnitten auch eine Klassifikation der Daten aus juristischer Sicht vorgenommen. Anschließend werden Lösungsansätze vorgestellt, die im Rahmen des o. g. Verbundprojektes erarbeitet werden (Abschnitt 3).
Die Universität Bonn verfügt über ein elektronisches Korpus von Immanuel Kants gesammelten Schriften gemäß den Abteilungen 1–3 der Akademie-Ausgabe. Dieses Korpus bildet die Grundlage einer elektronischen Edition der Schriften Kants, auf die über die Webseite des ehemaligen Instituts für Kommunikationsforschung und Phonetik zugegriffen werden kann: http://www.ikp.uni-bonn.de/kant/. Im vorliegenden Artikel wird über den Umfang und den Zustand des Bonner Korpus und der elektronischen Edition berichtet.
Im Beitrag werden korpuslinguistische Aspekte und Fragestellungen aus variationslinguistischer Perspektive diskutiert, wobei der Fokus auf der Analyse regionalsprachlicher Daten und Korpora des Deutschen liegt. Unter Regionalsprache wird hier der areal gebundene, sprechsprachliche Gesamtbereich „unterhalb“ der normierten Standardsprache verstanden, der sich von den lokalen Basisdialekten über Varietäten bzw. Sprechlagen des mittleren Bereichs bis hin zum standardnächsten Pol der Regionalsprache (Regionalakzent oder Regionalstandard) erstreckt.
Am Beginn des Beitrags steht ein Überblick über Datenklassen, die als empirische Grundlage für regionalsprachliche Fragestellungen herangezogen werden können. Eine Präsentation regionalsprachlicher Korpora, die auf den vorgestellten Datenklassen aufbauen, schließt sich an, wobei hier lediglich einige ausgewählte, online zugängliche Korpora Berücksichtigung finden (können). In einem nächsten Schritt werden die vorgestellten Korpora zur konkreten variationslinguistischen Analyse von zwei regionalsprachlichen Phänomenen aus dem lautlichen („g-Spirantisierung“) bzw. grammatischen Bereich („Rezipientenpassiv“) herangezogen und auf ihre Ergiebigkeit geprüft.
Es gibt viele linguistische Forschungsfragen, für deren Beantwortung man Korpusdaten qualitativ und quantitativ auswerten möchte. Beide Auswertungsmethoden können sich auf den Korpustext, aber auch auf Annotationsebenen beziehen. Jede Art von Annotation, also Kategorisierung, stellt einen kontrollierten und notwendigen Informationsverlust dar. Das bedeutet, dass jede Art von Kategorisierung auch eine Interpretation der Daten ist. In den meisten großen Korpora wird zu jeder vorgesehenen Annotationsebene, wie z. B. Wortart-Ebene oder Lemma-Ebene, genau eine Interpretation angeboten. In den letzten Jahren haben sich neben den großen, ,,flach“ annotierten Korpora Korpusmodelle herausgebildet, mit denen man konfligierende Informationen kodieren kann, die so genannten Mehrebenen-Modelle (multilevel standoff corpora), in denen alle Annotationsebenen unabhängig vom Text gespeichert werden und nur auf bestimmte Textanker verweisen. Ich argumentiere anhand der Fehlerannotation in einem Lernerkorpus dafür, dass zumindest Korpora, in denen es stark variierende Annotationsbedürfnisse und umstrittene Analysen geben kann, davon profitieren, in Mehrebenen-Modellen kodiert zu werden.
This study investigates the question of whether the processing of complex anaphors require more cognitive effort than the processing of NP-anaphors. Complex anaphors refer to abstract objects which are not introduced as a noun phrase and bring about the creation of a new discourse referent. This creation is called “complexation process”. We describe ERP findings which provide converging support for the assumption that the cognitive cost of this complexation process is higher than the cognitive cost of processing NP-anaphors.
In dem Beitrag werden jüngste Entwicklungen auf dem Gebiet der Sprachpolitik, der Bildungspolitik und der Integrationspolitik in Deutschland dargestellt, die ein neues Verhältnis zur Mehrsprachigkeit erkennen lassen und die Schaffung zweisprachiger Bildungseinrichtungen ermöglichen. Die deutsche Version dieses Beitrags ist nicht veröffentlicht, wohl aber die russische Version "Политические рамочные условия для создания и развития двуязычных детских дошкольных учреждений в Берлине" und die englische Version "The political framework for creation and development of bilingual Kindergartens in Berlin".
Vorliegende Studie beschreibt schlaglichtartig die jüngere Geschichte der deutschen Orthographie. Von den Bemühungen um eine Reform während des Nationalsozialismus über die Kontinuitäten und Reformbemühungen in den Dudenredaktionen Leipzig und Wiesbaden/Mannheim schlägt sie den Bogen bis zur amtlichen Neuregelung der Rechtschreibung 1996/2000 und der nachfolgenden Kritik bis 2006. Die wissenschaftlich fundierte und gleichzeitig inhaltsreiche, spannende Darstellung enthält zahlreiche historische Rückblenden, in denen die Kontinuität von Personen und Konzepten sowie die Texttradition und -rezeption im Wandel der Zeiten augenfällig gemacht wird.
Die beiliegende CD-ROM stellt wichtige, in der Darstellung erwähnte Dokumente zur Orthographie und ihrer Reform als Faksimile zur Verfügung.
Sprachkritik, dahinsickernd
(2007)
Three popular collections of essays concerning correct language use in German are reviewed from a linguist’s point of view. It is claimed that the overall picture of language that Sick conveys to the layperson is inadequate; in addition, the author fails to reflect explicitly on the purpose and consequences of his prescriptive approach to language use.