Refine
Year of publication
- 2007 (185) (remove)
Document Type
- Part of a Book (75)
- Article (63)
- Conference Proceeding (21)
- Book (16)
- Part of Periodical (6)
- Contribution to a Periodical (1)
- Master's Thesis (1)
- Preprint (1)
- Report (1)
Language
- German (146)
- English (37)
- Norwegian (1)
- Portuguese (1)
Keywords
- Deutsch (97)
- Korpus <Linguistik> (34)
- Konversationsanalyse (15)
- Gesprochene Sprache (11)
- Sprachgeschichte (9)
- Computerlinguistik (8)
- Grammatik (8)
- Semantik (8)
- Sprachpflege (7)
- Verb (7)
Publicationstate
- Veröffentlichungsversion (82)
- Zweitveröffentlichung (16)
- Postprint (11)
Reviewstate
Publisher
- de Gruyter (34)
- Narr (29)
- Institut für Deutsche Sprache (22)
- Equinox (4)
- Benjamins (3)
- Lang (3)
- Niemeyer (3)
- University of Birmingham (3)
- University of Illinois (3)
- Association for Computational Linguistics (2)
Die in diesem Band zusammengestellten Beiträge behandeln die Zeitlichkeit, Prozessualität und Flüchtigkeit des Gesprächs auf unterschiedlichen Beschreibungsebenen. Von der Prosodie und Syntax (Couper- Kuhlen, Auer, Günthner) über die Gestik (Streeck) bis hin zur Ebene unterschiedlicher konversationeller Aufgaben im Sinne des Formulierens (Dausendschön-Gay/Gülich/Krafft), des Fokussierens (Hausendorf), des Turn-Taking (Mondada), des Erzählens/Erklärens (Quasthoff/Kern) und des Beendens (Selting) wird gezeigt, welche Perspektiven die Prozessualitätsannahme für die Beschreibung sprachlich-kommunikativer Phänomene eröffnet und welcher Art die Ergebnisse sind, die man auf dieser Grundlage erzielen kann. Zudem wird ebenenübergreifend ein besonders eng mit der Prozessualität des Gesprächs verbundenes Merkmal in seiner methodologischen Relevanz hervorgehoben: die Flüchtigkeit gesprochener Sprache (Bergmann).
Deutsches Fremdwörterbuch R-Z: Rückblick und Ausblick. Zum Gedenken an Gerhard Strauß (1941-2006)
(2007)
Dieser Beitrag gliedert sich in zwei Teile. Der erste ist ein Rückblick auf das Deutsche Fremdwörterbuch in seinem (wörterbuch-)geschichtlichen Kontext, auf seine Entstehung und seine Fertigstellung im Institut für Deutsche Sprache (IDS). Der zweite ist ein eher persönlich gefärbter Ausblick auf die Lexikologie und Lexikographie des Fremdworts im Deutschen, der auf meinen während der Fertigstellung des Fremdwörterbuchs gemachten Erfahrungen beruht. Er geht exemplarisch auf zwei Fragenkomplexe näher ein, die nach meiner Überzeugung bei fundierten und sachgemäßen historischen Untersuchungen zum deutschen Fremdwort mitberücksichtigt werden müssen.
Für die Analyse der gesprochenen Sprache wurden in den letzten Jahrzehnten computerisierte Sprachkorpora bereitgestellt, die qualitative und quantitative Untersuchungen erlauben. Die nächste „Herausforderung“ für die Korpuslinguistik stellt heute der Gebrauch des „World Wide Webs“ als unerschöpflicher Datenbank dar. Theoretischen Überlegungen über das Potenzial des WWWs folgt ein praktisches Beispiel: die Verwendung deutscher sprechsprachlicher Relativkonstruktionen in „Webforen“.
We present an XML-based metadata standard for the documentation of speech and multimedia corpora that was developed at the Institute for German Language (IDS) in Mannheim, Germany. The IDS is one of the major institutions providing German speech and language corpora to researchers. These corpora stem from many different sources and were previously documented in a rather heterogeneous fashion using a variety of data models and formats. In order to unify the documentation for existing and future corpora, the IDS- internal Archive for Spoken German collaborated with several projects and developed a set of standardised XML metadata schemas. These XML schemas build on existing internal and external documentation schemas (such as IMDI) and take into account the workflow of speech corpus production. In order to minimise redundancy, separate schemas were designed for projects, speakers, recording sessions, and entire corpora. The resulting schemas are tested in ongoing speech and multi-media projects at the IDS and are regularly revised. They are accompanied by element definitions, guidelines, and examples. In addition, a mapping to IMDI will be provided.
Der vorliegende Band untersucht, wie Sprachwandel, Sprachvariation und Sprachkontakt einige wichtige germanische Sprachen transformieren und wie als Folge davon das Verhältnis von Standard und Varietäten (neu) konzeptualisiert wird. In welcher Weise beeinflussen und verändern Sprachkontaktprozesse die germanischen Sprachen heute, wie werden die Standardsprachen jeweils betroffen? Welche neuen Varietäten entstehen als Teil dieser Prozesse? Wie werden sprachliche Pluralität und Differenz im öffentlichen und sprachpolitischen Diskurs thematisiert, welche Rolle spielen sie in alltäglichen Erzählungen und Konversationen verschiedener sozialer Gruppen? Welche Sprachideologien entstehen in diesem Zusammenhang, und wie werden sie von den Medien geprägt? Wie beeinflussen solche Prozesse die politische Entscheidungsfindung, sprachliche Kodifizierung und Normierung?
Der Band untersucht diese und verwandte Fragestellungen mit Blick auf neuere Entwicklungen im gegenwärtigen Deutsch, Niederländisch, Friesisch, Niederdeutsch, Jiddisch, Norwegisch und Schwedisch. Gleichzeitig wird so auch ein guter Einblick in neuere Ansätze und Methoden der soziolinguistischen Forschung im Bereich der germanischen Sprachen gegeben.
Mit Beiträgen von: Christian Fandrych & Reinier Salverda, Wim Vandenbussche, Martin Durrell, Andrew Linn & Leigh Oakes, Jenny Carl & Patrick Stevenson, Jannis Androutsopoulos, Inken Keim & Ralf Knöbl, Stephan Elspaß, Nils Langer, Gertrud Reershemius, Roland Willemyns, Frans Hinskens.
Durch die Medienrevolution des Computerzeitalters hat auch die Lexikografie tiefgreifend verändert. Es stellen sich neue Fragen: Kann aus einer Datenbasis gleichzeitig ein gedrucktes und ein elektronisches Wörterbuch entwickelt werden? Welche innovativen Funktionalitäten können den Wörterbuchbenutzern im elektronischen Medium angeboten werden? Wie kann die Erarbeitung der Daten im lexikografischen Prozess bestmöglich unterstützt werden? Die Basis für die Möglichkeiten im Umgang mit den lexikografischen Daten bildet dabei die Datenmodellierung und -aufbereitung. Daher ist für die Erarbeitung eines Wörterbuchs eine Konzeption zur Modellierung und Aufbereitung der zugrunde liegenden Daten von entscheidender Bedeutung.
Die vorliegende Arbeit stellt nachdrücklich dar, wie eine wohlüberlegte, methodisch fundierte und vor allem anwendbare Datenmodellierung zu weitreichenden Verbesserungen der lexikografischen Praxis führt. Dazu wird ein Modell für den lexikografischen Prozess entwickelt, welches die Erarbeitung der Daten und die Recherchierbarkeit sowohl für Lexikografen als auch Wörterbuchbenutzer optimiert.
Vorliegende Studie beschreibt schlaglichtartig die jüngere Geschichte der deutschen Orthographie. Von den Bemühungen um eine Reform während des Nationalsozialismus über die Kontinuitäten und Reformbemühungen in den Dudenredaktionen Leipzig und Wiesbaden/Mannheim schlägt sie den Bogen bis zur amtlichen Neuregelung der Rechtschreibung 1996/2000 und der nachfolgenden Kritik bis 2006. Die wissenschaftlich fundierte und gleichzeitig inhaltsreiche, spannende Darstellung enthält zahlreiche historische Rückblenden, in denen die Kontinuität von Personen und Konzepten sowie die Texttradition und -rezeption im Wandel der Zeiten augenfällig gemacht wird.
Die beiliegende CD-ROM stellt wichtige, in der Darstellung erwähnte Dokumente zur Orthographie und ihrer Reform als Faksimile zur Verfügung.
Große Sprachkorpora sind als empirische Basis für die Arbeit des Linguisten zunehmend wichtig geworden. Dabei gehen die Arbeiten zum Korpusaufbau Hand in Hand mit der Entwicklung immer komfortablerer computerlinguistischer Werkzeuge zur Verwaltung und Analyse großer Datenmengen. Mit dem Fortschritt in den Möglichkeiten der Datenerschließung stellt sich die Frage, wie die Linguistik dies in Erkenntniszuwachs umsetzen kann. Diese aktuelle Frage nach dem Zusammenhang von Datenverfügbarkeit und Wissenszuwachs stand im Zentrum der Jahrestagung des Instituts für Deutsche Sprache 2006. Das Jahrbuch Sprachkorpora - Datenmengen und Erkenntnisfortschritt stellt theoretische und methodische Fragen zu Anlage und Nutzung großer Korpora ins Zentrum und behandelt sie aus der Sicht verschiedener linguistischer Teildisziplinen wie Grammatik, Lexik/Lexikographie, Pragmatik/Soziolinguistik und Computerlinguistik/Informatik. Dabei werden anhand von Darstellungen zu aktuellen Projekten die unterschiedlichen Anforderungen an die Zusammensetzung und Aufbereitung von Sprachkorpora und an die Recherchemöglichkeiten ebenso deutlich wie Kernfragen der Methodologie, z.B. nach dem Status des linguistischen Datums selbst oder nach der Verbindung von quantitativen und qualitativen Verfahren.
Im Beitrag werden korpuslinguistische Aspekte und Fragestellungen aus variationslinguistischer Perspektive diskutiert, wobei der Fokus auf der Analyse regionalsprachlicher Daten und Korpora des Deutschen liegt. Unter Regionalsprache wird hier der areal gebundene, sprechsprachliche Gesamtbereich „unterhalb“ der normierten Standardsprache verstanden, der sich von den lokalen Basisdialekten über Varietäten bzw. Sprechlagen des mittleren Bereichs bis hin zum standardnächsten Pol der Regionalsprache (Regionalakzent oder Regionalstandard) erstreckt.
Am Beginn des Beitrags steht ein Überblick über Datenklassen, die als empirische Grundlage für regionalsprachliche Fragestellungen herangezogen werden können. Eine Präsentation regionalsprachlicher Korpora, die auf den vorgestellten Datenklassen aufbauen, schließt sich an, wobei hier lediglich einige ausgewählte, online zugängliche Korpora Berücksichtigung finden (können). In einem nächsten Schritt werden die vorgestellten Korpora zur konkreten variationslinguistischen Analyse von zwei regionalsprachlichen Phänomenen aus dem lautlichen („g-Spirantisierung“) bzw. grammatischen Bereich („Rezipientenpassiv“) herangezogen und auf ihre Ergiebigkeit geprüft.
In diesem Beitrag wird untersucht, wie mithilfe korpuslinguistischer Verfahren Erkenntnisse über den Aufbau von Bedeutungsparaphrasen in Wörterbüchern gewonnen werden können. Diese Erkenntnisse sollen dazu genutzt werden, den Aufbau von Bedeutungsparaphrasen in Wörterbüchern umfassend und systematisch zu beschreiben, z.B. im Hinblick auf eine Optimierung der Bedeutungsparaphrasen für so genannte elektronische Wörterbücher oder für die Extraktion lexikalisch-semantischer Information für NLP-Zwecke.
Der Begriff und die Rolle von Daten in einer Wissenschaft hängen eng mit ihrem Selbstverständnis zusammen. Als erstes ist zu überlegen, inwiefern Linguistik eine empirische Wissenschaft ist und also von Daten abhängt.
Während in den Philologien ein Korpus die Grundlage einer Disziplin abgibt, die ohne es nicht bestünde, ist in der Linguistik ein Korpus nur ein Weg, an Daten zu kommen. Hier ist zu diskutieren, welche relativen Meriten die alternativen Wege im Hinblick auf die angestrebten Ziele haben.
Während manches auf uns gekommene Korpus seine Sprache sicher nicht angemessen repräsentiert, könnte eine heute von Linguisten erstellte Dokumentation diesen Anspruch im Prinzip einlösen. Hier stellt sich die Frage, ob das - angesichts des infiniten Charakters der Sprache - überhaupt möglich ist und in wieweit die Repräsentativität wieder von den angestrebten Zielen abhängt.
Dies sind alles Fragen linguistischer Methodologie. Eine Zeitlang hat man in der Linguistik geglaubt, ohne Methodologie zu Theorien gelangen zu können. Seit sich das als irrig herausgestellt hat, ist die Entwicklung von Methoden ein fühlbares Desiderat geworden. Wie man repräsentative Daten erhebt, wie man ein Korpus zusammenstellt und nutzt, wie man eine Sprache dokumentiert, sind alles Fragen, die eigentlich in die Alltagsroutine einer Wissenschaft fallen müssten. Dass sie noch weitgehend ungeklärt sind, ist ein Symptom dafür, dass die Linguistik noch keine erwachsene Wissenschaft ist.
Wer sich mit grammatischen Phänomenen historischer Sprachstufen beschäftigt, kann seine empirischen Daten bekanntermaßen nicht auf der Grundlage von Sprecherurteilen gewinnen, sondern muss zunächst Korpusrecherchen betreiben. Die Größe des auszuwählenden Korpus ist sehr stark phänomenabhängig: So reicht es im Bereich der Syntax in der Regel nicht aus, kleinere Textausschnitte aus verschiedenen Textquellen zu einem Korpus zusammenzufügen, vielmehr müssen vollständige Texte nicht nur nach raum-zeitlichen Koordinaten, sondern auch textsortenabhängig ausgewählt werden, um ein repräsentatives Korpus für eine spezifische Sprachstufe zu erstellen. Da eine manuelle Sichtung dieser doch recht großen Korpora sich sehr zeitaufwändig gestaltet, bietet sich gerade im Bereich der historischen Syntax der Einsatz von syntaktisch annotierten, digitalen Korpora an. Im folgenden Beitrag wird der Aufbau einer solchen Baumbank für das Frühneuhochdeutsche einschließlich der verfügbaren Recherchemöglichkeiten vorgestellt.
In diesem Aufsatz diskutiere ich drei syntaktische Phänomene, die für die Grammatikforschung von zentraler Bedeutung sind. Ich zeige, dass Introspektion als Stütze von Theorien nicht ausreicht und entwickle Korpusanfragen für die diskutierten Fälle. Der Aufsatz schließt mit Anmerkungen zu den Grenzen der Korpuslinguistik.