OPUS 4 | Sprache im 20. Jahrhundert. Gegenwartssprache

Rettung - Pleite - Griechenland. Wortschatzstatistik in Zeiten der Finanzkrise (2017)

Adler, Astrid ; Perkuhn, Rainer ; Plewnia, Albrecht

Von der Tonbandaufnahme zur integrierten Text-Ton-Datenbank. Instrumente für die Arbeit mit Gesprächskorpora (2002)

Bodmer Mory, Franck ; Fach, Marcus L. ; Schmidt, Rudolf ; Schütte, Wilfried

The development of tools for computer-assisted transcription and analysis of extensive speech corpora is one main issue at the Institute of German Language (IDS) and the Institute of Natural Language Processing (IMS). Corpora of natural spoken dialogue have been transcribed, and the analogue recordings of these discourses are digitized. An automatic segmentation system is employed which is based on Hidden Markov Models. The orthographic representation of the speech signal is transformed into a phonetic representation, the phonetic transcription is transformed into a system-internal representation, and the time alignment between text and speech signal follows. In this article, we also describe the retrieval software Cosmas II and its special features for searching discourse transcripts and playing time aligned passages.

Transcription Bottleneck of Speech Corpus Exploitation (2009)

Brinckmann, Caren

While written corpora can be exploited without any linguistic annotations, speech corpora need at least a basic transcription to be of any use for linguistic research. The basic annotation of speech data usually consists of time-aligned orthographic transcriptions. To answer phonetic or phonological research questions, phonetic transcriptions are needed as well. However, manual annotation is very time-consuming and requires considerable skill and near-native competence. Therefore it can take years of speech corpus compilation and annotation before any analyses can be carried out. In this paper, approaches that address the transcription bottleneck of speech corpus exploitation are presented and discussed, including crowdsourcing the orthographic transcription, automatic phonetic alignment, and query-driven annotation. Currently, query-driven annotation and automatic phonetic alignment are being combined and applied in two speech research projects at the Institut für Deutsche Sprache (IDS), whereas crowdsourcing the orthographic transcription still awaits implementation.

Phraseologische und phraseographische Aspekte korpusgesteuerter Empirie (2007)

Brunner, Annelen ; Steyer, Kathrin

Einleitung (2022)

Dang-Anh, Mark ; Kämper, Heidrun ; Markewitz, Friedrich ; Scholl, Stefan ; Schuster, Britt-Marie ; Wilk, Nicole M.

Einleitung (2022)

Dang-Anh, Mark ; Kämper, Heidrun ; Markewitz, Friedrich ; Scholl, Stefan ; Schuster, Britt-Marie ; Wilk, Nicole M.

Vorwort (2018)

Eichinger, Ludwig M.

Muster, Dynamik, Komplexität – eine Einführung in den Gegenstand des Bandes (2018)

Engelberg, Stefan ; Lobin, Henning ; Steyer, Kathrin ; Wolfer, Sascha

In der Geschichte der Sprachwissenschaft hat das Lexikon in unterschiedlichem Maße Aufmerksamkeit erfahren. In jüngerer Zeit ist es vor allem durch die Verfügbarkeit sprachlicher Massendaten und die Entwicklung von Methoden zu ihrer Analyse wieder stärker ins Zentrum des Interesses gerückt. Dies hat aber nicht nur unseren Blick für lexikalische Phänomene geschärft, sondern hat gegenwärtig auch einen profunden Einfluss auf die Entstehung neuer Sprachtheorien, beginnend bei Fragen nach der Natur lexikalischen Wissens bis hin zur Auflösung der Lexikon-Grammatik-Dichotomie. Das Institut für Deutsche Sprache hat diese Entwicklungen zum Anlass genommen, sein aktuelles Jahrbuch in Anknüpfung an die Jahrestagung 2017 – „Wortschätze: Dynamik, Muster, Komplexität“ – der Theorie des Lexikons und den Methoden seiner Erforschung zu widmen.

Ein Parallelkorpus im Einsatz: grammatische Variation im Bereich der Satzverbindung und Informationsverteilung (Deutsch - Norwegisch - Englisch/Französisch) (2012)

Fabricius-Hansen, Cathrine ; Ramm, Wiebke

Am Beispiel des an der Universität Oslo entwickelten Oslo Multilingual Corpus (OMC) wird illustriert, wie ein Parallelkorpus aus Originaltexten und deren Übersetzungen zur sprachvergleichenden Erforschung von Phänomenen der Satzverbindung und der Informationsverteilung auf Satz- und Textebene eingesetzt werden kann. Nach einer Skizze der OMC-Architektur wird eine Untersuchung von Satzverknüpfungen mit dem komitativen Konnektor „wobei“ und deren Entsprechungen in norwegischen Übersetzungen und Originaltexten vorgestellt, die dazu beiträgt, Bedeutungsfacetten dieses Konnektors aufzuzeigen, die in rein intralingualen Studien nicht so einfach zu erkennen sind, und dadurch einen besseren und systematischeren Einblick in die angewandten Übersetzungsstrategien gibt. Als zweites Einsatzbeispiel wird eine explorative Untersuchung zur Elaborierung von Ereignisbeschreibungen vorgestellt, die deutsche, norwegische, englische und französische Entsprechungen von „mit“-Konstruktionen (sog. „Sätzchen“) als Ausgangspunkt nimmt. Beide Studien illustrieren, dass ein Parallelkorpus auch ohne komplexe Annotierungen nicht nur für wort-basierte quantitative Untersuchungen verwertet werden, sondern auch im Zuge weniger zielgerichteter, eher qualitativ angelegter Studien als „Augenöffner“ für komplexe linguistische Phänomene dienen kann.

Instrumente für die Arbeit mit Korpora gesprochener Sprache. Text-Ton-Alignment und COSMAS II (2000)

Fiehler, Reinhard ; Schütte, Wilfried

Sprache der Wende – Wende der Sprache? Beharrungsvermögen und Dynamik von Strukturen im öffentlichen Sprachgebrauch (2008)

Fraas, Claudia ; Steyer, Kathrin

Der Beitrag diskutiert linguistische Fragestellungen und Probleme, die sich aus dem Projekt "Gesamtdeutsche Korpusinitiative" ergeben. Ausgangspunkt der Überlegungen ist die Frage, welchen Nutzen das Wendekorpus als Kern und eine weiterzuführende Dokumentation der deutschen Gegenwartssprache für sprachwissenschaftliche Analysen bringen könnte. Im Zentrum der Untersuchungen steht das Spannungsverhältnis zwischen Kontinuität, Variation und wirklichem Wandel der Sprachverwendung. Dabei schließt sich an übergreifende, sich von Einzelphänomenen lösende Aussagen zur Sprache der Wende (Abschnitt I.) die exemplarische Vorführung von Kontinuität und Dynamik sprachlicher Strukturen an Textausschnitten aus dem Wendekorpus an (Abschnitt II.).

Hat die Frauenbewegung Wortschatzgeschichte geschrieben? (2001)

Haß-Zumkehr, Ulrike

Lexikographische Erschließung des Wendekorpus (1996)

Hellmann, Manfred W.

Das Bonner Zeitungskorpus Teil 1 (1984)

Hellmann, Manfred W.

Vom Text zum Wörterbuch. Ermittlung und Darstellung von DDR- und BRD-Spezifika im Bonner Maschinellen Korpus-Wörterbuch (1984)

Hellmann, Manfred W.

Die Projekte "Kleines Wörterbuch des DDR spezifischen Wortschatzes" und "Lunder Korpus" (1984)

Hellmann, Manfred W.

Einige Beobachtungen zu Häufigkeit, Stil, und journalistischen Einstellungen in west- und ostdeutschen Zeitungstexten (1985)

Hellmann, Manfred W.

Neues im Wortgebrauch der Wendezeit. Zur Arbeit mit dem IDS-Wendekorpus (1998)

Herberg, Dieter

Dieser Beitrag nimmt Bezug auf ein lexikologisches Arbeitsprojekt des Instituts für deutsche Sprache (Mannheim) und will einen Einblick in die Voraussetzungen und Ziele dieses Vorhabens sowie in die Arbeitsweise der Projektmitarbeiter geben. Dabei soll Aspekten der Korpus- und Computernutzung in den einzelnen Arbeitsetappen besondere Aufmerksamkeit gelten.

Der Umgang mit Gesprächskorpora am IDS Mannheim: Die Recherche in der COSMAS-II-Gesprächsdatenbank (2005)

Kallmeyer, Werner ; Schütte, Wilfried

Die deutsche Gegenwartssprache im Fokus korpusbasierter Lexikographie. Korpora als Grundlage moderner allgemeinsprachlicher Wörterbücher am Beispiel des WAHRIG Textkorpus digital (2010)

Krome, Sabine

Angebote zu den Korpora der deutschen Gegenwartsschriftsprache am Leibniz-Institut für Deutsche Sprache, Mannheim (2022)

Perkuhn, Rainer

Korpora sind – als idealerweise digital verfüg- und auswertbare Sammlungen von Texten – eine wertvolle empirische Grundlage linguistischer Studien. Eigene Korpora aufzubauen ist, je nach Sprachausschnitt, mit unterschiedlichen Herausforderungen verbunden. Zu allen Texten sollten Metadaten zu den Textentstehungsbedingungen (Zeit, Quelle usw.) erhoben werden, um diese als Variablen in Auswertungen einbeziehen zu können. Andere Informationen wie etwa die Themenzugehörigkeit (oder Annotationen auch unterhalb der Textebene) sind auch hilfreich, in vielerlei Hinsicht aber schwieriger pauschal taxonomisch vorzugeben, geschweige denn, operationell zu ermitteln. Jenseits der »materiellen« Verfügbarkeit der Texte und der technischen Aufbereitung sind es das Urheberrecht, vor allem Lizenz- bzw. Nutzungsrechte, sowie ethische Verantwortung und Persönlichkeitsrechte, die beachtet werden müssen, auch um zu gewährleisten, dass die Daten für die Reproduktion der Studien Dritten rechtssicher zugänglich gemacht werden dürfen. Bevor für ein Vorhaben ein neues Korpus aufgebaut wird, sollte deshalb am besten geprüft werden, ob nicht ein geeignetes bereits zur Verfügung steht. Wenn ein Korpus aufgebaut wird, sollte für eine nachhaltige Aufbewahrung und Zugänglichmachung gesorgt und die Existenz an geeigneter Stelle dokumentiert werden.

ATLAS.ti 5 – ein Werkzeug zur qualitativen Datenanalyse (2007)

Schütte, Wilfried

GAIS: Warum Hypermedia für Gesprächsanalyse? (2004)

Schütte, Wilfried

Wenn der Schwanz mit dem Hund wedelt. Zum linguistischen Erklärungspotenzial der korpusbasierten Kookkurrenzanalyse (2002)

Steyer, Kathrin

Korpus, Statistik, Kookkurrenz. Lässt sich Idiomatisches “berechnen”? (2003)

Steyer, Kathrin

Korpuslinguistik im Internet. Neue Wege dialektologischer Forschung am Beispiel des virtuellen Deutschen Spracharchivs (2005)

Wagener, Peter

Gesprochenes Deutsch online. Zur Modernisierung des Deutschen Spracharchivs (2002)

Wagener, Peter

In recent decades, the investigation of spoken language has become increasingly important in linguistic research. However, the spoken word is a fleeting phenomenon which is difficult to analyse and which requires an elaborate process of examination and appraisal. The Institute for the German Language (Institut für Deutsche Sprache) has the largest collection of recordings of spoken German, the German Speech Archive (Deutsches Spracharchiv [DSAv]). Up to now, the inadequate processing and accessibility of the valuable material held by the DSAv has been regarded as its major shortcoming. A solution to this problem is at hand now that a start has been made with the systematic modernization of the DSAv and, in particular, with the digitalization of its material. In recent years, we have been able to systematically exploit the unique opportunities provided by a new and easier form of access to the spoken language via the recorded sound signal, which can be realized digitally in the computer, and its linkage to the corresponding texts and documentary data. Through the integration of the existing data about the corpora and of the written versions of the texts into an information and full text database and through the linking of these data with the acoustic signal itself, it is now possible for us to construct a data pool which allows a better documentation of the material and provides rapid internal and external access to the sound recordings. Processed in such a way, the material of the German Speech Archive can now be regarded as having been saved for posterity. As a result, entirely new areas of inquiry and entirely new research perspectives have been opened up. This is true both for the work of the Institute itself and for linguistic research in German as a whole.

Sprechen im Umbruch. Zeitzeugen erzählen und argumentieren rund um den Fall der Mauer im Wendekorpus (2019)

Sprache in Politik und Gesellschaft. Perspektiven und Zugänge (2022)

Sprache ist politisch, und politisches Handeln vollzieht sich nie ohne Sprache. Sprachgebrauch bzw. sprachliches Handeln stehen dabei in einer unauflösbaren Wechselbeziehung mit der gesellschaftlich-politischen Wirklichkeit. Diese Wechselbeziehung aus verschiedenen Perspektiven zu analysieren, ist das Ziel der in diesem Band versammelten Beiträge, mit denen die Jahrestagung 2021 des Leibniz-Instituts für Deutsche Sprache dokumentiert wird. Dabei geht es nicht zuletzt um die gesellschaftliche Verantwortung, die die Sprachwissenschaft – wie alle Sozialwissenschaften – hat. Diese Verantwortung besteht darin zu zeigen, welche Rolle und Funktion Sprache im gesellschaftlich-politischen Kontext zukommt. Mit diesem Anspruch bekommen Themen aus dem Bereich Sprache, Politik und Gesellschaft sowohl gegenwarts- als auch vergangenheitsbezogen eine neue Relevanz. Der Zugang ist dabei dezidiert transdisziplinär, neben der Linguistik sind insbesondere auch die Politologie und die Geschichtswissenschaft beteiligt.

Open Access

Sprache im 20. Jahrhundert. Gegenwartssprache

Refine

Author

Year of publication

Document Type

Language

Has Fulltext

Is part of the Bibliography

Keywords

Publicationstate

Reviewstate

Publisher

29 search hits