OPUS 4 | Sprache im 20. Jahrhundert. Gegenwartssprache

Einleitung (2022)

Dang-Anh, Mark ; Kämper, Heidrun ; Markewitz, Friedrich ; Scholl, Stefan ; Schuster, Britt-Marie ; Wilk, Nicole M.

Einleitung (2022)

Dang-Anh, Mark ; Kämper, Heidrun ; Markewitz, Friedrich ; Scholl, Stefan ; Schuster, Britt-Marie ; Wilk, Nicole M.

Korpuslinguistik im Internet. Neue Wege dialektologischer Forschung am Beispiel des virtuellen Deutschen Spracharchivs (2005)

Wagener, Peter

Ein Parallelkorpus im Einsatz: grammatische Variation im Bereich der Satzverbindung und Informationsverteilung (Deutsch - Norwegisch - Englisch/Französisch) (2012)

Fabricius-Hansen, Cathrine ; Ramm, Wiebke

Am Beispiel des an der Universität Oslo entwickelten Oslo Multilingual Corpus (OMC) wird illustriert, wie ein Parallelkorpus aus Originaltexten und deren Übersetzungen zur sprachvergleichenden Erforschung von Phänomenen der Satzverbindung und der Informationsverteilung auf Satz- und Textebene eingesetzt werden kann. Nach einer Skizze der OMC-Architektur wird eine Untersuchung von Satzverknüpfungen mit dem komitativen Konnektor „wobei“ und deren Entsprechungen in norwegischen Übersetzungen und Originaltexten vorgestellt, die dazu beiträgt, Bedeutungsfacetten dieses Konnektors aufzuzeigen, die in rein intralingualen Studien nicht so einfach zu erkennen sind, und dadurch einen besseren und systematischeren Einblick in die angewandten Übersetzungsstrategien gibt. Als zweites Einsatzbeispiel wird eine explorative Untersuchung zur Elaborierung von Ereignisbeschreibungen vorgestellt, die deutsche, norwegische, englische und französische Entsprechungen von „mit“-Konstruktionen (sog. „Sätzchen“) als Ausgangspunkt nimmt. Beide Studien illustrieren, dass ein Parallelkorpus auch ohne komplexe Annotierungen nicht nur für wort-basierte quantitative Untersuchungen verwertet werden, sondern auch im Zuge weniger zielgerichteter, eher qualitativ angelegter Studien als „Augenöffner“ für komplexe linguistische Phänomene dienen kann.

Muster, Dynamik, Komplexität – eine Einführung in den Gegenstand des Bandes (2018)

Engelberg, Stefan ; Lobin, Henning ; Steyer, Kathrin ; Wolfer, Sascha

In der Geschichte der Sprachwissenschaft hat das Lexikon in unterschiedlichem Maße Aufmerksamkeit erfahren. In jüngerer Zeit ist es vor allem durch die Verfügbarkeit sprachlicher Massendaten und die Entwicklung von Methoden zu ihrer Analyse wieder stärker ins Zentrum des Interesses gerückt. Dies hat aber nicht nur unseren Blick für lexikalische Phänomene geschärft, sondern hat gegenwärtig auch einen profunden Einfluss auf die Entstehung neuer Sprachtheorien, beginnend bei Fragen nach der Natur lexikalischen Wissens bis hin zur Auflösung der Lexikon-Grammatik-Dichotomie. Das Institut für Deutsche Sprache hat diese Entwicklungen zum Anlass genommen, sein aktuelles Jahrbuch in Anknüpfung an die Jahrestagung 2017 – „Wortschätze: Dynamik, Muster, Komplexität“ – der Theorie des Lexikons und den Methoden seiner Erforschung zu widmen.

Vorwort (2018)

Eichinger, Ludwig M.

Transcription Bottleneck of Speech Corpus Exploitation (2009)

Brinckmann, Caren

While written corpora can be exploited without any linguistic annotations, speech corpora need at least a basic transcription to be of any use for linguistic research. The basic annotation of speech data usually consists of time-aligned orthographic transcriptions. To answer phonetic or phonological research questions, phonetic transcriptions are needed as well. However, manual annotation is very time-consuming and requires considerable skill and near-native competence. Therefore it can take years of speech corpus compilation and annotation before any analyses can be carried out. In this paper, approaches that address the transcription bottleneck of speech corpus exploitation are presented and discussed, including crowdsourcing the orthographic transcription, automatic phonetic alignment, and query-driven annotation. Currently, query-driven annotation and automatic phonetic alignment are being combined and applied in two speech research projects at the Institut für Deutsche Sprache (IDS), whereas crowdsourcing the orthographic transcription still awaits implementation.

Einige Beobachtungen zu Häufigkeit, Stil, und journalistischen Einstellungen in west- und ostdeutschen Zeitungstexten (1985)

Hellmann, Manfred W.

Rettung - Pleite - Griechenland. Wortschatzstatistik in Zeiten der Finanzkrise (2017)

Adler, Astrid ; Perkuhn, Rainer ; Plewnia, Albrecht

Hat die Frauenbewegung Wortschatzgeschichte geschrieben? (2001)

Haß-Zumkehr, Ulrike

Lexikographische Erschließung des Wendekorpus (1996)

Hellmann, Manfred W.

Die Projekte "Kleines Wörterbuch des DDR spezifischen Wortschatzes" und "Lunder Korpus" (1984)

Hellmann, Manfred W.

Vom Text zum Wörterbuch. Ermittlung und Darstellung von DDR- und BRD-Spezifika im Bonner Maschinellen Korpus-Wörterbuch (1984)

Hellmann, Manfred W.

Neues im Wortgebrauch der Wendezeit. Zur Arbeit mit dem IDS-Wendekorpus (1998)

Herberg, Dieter

Dieser Beitrag nimmt Bezug auf ein lexikologisches Arbeitsprojekt des Instituts für deutsche Sprache (Mannheim) und will einen Einblick in die Voraussetzungen und Ziele dieses Vorhabens sowie in die Arbeitsweise der Projektmitarbeiter geben. Dabei soll Aspekten der Korpus- und Computernutzung in den einzelnen Arbeitsetappen besondere Aufmerksamkeit gelten.

Die deutsche Gegenwartssprache im Fokus korpusbasierter Lexikographie. Korpora als Grundlage moderner allgemeinsprachlicher Wörterbücher am Beispiel des WAHRIG Textkorpus digital (2010)

Krome, Sabine

Sprache der Wende – Wende der Sprache? Beharrungsvermögen und Dynamik von Strukturen im öffentlichen Sprachgebrauch (2008)

Fraas, Claudia ; Steyer, Kathrin

Der Beitrag diskutiert linguistische Fragestellungen und Probleme, die sich aus dem Projekt "Gesamtdeutsche Korpusinitiative" ergeben. Ausgangspunkt der Überlegungen ist die Frage, welchen Nutzen das Wendekorpus als Kern und eine weiterzuführende Dokumentation der deutschen Gegenwartssprache für sprachwissenschaftliche Analysen bringen könnte. Im Zentrum der Untersuchungen steht das Spannungsverhältnis zwischen Kontinuität, Variation und wirklichem Wandel der Sprachverwendung. Dabei schließt sich an übergreifende, sich von Einzelphänomenen lösende Aussagen zur Sprache der Wende (Abschnitt I.) die exemplarische Vorführung von Kontinuität und Dynamik sprachlicher Strukturen an Textausschnitten aus dem Wendekorpus an (Abschnitt II.).

Phraseologische und phraseographische Aspekte korpusgesteuerter Empirie (2007)

Brunner, Annelen ; Steyer, Kathrin

GAIS: Warum Hypermedia für Gesprächsanalyse? (2004)

Schütte, Wilfried

Der Umgang mit Gesprächskorpora am IDS Mannheim: Die Recherche in der COSMAS-II-Gesprächsdatenbank (2005)

Kallmeyer, Werner ; Schütte, Wilfried

Von der Tonbandaufnahme zur integrierten Text-Ton-Datenbank. Instrumente für die Arbeit mit Gesprächskorpora (2002)

Bodmer Mory, Franck ; Fach, Marcus L. ; Schmidt, Rudolf ; Schütte, Wilfried

The development of tools for computer-assisted transcription and analysis of extensive speech corpora is one main issue at the Institute of German Language (IDS) and the Institute of Natural Language Processing (IMS). Corpora of natural spoken dialogue have been transcribed, and the analogue recordings of these discourses are digitized. An automatic segmentation system is employed which is based on Hidden Markov Models. The orthographic representation of the speech signal is transformed into a phonetic representation, the phonetic transcription is transformed into a system-internal representation, and the time alignment between text and speech signal follows. In this article, we also describe the retrieval software Cosmas II and its special features for searching discourse transcripts and playing time aligned passages.

Open Access

Sprache im 20. Jahrhundert. Gegenwartssprache

Refine

Author

Year of publication

Document Type

Language

Has Fulltext

Is part of the Bibliography

Keywords

Publicationstate

Reviewstate

Publisher

22 search hits