OPUS 4 | Search

11 search hits

1 to 11

Sort by

cOWIDplus (2020)

Wolfer, Sascha ; Koplenig, Alexander ; Michaelis, Frank ; Müller-Spitzer, Carolin

Die Corona-Krise hat Einfluss auf die Sprache in deutschsprachigen Online-Medien. Wir haben die Hypothese, dass sich die Vielfältigkeit des verwendeten Vokabulars einschränkt. Wir glauben zudem, dass sich die Diversität des Vokabulars nach "überstandener" Krise wieder auf ein "Prä-Pandemie-Niveau" einpendeln wird. Diese zweite Hypothese lässt sich erst im Laufe der Zeit überprüfen.

cOWIDplus Viewer (2020)

Wolfer, Sascha ; Koplenig, Alexander ; Michaelis, Frank ; Müller-Spitzer, Carolin

Diskurs - ethisch (2020)

Duden - Die deutsche Rechtschreibung. Auf der Grundlage der aktuellen amtlichen Rechtschreibregeln (2020)

Kasusmarkierung im Russischen und Deutschen. Eine Untersuchung bei bilingualen Vorschulkindern mit und ohne auffällige Sprachentwicklung (2020)

Werthmann, Antonina

KoGra-R 2.0: Standardisierte statistische Verfahren für korpusbasierte Häufigkeiten (2020)

Falke, Stefan ; Hansen-Morath, Sandra ; Wolfer, Sascha

Neuer Wortschatz rund um die Coronapandemie (2020)

Klosa-Kückelhaus, Annette ; Park, Maike ; Möhrs, Christine

In der Berichterstattung über die Coronapandemie werden einige für den deutschen Allgemeinwortschatz neue Wörter sowie bekannte Wörter mit neuen Bedeutungen verwendet. Manche sind aus dem Englischen entlehnt, andere im Deutschen gebildet. Neben etwas älteren Lexemen stehen ganz neue, neben solchen aus bestimmten Fachsprachen solche, die außerhalb von Fachkontexten entstanden sind. Sie erscheinen uns alle erklärenswert, selbst, wenn wir sie für das Neologismenwörterbuch zunächst noch beobachten.

Special Issue: Global Viewpoints on Lexicography and Neologisms (2020)

Special issue: language challenges in the 21st century (2020)

Using Automatic Speech Recognition in Spoken Corpus Curation (2020)

Gorisch, Jan ; Gref, Michael ; Schmidt, Thomas

The newest generation of speech technology caused a huge increase of audio-visual data nowadays being enhanced with orthographic transcripts such as in automatic subtitling in online platforms. Research data centers and archives contain a range of new and historical data, which are currently only partially transcribed and therefore only partially accessible for systematic querying. Automatic Speech Recognition (ASR) is one option of making that data accessible. This paper tests the usability of a state-of-the-art ASR-System on a historical (from the 1960s), but regionally balanced corpus of spoken German, and a relatively new corpus (from 2012) recorded in a narrow area. We observed a regional bias of the ASR-System with higher recognition scores for the north of Germany vs. lower scores for the south. A detailed analysis of the narrow region data revealed – despite relatively high ASR-confidence – some specific word errors due to a lack of regional adaptation. These findings need to be considered in decisions on further data processing and the curation of corpora, e.g. correcting transcripts or transcribing from scratch. Such geography-dependent analyses can also have the potential for ASR-development to make targeted data selection for training/adaptation and to increase the sensitivity towards varieties of pluricentric languages.

Von Weihnachtsmännern und Geschäftsleuten - Plural auf -männer und -leute (2020)

Konopka, Marek

1 to 11

Open Access

Refine

Author

Year of publication

Document Type

Language

Has Fulltext

Is part of the Bibliography

Keywords

Publicationstate

Reviewstate

Publisher

11 search hits