Quantitative Linguistik
Refine
Year of publication
- 2021 (3) (remove)
Document Type
- Part of a Book (2)
- Article (1)
Has Fulltext
- yes (3)
Is part of the Bibliography
- yes (3)
Keywords
- COVID-19 (2)
- Deutsch (2)
- Lexikostatistik (2)
- Online-Medien (2)
- Vielfalt (2)
- Wortschatz (2)
- Effizienz (1)
- Informationstheorie (1)
- Schriftsprache (1)
- Sprachstatistik (1)
Publicationstate
Reviewstate
- (Verlags)-Lektorat (2)
- Peer-Review (1)
Publisher
cOWIDplus Analyse ist eine kontinuierlich aktualisierte Ressource zu der Frage, ob und wie stark sich der Wortschatz ausgewählter deutscher Online-Pressemeldungen während der Corona-Pandemie systematisch einschränkt und ob bzw. wann sich das Vokabular nach der Krise wieder ausweitet. In diesem Artikel erläutern die Autor*innen die hinter der Ressource stehende Forschungsfrage, die zugrunde gelegten Daten, die Methode sowie die bisherigen Ergebnisse.
Information theory can be used to assess how efficiently a message is transmitted on the basis of different symbolic systems. In this paper, I estimate the information-theoretic efficiency of written language for parallel text data in more than 1000 different languages, both on the level of characters and on the level of words as information encoding units. The main results show that (i) the median efficiency is ∼29% on the character level and ∼45% on the word level, (ii) efficiency on both levels is strongly correlated with each other and (iii) efficiency tends to be higher for languages with more speakers.