Mathematische Häufigkeitsmaße in der Korpuslinguistik. Eigenschaften und Verwendung
- In der Korpuslinguistik und der Quantitativen Linguistik werden ganz verschiedenartige formale Maße verwendet, mit denen die Gebrauchshäufigkeit eines Wortes, eines Ausdrucks oder auch abstrakter oder komplexer sprachlicher Elemente in einem gegebenen Korpus gemessen und ggf. mit anderen Gebrauchshäufigkeiten verglichen werden kann. Im Folgenden soll für eine Auswahl dieser Maße (absolute Häufigkeit, relative Häufigkeit, Wahrscheinlichkeitsverteilung, Differenzenkoeffizient, Häufigkeitsklasse) zusammengefasst werden, wie sie definiert sind, welche Eigenschaften sie haben und unter welchen Bedingungen sie (sinnvoll) anwendbar und interpretierbar sind – dabei kann eine Rolle spielen, ob das Häufigkeitsmaß auf ein Korpus als Ganzes angewendet wird oder auf einzelne Teilkorpora. Zusätzlich zu den bei den einzelnen Häufigkeitsmaßen genannten Einschränkungen gilt generell der folgende vereinfachte Zusammenhang: Je seltener ein Wort im gegebenen Korpus insgesamt vorkommt und je kleiner dieses Korpus ist, desto stärker hängt die beobachtete Gebrauchshäufigkeit des Wortes von zufälligen Faktoren ab, d.h., desto geringer ist die statistische Zuverlässigkeit der Beobachtung.
Author: | Holger KeibelGND |
---|---|
URN: | urn:nbn:de:bsz:mh39-115862 |
URL: | http://www.ids-mannheim.de/kl/dokumente/freqMeasures.html |
DOI: | https://doi.org/10.14618/ids-pub-11586 |
Publisher: | Institut für Deutsche Sprache |
Place of publication: | Mannheim |
Document Type: | Other |
Language: | German |
Year of first Publication: | 2009 |
Date of Publication (online): | 2023/04/05 |
Publicationstate: | Veröffentlichungsversion |
Reviewstate: | (Verlags)-Lektorat |
Tag: | Absolute Häufigkeit; Differenzenkoeffizient; Gebrauchshäufigkeit; Häufigkeitsklasse; Häufigkeitsmaß; Mathematisches Häufigkeitsmaß; Relative Häufigkeit |
GND Keyword: | Häufigkeit; Korpus <Linguistik>; Sprachstatistik; Wahrscheinlichkeitsverteilung |
Page Number: | 11 |
Note: | Elektronisch dynamische Ressource |
DDC classes: | 400 Sprache / 400 Sprache, Linguistik |
Open Access?: | ja |
Leibniz-Classification: | Sprache, Linguistik |
Linguistics-Classification: | Korpuslinguistik |
Linguistics-Classification: | Quantitative Linguistik |
Licence (German): | Urheberrechtlich geschützt |