Refine
Year of publication
Document Type
- Other (38) (remove)
Language
- German (38) (remove)
Is part of the Bibliography
- no (38) (remove)
Keywords
- Deutsch (20)
- Korpus <Linguistik> (4)
- Grammatik (3)
- Linguistik (3)
- Sprachwandel (3)
- Bedeutung (2)
- Computerlinguistik (2)
- Diskursanalyse (2)
- Forschungsdaten (2)
- Fremdwort (2)
Publicationstate
- Veröffentlichungsversion (22)
- Postprint (2)
- Zweitveröffentlichung (2)
Reviewstate
- (Verlags)-Lektorat (22)
- Peer-review (1)
Publisher
- Institut für Deutsche Sprache (17)
- Beck (1)
- Deutsche Gesellschaft für Sprachwissenschaft (1)
- Dresdner Bank (1)
- Faust-Kultur (1)
- Frankfurter Allgemeine (1)
- Germanistisches Seminar der Universität Heidelberg (1)
- Institut für deutsche Sprache (1)
- Institut für deutsche Sprache (IDS) (1)
- Leibniz-Institut für Deutsche Sprache (IDS) (1)
In der Korpuslinguistik und der Quantitativen Linguistik werden ganz verschiedenartige formale Maße verwendet, mit denen die Gebrauchshäufigkeit eines Wortes, eines Ausdrucks oder auch abstrakter oder komplexer sprachlicher Elemente in einem gegebenen Korpus gemessen und ggf. mit anderen Gebrauchshäufigkeiten verglichen werden kann. Im Folgenden soll für eine Auswahl dieser Maße (absolute Häufigkeit, relative Häufigkeit, Wahrscheinlichkeitsverteilung, Differenzenkoeffizient, Häufigkeitsklasse) zusammengefasst werden, wie sie definiert sind, welche Eigenschaften sie haben und unter welchen Bedingungen sie (sinnvoll) anwendbar und interpretierbar sind – dabei kann eine Rolle spielen, ob das Häufigkeitsmaß auf ein Korpus als Ganzes angewendet wird oder auf einzelne Teilkorpora. Zusätzlich zu den bei den einzelnen Häufigkeitsmaßen genannten Einschränkungen gilt generell der folgende vereinfachte Zusammenhang: Je seltener ein Wort im gegebenen Korpus insgesamt vorkommt und je kleiner dieses Korpus ist, desto stärker hängt die beobachtete Gebrauchshäufigkeit des Wortes von zufälligen Faktoren ab, d.h., desto geringer ist die statistische Zuverlässigkeit der Beobachtung.
Datenmanagement wird durch die Forschungsföderungsorganisationen (etwa in Horizon 2020 der EU, die Allianz der deutschen Wissenschaftsorganisationen oder in DFG geförderten Projekten) mehr und mehr Teil der Forschungslandschaft. Für die Computerlinguistik ist das Forschungsdatenmanagement aber auch Teil des Forschungsgebietes: Datenmodellierung und Transformation für die nachhaltige Datenspeicherung gehören in den Bereich der Texttechnologie und Textlinguistik, ebenso die Modellierung der beschreibenden Daten zu Datensätzen.
Kein Grund zur Panikmache
(2002)
Flexionsmorphologie
(2004)
Wortarten
(2018)
Konnektoren
(2018)
Numerus
(2012)
X-Worträtsel
(1992)