Volltext-Downloads (blau) und Frontdoor-Views (grau)

Applied corpus linguistics for lexicography: Sepedi negation as a case in point

Eine korpuslinguistische Untersuchung der Sepedi-Negation für die Lexikographie

  • So far, Sepedi negations have been considered more from the point of view of lexico­graphical treatment. Theoretical works on Sepedi have been used for this purpose, setting as an objective a neat description of these negations in a (paper) dictionary. This paper is from a different perspective: instead of theoretical works, corpus linguistic methods are used: (1) a Sepedi corpus is examined on the basis of existing descriptions of the occurrences of a relevant verb, looking at its negated forms from a purely prescriptive point of view; (2) a "corpus-driven" strategy is employed, looking only for sequences of negation particles (or morphemes) in order to list occurring con­structions, without taking into account the verbs occurring in them, apart from their endings. The approach in (2) is only intended to show a possible methodology to extend existing theories on occurring negations. We would also like to try to help lexicographers to establish a frequency-based order of entries of possible negation forms in their dictionaries by showing them the number of respective occurrences. As with all corpus linguistic work, however, we must regard corpus evidence not as representative, but as tendencies of language use that can be detected and described. This is especially true for Sepedi, for which only few and small corpora exist. This paper also describes the resources and tools used to create the necessary corpus and also how it was annotated with part of speech and lemmas. Exploring the quality of available Sepedi part-of-speech taggers concerning verbs, negation morphemes and subject concords may be a positive side result.
  • Bisher wurden Sepedi Negationen eher aus der Sicht der lexi­ko­graphischen Behandlung betrachtet. Hierfür wurden theoretische Werke über Sepedi ver­wendet, wobei als Zielsetzung eine saubere Beschreibung dieser Negationen in einem (Papier-)Wör­ter­buch gesetzt wurde. Dieser Beitrag ist aus einer anderen Perspektive: statt theoretischer Werke werden korpuslinguistische Methoden eingesetzt: (1) ein Sepedi Korpus wird auf Basis bestehender Beschrei­bungen zu den Vorkommen eines einschlägigen Verbs untersucht und dabei seine negierten Formen aus rein präskriptiver Sicht betrachtet; (2) wird eine "corpus-driven"-Strategie ein­gesetzt, bei dem nur nach Sequenzen von Negationspartikeln (oder Morphemen) gesucht wird, um vor­kom­mende Konstruktionen auflisten zu können, ohne dabei die dabei vorkommenden Verben — abgesehen von ihrer Endung — zu berücksichtigen. Der Ansatz in (2) soll dabei nur eine mögliche Methodik aufzeigen, um bestehende Theorien über vorkommende Negationen erweitern zu können. Wir möchten auch versuchen, Lexikographen darin zu unterstützen, eine frequenz­basierte Reihen­folge der Einträge möglicher Negationsformen in ihren Wörterbüchern aufzu­stellen, in dem wir ihnen die Anzahl der jeweiligen Okkurrenzen aufzeigen. Wie bei allen korpus­linguis­tischen Arbei­ten müssen wir jedoch Korpusevidenz nicht als repräsentativ ansehen, sondern als Tendenzen des Sprach­gebrauchs, die festgestellt und beschrieben werden können. Dies gilt insbeson­dere für Sepedi, für das nur wenige und kleine Korpora existieren. Dieser Beitrag beschreibt außerdem die Ressourcen und Werkzeuge, die verwendet wurden, um das nötige Kor­pus zu erstellen und auch, wie dieses mit Wortart und Grundformen der Wörter angereichert wurde. Ein Nebenergebnis ist dabei die Unter­suchung der Qualität von verfügbaren Taggern bzgl. Verben, Negationsmorphemen und Kon­gruenzpartikel.

Export metadata

Additional Services

Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Gertrud FaaßORCiD
URN:urn:nbn:de:bsz:mh39-116271
DOI:https://doi.org/10.5788/32-2-1698
ISSN:2224-0039
Parent Title (English):Lexikos
Document Type:Article
Language:English
Year of first Publication:2022
Date of Publication (online):2023/05/02
Publishing Institution:Leibniz-Institut für Deutsche Sprache (IDS)
Publicationstate:Veröffentlichungsversion
Reviewstate:Peer-Review
Tag:Bearbeitung von Korpusanfragen; Korpuslinguistik; Lexikographie; Nega­tionen; Nord-Sotho; Sepedi; Tagging; Wörterbücher afrikanischer Sprachen
African languages dictionaries; Northern Sotho; Sepedi; corpus linguistics; corpus query processing; lexicography; negation; part-of-speech tagging
GND Keyword:Annotation; Korpus <Linguistik>; Lexikografie; Negation; Pedi-Sprache; Wörterbuch
Volume:32
Issue:2
First Page:82
Last Page:104
DDC classes:400 Sprache / 400 Sprache, Linguistik
Open Access?:ja
Linguistics-Classification:Korpuslinguistik
Linguistics-Classification:Lexikografie
Licence (English):License LogoCreative Commons - Attribution 4.0 International