@incollection{Senft2018, author = {Gunter Senft}, title = {\"Ich wei{\"s} nicht, was soll es bedeuten ...\" - Ethnolinguistische Winke zur Rolle von umfassenden Metadaten bei der (und f{\"u}r die) Arbeit mit Korpora}, series = {Sprachkorpora. Datenmengen und Erkenntnisfortschritt}, editor = {Werner Kallmeyer and Gisela Zifonun}, publisher = {de Gruyter}, address = {Berlin [u.a.]}, doi = {10.1515/9783110439083-010}, pages = {152 -- 168}, year = {2018}, abstract = {Arbeitet man als muttersprachlicher Sprecher des Deutschen mit Corpora gesprochener oder geschriebener deutscher Sprache, dann reflektiert man in aller Regel nur selten {\"u}ber die Vielzahl von kulturspezifischen Informationen, die in solchen Texten kodifiziert sind - vor allem, wenn es sich bei diesen Daten um Texte aus der Gegenwart handelt. In den meisten F{\"a}llen hat man n{\"a}mlich keinerlei Probleme mit dem in den Daten pr{\"a}supponierten und als allgemein bekannt erachteten Hintergrundswissen. Betrachtet man dagegen Daten in Corpora, die andere - vor allem nicht-indoeurop{\"a}ische - Sprachen dokumentieren, dann wird einem schnell bewusst, wieviel an kulturspezifischem Wissen n{\"o}tig ist, um diese Daten ad{\"a}quat zu verstehen. In meinem Beitrag illustriere ich diese Beobachtung an einem Beispiel aus meinem Corpus des Kilivila, der austronesischen Sprache der Trobriand-Insulaner von Papua-Neuguinea. Anhand eines kurzen Ausschnitts einer insgesamt etwa 26 Minuten dauernden Dokumentation, wor{\"u}ber und wie sechs Trobriander miteinander tratschen und klatschen, zeige ich, was ein H{\"o}rer oder Leser eines solchen kurzen Daten-Ausschnitts wissen muss, um nicht nur dem Gespr{\"a}ch {\"u}berhaupt folgen zu k{\"o}nnen, sondern auch um zu verstehen, was dabei abl{\"a}uft und wieso ein auf den ersten Blick absolut allt{\"a}gliches Gespr{\"a}ch pl{\"o}tzlich f{\"u}r einen Trobriander ungeheuer an Brisanz und Bedeutung gewinnt. Vor dem Hintergrund dieses Beispiels weise ich dann zum Schluss meines Beitrags darauf hin, wie unbedingt n{\"o}tig und erforderlich es ist, in allen Corpora bei der Erschlie{\"s}ung und Kommentierung von Datenmaterialien durch sogenannte Metadaten solche kulturspezifischen Informationen explizit zu machen.}, language = {de} }