Volltext-Downloads (blau) und Frontdoor-Views (grau)
  • search hit 94 of 9850
Back to Result List

Empirische Verortung konzeptioneller Nähe/Mündlichkeit inner- und außerhalb schriftsprachlicher Korpora

  • Linguistische Studien arbeiten häufig mit einer Differenzierung zwischen gesprochener und geschriebener Sprache bzw. zwischen Kommunikation der Nähe und Distanz. Die Annahme eines Kontinuums zwischen diesen Polen bietet sich für eine Verortung unterschiedlichster Äußerungsformen an, inklusive unkonventioneller Textsorten wie etwa Popsongs. Wir konzipieren, implementieren und evaluieren ein automatisiertes Verfahren, das mithilfe unkorrelierter Entscheidungsbäume entsprechende Vorhersagen auf Textebene durchführt. Für die Identifizierung der Pole definieren wir einen Merkmalskatalog aus Sprachphänomenen, die als Markierer für Nähe/Mündlichkeit bzw. Distanz/Schriftlichkeit diskutiert werden, und wenden diesen auf prototypische Nähe-/Mündlichkeitstexte sowie prototypische Distanz-/Schrifttexte an. Basierend auf der sehr guten Klassifikationsgüte verorten wir anschließend eine Reihe weiterer Textsorten mithilfe der trainierten Klassifikatoren. Dabei erscheinen Popsongs als „mittige Textsorte“, die linguistisch motivierte Merkmale unterschiedlicher Kontinuumsstufen vereint. Weiterhin weisen wir nach, dass unsere Modelle mündlich kommunizierte, aber vorab oder nachträglich verschriftlichte Äußerungen wie Reden oder Interviews vollkommen anders verorten als prototypische Gesprächsdaten und decken Klassifikationsunterschiede für Social-Media-Varianten auf. Ziel ist dabei nicht eine systematisch-verbindliche Einordung im Kontinuum, sondern eine empirische Annäherung an die Frage, welche maschinell vergleichsweise einfach bestimmbaren Merkmale („shallow features“) nachweisbar Einfluss auf die Verortung haben.

Download full text files

Export metadata

Additional Services

Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Sarah BrollORCiDGND, Roman SchneiderORCiDGND
URN:urn:nbn:de:bsz:mh39-122057
DOI:https://doi.org/10.21248/jlcl.36.2023.240
ISSN:2190-6858
Parent Title (English):Journal for Language Technology and Computational Linguistics
Publisher:Gesellschaft für Sprachtechnologie und Computerlinguistik
Place of publication:Hildesheim
Document Type:Article
Language:German
Year of first Publication:2023
Date of Publication (online):2023/10/27
Publishing Institution:Leibniz-Institut für Deutsche Sprache (IDS)
Publicationstate:Veröffentlichungsversion
Reviewstate:Peer-Review
Tag:Distanz; Empirik; Features; Machine Learning; Mündlichkeit; Nähe; Schriftlichkeit; Textsorten
GND Keyword:Computerlinguistik; Empirische Linguistik; Klassifikation; Korpus <Linguistik>; Maschinelles Lernen; Mündlichkeit; Schriftsprache; Textsorte
Volume:36
Issue:1
First Page:113
Last Page:150
DDC classes:400 Sprache / 400 Sprache, Linguistik
Open Access?:ja
Leibniz-Classification:Sprache, Linguistik
Linguistics-Classification:Computerlinguistik
Program areas:G2: Sprachinformationssysteme
Licence (English):License LogoCreative Commons - Attribution-ShareAlike 4.0 International