400 Sprache, Linguistik
Refine
Document Type
- Article (3)
- Conference Proceeding (1)
Has Fulltext
- yes (4)
Keywords
- Klassifikation (4) (remove)
Publicationstate
- Veröffentlichungsversion (2)
- Zweitveröffentlichung (2)
- Postprint (1)
Reviewstate
- Peer-Review (4)
Linguistische Studien arbeiten häufig mit einer Differenzierung zwischen gesprochener und geschriebener Sprache bzw. zwischen Kommunikation der Nähe und Distanz. Die Annahme eines Kontinuums zwischen diesen Polen bietet sich für eine Verortung unterschiedlichster Äußerungsformen an, inklusive unkonventioneller Textsorten wie etwa Popsongs. Wir konzipieren, implementieren und evaluieren ein automatisiertes Verfahren, das mithilfe unkorrelierter Entscheidungsbäume entsprechende Vorhersagen auf Textebene durchführt. Für die Identifizierung der Pole definieren wir einen Merkmalskatalog aus Sprachphänomenen, die als Markierer für Nähe/Mündlichkeit bzw. Distanz/Schriftlichkeit diskutiert werden, und wenden diesen auf prototypische Nähe-/Mündlichkeitstexte sowie prototypische Distanz-/Schrifttexte an. Basierend auf der sehr guten Klassifikationsgüte verorten wir anschließend eine Reihe weiterer Textsorten mithilfe der trainierten Klassifikatoren. Dabei erscheinen Popsongs als „mittige Textsorte“, die linguistisch motivierte Merkmale unterschiedlicher Kontinuumsstufen vereint. Weiterhin weisen wir nach, dass unsere Modelle mündlich kommunizierte, aber vorab oder nachträglich verschriftlichte Äußerungen wie Reden oder Interviews vollkommen anders verorten als prototypische Gesprächsdaten und decken Klassifikationsunterschiede für Social-Media-Varianten auf. Ziel ist dabei nicht eine systematisch-verbindliche Einordung im Kontinuum, sondern eine empirische Annäherung an die Frage, welche maschinell vergleichsweise einfach bestimmbaren Merkmale („shallow features“) nachweisbar Einfluss auf die Verortung haben.
Klassische Namen der Offline-Welt sind bei weitem umfangreicher erforscht als die eher kurzlebigen und auch noch sehr jungen Namen der digitalen Welt. Im vorliegenden Beitrag werden virtuelle Namen als eigene Namenklasse postuliert und unter Verweis auf bestehende Namentypologien verortet. Anschließend werden drei unterschiedliche Typen frei wählbarer virtueller Namen in Videospielen am Beispiel des populären Browserspiels ‚Forge of Empires‘ graphematisch und semantisch analysiert: Gilden-, Städte- und Benutzernamen. Hierfür werden drei Korpora mit je 100 Namen des jeweiligen Typs auf unterschiedliche Muster zunächst hinsichtlich Sprachwahl, Zeichenverwendung und graphematischen Besonderheiten untersucht. Anschließend erfolgt eine Untersuchung der den Namen zugrundeliegenden Benennungsmotive durch induktiv-explorative Kategorienbildung. Zwischen den untersuchten Namentypen kristallisiert sich in der Analyse ein funktionaler Unterschied heraus: Gildennamen priorisieren eine kommunikativ-phatische Funktion, wohingegen Benutzernamen primär Individualität ausdrücken. Städtenamen nehmen dabei eine Zwischenposition ein. Insgesamt fügen sich die verschiedenen Teilergebnisse in das Bild der bisherigen spärlichen Studien zur Namenwahl in Videospielen ein und rufen zugleich zur weiteren Erforschung auf.
Alleviating pain is good and abandoning hope is bad. We instinctively understand how words like alleviate and abandon affect the polarity of a phrase, inverting or weakening it. When these words are content words, such as verbs, nouns, and adjectives, we refer to them as polarity shifters. Shifters are a frequent occurrence in human language and an important part of successfully modeling negation in sentiment analysis; yet research on negation modeling has focused almost exclusively on a small handful of closed-class negation words, such as not, no, and without. A major reason for this is that shifters are far more lexically diverse than negation words, but no resources exist to help identify them. We seek to remedy this lack of shifter resources by introducing a large lexicon of polarity shifters that covers English verbs, nouns, and adjectives. Creating the lexicon entirely by hand would be prohibitively expensive. Instead, we develop a bootstrapping approach that combines automatic classification with human verification to ensure the high quality of our lexicon while reducing annotation costs by over 70%. Our approach leverages a number of linguistic insights; while some features are based on textual patterns, others use semantic resources or syntactic relatedness. The created lexicon is evaluated both on a polarity shifter gold standard and on a polarity classification task.
The sentiment polarity of an expression (whether it is perceived as positive, negative or neutral) can be influenced by a number of phenomena, foremost among them negation. Apart from closed-class negation words like no, not or without, negation can also be caused by so-called polarity shifters. These are content words, such as verbs, nouns or adjectives, that shift polarities in their opposite direction, e. g. abandoned in “abandoned hope” or alleviate in “alleviate pain”. Many polarity shifters can affect both positive and negative polar expressions, shifting them towards the opposing polarity. However, other shifters are restricted to a single shifting direction. Recoup shifts negative to positive in “recoup your losses”, but does not affect the positive polarity of fortune in “recoup a fortune”. Existing polarity shifter lexica only specify whether a word can, in general, cause shifting, but they do not specify when this is limited to one shifting direction. To address this issue we introduce a supervised classifier that determines the shifting direction of shifters. This classifier uses both resource-driven features, such as WordNet relations, and data-driven features like in-context polarity conflicts. Using this classifier we enhance the largest available polarity shifter lexicon.