Refine
Year of publication
- 2019 (223) (remove)
Document Type
- Part of a Book (80)
- Article (76)
- Conference Proceeding (25)
- Book (22)
- Other (7)
- Review (6)
- Part of Periodical (3)
- Working Paper (3)
- Report (1)
Language
- German (153)
- English (68)
- Multiple languages (1)
- Chinese (1)
Is part of the Bibliography
- yes (223) (remove)
Keywords
- Deutsch (92)
- Korpus <Linguistik> (48)
- Gesprochene Sprache (18)
- Automatische Sprachanalyse (11)
- Grammatik (11)
- Sprache (11)
- Interaktionsanalyse (10)
- Sprachstatistik (10)
- Pragmatik (9)
- Annotation (8)
Publicationstate
- Zweitveröffentlichung (111)
- Veröffentlichungsversion (79)
- Postprint (16)
- Erstveröffentlichung (2)
Reviewstate
- (Verlags)-Lektorat (92)
- Peer-Review (92)
- (Verlags-)Lektorat (2)
- Peer review (1)
- Peer-review (1)
Publisher
- de Gruyter (41)
- Leibniz-Institut für Deutsche Sprache (IDS) (18)
- Erich Schmidt (13)
- Narr Francke Attempto (10)
- German Society for Computational Linguistics & Language Technology und Friedrich-Alexander-Universität Erlangen-Nürnberg (8)
- Leibniz-Institut für Deutsche Sprache (7)
- Lang (6)
- Narr (6)
- Winter (6)
- Buske (5)
Wird aus Sprache Gewalt?
(2019)
Nach dem Mord am Kasseler Regierungspräsidenten Walter Lübcke und weiteren Mordanschlägen in der jüngsten Vergangenheit wurde in Kommentaren und Stellungnahmen immer wieder behauptet, dass hier Sprache in Gewalt umgeschlagen sei. Dies ist einerseits naheliegend vor dem Hintergrund dessen, was wir über die Täter und ihre Äußerungen wissen. Was aber sagt die Wissenschaft dazu? Wie ist aus sprach- und kommunikationswissenschaftlicher Sicht dieser angenommene Zusammenhang zu bewerten?
Wörterbuchartikel
(2019)
Nach dem Mord am Kasseler Regierungspräsidenten Walter Lübcke und weiteren Mordanschlägen in der jüngsten Vergangenheit wurde in Kommentaren und Stellungnahmen immer wieder behauptet, dass hier Sprache in Gewalt umgeschlagen sei. Dies ist einerseits naheliegend vor dem Hintergrund dessen, was wir über die Täter und ihre Äußerungen wissen. Was aber sagt die Wissenschaft dazu?
Automatic division of spoken language transcripts into sentence-like units is a challenging problem, caused by disfluencies, ungrammatical structures and the lack of punctuation. We present experiments on dividing up German spoken dialogues where we investigate the impact of task setup and data representation, encoding of context information as well as different model architectures for this task.
We discuss the impact of data bias on abusive language detection. We show that classification scores on popular datasets reported in previous work are much lower under realistic settings in which this bias is reduced. Such biases are most notably observed on datasets that are created by focused sampling instead of random sampling. Datasets with a higher proportion of implicit abuse are more affected than datasets with a lower proportion.
We examine the new task of detecting derogatory compounds (e.g. curry muncher). Derogatory compounds are much more difficult to detect than derogatory unigrams (e.g. idiot) since they are more sparsely represented in lexical resources previously found effective for this task (e.g. Wiktionary). We propose an unsupervised classification approach that incorporates linguistic properties of compounds. It mostly depends on a simple distributional representation. We compare our approach against previously established methods proposed for extracting derogatory unigrams.