Refine
Year of publication
- 2020 (137) (remove)
Document Type
- Part of a Book (98)
- Article (29)
- Conference Proceeding (8)
- Book (1)
- Other (1)
Keywords
- Deutsch (52)
- Korpus <Linguistik> (24)
- Mundart (20)
- Dialektologie (15)
- Social Media (14)
- Sprachgebrauch (12)
- Gesprochene Sprache (11)
- Grammatik (10)
- Terminologie (9)
- Sprachvariante (8)
Publicationstate
- Zweitveröffentlichung (137) (remove)
Reviewstate
- (Verlags)-Lektorat (95)
- Peer-Review (41)
Publisher
Seit dem Präsidentschaftswahlkampf in den USA sorgen „Fake News“ für eine lebhafte wissenschaftliche Debatte. Bisherige Definitionen sind allerdings weder einheitlich noch widerspruchsfrei und werden zudem nicht nachvollziehbar entwickelt, sondern meist einfach gesetzt. Unser Beitrag will dieses Theoriedefizit mittels einer Begriffsexplikation unter Rückgriff auf Literatur zu Desinformation, Lüge und (öffentliche) Kommunikation abstellen. Dabei ersetzen wir den Begriff „Fake News“ durch „aktuelle Desinformation“ und erörtern systematisch, welche Bedingungen notwendig sind, um von diesem Phänomen sprechen zu können. Wir definieren aktuelle Desinformation als Kommunikation wissentlich und empirisch falscher Informationen zu neuen und relevanten Sachverhalten mit dem Anspruch auf Wahrheit.
We present a new resource for German causal language, with annotations in context for verbs, nouns and adpositions. Our dataset includes 4,390 annotated instances for more than 150 different triggers. The annotation scheme distinguishes three different types of causal events (CONSEQUENCE, MOTIVATION, PURPOSE). We also provide annotations for semantic roles, i.e. of the cause and effect for the causal event as well as the actor and affected party, if present. In the paper, we present inter-annotator agreement scores for our dataset and discuss problems for annotating causal language. Finally, we present experiments where we frame causal annotation as a sequence labelling problem and report baseline results for the prediciton of causal arguments and for predicting different types of causation.
In diesem Beitrag werden neue, repräsentative Daten zur arealen Variation in Deutschland vorgestellt, die das Leibniz-Institut für Deutsche Sprache im Rahmen der Innovationsstichprobe des Sozio-ökonomischen Panels (SOEP) des Deutschen Instituts für Wirtschaftsforschung (DIW) in der Befragungsrunde 2017/2018 erhoben hat. Zum einen wurde die Dialektkompetenz abgefragt; überindividuell zeigt sich hier das bekannte Nord-Süd-Gefälle, beim individuellen Grad der Kompetenz der Dialektsprecher gibt es aber regional nur geringe Unterschiede. Zum anderen wurden die Bewertungen von Dialekten erhoben; hier werden Norddeutsch und Bayerisch besonders positiv, Sächsisch hingegen besonders negativ bewertet, wobei regionale Muster eine Rolle spielen. Auffällig ist ferner die bundesweit sehr einheitlich positive Bewertung des Hochdeutschen.
Die Terminologielehre(speziell die Terminologielehre nach Eugen Wüster)liefert eine Basis und Methoden für terminologische Anwendungen in der Praxis. Viele Unternehmen und Institutionen richten ihr Terminologiemanagement danach aus. Nach einer kurzen Vorstellung der entsprechenden Ziele und Prozesse werden wichtige Typen von Begriffssystemen dargestellt, und es wird aufgezeigt, welche positiven Effekte das Erarbeiten von Begriffssystemen auf die Qualität der Terminologiearbeit hat. Als nächster inhaltlicher Schwerpunkt werden Möglichkeiten und Besonderheiten der Terminologieverwaltung unter besonderer Berücksichtigung der Eintragsmodellierung in terminologischen Datenbanken erörtert. Den Abschluss der Betrachtungen bildet die Zusammenführung der zwei Bereiche: Welche Optionen stehen für die Repräsentation von Begriffssystemen in Terminologieverwaltungssystemen zur Verfügung bzw. können dort umgesetzt werden?
Der Beitrag zeigt die Dialekte auf, die im Rahmen eines Online-Fragebogens von österreichischen Gewährspersonen als besonders „beliebt“, „unbeliebt“ sowie als „markant/auffällig“ bewertet wurden ebenso wie die hierfür herangezogenen Begründungen. In einem zweiten Schritt wird mithilfe eines Hörerurteilstests belegt, dass die als „auffällig“ empfundenen Dialekte durchaus erkannt und zu einem Großteil korrekt dem richtigen Bundesland zugeordnet werden. Dies sind vor allem das Vorarlbergerische und Tirolerische neben dem Kärntnerischen, Wienerischen und Steirischen.
Bericht vom ersten nationalen Best-Practice-Workshop der deutschen Open-Access-Monografienfonds
(2020)
Beyond Citations: Corpus-based Methods for Detecting the Impact of Research Outcomes on Society
(2020)
This paper proposes, implements and evaluates a novel, corpus-based approach for identifying categories indicative of the impact of research via a deductive (top-down, from theory to data) and an inductive (bottom-up, from data to theory) approach. The resulting categorization schemes differ in substance. Research outcomes are typically assessed by using bibliometric methods, such as citation counts and patterns, or alternative metrics, such as references to research in the media. Shortcomings with these methods are their inability to identify impact of research beyond academia (bibliometrics) and considering text-based impact indicators beyond those that capture attention (altmetrics). We address these limitations by leveraging a mixed-methods approach for eliciting impact categories from experts, project personnel (deductive) and texts (inductive). Using these categories, we label a corpus of project reports per category schema, and apply supervised machine learning to infer these categories from project reports. The classification results show that we can predict deductively and inductively derived impact categories with 76.39% and 78.81% accuracy (F1-score), respectively. Our approach can complement solutions from bibliometrics and scientometrics for assessing the impact of research and studying the scope and types of advancements transferred from academia to society.
Im vorliegenden Beitrag werden erstmals Daten zweier aktueller Projekte zu Einstellungen von Deutschschweizer/-innen zu Hochdeutsch und Dialekt verglichen. Dabei wird beleuchtet, welche Unterschiede und Gemeinsamkeiten sich in den Daten der Samples – einem bezüglich Bildung und Beruf heterogenen und einem bezüglich dieser Faktoren homogenen – feststellen lassen. Es zeigt sich eine vielschichtige Konzeptualisierung des Hochdeutschen in beiden Studien, die mit der Annahme unterschiedlicher mentaler Hochdeutsch-Modelle (Norm, Plurizentrizität, Schriftlichkeit, Mündlichkeit mit zwei Untermodellen) erklärt werden kann.
Blogg Dir deinen Urlaub nach Tunesien! Zur Erläuterung des Musters [VImp PROPReflexivDat NPAkk]
(2020)
In diesem Beitrag soll das Muster [VImp PROPReflexivDat NPAkk] semantisch und syntaktisch erläutert werden. Dieses Muster, das semantisch mit Verben des Erwerbens wie anschaffen korreliert, wird auch im Zusammenhang mit Kommunikationsverben wie bloggen und facebooken sowie mit dem Kontaktverb rubbeln belegt. Mithilfe des Konzeptes der Koerzion bzw. der semantischen Anpassung soll das Kovorkommen des erwänhten Musters mit diesen Verben beschrieben und erklärt werden. Als empirische Quelle dient das Korpus für das Deutsche 2012 und 2014 aus den Corpora from the Web. Die vorliegende Untersuchung ist im Rahmen meiner Dissertationsarbeit zum Thema Argumentstruktur und Bedeutung medialer Kommunikationsverben des Deutschen und des Spanischen im Sprachvergleich durchgeführt worden.
Im Projekt fussballlinguistik.de baue ich Korpora mit schriftlichen und mündlichen Texten aus dem Bereich der Fußballberichterstattung auf und mache sie über das webbasierte Tool CQPweb (Hardie 2012) der Fachöffentlichkeit zuganglich (Meier 2017). Die Korpora (www.fussballlinguistik.de/korpora) enthalten vornehmlich internetbasierte Texte wie etwa Liveticker, Spielberichte und Taktikanalysen, aber auch transkribierte Radioreportagen im Umfang von 44,8 Mio. Tokens (Stand Marz 2019) in den Sprachen Deutsch, Englisch, Niederländisch und Russisch in vollständig annotierter Form. Ein Teil der Daten ist zudem in das Deutsche Referenzkorpus (DeReKo 2018–II) eingegangen. Die seit gut 50 Jahren etablierte sprachwissenschaftliche Forschung zur Sprache des Fußballs hat dadurch eine in ihrer Themenspezifik einzigartige empirische Ressource erhalten.
Are borrowed neologisms accepted more slowly into the German language than German words resulting from the application of word formation rules? This study addresses this question by focusing on two possible indicators for the acceptance of neologisms: a) frequency development of 239 German neologisms from the 1990s (loanwords as well as new words resulting from the application of word formation rules) in the German reference corpus DeReKo and b) frequency development in the use of pragmatic markers (‘flags’, namely quotation marks and phrases such as sogenannt ‘so-called’) with these words. In the second part of the article, a psycholinguistic approach to evaluating the (psychological) status of different neologisms and non-words in an experimentally controlled study and plans to carry out interviews in a field test to collect speakers’ opinions on the acceptance of the analysed neologisms are outlined. Finally, implications for the lexicographic treatment of both types of neologisms are discussed.
Ancient Chinese poetry is constituted by structured language that deviates from ordinary language usage; its poetic genres impose unique combinatory constraints on linguistic elements. How does the constrained poetic structure facilitate speech segmentation when common linguistic and statistical cues are unreliable to listeners in poems? We generated artificial Jueju, which arguably has the most constrained structure in ancient Chinese poetry, and presented each poem twice as an isochronous sequence of syllables to native Mandarin speakers while conducting magnetoencephalography (MEG) recording. We found that listeners deployed their prior knowledge of Jueju to build the line structure and to establish the conceptual flow of Jueju. Unprecedentedly, we found a phase precession phenomenon indicating predictive processes of speech segmentation—the neural phase advanced faster after listeners acquired knowledge of incoming speech. The statistical co-occurrence of monosyllabic words in Jueju negatively correlated with speech segmentation, which provides an alternative perspective on how statistical cues facilitate speech segmentation. Our findings suggest that constrained poetic structures serve as a temporal map for listeners to group speech contents and to predict incoming speech signals. Listeners can parse speech streams by using not only grammatical and statistical cues but also their prior knowledge of the form of language.
The present paper outlines the projected second part of the Corpus Query Lingua Franca (CQLF) family of standards: CQLF Ontology, which is currently in the process of standardization at the International Standards Organization (ISO), in its Technical Committee 37, Subcommittee 4 (TC37SC4) and its national mirrors. The first part of the family, ISO 24623-1 (henceforth CQLF Metamodel), was successfully adopted as an international standard at the beginning of 2018. The present paper reflects the state of the CQLF Ontology at the moment of submission for the Committee Draft ballot. We provide a brief overview of the CQLF Metamodel, present the assumptions and aims of the CQLF Ontology, its basic structure, and its potential extended applications. The full ontology is expected to emerge from a community process, starting from an initial version created by the authors of the present paper.
Corpus REDEWIEDERGABE
(2020)
This article presents the corpus REDEWIEDERGABE, a German-language historical corpus with detailed annotations for speech, thought and writing representation (ST&WR). With approximately 490,000 tokens, it is the largest resource of its kind. It can be used to answer literary and linguistic research questions and serve as training material for machine learning. This paper describes the composition of the corpus and the annotation structure, discusses some methodological decisions and gives basic statistics about the forms of ST&WR found in this corpus.
Südtirol ist eine mehrsprachige italienische Provinz, in der die Verwendung unterschiedlicher Sprachen, besonders Deutsch und Italienisch, sowie der lokalen deutschen Dialekte in der mündlichen Kommunikation in formalen wie informalen Sprechsituationen einen hohen gesellschaftlichen Stellenwert hat. Mit der Frage, welche Sprachen bzw. Varietäten in der schriftlichen Alltagskommunikation verwendet werden und welche soziolinguistischen Faktoren dabei eine Rolle spielen, hat sich das Projekt DiDi befasst, in dem die Sprach- und Varietätenverwendung in Facebook-Texten näher untersucht wurden. Dabei stellte sich unter anderem heraus, dass das Schreiben im Dialekt besonders unter Jugendlichen weit verbreitet ist (Glaznieks/Frey 2018). Mithilfe des aus diesem Projekt entstandenen und für wissenschaftliche Nutzung frei zugänglichen Facebook-Korpus kann die Sprach- und Varietätenverwendung Südtiroler Facebooknutzer/innen in der internetbasierten Kommunikation aus unterschiedlichen linguistischen Perspektiven untersucht werden.
Dieser Beitrag widmet sich der Beschreibung des Korpus Deutsch in Namibia (DNam), das über die Datenbank für Gesprochenes Deutsch (DGD) frei zugänglich ist. Bei diesem Korpus handelt es sich um eine neue digitale Ressource, die den Sprachgebrauch der deutschsprachigen Minderheit in Namibia sowie die zugehörigen Spracheinstellungen umfassend und systematisch dokumentiert. Wir beschreiben die Datenerhebung und die dabei angewandten Methoden (freie Gespräche, „Sprachsituationen“, semi-strukturierte Interviews), die Datenaufbereitung inklusive Transkription, Normalisierung und Tagging sowie die Eigenschaften des verfügbaren Korpus (Umfang, verfügbare Metadaten usw.) und einige grundlegende Funktionalitäten im Rahmen der DGD. Erste Forschungsergebnisse, die mithilfe der neuen Ressource erzielt wurden, veranschaulichen die vielseitige Nutzbarkeit des Korpus für Fragestellungen aus den Bereichen Kontakt-, Variations-
und Soziolinguistik.
In internetgestützten Medien ist eine Reihe von medienspezifischen Kommunikationspraktiken entstanden - vom Flaming und Trolling aus der Frühzeit des Internet bis zum für die Sozialen Medien charakteristischen Shitstorm. In diesem Beitrag befasse ich mich anhand einer Fallstudie eines von mir als „personalisiert“ bezeichneten Shitstorms gegen die Sprachwissenschaftlerin Luise Pusch mit der Frage, inwiefern diese Form des Shitstorms mit den medialen Eigenschaften sozialer Netze - speziell, des Netzwerks Twitter - zusammenhängt und welche gesellschaftlichen Rahmenbedingungen er benötigt.
Der Weihnachtsbrief
(2020)
Die diesjährige Jahrestagung des Leibniz-Instituts für Deutsche Sprache in Mannheim mit dem Titel „Deutsch in Europa“ zielte auf eine Perspektivenerweiterung ab. In zwölf Fachvorträgen, neun Projektvorstellungen im Rahmen einer Methodenmesse und einer Podiumsdiskussion wurden sprachpolitische, grammatische und methodische Aspekte des sprachlichen Nebeneinanders in Europa, des Sprachvergleichs und des Deutscherwerbs diskutiert.
Im alltäglichen Leben sind Sozialen Medien kaum mehr entbehrlich: ob zum Zweck der Kommunikation, wie auf WhatsApp, zum Teilen von Inhalten und Fotos, z.B. durch Facebook und Instagram, oder zur Teilhabe am Weltgeschehen über Twitter. Der Band untersucht, ob und wie Soziale Medien unsere Kommunikation und auch unsere Sprache verändern und welche neuartigen kommunikativen Formen der Gebrauch Sozialer Medien hervorgebracht hat.
Dialekt und Regiolekt in der politischen Kommunikation: Code-Switching, -Mixing und -Shifting
(2020)
Politische Kommunikation erfolgt in Bayern im Kontinuum zwischen Standardsprache, Regiolekt und Basisdialekt. Dieser Wechsel zwischen den Sprechlagen in der bayerischen Kommunalpolitik ist Gegenstand dieses Beitrags. Das zugrundeliegende Korpus besteht aus Aufzeichnungen von Stadtratssitzungen in zwei Kleinstädten im mittelbairischen Dialektgebiet Niederbayerns. Dieser Beitrag will die im Untersuchungsmaterial festgestellten Wechselphänomene des Code-Switching, -Mixing und -Shifting anhand der sprecherinternen (interindividuellen) Schwankungen des Abstands zur Standardsprache sowohl phonetisch, als auch unter Berücksichtigung der innersprachlichen Ebenen Lexik, Morphologie und Syntax sowie unter dem Aspekt der Sprecherstrategien untersuchen.
Die Thematisierung von Dialekt im Unterricht ist einem größeren Wandel unterworfen. Als neue Komponente trat der dialektale Spracherwerb hinzu, für den insbesondere im niederdeutschen Sprachraum Strukturen und Materialien geschaffen wurden und fortgesetzt ergänzt werden. Bedeutsam ist die Abgrenzung dialekt- und regionalsprachdidaktischer Zielsetzungen. Regionalsprachliche Reflexion und gesteuerter Dialekterwerb betreffen unterschiedliche Lernziele, die in einen neuen Einklang einer parallelen Existenz im Unterrichtsgeschehen zu bringen sind.
Innerhalb der Wahrnehmungsdialektologie werden Begriffe oft vortheoretisch benutzt. Ziel dieses Beitrages ist, ein an den Bedürfnissen der Disziplin orientierten Begriff dialektologischen Wissens zu entwerfen, der auf den Wissenserwerb wie auf die Repräsentation gleichermaßen eingeht. Dafür wird zunächst eine Bestandsaufnahme bisheriger Konzeptionen vorgenommen, von der ausgehend im Anschluss an Erkenntnisse der kognitiven Linguistik ein neuer Wissensbegriff entworfen wird. Das Zentrum ist dabei das sogenannte Epistemikon, das die einzelnen Wissensbestände (Episteme) in sich vereint und organisiert.
Sprachliche Zeichen im öffentlichen Raum (Linguistic Landscape - LL) tragen neben ihrer primären Bedeutung und Funktion wie Auskunft und Werbung auch sekundäre Informationen zur Sprachenhierarchie, zur Repräsentation von Minderheitensprachen, zur sprachlichen Toleranz gegenüber der Mehrsprachigkeit in diesem Raum, etc. Diese Vielschichtigkeit macht die sprachlichen Zeichen im öffentlichen Raum zu wertvollen Lernobjekten, an denen die im Berufsleben so bedeutende diskursive Lesefähigkeit der Studierenden trainiert werden kann. Der Beitrag öffnet Perspektiven auf die Möglichkeiten der Verknüpfung der LL-Analyse mit den Inhalten der traditionellen germanistischen Curricula wie auch benachbarter Fachbereiche und verweist auf bisherige Studien in diesem Bereich.
Grammatische Termini sind in ihrer Existenz nicht immer stabil. neue wissenschaftliche Erkenntnisse, erweiterte Perspektiven und Paradigmenwechsel führen zu einem Wandelin der Terminologie. Während die Termini in Linguistischen Grammatiken dem aktuellen Status Quo der sprachwissenschaftlichen Grammatikschreibung weitgehend entsprechen, hinkt die sprachpraktische Anwendung in der Didaktik deutsch als Fremdsprache oft hinterher. Dies wird mithilfe einer Auswahl grammatischer Themen (Konnektoren, Verbvalenz, Wortbildung des Verbs und dem Bereich der Kollokationen/usuellen Wortverbindungen) und der im DAF-Bereich häufig verwendeten Pädagogisch-didaktischen Grammatiken, Handbüchern und Fachlexika sowie Lehrwerken aufgezeigt.
Die MoCoDa 2 (https://db.mocoda2.de) ist eine webbasierte Infrastruktur für die Erhebung, Aufbereitung, Bereitstellung und Abfrage von Sprachdaten aus privater Messenger-Kommunikation (WhatsApp und ähnliche Anwendungen). Zentrale Komponenten bilden (1) eine Datenbank, die für die Verwaltung von WhatsApp-Sequenzen eingerichtet ist, die von Nutzer/innen gespendet und für linguistische Recherche- und Analysezwecke aufbereitet wurden, (2) ein Web-Frontend, das die Datenspender/innen dabei unterstützt, gespendete Sequenzen um analyserelevante Metadaten anzureichern und zu pseudonymisieren, und (3) ein Web-Frontend, über das die Daten für Zwecke in Forschung und Lehre abgefragt werden können. Der Aufbau der MoCoDa-2-Infrastruktur wurde im Rahmen des Programms „Infrastrukturelle Forderung für die Geistes- und Gesellschaftswissenschaften“ vom Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen gefordert. Ziel des Projekts ist es, ein aufbereitetes Korpus zur Sprache und Interaktion in der deutschsprachigen Messenger-Kommunikation bereitzustellen, das speziell auch für qualitative Untersuchungen eine wertvolle Grundlage bildet.
Die Kernaufgabe der Projektgruppe des DWDS besteht darin, den in den Korpora enthaltenen Wortschatz lexikografisch und korpusbasiert zu beschreiben. In der modernen Lexikografie werden die Aussagen zu den sprachlichen Aspekten und Eigenschaften der beschriebenen Wörter und zu Besonderheiten ihrer Verwendung auf Korpusevidenz gestutzt. Empirisch können riesige Textsammlungen Hypothesen genauer oder ausführlicher belegen. Dabei wird deutlich, wie vielfältig Sprache im Gebrauch tatsachlich realisiert wird. Zu diesem Zweck bieten wir auf der DWDS-Plattform neben den zeitlich und nach Textsorten ausgewogenen Kernkorpora und den Zeitungskorpora eine Reihe von Spezialkorpora an, die hinsichtlich ihres Gegenstandes oder ihrer sprachlichen Charakteristika von den erstgenannten Korpora abweichen. Die Webkorpora bilden einen wesentlichen Bestandteil dieser Spezialkorpora.
Texte aus Sozialen Medien finden in linguistischen Diskursanalysen bisher noch wenig Berücksichtigung. Viele Diskursanalysen konzentrieren sich auf Zeitungstexte als Untersuchungsgegenstände. Dieser Beitrag unterbreitet einen Vorschlag zur Überwindung dieses Newspaper Bias, um das Programm und das Methodeninventar der Diskurslinguistik am Beispiel der Wikipedia hin zu digitalen Diskursanalysen zu erweitern. Neben den besonderen Eigenschaften digitaler Diskurse wird die Bedeutung digitaler Objekte (v.a. Links) in den Diskursfragmenten der Wikipedia thematisiert. Zuletzt wird ein Analysemodell präsentiert, das einen umfassenden Rahmen für die Untersuchung von digitalen Diskursen bietet.
Der Beitrag diskutiert Interpunktion als ein Teilsystem des Deutschen, an dem das Verhältnis zwischen Sprachwandel und dem gesamtgesellschaftlichen Wandelprozess der Digitalisierung besonders gut ablesbar ist. Der Gebrauch von Interpunktionszeichen im interaktionsorientierten digitalen Schreiben ist gekennzeichnet durch eine distributive Umstrukturierung des Interpunktionsinventars sowie durch Prozesse der Pragmatikalisierung, Syntaktisierung und Ikonizität, die verschiedene Satzzeichen betreffen. In der privaten und öffentlichen metasprachlichen Reflexion zeigen sich eine nicht-binäre Wahrnehmung digitaler Interpunktion und eine Registrierung einzelner Interpunktionspraktiken mit sozialen Gruppen. Die Verlagerung interpersonaler Kommunikation auf digitale Schriftlichkeit führt insgesamt zu einer Ausfächerung des interaktionalen Umgangs mit Interpunktion und zur Herausbildung domänenspezifischer Interpunktionsstile.
Die Sprache in Sozialen Medien zeigt auf allen Ebenen eine hohe Variabilität und wurde daher als eine Mischung verschiedener Register (Tagliamonte/Denis 2008) analysiert, die sowohl informelle als auch formelle Formen umfassen. Im Gegensatz zu herkömmlichen schriftlichen Medien, wie z.B. Zeitungstexten, sind Soziale Medien wie Chat, Twitter, Forumsdiskussionen, Facebook oder Blogs für diverse Autor/innen zugänglich, sind spontaner, und unterliegen weniger den sprachlichen Standards. Ein Teil der in diesen Kommunikationskanälen gefundenen Variabilität wird häufig auf Fehler zurückgeführt, es gibt jedoch viele Phänomene, die eigenen Regeln folgen. In Bezug auf das Kontinuum von konzeptueller/medialer Mündlichkeit/Schriftlichkeit (Koch/Oesterreicher 1985) befinden sich die meisten Social-Media-Beitrage in der Mitte des konzeptuellen Oralitätskontinuums, obwohl deren genaue Position bisher weitgehend unbestimmt ist. Soweit Nicht-Standard-Merkmale untersucht wurden, wurde meist die Orthographie, Morphologie, das Lexikon und die Syntax (z.B. Abkürzungen, Emoticons, Ellipsis) berücksichtigt.
Im Gegensatz dazu wählen wir einen pragmatischen, diskursorientierten Standpunkt: Welche Diskursstrategien wählen Sprecher/innen in Sozialen Medien und wie unterscheiden sich diese von bisher untersuchten Medienformen?
Entity framing is the selection of aspects of an entity to promote a particular viewpoint towards that entity. We investigate entity framing of political figures through the use of names and titles in German online discourse, enhancing current research in entity framing through titling and naming that concentrates on English only. We collect tweets that mention prominent German politicians and annotate them for stance. We find that the formality of naming in these tweets correlates positively with their stance. This confirms sociolinguistic observations that naming and titling can have a status-indicating function and suggests that this function is dominant in German tweets mentioning political figures. We also find that this status-indicating function is much weaker in tweets from users that are politically left-leaning than in tweets by right leaning users. This is in line with observations from moral psychology that left-leaning and right-leaning users assign different importance to maintaining social hierarchies.
Older adults are often exposed to elderspeak, a specialized speech register linked with negative outcomes. However, previous research has mainly been conducted in nursing homes without considering multiple contextual conditions. Based on a novel contextually-driven framework, we examined elderspeak in an acute general versus geriatric German hospital setting. Individuallevel information such as cognitive impairment (CI) and audio-recorded data from care interactions between 105 older patients (M = 83.2 years; 49% with severe CI) and 34 registered nurses (M = 38.9 years) were assessed. Psycholinguistic analyses were based on manual coding (k = .85 to k = .97) and computer-assisted procedures. First, diminutives (61%), collective pronouns (70%), and tag questions (97%) were detected. Second, patients’ functional impairment emerged as an important factor for elderspeak. Our study suggests that functional impairment may be a more salient trigger of stereotype activation than CI and that elderspeak deserves more attention in acute hospital settings.
The sentiment polarity of an expression (whether it is perceived as positive, negative or neutral) can be influenced by a number of phenomena, foremost among them negation. Apart from closed-class negation words like no, not or without, negation can also be caused by so-called polarity shifters. These are content words, such as verbs, nouns or adjectives, that shift polarities in their opposite direction, e. g. abandoned in “abandoned hope” or alleviate in “alleviate pain”. Many polarity shifters can affect both positive and negative polar expressions, shifting them towards the opposing polarity. However, other shifters are restricted to a single shifting direction. Recoup shifts negative to positive in “recoup your losses”, but does not affect the positive polarity of fortune in “recoup a fortune”. Existing polarity shifter lexica only specify whether a word can, in general, cause shifting, but they do not specify when this is limited to one shifting direction. To address this issue we introduce a supervised classifier that determines the shifting direction of shifters. This classifier uses both resource-driven features, such as WordNet relations, and data-driven features like in-context polarity conflicts. Using this classifier we enhance the largest available polarity shifter lexicon.
Professional and technical practice and the technical character of social interaction.
The focus on communication in research on professional and scientific language somehow reflects the intention of John L. Austin’s phrase “How to do things with words?” But a description based on the concept of communication ultimately also relies on linguistic idiosyncrasies. We will look at things the other way round and ask first “how to do (professional) things” and then look at the linguistic units used specifically for this purpose. Professionalism in this view takes very different forms for different types of actions (“practices”). Although reliability and professional authority are central features of all linguistic realizations to be considered, they are represented in very different ways. As a result, professionalism not only shows in the high degree of explicitness of technical prose typical for written scientific discussion. It is also reflected in the high degree of implicitness of speech that accompanies and constitutes practical action.
We present a fine-grained NER annotations scheme with 30 labels and apply it to German data. Building on the OntoNotes 5.0 NER inventory, our scheme is adapted for a corpus of transcripts of biographic interviews by adding categories for AGE and LAN(guage) and also adding label classes for various numeric and temporal expressions. Applying the scheme to the spoken data as well as a collection of teaser tweets from newspaper sites, we can confirm its generality for both domains, also achieving good inter-annotator agreement. We also show empirically how our inventory relates to the well-established 4-category NER inventory by re-annotating a subset of the GermEval 2014 NER coarse-grained dataset with our fine label inventory. Finally, we use a BERT-based system to establish some baselines for NER tagging on our two new datasets. Global results in in-domain testing are quite high on the two datasets, near what was achieved for the coarse inventory on the CoNLLL2003 data. Cross-domain testing produces much lower results due to the severe domain differences.
Fragen sind zentrale Interventionen im Coaching. Trotzdem gibt es kaum Erkenntnisse darüber, wie sie zur Veränderung bei Klientinnen und Klienten beitragen. Mit ihrem Fokus auf die sequenzielle Abfolge von Äußerungen wie „Frage – Antwort – Reaktion“ kann die linguistische Gesprächsanalyse dieses Veränderungspotenzial von Fragen beschreiben und so auch für die (Weiterbildungs-)Praxis oder Personalwirtschaft zugänglich machen.
This is an introduction to a special issue of Dictionaries: Journal of the Dictionary Society of North America. It offers a characterization of neology and describes the Globalex-sponsored workshop at which the papers in the issue originated. It provides an overview of the papers, which treat lexicographical neology and neological lexicography in Danish, Dutch, Estonian, Frisian, Greek, Korean, Spanish, and Swahili and address relevant aspects of lexicography in those languages, presenting state-of-the-art research into neology and ideas about modern lexicographic treatment of neologisms in various dictionary types.
How Do Speakers Define the Meaning of Expressions? The Case of German x heißt y (“x means y”)
(2020)
To secure mutual understanding in interaction, speakers sometimes explain or negotiate expressions. Adopting a conversation analytic and interaction linguistic approach, I examine how participants explain which kinds of expressions in different sequential environments, using the format x heißt y (“x means y”). When speakers use it to clarify technical terms or foreign words that are unfamiliar to co-participants, they often provide a situationally anchored definition that however is rather context-free and therefore transferable to future situations. When they explain common (but indexical, ambiguous, polysemous, or problematic) expressions instead, speakers always design their explanation strongly connected to the local context, building on situational circumstances. I argue that x heißt y definitions in interaction do not meet the requirements of scientific or philosophical definitions but that this is irrelevant for the situational exigencies speakers face.
Der Beitrag untersucht vorhandene Lösungen und neue Möglichkeiten des Korpusausbaus aus Social Media- und internetbasierter Kommunikation (IBK) für das Deutsche Referenzkorpus (DEREKO). DEREKO ist eine Sammlung gegenwartssprachlicher Schriftkorpora am IDS, die der sprachwissenschaftlichen Öffentlichkeit über die Korpusschnittstellen COSMAS II und KorAP angeboten wird. Anhand von Definitionen und Beispielen gehen wir zunächst auf die Extensionen und Überlappungen der Konzepte Social Media, Internetbasierte Kommunikation und Computer-mediated Communication ein. Wir betrachten die rechtlichen Voraussetzungen für einen Korpusausbau aus Sozialen Medien, die sich aus dem kürzlich in relevanten Punkten reformierten deutschen Urheberrecht, aus Persönlichkeitsrechten wie der europäischen Datenschutz-Grundverordnung ergeben und stellen Konsequenzen sowie mögliche und tatsächliche Umsetzungen dar. Der Aufbau von Social Media-Korpora in großen Textmengen unterliegt außerdem korpustechnologischen Herausforderungen, die für traditionelle Schriftkorpora als gelöst galten oder gar nicht erst bestanden. Wir berichten, wie Fragen der Datenaufbereitung, des Korpus-Encoding, der Anonymisierung oder der linguistischen Annotation von Social Media Korpora für DEREKO angegangen wurden und welche Herausforderungen noch bestehen. Wir betrachten die Korpuslandschaft verfügbarer deutschsprachiger IBK- und Social Media-Korpora und geben einen Überblick über den Bestand an IBK- und Social Media-Korpora und ihre Charakteristika (Chat-, Wiki Talk- und Forenkorpora) in DEREKO sowie von laufenden Projekten in diesem Bereich. Anhand korpuslinguistischer Mikro- und Makro-Analysen von Wikipedia-Diskussionen im Vergleich mit dem Gesamtbestand von DEREKO zeigen wir charakterisierende sprachliche Eigenschaften von Wikipedia-Diskussionen auf und bewerten ihren Status als Repräsentant von IBK-Korpora.
This paper presents experiments on sentence boundary detection in transcripts of spoken dialogues. Segmenting spoken language into sentence-like units is a challenging task, due to disfluencies, ungrammatical or fragmented structures and the lack of punctuation. In addition, one of the main bottlenecks for many NLP applications for spoken language is the small size of the training data, as the transcription and annotation of spoken language is by far more time-consuming and labour-intensive than processing written language. We therefore investigate the benefits of data expansion and transfer learning and test different ML architectures for this task. Our results show that data expansion is not straightforward and even data from the same domain does not always improve results. They also highlight the importance of modelling, i.e. of finding the best architecture and data representation for the task at hand. For the detection of boundaries in spoken language transcripts, we achieve a substantial improvement when framing the boundary detection problem as a sentence pair classification task, as compared to a sequence tagging approach.
Der folgende Beitrag verfolgt das Ziel, einen Impuls für die Problematik des Übertrags der linguistischen Fachterminologie in die fachdidaktische Anwendung zu geben. Die daten stammen aus einem Seminar des Praxissemesters in NRW, wo Studierende Unterrichtseinheiten zum Thema Informationsstruktur erstellt haben.
In der Schule tätig greifen Studierende bei der Unterrichtsplanung auf Lehrbücher, Zeitschriften und Online-Vorlagen (Arbeitsblätter und Hilfestellungen für Lehrkräfte) zurück, damit sie möglichst schnell adäquates Material für den eigenen Unterricht vorliegen haben. Die Herausforderung beginnt beim Übertragen der fachwissenschaftlichen
Erkenntnisse in die Recherche mit der nicht immer eindeutigen Terminologie. Im Beitrag wird darauf eingegangen, welche Termini zur Informationsstruktur überhaupt zum Ziel führen und auf welche Alternativen man ausweichen muss, um passende Ergebnisse zu haben.
Interaktionale Semantik
(2020)
Interaktive Emergenz und Stabilisierung. Zur Entstehung kollektiver Kreativität in Theaterproben
(2020)
Ein multilinguales linguistisches Begriffssystem wird in Form einer Datenbank implementiert, die dem Benutzer den semasiologischen und onomasiologischen Zugriff erlaubt, ihn also zu einem gegebenen Terminus den Begriff und seine Definition und zu einem gegebenen Begriff die Termini in den beteiligten Sprachen finden lässt. Die Mehrfachzuordnung von Begriffen zu Termini ist dabei auf interlingualer Ebene nicht wesentlich verschieden von der Situation in einer monolingualen Ontologie. Für die Normierung einer interlingualen Ontologie werden Grundsätze zur Bildung von Begriffen und von Termini vorgeschlagen. Zwischen den Begriffen bestehen eine Menge von vordefinierten konzeptuellen Relationen, die sie in systematische Beziehungen zueinander setzen und es sowohl dem Verwalter ermöglichen, das System konsistent zu halten, als auch dem Benutzer, im Begriffssystem zu navigieren.
Der Beitrag behandelt die Frage, wie sich das spezifisch Neue internetbasierter Kommunikation unter linguistischer Perspektive fassen und in Traditionen des sprachlichen Handelns einordnen lässt. Es wird gezeigt, dass sich die internetbasierte Kommunikation weder als Interaktion noch als Textkommunikation hinreichend beschreiben lasst, zugleich aber Merkmale mit beiden Formen teilt. Mit dem Konzept der Textformen-basierten Interaktion wird ein Vorschlag formuliert, wie dieses Dilemma aufgelöst werden kann: Das Innovationspotenzial internetbasierter Kommunikationstechnologien liegt gerade darin, dass diese durch Indienstnahme von Textformen die Möglichkeiten von Interaktion erweitern. Das hat einerseits Konsequenzen fur die linguistische Analyse und lässt sich andererseits fruchtbar machen fur die Entwicklung von Standards fur die Repräsentation von Korpora.
Interoperability in an Infrastructure Enabling Multidisciplinary Research: The case of CLARIN
(2020)
CLARIN is a European Research Infrastructure providing access to language resources and technologies for researchers in the humanities and social sciences. It supports the use and study of language data in general and aims to increase the potential for comparative research of cultural and societal phenomena across the boundaries of languages and disciplines, all in line with the European agenda for Open Science. Data infrastructures such as CLARIN have recently embarked on the emerging frameworks for the federation of infrastructural services, such as the European Open Science Cloud and the integration of services resulting from multidisciplinary collaboration in federated services for the wider domain of the social sciences and humanities (SSH). In this paper we describe the interoperability requirements that arise through the existing ambitions and the emerging frameworks. The interoperability theme will be addressed at several levels, including organisation and ecosystem, design of workflow services, data curation, performance measurement and collaboration. For each level, some concrete outcomes are described.
Jesus in der Alltagssprache
(2020)
In dem Beitrag werden Kommunikationsstörungen in Sportvideointerviews im Ukrainischen und Deutschen im Zeitraum von 2000-2018 untersucht. Für die Typologie der Kommunikationsstörungen werden der Faktor ihres Auftretens und die strukturelle Ebene ihrer Entwicklung betrachtet. Dabei zeigt sich, dass je nach Typ und Besonderheiten der Kommunikationsstörungen Sportvideointerviews mehr Gemeinsames als Unterschiedliches in beiden Sprachen aufweisen. Sowohl kommunikative als auch rein sprachliche Störungen treten bei den Interviewern und Interviewten im Ukrainischen und bei den Interviewten als Nichtmuttersprachler im Deutschen auf.
Kommunikative Misserfolge im Deutschen für ukrainische Deutschlerner aus interkultureller Sicht
(2020)
Begriffe, die meist als nulläquivalente Lexik (Lakunen) für ukrainische Deutschlerner gelten und somit Schwierigkeiten bereiten sowie im Allgemeinen zu Misserfolgen zwischen Kommunizierenden führen können, stehen im Mittelpunkt der folgenden Ausführungen. Um sie zu vermeiden, werden einige Themen und Aufgaben zur Erweiterung der sozial-kommunikativen und interkulturellen Kompetenzen vorgeschlagen.
Am Leibniz-Institut für Deutsche Sprache (IDS) wurde im Programmbereich „Lexikografie und Sprachdokumentation“ ein neuartiges Wörterbuch entwickelt, das leicht verwechselbare Ausdrücke in ihrem aktuellen öffentlichen Sprachgebrauch deskriptiv beschreibt. Im Jahr 2018 erschien das elektronische Nachschlagewerk „Paronyme – Dynamisch im Kontrast“, das sich durch folgende drei Aspekte auszeichnet:
1) Erstens liegen mehrstufige kontrastive Beschreibungsebenen und flexible Darstellungsformen vor;
2) zweitens sind die Bedeutungserläuterungen kognitiv-konzeptuell angelegt, um einer langen Forderung nach einer stärker kognitiv ausgerichteten Lexikografie Rechnung zu tragen;
3) drittens werden Datengrundlagen und Analysemethoden genutzt, mit denen umfassend Paronyme ermittelt und diese anschließend erstmals empirisch ausgewertet werden konnten.
Der Mythos „Künstliche Intelligenz“ wird besonders von der sogenannten „transhumanistischen“ Community im Silicon Valley propagiert, deren Vertreter wie der Physiker Ray Kurzweil davon ausgehen, dass wir in spätestens 30 Jahren mit KIs kommunizieren könnten, wie mit einem Menschen (Kurzweil 2005). Saudi Arabien hat 2017 bereits dem anthropomorphen Roboter mit Sprachinterface Sophia die Staatsbürgerschaft zugesprochen (Arab News 2017). Künstliche Intelligenzen wie Apples Assistenzsystem Siri oder Amazons Alexa halten derzeit Einzug in unseren Alltag. Chatbots und Social-Bots wie der Twitter-Bot Tay nehmen Einfluss auf öffentliche Diskurse und interaktives Spielzeug mit Dialogfunktion führt bereits unsere Jüngsten an die Interaktion mit dem artifiziellen Gegenüber heran. Hier entsteht eine völlig neue Form der Dialogizität, die wir aus linguistischer Perspektive noch kaum verstehen. Unabhängige Studien zur Mensch-Maschine-Interaktion stellen also ein großes Desiderat dar.
Gegenstand dieses Beitrags ist die Entwicklung des graphentheoretischen Analysetools Laniakea, das zur Visualisierung von Phänomenen und Veränderungen in terminologischen Netzwerken entwickelt wurde. Wir führen theoretische Grundlagen, Designentscheidungen und technische Details der Implementierung des Tools aus. Darüber hinaus wird auch eine Beschreibung von Erfahrungen im Fokus des Beitrages stehen, die bei der Anwendung von Laniakea bei der Überarbeitung der terminologischen Ressourcen des Grammatischen Informationssystems grammis, gesammelt wurden.
Le bilinguisme en Moselle-Est. Un projet de documentation linguistique de la situation actuelle.
(2020)
Qui parle aujourd'hui quelle langue avec qui et à quelle occasion? Quelles idées les habitants de la Moselle germanophone associent-ils aux dialectes et aux langues? Comment le Platt lorrain est-il transmis? à quoi cela ressemble-t-il dans les différents coins de la Moselle ? Pour répondre à ces questions, le Leibniz- Institut für Deutsche Sprache (IDS) a lancé un projet de documentation sonore pour la recherche linguistique.
Lean syntax: how argument structure is adapted to its interactive, material, and temporal ecology
(2020)
It has often been argued that argument structure in spoken discourse is less complex than in written discourse. This paper argues that lean argument structure, in particular, argument omission, gives evidence of how the production and understanding of linguistic structures is adapted to the interactive, material, and temporal ecology of talk-in-interaction. It is shown how lean argument structure builds on participants' ongoing bodily conduct, joint perceptual salience, joint attention, and their Orientation to expectable next actions within a joint project. The phenomena discusscd in this paper are verb-derived discourse markers and tags, analepsis in responsive actions, and ellipsis in first actions, such as requests and instructions. The study draws from transcripts and audio- and video-recordings of naturally occurring interaction in German from the Research and Teaching Corpus of Spoken German (FOLK).
Lexikonprojektion und Konstruktion: Experimentelle Studien zu Argumentalternationen im Deutschen
(2020)
Debates on lexicalist vs. constructionist modelling of argument alternations are typically based on data from single constructions, each including different types of verbs. Evidence from constructions with an identical set of verb types that systematically differ in their meaning is lacking, even though such evidence is imperative for specifically investigating the dependence of argument alternations on the interaction between construction and lexical meanings. We present two acceptability studies where verb lexeme meanings and constructions - specifically active voice, impersonal passive and the construction with man 'one' in German - vary systematically. Prima facie our results support a constructionist explanation, because each construction exhibits a unique acceptability cline. However, across constructions, an adequate explanation has to consider verb-based lexical meanings. The most plausible explanation is that the semantic features licensed by the construction are matched with the semantic features provided by the verb lexeme.
Ziel des vorliegenden Beitrages ist es, LingTermNet, ein Online-Repositorium für linguistische Fachtermini, vorzustellen. Methodologisch und hinsichtlich seiner lexikografischen Umsetzung basiert LingTermNet auf framesemantischen Prinzipien, die auch dem Berkeleyer FrameNet-Projekt zugrunde liegen. Dargestellt werden zunächst leitende theoretische Annahmen; im Zentrum steht sodann die Präsentation von Aufbau und Struktur der Ressource. Im Unterschied zu ‘traditionellen’ Wörterbüchern entstehen Einträge in LingTermNet auf der Grundlage von framesemantischen Annotationen, deren Auswertung auf zwei Ebenen lexikografisch aufgearbeitet werden: Die framesemantische Ebene dokumentiert Frames und ihre Beziehungen untereinander, die lemmaspezifische Ebene basiert auf framesemantischen Untersuchungserkenntnissen, wobei die Einträge hier klassischen Wörterbuchdefinitionen ähneln.
Nonnative-accented speakers face prevalent discrimination. The assumption that people freely express negative sentiments toward nonnative speakers has also guided common research methods. However, recent studies did not consistently find downgrading, so that prejudice against nonnative accents might even be questioned at first sight. The present theoretical article will bridge these contradictory findings in three ways: (a) We illustrate that nonnative speakers with foreign accents frequently may not be downgraded in commonly used first-impression and employment scenario paradigms. It appears that relatively controlled responding may be influenced by norms and motivations to respond without prejudice, whereas negative biases emerge in spontaneous responding. (b) We present an integrative view based on knowledge on modern forms of prejudice to develop modern notions of accent-ism, which allow for predictions when accent biases are (not) likely to surface. (c) We conclude with implications for interventions and a tailored research agenda.
Dieser Beitrag analysiert auf der Grundlage der Wikipedia-Korpora des Leibniz-Instituts für Deutsche Spra-che morphosyntaktische Phänomene im deutsch-italienischen Vergleich. Konkret fokussiert die Fallstudie Konfixe, die ursprünglich lateinischen bzw. griechischen Ursprungs waren und zunächst überwiegend für den Bereich der Medizinfachsprache entlehnt wurden. Mittlerweile werden diese mit veränderter Semantik jedoch auch für gemeinsprachliche Wortbildungsprodukte eingesetzt: So finden sich -phob- (D) und -fob- (IT) sowie -man- (D) und -man- (IT) in gemeinsprachlichen Wortbildungsprodukten, die formale und funk-tionale Äquivalenzen im Deutschen und Italienischen aufweisen. Wikipedia-Autor/-innen nutzen die als Krankheitsmetaphern zu deutenden Termini wie Lösch(o)manie oder cancellomania auf den Diskussionsseiten der Online-Enzyklopädie dazu, das Verhalten anderer Autor/-innen in der kollaborativen Textproduktion der Wikipedia metadiskursiv zu normieren.
Objekte der Begeisterung
(2020)
We present a construction-based approach to German prepositional object (I’O) constructions occurring with the verb begeistern ,to thrill'. Traditionally, the preposition in such structures is analysed as a meaningless object marker that is lexically selected by the governing verb and not subject to variation. Drawing on a corpus study in the German reference corpus DeReKo, we show that our target verb occurs with four different PO prepositions (für ,lor‘,« ׳? ,at', von ,front' and über ,over‘) that can be analysed as markers o f schematic argument structure constructions in the Construction Grammar sense. We show that each construction comes with its own meaning and semantically coherent predicate restrictions. We argue that purely valency-based (lexical) approaches to argument structure fail to capture these generalisations. On the other hand, purely schema-based (constructionist) approaches to argument structure face the complcmentary problem o f accommodating item-specific restrictions and exceptions to the generalisations they embody. We suggest that the necessary synthesis can be formulated within an account that recognises both generalised constructions and item-specific valency properties.
Paronymie und Sprachwandel
(2020)
Dieser Beitrag geht der Frage nach, welche Faktoren beim Bedeutungswandel von deutschen Paronymen (z. B. effektiv/effizient, virtuell/virtual, nicht ehelich/unehelich/außerehelich) eine Rolle spielen und wie sich diese im aktuellen Sprachgebrauch zeigen. Dabei können gerade Korpusanalysen unterschiedliche Tendenzen sprachlicher Entwicklung aufdecken. Als morphologische Alternativen können Paronyme durchaus das sprachliche Inventar bereichern und der Sprachgemeinschaft neue lexikalische Varianten zur Verfügung stellen. In anderen Fällen konkurrieren Paronyme stark miteinander und dadurch verändern sich Verwendungsweisen. Zusätzlich ist häufiger fehlerhafter Gebrauch ein wichtiger Impuls für semantische Veränderungen. Als Ergebnis beobachten wir semantische Angleichungen oder lexikalische Verdrängungen. Zahlreiche Ausdrücke haben sich in der jüngsten Sprachgeschichte semantisch, stilistisch oder diskursiv spezialisiert, um veränderten sprachlichen Bedürfnissen sowie neuen kommunikativen Situationen Rechnung zu tragen. Die Ursachen und Folgen des Wandels von paronymen Zweifelsfällen sind vielschichtig. In diesem Beitrag werden einige konkrete Ausdrücke näher beleuchtet, ihre gebrauchsorientierte Untersuchung, aber auch Möglichkeiten der lexikografischen Dokumentation werden erörtert.
Viele neue Orte des akademischen Lesens und Schreibens sind Anfang der 2000er im Mitmachnetz „Web 2.0“ entstanden, die heute als „Soziale Medien“ Forschung und Lehre sowohl hinsichtlich Produktion und Rezeption als auch als Gegenstand massiv beeinflussen. Zu diesen Formen zählt u.a. auch die Wissenschaftsvermittlung auf (Micro-)Blogs, an der (beinahe typisch) die nicht immer reibungslosen Annäherungen einer Fachkultur an digitale Formen der Textproduktion im Beitrag nachgezeichnet werden. Angesichts der ambivalenten Bewertung dieser neuen Formen der Fachkommunikation wird dafür votiert, (Micro-)Blogs als Arbeitsplattformen zur Kollaboration und nur als solche zu begreifen.
This paper studies practices of indexing discrepant assumptions accomplished by turn-constructional units with ich dachte ('I thought') in German talk-in-interaction. Building on the analysis of 141 instances from the corpus FOLK, we identify three sequential environments in which ich dachte is used to index that an assumption which a speaker (has) held contrasts with some other, contextually salient assumption. We show that practices which have been studied for English I thought are also routinely used in German: ich dachte is a means to manage epistemic incongruencies and to contrast an incorrect with a correct assumption in narratives. In addition, ich dachte is also used to account for the speaker's own prior actions which may have looked problematic because they built on misunderstandings which the speaker only discovered later. Moreover, ich dachte-practices may also be used to create comic effects by reporting an earlier, absurd assumption. The practices are discussed with regard to their role in regaining common ground, in managing relationships, in maintaining the identity of a rational actor, and in terms of their exploitation for other conversational interests. Special attention is paid to how co-occurring linguistic features, and sequential and pragmatic factors, account for local interpretations of ich dachte.
Privacy by Design (also referred to as Data Protection by Design) is an approach in which solutions and mechanisms addressing privacy and data protection are embedded through the entire project lifecycle, from the early design stage, rather than just added as an additional layer to the final product. Formulated in the 1990 by the Privacy Commissionner of Ontario, the principle of Privacy by Design has been discussed by institutions and policymakers on both sides of the Atlantic, and mentioned already in the 1995 EU Data Protection Directive (95/46/EC). More recently, Privacy by Design was introduced as one of the requirements of the General Data Protection Regulation (GDPR), obliging data controllers to define and adopt, already at the conception phase, appropriate measures and safeguards to implement data protection principles and protect the rights of the data subject. Failing to meet this obligation may result in a hefty fine, as it was the case in the Uniontrad decision by the French Data Protection Authority (CNIL). The ambition of the proposed paper is to analyse the practical meaning of Privacy by Design in the context of Language Resources, and propose measures and safeguards that can be implemented by the community to ensure respect of this principle.
Der Beitrag beschäftigt sich mit kommunikativen Praktiken in audiovisuellen Webformaten am Beispiel von sogenannten „Let’s Plays“, in denen ein Videospiel im Internet für Zuschauende gespielt und kommentiert wird. An live ausgestrahlten Let’s Plays zeigen wir, wie Zuschauende mit Produzierenden während der Ausstrahlung interagieren und so integraler Bestandteil des entstehenden Produkts werden. Live ausgestrahlte Let’s Plays machen eine Trennung zwischen Produktion, Produkt und Rezeption, wie wir sie von traditionellen Medien kennen, obsolet. Wir sprechen daher von sogenannten Medienketten. Sie zeichnen sich dadurch aus, dass die drei genannten Elemente, aufgrund der gegebenen medialen Affordanzen ineinander übergehen, sich dynamisch beeinflussen oder gegenseitig hervorbringen.
As immigration and mobility increases, so do interactions between people from different linguistic backgrounds. Yet while linguistic diversity offers many benefits, it also comes with a number of challenges. In seven empirical articles and one commentary, this Special Issue addresses some of the most significant language challenges facing researchers in the 21st century: the power language has to form and perpetuate stereotypes, the contribution language makes to intersectional identities, and the role of language in shaping intergroup relations. By presenting work that aims to shed light on some of these issues, the goal of this Special Issue is to (a) highlight language as integral to social processes and (b) inspire researchers to address the challenges we face. To keep pace with the world’s constantly evolving linguistic landscape, it is essential that we make progress toward harnessing language’s power in ways that benefit 21st century globalized societies.
Historiquement, les variétés germaniques de la Moselle-Est (ancienne région Lorraine) font partie du continuum dialectal de l’allemand. Après la Seconde Guerre mondiale, leur utilisation (y compris celle de l’allemand standard) a été fortement réprimée et la francisation résolument poursuivie. Depuis quelques décennies maintenant, des efforts ont été faits pour élever les dialectes de la Moselle-Est au statut de langue indépendante afin de marquer une distance par rapport à la langue allemande, de permettre leur identification et de pouvoir les réutiliser. Le paysage linguistique donne une bonne indication de la manière dont coexistent les différents groupes linguistiques et une indication sur le statut de leurs langues. Dans le cadre d’une analyse qualitative, les contextes d’apparition, les fonctions et les auteurs des éléments linguistiques visibles dans l’espace public en allemand standard et dialectal seront discutés pour la Moselle-Est. Il s’avère qu’ils constituent des exceptions notables, distribuées de manière significative. L’allemand (standard) apparaît dans les inscriptions historiques ainsi que dans le domaine des relations internationales, et est donc implicitement exogénéisé. En revanche, on trouve le dialecte (appelé « platt ») dans des contextes ayant des références locales et portant sur des aspects identitaires.
Die Korpusanalyseplattform KorAP wird als Nachfolgesystem zu COSMAS II am Leibniz-Institut für Deutsche Sprache (IDS) entwickelt und erlaubt einen umfassenden Zugriff auf einen Teil von DeReKo (Kupietz et al. 2010). Trotz einiger noch fehlender Funktionalitäten ist KorAP bereits produktiv einsetzbar. Im Folgenden wollen wir am Beispiel der Untersuchung von Social-Media-Korpora einige neue Möglichkeiten und Besonderheiten vorstellen.
As part of a larger research paradigm on understanding client change in the helping professions from an interprofessional perspective, this paper applies a conversation analytic approach to investigate therapists’ requesting examples (REs) and their interactional and sequential contribution to clients’ change during the diagnostic evaluation process. The analyzed data comprises 15 videotaped intake interviews that followed the system of Operationalized Psychodynamic Diagnosis. Therapists’ requesting examples in psychodiagnostic interviews explicitly or implicitly criticize the patient’s prior turn as insufficient. They also open a retro-sequence and in the following turns provide for a description that helps clarify meaning and evince psychic or relational aspects of the topic at hand. While the therapist’s prior request initiates the patient’s insufficient presentation, the patient’s example presentation is regularly followed by the therapist’s summarizing comments or by further requests. Requesting examples thus are a particular case of requests that follow expandable responses regarding the sequential organization; yet, given that they make examples conditionally relevant, they are more specific. With the help of this sequential organization, participants co-construct common knowledge which allows the therapist to pursue the overall aim of therapy, which is to increase the patients’ awareness of their distorted perceptions, and thus to pave the way for change.
Making corpora accessible and usable for linguistic research is a huge challenge in view of (too) big data, legal issues and a rapidly evolving methodology. This does not only affect the design of user-friendly graphical interfaces to corpus analysis tools, but also the availability of programming interfaces supporting access to the functionality of these tools from various analysis and development environments. RKorAPClient is a new research tool in the form of an R package that interacts with the Web API of the corpus analysis platform KorAP, which provides access to large annotated corpora, including the German reference corpus DeReKo with 45 billion tokens. In addition to optionally authenticated KorAP API access, RKorAPClient provides further processing and visualization features to simplify common corpus analysis tasks. This paper introduces the basic functionality of RKorAPClient and exemplifies various analysis tasks based on DeReKo, that are bundled within the R package and can serve as a basic framework for advanced analysis and visualization approaches.
Einleitend stellt der Beitrag unter Bezugnahme auf die Jahrestagungen des Leibniz-Instituts für Deutsche Sprache von 2019 und 1999 die Bezeichnungen Soziale Medien und neue Medien gegenüber. Dann steht die schriftbasierte Whats-App-Kommunikation im Fokus, es werden aber auch Beispiele aus anderen Kommunikationsformen angeführt (z.B. Zeitungsartikel auf Facebook, Texte aus der Unternehmenskommunikation). Gezeigt werden soll, wie sich die Verwendung von Emojis in diesen Texten gestaltet. Im Anschluss daran geht es um die Frage, welchen Stellenwert das Schreiben in Sozialen Medien in der Schule hat und welchen Stellenwert es künftig haben wird. Diese Frage leitet über zu dem im Titel unter Perspektiven angedeuteten Blick in die Zukunft: Hier wird zum einen diskutiert, ob die Popularität von Emojis noch zunehmen wird, zum anderen wird gefragt, ob das digitale Schreiben in Zukunft möglicherweise von anderen Praktiken abgelöst wird.
Zum (Fremdsprachen-)Lernen mit Sozialen Medien existieren verschiedene Hypothesen, von denen ein paar eine große Stoßkraft entwickelt haben, obwohl sie sich empirisch nicht belegen lassen. In diesem Artikel werden einige von ihnen dekonstruiert, gleichzeitig wird aber auch gezeigt, warum und mit welchen Zielen ein Einsatz Sozialer Medien im Deutsch-als-Fremdsprache-Unterricht sinnvoll ist. Möglichkeiten des Einsatzes werden beispielhaft für die Förderbereiche des kooperativen Schreibens sowie für eine Verbindung von informellem und formalem Lernen thematisiert. Dabei wird ein besonderer Schwerpunkt auf die Betrachtung sozialer Netzwerke gelegt. Abschließend wird auf Herausforderungen eingegangen, die sich im Zusammenhang mit dem Einsatz Sozialer Medien im Deutsch-als-Fremdsprache-Unterricht stellen.
Was macht eigentlich die Netzwerkforschung im Zusammenhang mit Beziehungen und deren Struktur in der digitalen Welt? Wie hängt Struktur und die Herausbildung von Kultur und Sprache zusammen? Obwohl Kultur noch mehr als Sprache umfasst, sind die Aushandlung von Kultur und die Anwendung von Kulturelementen kaum ohne Sprache vorstellbar. Sprache ist also integrativer Teil von Kultur - ohne Sprache keine Kultur. Die Herausbildung von Sprachkulturen ist wesentlicher Teil dieser Entwicklungen. Wenn wir nun auf den Zusammenhang von Netzwerken und Kultur schauen, so können wir feststellen, dass hier kaum eine Kausalität behauptet werden kann, sondern beides ist miteinander tief verwoben. Zunächst werden einige wichtige Aspekte der Netzwerkforschung exemplarisch angesprochen und mit eigener Forschung illustriert. Danach gehe ich auf einen Shitstorm ein, an dem ich einige Aspekte aus dem Anfangsteil noch einmal aufnehme.
Als die Olympischen Sommerspiele 1968 im Oktober 1963 nach Mexico City vergeben wurden, machten sorgenvolle Befürchtungen aufgrund der Höhe des Austragungsorts und die dadurch auftretenden Belastungen der Athlet*innenkörper in den Medien die Runde. Sehr schnell gingen fast alle teilnehmenden Sportverbände zur höhenphysiologischen Vorbereitung unter Einbeziehung sportmedizinischer Expertise über. Auf der Basis von Archivbeständen des Deutschen Olympischen Sportbundes sowie zeitgenössischen sportmedizinischen Beiträgen beleuchtet der Aufsatz die Rolle der Sportmedizin in der Vorbereitungsphase auf die Olympischen Sommerspiele 1968. Im Zentrum steht die Frage, auf welche Weise der Leistungskörper der Athlet*innen ins biopolitische, sportmedizinische Blickfeld rückte, welche Tests und Untersuchungen mit ihm durchgeführt wurden und welche Bedeutung dies für das Zusammenspiel von Leistungssport und Sportmedizin hatte.
In dem einleitenden Beitrag wird in groben Zügen 1. ein Überblick über die digitale Entwicklung und die Entwicklung der Internetlinguistik gegeben und 2. auf Probleme und Desiderata hinsichtlich theoretischer und empirisch-methodischer Aspekte in der Forschung eingegangen, wobei 3. perspektivisch auf Vernetzung und Netzwerkanalysen fokussiert wird. Dies wird schlaglichtartig reflektiert vor dem Hintergrund der Entwicklung eines maschinenbasierten Digitalkapitalismus.
Sprachentwicklungstest zum Kasus bei bilingualen Vorschulkindern: Sprachstand Deutsch (KT-DEU)
(2020)
Sprachentwicklungstest zum Kasus bei den bilingualen Vorschulkindern: Sprachstand Russisch (KT-RUS)
(2020)
Studenten, StudentInnen, Studierende? Aktuelle Verwendungspräferenzen bei Personenbezeichnungen
(2020)
Im Beitrag werden Meinungen und Einstellungen zur geschlechtergerechten Sprache dargestellt. Dazu werden verschiedene Möglichkeiten für die Bezeichnung von Personen, die studieren, in den Blick genommen. Diese werden zunächst beschrieben und ihre Frequenzen im Deutschen Referenzkorpus ausgewertet. Anschließend werden explizit die Meinungen und Einstellungen behandelt. Dafür werden die Daten der Deutschland-Erhebung 2008 und der Deutschland-Erhebung 2017 ausgewertet. In der aktuellen Erhebung wurden laienlinguistische Verwendungspräferenzen von Personenbezeichnungen erhoben; präferiert wird von den meisten Befragten die Partizipialform (den Studierenden). Die Verwendungspräferenzen hangen vor allem mit dem Alter der Befragten und ihrer politischen Orientierung zusammen. Insgesamt zeigt sich jedoch, dass das Thema der geschlechtergerechten Sprache für die meisten Befragten nur eine untergeordnete Rolle spielt.
T-Shirt Lexicography
(2020)
This article presents a study of graphic inscriptions on garments such as T-shirts, inscriptions that resemble entries in general monolingual dictionaries of German. Referred to here as "T-shirt lexicography," the collected material is analyzed in terms of its form, content, and function, focusing on lexicographical aspects. T-shirt lexicography is an example of vernacular lexicography inasmuch as different lexicographical traditions are assumed (correctly as well as erroneously) by the (unknown) authors, but also adapted to their specific needs.
Text und Sprache digital
(2020)
Wie wirkt sich das Schreiben kürzerer Texte in interaktionsorienterter Online-Kommunikation langfristig auf das Schreiben und die Qualität monologischer Texte aus? Auf diese Frage geht der Beitrag ein und präsentiert dazu empirische Daten aus einer Korpus-Vergleichsstudie, in der die Verwendung ausgewählter Konnektoren in einem Facebook-Korpus quantitativ und qualitativ analysiert und mit der Verwendung in dialogischen Texten von Wikipedia-Diskussionsseiten einerseits und in monologischen Texten wie Zeitungskommentaren und Schulertexten anderseits verglichen wurde. Die Analysen fokussieren darauf, wie Konnektoren in Online-Texten eingesetzt werden, ob sich spezifische Online-Verwendungen etablieren und ob „Spuren“ typischer Online-Verwendungen auch in normgebundener Umgebung nachweisbar sind.
This article makes an empirical and a methodological contribution to the comparative study of action. The empirical contribution is a comparative study of three distinct types of action regularly accomplished with the turn format du meinst x (“you mean/think x”) in German: candidate understandings, formulations of the other’s mind, and requests for a judgment. These empirical materials are the basis for a methodological exploration of different levels of researcher abstraction in the comparative study of action. Two levels are examined: the (coarser) level of conditionally relevant responses (what a response speaker must do to align with the action of the prior turn) and the (finer) level of “full alignment” (what a response speaker can do to align with the action of a prior turn). Both levels of abstraction provide empirically viable and analytically interesting descriptive concepts for the comparative study of action. Data are in German.