Refine
Year of publication
- 2021 (356) (remove)
Document Type
- Article (125)
- Part of a Book (115)
- Conference Proceeding (30)
- Other (25)
- Book (19)
- Part of Periodical (16)
- Report (13)
- Review (9)
- Working Paper (2)
- Course Material (1)
Language
- German (246)
- English (107)
- French (1)
- Multiple languages (1)
- Russian (1)
Keywords
- Deutsch (132)
- Korpus <Linguistik> (66)
- COVID-19 (53)
- Interaktion (44)
- Sprachgebrauch (43)
- Konversationsanalyse (42)
- Kommunikation (36)
- Neologismus (33)
- Wortschatz (30)
- Grammatik (27)
Publicationstate
- Veröffentlichungsversion (205)
- Zweitveröffentlichung (116)
- Postprint (27)
- Hybrides Open Access (2)
- Erstveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (160)
- Peer-Review (135)
Publisher
- Leibniz-Institut für Deutsche Sprache (IDS) (65)
- de Gruyter (48)
- IDS-Verlag (39)
- Taylor & Francis (15)
- Verlag für Gesprächsforschung (9)
- Leibniz-Institut für Deutsche Sprache (8)
- Peter Lang (8)
- Winter (8)
- Benjamins (7)
- Zenodo (7)
Die Vernetzung von Computern bewirkt die Entstehung eines Netzes aus Texten und, als Folge davon, sozialen Netzen von Nutzern dieser Texte als Schreibern und Lesern. Netzwerke sprachlicher Objekte gab und gibt es zwar auch ohne Digitalisierung und Vernetzung, jedoch weniger umfangreich und wesentlich schwerer, möglicherweise gar nicht in großer Menge analysierbar. Der vorliegende Beitrag befasst sich mit den verschiedenen Typen sprachlicher Netzwerke: Textgeweben, Interaktionsnetzwerken und sozialen Netzwerken. Es werden zentrale Begrifflichkeiten der Netzwerkanalyse erläutert und anhand von Beispielen gezeigt, wie sprachliche Kommunikation auf der Grundlage der Methoden der Netzwerkanalyse aus einer anderen, neuen Perspektive betrachtet werden kann.
Selten hat ein globales Ereignis nicht nur den Alltag sehr vieler Menschen weltweit schlagartig verändert und in einem längeren Zeitraum zu nachhaltigen Änderungen der Lebensumstände geführt, sondern auch direkte Spuren im Wortschatz und der Art und Weise des Kommunizierens hinterlassen, wie dies durch die Coronakrise der Fall war. Die Beiträge in diesem Band zeichnen diese Reflexionen nach und machen die Veränderungen auf Basis unterschiedlichen Materials (z.B. Pressetexte, Social-Media-Quellen, Gespräche) und zu einem breiten Themenspektrum (Arbeit, Schule, Wirtschaft usw.) nachvollziehbar. Ein deutlicher Fokus liegt dabei auf dem lexikalischen Wandel und zahlreichen Neologismen, die rund um die Coronapandemie aufgekommen sind.
Sprache im Gepäck. Von den vielfältigen Dialekten der Deutschen in der ehemaligen Sowjetunion
(2021)
Im Gepäck der etwa 2,5 Millionen der in den letzten rund dreißig Jahren in die Bundesrepublik eingewanderten (Spät-)Aussiedler aus Staaten der ehemaligen Sowjetunion befand sich ein großes immaterielles Erbe. Dieses war nicht auf alle gleichermaßen verteilt, bei dem einen mehr, bei der anderen weniger spürbar und ist immer weniger geworden. Es handelt sich dabei um die mitgebrachten »russlanddeutschen« Dialekte. Was sind das für Dialekte und wer spricht sie noch?
Gerade wenn es um die Gewinnung und eine erste Bewertung von Forschungsdaten geht, ist derzeit oft vom Übergang zu citizen science die Rede. Nachdem dieses Konzept zunächst in den Lebenswissenschaften eine größere Rolle gespielt hat, findet es sich neuerdings auch in Teilen der Sprachwissenschaft. Viele einschlägige Initiativen schließen an die Tätigkeiten an, bei denen sich auch traditionell schon die professionalisierte Wissenschaft der Hilfe der ‚Laien‘ bediente, sie können allerdings jetzt die in ungeahntem Ausmaß gewachsenen Möglichkeiten elektronischer Kommunikation und elektronischen Daten-Managements nutzen. Das digitale Interagieren erweitert die Möglichkeiten der als beteiligte „Laien“ gesehenen Personen aber doch so sehr, dass sich auch qualitativ ein neues Verhältnis zwischen den am Forschungsprozess Beteiligten entwickelt. In diesem Beitrag wird diskutiert, welche Folgen diese Veränderung für die wissenschaftliche Praxis, aber auch für das Verständnis des Konzepts „Wissenschaft“ hat.
Spiele und Spielgeräte: Tamagotchi, Sudoku oder doch Puzzle? (Aus der Rubrik Neuer Wortschatz)
(2021)
In conversation, speakers need to plan and comprehend language in parallel in order to meet the tight timing constraints of turn taking. Given that language comprehension and speech production planning both require cognitive resources and engage overlapping neural circuits, these two tasks may interfere with one another in dialogue situations. Interference effects have been reported on a number of linguistic processing levels, including lexicosemantics. This paper reports a study on semantic processing efficiency during language comprehension in overlap with speech planning, where participants responded verbally to questions containing semantic illusions. Participants rejected a smaller proportion of the illusions when planning their response in overlap with the illusory word than when planning their response after the end of the question. The obtained results indicate that speech planning interferes with language comprehension in dialogue situations, leading to reduced semantic processing of the incoming turn. Potential explanatory processing accounts are discussed.
This paper investigates situations in French videogame interactions where non-players who share the same physical space as players, participate in the gaming activities as spectators. Through a detailed multimodal and sequential analysis, we show that being a spectator is a local achievement of all co-present participants - players and non-players.
Deutsche Genitivattribute benötigen eine hinreichend overte Kasusmarkierung an abhängigen Wortarten (Determinierern, Adjektiven), mitunter in Kombination mit einer Markierung am Genitivnomen selbst. Wenn die Struktur der Attributsphrase solche Markierungen unmöglich macht, wird eine Präpositionalphrase mit von genutzt. Es gibt allerdings eine Reihe von Grenzfällen, die Genitivgebrauch erlauben, obwohl keine hinreichende Markierung möglich ist. Die vorliegende Studie liefert zu drei solchen Fällen empirische Daten: 1. Fälle, wo der unflektierte Wortstamm des Adjektivs oder des Genitivnomens einem Genitivsuffix gleicht („Pseudoflexion“), 2. Fälle, wo Determinierer und Genitivnomen schwach flektiert werden („doppelt schwache Flexion“) und 3. Fälle, wo die Determiniererposition durch einen weiteren, pränominalen Genitiv besetzt ist, der keine Kongruenz aufweisen kann („verschachtelte Genitivattribute“). Anhand umfassender Korpusuntersuchungen kann so eingeschätzt werden, welche Rolle diese Grenzfälle im System der deutschen Standardsprache spielen.
Social actions
(2021)
Social actions are recipient-designed actions that occur in the context of interaction sequences. This chapter focuses on sources and practices for the formation and ascription of social actions. While linguists stress the relevance of linguistic social action formats, conversation analysts highlight the relevance of the sequential position of an action, and sociolinguists point to the influence of social identities for action-formation and -ascription. The combination of these three approaches helps us to solve the analytic problem of indirectness, which, however, only rarely becomes a problem for the participants in an interaction themselves. Social properties which recurrently apply when using verbal and bodily resources of action-formation, i.e. the social actions themselves, inferred meanings, projected next actions, the participation framework, the activity type, speaker’s stance, participants’ identities, etc. lead to stable pragmatic connotations of those forms, i.e. action-meanings, which become idiomatic and part of our common-sense competence. Still, social actions are multi-layered and can be ambiguous at times. Therefore, their meaning can be open for negotiation. Intersubjectivity of action ascription is ultimately secured neither by conventions nor by speaker’s intentions, but is accomplished by their treatment in subsequent discourse.
Mobile live video streaming with smartphones is an everyday media practice in which the participants are in a specific multimodal constellation and streamers and viewers have access to various semiotic resources for interactionally establishing alignment. Based on the multimodal sequence analysis of a concise episode of a journalist's livestream coverage of a political event on the streaming platform Periscope, I will address the question of how participation and involvement in live video streams are achieved and organised by the participants. I will show that hosts in the media practice of live video streaming act in an interaction-dominant manner and involve the viewers in the situation through asymmetrical participation coordination via footing shifts.
Signposts for CLARIN
(2021)
An implementation of CMDI-based signposts and its use is presented in this paper. Arnold, Fisseni et al. (2020) present signposts as a solution to challenges in long-term preservation of corpora. Though applicable to digital resources in general, we focus on corpora, especially those that are continuously extended or subject to modification, e.g., due to legal injunctions, but also may overlap with respect to constituents, and may be subject to migrations to new data formats. We describe the contribution signposts can make to the CLARIN infrastructure, notably virtual collections, and document the design for the CMDI profile.
Dieser Aufsatz befasst sich mit pragmatischen Aspekten von Negationsanhebung (NA), die vor allem in Horn (1978) erörtert wurden, und mit performativischen Eigenschaften von NA-Konstruktionen, die ursprünglich in Prince (1976), vor allem mit Bezug auf französische Daten diskutiert wurden. Das Ziel ist, die Kernaussagen von Horn (1978) und Prince (1976) mit Korpusdaten im übereinzelsprachlichen Kontext zu validieren. Als Gegenstand der Untersuchung werden deutsche und polnische NA-Konstruktionen herangezogen und entsprechend zwei verschiedene monolinguale Korpora als Datenquelle benutzt.
Shutdown, Lockdown und Exit
(2021)
This article examines how the most frequent imperative forms of the verb to show in German (zeig mal) and Czech (ukaž) are deployed in object-centred sequences. Specifically, it focuses on smartphone-based showing activities as these were the main sequential environments of show imperatives in the datasets investigated. In both languages, the imperative form does not merely aim to elicit a responsive action from the smartphone holder (such as making the device available) but projects an individual course of action from the requester’s side in the form of an immediate visual inspection of the digital content. This inspection is carried out as part of a joint course of action, allowing the recipient to provide a more detailed response to a prior action. Therefore, this specific imperative form is proven to be cross-linguistically suited to technology-mediated inspection sequences.
The article focuses on determining responsible parties and the division of potential liability arising from sharing language data (LD) containing personal data (PD). A key issue here is to identify who has to make sure and guarantee the GDPR compliance. The authors aim to answer 1) whether an individual researcher is a controller and 2) whether sharing LD results in joint controllership or separate controllership (whether the data's transferee becomes the controller, the joint controller or the processor). The article also analyses the legal relations of parties involved in data sharing and potential liability. The final section outlines data sharing in the CLARIN context. The analysis serves as a preliminary analytical background for redesigning the CLARIN contractual framework for sharing data.
In order to differentiate between figurative and literal usage of verb-noun combinations for the shared task on the disambiguation of German Verbal Idioms issued for KONVENS 2021, we apply and extend an approach originally developed for detecting idioms in a dataset consisting of random ngram samples. The classification is done by implementing a rather shallow, statistics-based pipeline without intensive preprocessing and examinations on the morphosyntactic and semantic level. We describe the overall approach, the differences between the original dataset and the dataset of the KONVENS task, provide experimental classification results, and analyse the individual contributions of our feature sets.
Semiotische Medientheorien
(2021)
In this paper, the meaning and processing of the German conditional connectives (CCs) such as wenn ‘if’ and nur wenn ‘only if’ are investigated. In Experiment 1, participants read short scenarios containing a conditional sentence (i.e., If P, Q.) with wenn/nur wenn ‘if/only if’ and a confirmed or negated antecedent (i.e., P/not-P), and subsequently completed the final sentence about Q (with or without negation). In Experiment 2, participants rated the truth or falsity of the consequent Q after reading a conditional sentence with wenn or nur wenn and a confirmed or negated antecedent (i.e., If P, Q. P/not-P. // Therefore, Q?). Both experiments showed that neither wenn nor nur wenn were interpreted as biconditional CCs. Modus Ponens (If P, Q. P. // Therefore, Q) was validated for wenn, whereas it was not validated in the case of nur wenn. While Denial of the Antecedent (If P, Q. not-P. // Therefore, not-Q.) was validated in the case of nur wenn, it was not validated for wenn. The same method was used to test wenn vs. unter der Bedingung, dass ‘on condition that’ in Experiment 3, and wenn vs. vorausgesetzt, dass ‘provided that’ in Experiment 4. Experiment 5, using Affirmation of the Consequent (If P, Q. Q. // Therefore, P.) to test wenn vs. nur wenn replicated the results of Experiment 2. Taken together, the results show that in German, unter der Bedingung, dass is the most likely candidate of biconditional CCs whereas all others are not biconditional. The findings, in particular of nur wenn not being semantically biconditional, are discussed based on available formal analyses of conditionals.
Oralität ist gegenüber Literalität historisch primär, und der Übergang hin zur Literalität ist sprach- wie kulturwissenschaftlich einschneidend. Unserdeutsch (Rabaul Creole German), eine erst knapp über 100 Jahre junge, originär ausschließlich mündlich verwendete Kreolsprache, befindet sich gegenwärtig an der Schwelle hin zur Verschriftung. Eine Sammlung von rund 180 spontan schriftlich produzierten Äußerungen dieser noch auf allen Ebenen unnormierten Sprache zeigt von den Unserdeutsch-SchreiberInnen intuitiv zugrunde gelegte Graphem-Phonem-Korrespondenzen. Die Schriftbelege lassen dabei Rückschlüsse zu auf graphematische Kontakteinflüsse sowie auf die mentale Repräsentation von Wörtern bei den SprecherInnen. Diese Erkenntnisse sind, neben ihrer sprachtheoretischen Relevanz, vor allem auch für die noch ausstehende Erarbeitung einer Orthographie von Unserdeutsch von Bedeutung.
Die Dokumentation und Untersuchung deutscher Sprachinselvarietäten war schon immer eine der wichtigsten Aufgaben der germanistischen Sprachwissenschaft. Mittlerweile stellt sich aber immer öfter die Frage der Nachhaltigkeit der erhobenen Spachinseldaten. Insbesondere in Bezug auf die vom Sprachtod bedrohten Varietäten, wie z.B. im Fall der russlanddeutschen Dialekte aus den noch intakten Sprachinseln der ehemaligen Sowjetunion, ist es äußerst wichtig, die existierenden Audioaufnahmen systematisch und dauerhaft zu archivieren. Aber nicht nur die Archivierung, sondern auch der freie und unkomplizierte Zugang zu diesen Materialien ist ein wesentlicher Aspekt im Konzept der Nachhaltigkeit. Wie sollte dieser Zugang aber gestaltet sein und in welcher Form sollen die Daten präsentiert werden? Auf genau diese Frage ist das Projekt „Elektronisches Wörterbuch. Ein Online-Informationsangebot zu Sprache und Dialekten der Russlanddeutschen" eingegangen. In diesem Projekt wurden historische Tonaufnahmen russlanddeutscher Dialekte linguistisch aufbereitet und in Form einer strukturierten Russlanddeutschen Dialektdatenbank (RuDiDat) online veröffentlicht. Diese Datenbank ist frei verfügbar und ermöglicht die Recherche im Korpus des Russlanddeutschen. Der vorliegende Beitrag stellt die Datenbank vor und thematisiert Herausforderungen, die durch unterschiedliche Ausprägungsformen des Russlanddeutschen entstehen könnten, wenn man die im Internet freigegebenen Sprachinseldaten für vergleichende Analysen heranzieht.
The present paper explores how rules are enforced and talked about in everyday life. Drawing on a corpus of board game recordings across European languages, we identify a sequential and praxeological context for rule talk. After a game rule is breached, a participant enforces proper play and then formulates a rule with an impersonal deontic statement (e.g. “It’s not allowed to do this”). Impersonal deontic statements express what may or may not be done without tying the obligation to a particular individual. Our analysis shows that such statements are used as part of multi-unit and multi-modal turns where rule talk is accomplished through both grammatical and embodied means. Impersonal deontic statements serve multiple interactional goals: they account for having changed another’s behavior in the moment and at the same time impart knowledge for the future. We refer to this complex action as an “instruction.” The results of this study advance our understanding of rules and rule-following in everyday life, and of how resources of language and the body are combined to enforce and formulate rules.
Geeignete Such- und Visualisierungswerkzeuge, idealiter in Form von Webapplikationen, sind für den benutzerfreundlichen Zugang zu Sprachressourcen von großer Bedeutung. In diesem Beitrag stellen wir die Webapplikationen Rover und TüNDRA vor, die am CLARIN-D Zentrum Tübingen im Rahmen des BMBF-Projekts CLARIN-D entwickelt wurden.
In diesem Buch werden auf einer großen empirischen Basis die regionalen Sprechweisen von verschiedenen Bevölkerungsgruppen in einem kleinen Gebiet im alemannischen Sprachraum untersucht. Als Datengrundlage dienen aktuelle, spontansprachliche und fragebuchbasierte Daten, die einander gegenübergestellt und diachron mit den Ergebnissen des Südwestdeutschen Sprachatlas (SSA) aus den 1970er Jahren verglichen werden. Es werden vorwiegend datenaggregierende Verfahren angewendet, um die regionale und soziale Gebundenheit der vorgefundenen Variation zu erfassen. Mit Hilfe von Dialektabstandsmessungen werden ausgewählte, überwiegend phonologische Merkmale im Hinblick auf Dialektwandelprozesse untersucht. Außerdem wird gezeigt, dass mit dialektometrischen Verfahren explorative Aggregatanalysen möglich sind, die es erlauben, Sprachräume zu identifizieren und dialektologisch zu beschreiben.
Based on longitudinal audiovisual data from family interactions, we focus on how young children between 1;08 and 2;10 report trouble they are encountering in their current activity using the response cry oh in combination with other lexical items (e.g., “oh fell off”) and bodily displays. While at a very young age the children remain focused on their activity and try to solve the problem independently, at an older age they start to systematically use gaze directed toward the parent and suspension of the current activity to enlist the adult’s assistance. We argue that these bodily displays are among the resources whose presence or absence constrains whether the report of trouble leads to the recruitment of assistance or not. Regarding the developmental implications, it seems that during their third year of life, young children expand their repertoire for dealing with trouble interactively. Data are in German with English translations.
In this paper, the basic assumptions are presented against the background of the development of a corpus-based method to determine suitable headword candidates for the LeGeDe-prototype (LeGeDe= Lexik des gesprochenen Deutsch), a lexicographical resource on spoken German. In a first quantitatively oriented step, potential one-word headword candidates are identified with the help of frequency class comparisons from a corpus for spoken (FOLK) and a subset from a corpus for written German (DEREKO). Qualitative analyses based on a project-specifically defined sample of data from the FOLK corpus lead to multi-word headword candidates. The results of the qualitative analyses were also compared with the results of studies from the research literature as well as (quantitative-orientated) bi- and trigram analyses. In their multi-word form, these candidates are particularly characterized by the fact that they assume a very special interactional function in the (authentic) interaction and have to be described as a whole unit. The paper explains this combined procedure, which was extracted in the LeGeDe-project for the appointment of headword candidates.
Information theory can be used to assess how efficiently a message is transmitted on the basis of different symbolic systems. In this paper, I estimate the information-theoretic efficiency of written language for parallel text data in more than 1000 different languages, both on the level of characters and on the level of words as information encoding units. The main results show that (i) the median efficiency is ∼29% on the character level and ∼45% on the word level, (ii) efficiency on both levels is strongly correlated with each other and (iii) efficiency tends to be higher for languages with more speakers.
In diesem Beitrag werden Präpositionalobjektsätze – also Sätze, die in der Funktion von präpositionalen Objekten stehen, – aus ausgewählten germanischen und romanischen Sprachen sprachvergleichend betrachtet. Dabei zeigen sich zwei verschiedene Strategien, die Verbindung von Präposition und Satz herzustellen: direkt, indem die Präposition einen Satz selegiert, und indirekt über die Anbindung mit einer komplexen Proform. Erstere Strategie sehen wir im Schwedischen (stellvertretend für die nordgermanischen Sprachen) und auch im Französischen und Italienischen (mit einer coverten Präposition). Im Niederländischen und Deutschen findet sich die zweite Strategie, bei der Sätze mithilfe eines Pronominaladverbs angebunden werden. Eine genauere Analyse dieser beiden germanischen Sprachen zeigt, dass im Deutschen Pronominaladverb und Satz eine Konstituente bilden können, während dies im Niederländischen nicht möglich ist. Alle analysierten Sprachen haben gemeinsam, dass das präpositionale Element (Präposition oder Pronominaladverb) abwesend sein kann oder muss. Dabei lässt sich anhand von Pronominalisierung, Topikalisierung und W-Extraktion zeigen, dass das P-Element syntaktisch präsent als leeres Element (covert) realisiert werden muss, da diese Sätze mit und ohne P-Element Eigenschaften der PO-Sätze haben und mit DO-Sätzen kontrastieren.
Die Analyse prosodisch-phonetischer Ressourcen stand neben morpho-syntaktischen, lexiko-semantischen und diskurspragmatischen von Anfang an im Mittelpunkt interaktional-linguistischer Forschung. In den letzten Jahren sind darüber hinaus visuell wahrnehmbare Phänomene zunehmend Gegenstand interaktional-linguistischer Beschreibungen von Kommunikationssituationen geworden.
Der vorliegende Sammelband enthält neun Untersuchungen, die auf Korpora von Alltagsgesprächen oder institutionellen Interaktionssituationen (Unterricht und Parlamentsdebatten) in unterschiedlichen Sprachen (Deutsch, Englisch, Mandarin) beruhen. Die Beiträge zeigen, welchen Anteil unterschiedliche semiotische Ressourcen – interpretiert in ihrer holistischen Gestalt – an der Organisation sozialer Interaktionen haben. Der Band trägt somit dazu bei, die Rolle multimodaler Ressourcenbündel in ihrer Situiertheit, Prozesshaftigkeit und Kontextsensitivität für die Durchführung kommunikativer Aufgaben besser zu verstehen.
Das Projekt „Bürgernahe Sprache in der Finanzverwaltung“ verfolgt das Ziel, Texte aus dem Bereich der Steuerverwaltung in bürgernaher Sprache umzusetzen. Im September 2020 hat das IDS in enger Rückbindung an den Lenkungskreis des Projektes begonnen, eine Pilotstudie zu entwickeln. Hierin wurden ausgewählte Texte (Textbausteine) in einem Online-Umfrageformat mit verschiedenen Bewertungsskalen aufbereitet. Die Beispieltexte in der Studie stammen aus den Erläuterungstexten zum Einkommensteuerbescheid sowie den Ausfüllanleitungen zur Grundsteuer. Die Testpersonen sollten in mehreren unterschiedlichen Aufgabenblöcken ausgewählte Texte in Vorher- und/oder Nachher-Versionen über die Bewertungsskala bewerten. Zusätzlich konnten sie auf jeder Aufgabenseite Anmerkungen in einem Freifeld notieren. Das Ziel der Umfrage ist es, Bürgerinnen und Bürger zu ihren Eindrücken zu befragen und aus den Ergebnissen Rückschlüsse auf die Verständlichkeit der Texte zu ziehen. Ein wichtiges übergeordnetes Ziel der Pilotstudie ist es, die eigentlichen Adressatinnen und Adressaten der Texte in die Projektarbeit mit einzubeziehen. Die Einschätzungen und Anmerkungen der Beteiligten geben für den weiteren Projektverlauf hilfreiche Hinweise und werden in die weiteren Überlegungen und praktischen Umsetzungen einfließen. Dieser Bericht fasst die Ergebnisse aus der Pilotstudie zusammen. Er gibt zu den verschiedenen Blöcken, die die Probandinnen und Probanden bearbeitet haben, Einblick, wie die Testpersonen die ihnen präsentierten Texte bewertet haben. Dabei werden die quantitativ ausdrückbaren Ergebnisse durch grafische Darstellungen visualisiert und in textueller Form zusammengefasst. Die Antworten auf die offenen Fragen geben einen qualitativen Eindruck der Anmerkungen, die die Probandinnen und Probanden in Freifeldern hinterlassen haben.
The prohibitive is typically defined as the negative imperative, i.e. it “implies making someone not do something, having the effect of forbidding, preventing, or restricting” (Aikhenvald, 2017: 3). This chapter focuses on the formation of the prohibitive in the languages of Daghestan and neighboring regions, analyzing two different aspects of the morphological coding: first, the verb form (especially whether it is an imperative form or not), and second, the type of negation marker/affix used. Based on this, the general encoding types are deduced. Additionally, the phonological form of the markers is shortly analyzed.
Contents:
1. Julien Abadji, Pedro Javier Ortiz Suárez, Laurent Romary and Benoît Sagot: "Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus", S.1-9.
2. Markus Gärtner, Felicitas Kleinkopf, Melanie Andresen and Sibylle Hermann: "Corpus Reusability and Copyright - Challenges and Opportunities", S.10-19.
3. Nils Diewald, Eliza Margaretha and Marc Kupietz: "Lessons learned in Quality Management for Online Research Software Tools in Linguistics", S.20-26.
This paper deals with a specific type of lexeme, namely binary preposition-noun combinations containing temporal references like am Ende [at (the) end] or für Sekunden [for seconds]. The main characteristic of these combinations is the recurrent internal zero gap. Despite the fact that the omission of the determiner can often be explained by grammatical rules, the zero gaps indicate a higher degree of lexicalization. Therefore, we interpret these expressions as minimal phraseological units with holistic meanings and functions. The corpusdriven exploration of typical context patterns (e.g. using collocation profiles and the lexpan slot filler analysis) shows that a) even such minimal expressions are based on semi-abstract schemes and b) temporal expressions can also fulfill modal or discursive functions, usually with fuzzy borders and overlapping structures. In the case of modalization or pragmatization one can regard such PNs as distinct lexicon entries.
Das neue Onlineformat PREPCONonline führt durch die Welt der Korpusdaten und zeigt, welchen Erklärungswert authentische Sprache, die von Experten aufbereitet ist, für die eigene sprachliche Kompetenz haben kann. Dieser Ansatz folgt der Überzeugung, dass vor allem auf einem gehobenen Kompetenzniveau reale Sprachausschnitte, die für einen Aspekt des Gebrauchs besonders typisch sind, möglichst unverfälscht abrufbar sein sollten, um Sprache, so wie sie wirklich verwendet wird, versteh- und anwendbar zu machen.
As part of our project "German at Work: The Linguistic and Communicative Integration of Refugees" at the Leibniz-Institute for the German Language (Mannheim, Germany), we are conducting several ethnographic field studies to investigate the integration process of refugees into various professional fields. The guiding questions are which linguistic and communicative problems arise in workplace interactions between refugees and their colleagues and with which communicative practices the participants ensure mutual understanding. In the present article, we further focus on the question whether and how the professional trainers use the work interactions as opportunities for language mediation and which practices they use.
Mock fiction is a genre of humorous, fictional narratives. It is pervasive in adolescents’ peer-group interaction. Building on a corpus of informal peer-group interaction among 14 to 17 year-old German adolescents, it is shown how mock fiction is used to sanction identity-claims of peer-group co-members that are taken to be inadequate by the teller of a mock fiction. Mock fiction exposes and ridicules those claims by fictional exaggeration. Mock fiction is an indirect, yet sometimes even highly abusive means for criticizing and negotiating identities and statuses of peer-group members. The analysis shows how mock fiction is collaboratively produced, how it is used to convey criticism and to negotiate social norms indirectly, and how, in addition, it allows for performative self-positioning of the tellers as skilled, entertaining tellers and socio-psychological diagnosticians.
Schegloff (1996) has argued that grammars are “positionally-sensitive”, implying that the situated use and understanding of linguistic formats depends on their sequential position. Analyzing the German format Kannst du X? (corresponding to English Can you X?) based on 82 instances from a large corpus of talk-in-interaction (FOLK), this paper shows how different action-ascriptions to turns using the same format depend on various orders of context. We show that not only sequential position, but also epistemic status, interactional histories, multimodal conduct, and linguistic devices co-occurring in the same turn are decisive for the action implemented by the format. The range of actions performed with Kannst du X? and their close interpretive interrelationship suggest that they should not be viewed as a fixed inventory of context-dependent interpretations of the format. Rather, the format provides for a root-interpretation that can be adapted to local contextual contingencies, yielding situated action-ascriptions that depend on constraints created by contexts of use.
Polish żeby under negation
(2021)
The paper addresses two patterns in the distribution of complement clauses headed by the complementizer żeby in Polish related to the presence of sentential negation. It is argued that żeby-clauses with an obligatory negation in the matrix clause, licensed by epistemic verbs, can be treated in terms of negative polarity, with żeby defined as an n-word. Structures with żeby-clauses and an obligatory negation in the embedded clause, licensed by verbs of fear, are argued to be an instance of negative complementation, with żeby specified as a negative complementizer. A uniform lexicalist analysis within the framework of HPSG is provided, employing tools developed to account for Negative Concord in Polish.
The term “pivot” usually refers to two overlapping syntactic units such that the completion of the first unit simultaneously launches the second. In addition, pivots are generally said to be characterized by the smooth prosodic integration of their syntactic parts. This prosodic integration is typically achieved by prosodic-phonetic matching of the pivot components. As research on such turns in a range of languages has illustrated, speakers routinely deploy pivots so as to be able to continue past a point of possible turn completion, in the service of implementing some additional or revised action. This article seeks to build on, and complement, earlier research by exploring two issues in more detail as follows: (1) what exactly do pivotal turn extensions accomplish on the action dimension, and (2) what role does prosodic-phonetic packaging play in this? We will show that pivot constructions not only exhibit various degrees of prosodic-phonetic (non-)integration, i.e., differently strong cesuras, but that they can be ordered on a continuum, and that this cline maps onto the relationship of the actions accomplished by the components of the pivot construction. While tighter prosodic-phonetic integration, i.e., weak(er) cesuring, co-occurs with post-pivot actions whose relationship to that of the pre-pivot tends to be rather retrospective in character, looser prosodic-phonetic integration, i.e., strong(er) cesuring, is associated with a more prospective orientation of the post-pivot’s action. These observations also raise more general questions with regard to the analysis of action.
Die heutige Stellung des Deutschen in Europa beruht auf vielfältigen
Faktoren: Historische Entwicklungen, politische Rahmenbedingungen oder unterschiedliche Traditionen in den Bildungssystemen der Mitgliedsländer der Europäischen Union kommen dabei ebenso zum Tragen wie das hochaktuelle Thema der Fachkräftezuwanderung. Diese Bestandsaufnahme betrachtet die Hintergründe der Entwicklung der Stellung der deutschen Sprache und zeigt dabei auch Trends und Perspektiven für die Zukunft auf. An diesen setzt das Goethe-Institut als Sprach- und Kulturinstitut der Bundesrepublik Deutschland gemeinsam mit seinen Partnern an, um die Kenntnis und die Stellung der deutschen Sprache in Europa im Rahmen einer gelebten Mehrsprachigkeit gezielt zu fördern.
„Paronyme – Dynamisch im Kontrast“ ist ein neues und neuartiges Nachschlagewerk für sprachliche Zweifelsfälle und Unsicherheiten. Erstmals werden lautlich, orthografisch und/oder semantisch ähnliche Wörter (z. B. farbig-farblich, kindlich-kindisch, universal-universell, Mehrheit-Mehrzahl) korpusbasiert in ihrem aktuellen Gebrauch untersucht und dokumentiert. Nutzer*innen können sich über die Bedeutung jedes Ausdrucks in zahlreichen Angaben und Verwendungsbeispielen informieren. Dies erfolgt kontrastiv und dynamisch in selbst wählbaren Ausschnitts- oder Vergleichsansichten, im Überblick oder im Detail.
OKAY originates from English, but it is increasingly used across languages. This chapter presents data from 13 languages, illustrating the spectrum of possible uses of OKAY in responding and claiming understanding in contexts of informings. Drawing on a wide range of interaction types from both informal and institutional contexts, including those crucially involving embodied practices, we show how OKAY can be used to (i) claim sufficient understanding, (ii) mark understanding of the prior informing as preliminary or not complete, and (iii) index discrepancy of expectation.
OKAY has been termed ‘a spectacular expression’ and ‘America’s greatest invention.’ This volume offers an in-depth empirical study of the uses that have resulted from its global spread. Focusing on actions and interactional practices, it investigates OKAY in a variety of settings in 13 languages. The collected work showcases the importance of a holistic analysis: prosodic realization and the placement of OKAY in its larger sequential and multimodal context emerge as constitutive for distinct uses in individual languages. An inductive approach makes it possible to identify practices not previously documented, for example OKAY used for ‘qualified acceptance’ or as a ‘continuer’, and to document a core of recurrent, similar uses across languages. This work also outlines new research directions for comparative analysis by offering first insights into the diachronic development of OKAY’s uses and the relationship of OKAY to other particles in specific languages.
Dictionary usage research views dictionaries primarily as tools for solving linguistic problems. A large proportion of dictionary use now takes place online and can thus be easily monitored using tracking technologies. Using the data gathered through tracking usage data, we hope to optimize user experiences of dictionaries and other linguistic resources. Usage statistics are also used for external evaluation of linguistic resources. In this paper, we pursue the following three questions from a quantitative perspective: (1) What new insights can we gain from collecting and analysing usage data? (2) What limitations of the data and/or the collection process do we need to be aware of? (3) How can these insights and limitations inform the development and evaluation of linguistic resources?
Control, typically defined as a specific referential dependency between the null-subject of a non-finite embedded clause and a co-dependent of the matrix predicate, has been subject to extensive research in the last 50 years. While there is a broad consensus that a distinction between Obligatory Control (OC), Non-Obligatory Control (NOC) and No Control (NC) is useful and necessary to cover the range of relevant empirical phenomena, there is still less agreement regarding their proper analyses. In light of this ongoing discussion, the articles collected in this volume provide a cross-linguistic perspective on central questions in the study of control, with a focus on non-canonical control phenomena. This includes cases which show NOC or NC in complement clauses or OC in adjunct clauses, cases in which the controlled subject is not in an infinitival clause, or in which there is no unique controller in OC (i.e. partial control, split control, or other types of controllers). Based on empirical generalizations from a wide range of languages, this volume provides insights into cross-linguistic variation in the interplay of different components of control such as the properties of the constituent hosting the controlled subject, the syntactic and lexical properties of the matrix predicate as well as restrictions on the controller, thereby furthering our empirical and theoretical understanding of control in grammar.
Obwohl Smartphones und andere mobile Endgeräte mittlerweile ein fester Bestandteil unseres Alltags sind, betonen öffentliche und wissenschaftliche Diskurse immer noch bevorzugt mögliche negative Auswirkungen ihres Gebrauchs auf Gesundheit und Kommunikationsverhalten. Dieser Beitrag skizziert einen anderen Ansatz zur Analyse alltäglichen Technologiegebrauchs, indem er zunächst auf Studien aus der angewandten Linguistik und insbesondere der interaktionalen Forschung eingeht, die sich auf dessen öffentliche Beobachtbarkeit, Mobilität und Ubiquität konzentrieren. Anhand zweier Auszüge aus videoaufgezeichneten Interaktionen wird dann aufgezeigt, wie eine multimodale und sequentielle Analyse dazu beitragen kann, Technologiegebrauch als eine routinemäßige und geordnete soziale Praktik zu verstehen, die nicht mit sozialem, kooperativem Handeln in Widerspruch steht oder dieses gefährdet. Ein detaillierter Blick auf situierten Smartphonegebrauch in informellen und institutionellen Face-to-Face-Settings lenkt die analytische Aufmerksamkeit weg von einer generisch positiven oder negativen Bewertung der Technologie hin zu verschiedenen interaktionalen Phänomenen, die mit ihrer Handhabung und Erkundung in Zusammenhang stehen. Es wird abschließend argumentiert, dass diese Art von mikroanalytischem Ansatz zu einer facettenreichen und objektiveren Perspektive auf die situierte Nutzung mobiler Geräte beitragen kann.
Hier sehen Sie neue Wörter sowie bekannte Wörter mit neuen Bedeutungen, die seit Beginn der COVID-19-Pandemie aufgekommen sind, bei denen wir aber noch beobachten, ob sie eine gewisse Verbreitung in die Allgemeinsprache erfahren werden. Zu jedem dieser Wörter geben wir eine (vorläufige, grobe) Bedeutungserläuterung an und illustrieren die Verwendung mit 1-2 Belegen.
Technische Innovationen, historische Ereignisse, sich wandelnde gesellschaftliche Gegebenheiten
oder politische Neuerungen – für eine funktionierende Verständigung muss sich
der Wortschatz ständig anpassen. Da kann es schnell passieren, dass man ein Wort hört oder
liest, das man noch nicht kennt oder bei dem man sich unsicher ist, wie man es schreibt oder
spricht. Und beim Nachschlagen in einem Wörterbuch, das neue Wörter verzeichnet, stellen
sich weitere Fragen: Welche Quellen werden für ein solches Neologismenwörterbuch ausgewertet,
wie kommt ein Wort dort hinein, und ab wann gilt es als gut integriert? Welche
Typen von Neologismen gibt es eigentlich?
Negation raising and mood. A corpus-based study of Polish sądzić ‘think’ and wierzyć ‘believe’
(2021)
The paper describes the distribution of two negation raising predicates in Polish: sądzić ‛think’ and wierzyć ‛believe’ in the National Corpus of Polish with a particular focus on their morphosyntax and the mood of their clausal complements. The aim was to examine whether there are any correlations between these two parameters, and to what extent negation raising with those verbs exhibits performative features (in terms of Prince, 1976). The results of the study support the performative approach to negation raising as per Prince (1976) only for cases with subjunctive complements. The corpus findings further imply that Polish negation raising predicates encode two different degrees of (un)certainty concerning the truth of the embedded proposition depending on the mood of their complements. Structures with indicative complements express weaker uncertainty than structures with subjunctive complements.
Nachhaltigkeit und nachhaltige Entwicklung gehören zu den drängenden globalen Zielen unserer Zeit. Als interdisziplinäres und vielschichtiges Thema ist Nachhaltigkeit auch für die angewandte Linguistik hochrelevant – sei es mit Blick auf die diskursive Debattenkultur, neue mediale Formen der Partizipation oder Formen der Wissenskommunikation, wie die international entstandene Nachhaltigkeitskommunikation in Wirtschaft und Politik.
Argumentative Stützungen von diskursiven Geltungsansprüchen spielen im Rahmen von Diskursanalysen zu gesellschaftlich verhandelten Themen, wie ökologische Nachhaltigkeit, eine wichtige Rolle. Im vorliegenden Beitrag, der einen zentralen Aspekt der großangelegten diachronen Studie von Schwegler (2018) fokussiert vorstellt, wird ein diskurslinguistischer Ansatz zur Erfassung von Argumentationen und Werteverständnissen dargelegt, der Argumentgruppen inhaltlich bzw. thematisch unterscheidet – d. h. nicht mikro- oder makroformal analysiert – und gleichzeitig mittels eines framesemantischen Ansatzes über eine Argumentationsanalyse auf mittlerer Abstraktionsebene hinausgeht. So kann auch für vermeintlich konsensuelle Bereiche aufgedeckt werden, wie Konflikte latent innerhalb zentraler argumentativer Begriffe liegen. Identifizierte Argumentgruppen, wie hier beispielhaft Gerechtigkeit, sind dabei nicht genuin diskursspezifisch, spezifisch sind vielmehr die Kombinationen der Werteverständnisse, d. h. die Arten von Gerechtigkeit, an die argumentativ appelliert wird. Im deutschsprachigen Nachhaltigkeitskontext sind dies u. a. Fairness, Gleichheit (bzgl. Umweltgerechtigkeit oder Verfahrensgerechtigkeit), globale Gleichberechtigung, kosmische Gerechtigkeit (Schicksal), Reziprozität/Tauschgerechtigkeit sowie Gewohnheitsrecht oder Utilitarismus, die in kontrastiver Verwendung Konfliktpotenzial bergen.
Sprachressourcen in digitaler Form liegen für ein immer breiteres Spektrum von Einzelsprachen vor. Linguistisch annotierte Korpora ermöglichen es, gezielt nach linguistischen Mustern auf der Wort-, Phrasen-, und Satzebene zu suchen und in quantitativer und qualitativer Hinsicht auszuwerten. In diesem Beitrag illustriere ich anhand von ausgewählten Beispielen den Mehrwert, den annotierte Textkorpora für die sprachwissenschaftliche Forschung bieten können. Viele der vorgestellten Sprachressourcen werden im Rahmen der CLARIN-Infrastruktur nachhaltig zur Verfügung gestellt. Die Korpora sind entweder durch Suchportale recherchierbar oder werden per Download zur Verfügung gestellt.
The project “Paronymwörterbuch” investigates and documents easily confused words (so-called paronyms) in German with respect to their use in public discourse as documented in a large corpus. These are, for example, antik/antiquiert/antiquarisch (antique/antiquated/antiquarian) or sportlich/sportiv (sporty/athletic). The results of this work are explanatory, contrastive entries in a new dynamic e-dictionary called “Paronyme − Dynamisch im Kontrast”. The objective of this paper is twofold. Firstly, essential new usage modalities of the new dictionary will be illustrated. As it is designed for contrastive consultation processes, the comparative structure of the entries will be elucidated and we will show how this dictionary has moved away from static to dynamic presentation by incorporating flexible consultation options. Secondly, as entries contain linguistic details which are consistently paired up with conceptual-encyclopaedic information, it is shown how this reference guide combines corpus-based methods with cognitive semantics. In this way, linguistic findings correlate better with how users conceptualise language by adequately reflecting ideas such as conceptual structure, categorisation and knowledge. Consequently, appropriate contrastive corpus tools and methods are employed. This paper also emphasises the need of semiotic approaches to the analysis of linguistic data in order to provide ostensive and cognitive-oriented lexical explanations. Such approaches are also necessary to guarantee an efficient pairwise investigation of paronyms. Advantages and disadvantages of explorative self-organising feature maps will be explained in more detail.
Idealerweise sollen Migrantinnen und Migranten nach ihrer Ankunft in Deutschland zunächst erfolgreich einen sprachlichen Integrationskurs absolvieren und anschließend an einer beruflichen Maßnahme teilnehmen oder je nach Alter und Berufserfahrung eine duale Ausbildung beginnen beziehungsweise gleich eine Arbeitsstelle antreten. Doch wie sieht die Realität aus? Durchlaufen alle Einwandernden tatsächlich diese Etappen? Und was passiert in den Betrieben, wenn die Migrantinnen und Migranten trotz des Besuches eines Integrationskurses eine Ausbildung beginnen und ihre Sprachkenntnisse für den Beruf (zunächst) nicht ausreichend sind? Sind die Betriebe auf solche sprachlichen und kommunikativen Herausforderungen vorbereitet? Im Folgenden werde ich auf diese Fragen in Bezug auf die jüngste Einwanderungsbewegung nach Deutschland, nämlich der durch Krieg und Vertreibung ausgelösten Migration von 2015 und 2016, eingehen. Die hier präsentierten Befunde beruhen auf den Ergebnissen unseres Projekts „Deutsch im Beruf: Die sprachlich-kommunikative Integration von Flüchtlingen", das seit 2016 am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim durchgeführt wird.
Our study deals with early bodily responses to directives (requests and instructions, i.e., second pair parts [SPPs]) produced before the first pair part (FPP) is complete. We show how early bodily SPPs build on the properties of an emerging FPP. Our focus is on the successive incremental coordination of components of the FPP with components of the SPP. We show different kinds of micro-sequential relationships between FPP and SPP: successive specification of the SPP building on the resources that the FPP makes available, the readjustment or repair of the SPP in response to the emerging FPP, and reflexive micro sequential adaptions of the FPP to an early SPP. This article contributes to our understanding of the origins of projection in interaction and of the relationship between sequentially and simultaneity in interaction. Data are video-recordings from interaction in German.
Die Studie untersucht die argumentstrukturellen Eigenschaften von medialen Kommunikationsverben. Das sind Verben, die sich auf Situationen beziehen, in denen die Kommunikation mithilfe eines technologischen Mediums erfolgt. Im Mittelpunkt steht die Frage, ob bzw. inwiefern sich neue, aus dem Englischen entlehnte mediale Kommunikationsverben an die Argumentstrukturen bedeutungsverwandter Verben des Deutschen resp. des Spanischen anpassen.
Maske oder Mundschutz?
(2021)
How do people’s interactional practices change over time? Can conversation analysis identify those changes, and if so, how? In this introductory article, we scrutinize the novel insights that can be gained from examining interactional practices over time and discuss the related methodological challenges for longitudinal CA. We first retrace CA’s interest in the temporality of social interaction and then review three lines of current CA work on change over time: developmental studies, studies of sociohistorical change, and studies of joint interactional histories. Existing work shows how the execution of locally coordinated actions and their meanings change over time; how prior actions inform future actions; and how resources, practices, and structures of joint action emerge over people’s repeated interactional encounters. We conclude by arguing that the empirical analysis of the microlevel organization of social interaction, which is the hallmark of CA, can elucidate the fine-grained situated interactional infrastructure that provides for the larger-scale social dynamics that have been of interest to other lines of research.
Der vorliegende Band geht aus der Arbeit des DFG-Netzwerks >Linguistik und Medizin< – Patho- und Saluto-Diskurse im Spannungsfeld von objektivierter Diagnose, interaktiver Vermittlung und medialer Konstitution (vgl. Iakushevich, Ilg & Schnedermann 2017) hervor, das Forscherinnen und Forscher aus Deutschland, der Schweiz, Österreich und Ungarn vereint (www.linguistik-medizin.net). Das Netzwerk wurde 2017 gegründet, um die Forschungstätigkeiten der verschiedenen linguistischen Disziplinen, die an den Verbindungslinien von „Sprache – Wissen – Medizin“ arbeiten, zu bündeln und die interdisziplinäre Anschlussfähigkeit zwischen linguistischen und medizinischen, psychiatrischen und salutogenetischen Forschungsbereichen auf- und auszubauen.
Das Buch präsentiert die ersten Arbeitsergebnisse des wissenschaftlichen Netzwerks >Linguistik und Medizin< Patho- und Salutodiskurse im Spannungsfeld von objektivierter Diagnose, interaktiver Vermittlung und medialer Konstitution, gegründet 2017 und finanziert von der Deutschen Forschungsgemeinschaft. Aus unterschiedlichen linguistischen, medizinischen, historischen und soziologischen Perspektiven werden Prozesse der Wissenskonstitution, -aushandlung und des -transfers in Bezug auf Gesundheit und (psychische wie somatische) Krankheiten thematisiert. Mit Daten und Methoden der Gesprächs-, Korpus- und Diskurslinguistik, der Medizin und der Soziologie werden aktuelle und gesellschaftsrelevante Fragestellungen in der Arzt-Patienten-Kommunikation, den ö̈ffentlichen massenmedialen Diskursen und in der Fachkommunikation in einem interdisziplinären Dialog bearbeitet. Im Fokus stehen einzelne Krankheitsbilder und deren semiotische Konstruktion wie Schizophrenie, HIV/AIDS, Alzheimer, Depression; mannigfaltige interaktive Praktiken z.B. der Empathiebekundung, der Aufklärung, der Emotionalisierung in Arzt-Patienten-Gesprächen; Prozesse der gemeinsamen Wissensaushandlung in Online-Foren; fachliche Konstruktionen von Vorstellungen zu Normalität und Abweichung.
This chapter starts out by giving a brief overview of the main priorities of international and German studies in the area of linguistic landscape research. The contributions to this volume are then embedded in current debates and developments in the field. Finally, we outline important desiderata of linguistic landscape research that focus on German and address challenges of knowledge transfer and application as well as possible contributions to international lines of research.
Die Erforschung von Sprache im öffentlichen Raum (Linguistic Landscapes, LL) hat sich in den vergangen 20 Jahren als Teilgebiet der Soziolinguistik, der Semiotik und anderer Disziplinen fest etabliert. Der vorliegende Band gibt einen Überblick zu zentralen Ansätzen der LL-Forschung mit einem Bezug zur deutschen Sprache. Die Beiträge stellen aktuelle Studien aus dem deutschsprachigen Raum, zu Deutsch als Minderheitensprache sowie aus Ländern mit einer ausgeprägten DaF-Tradition vor. Sie thematisieren sprachstrukturelle und soziolinguistische ebenso wie didaktische, methodische und technologische Aspekte. Damit trägt der Band zu einer Systematisierung der deutschsprachigen LL-Forschung bei, gibt Impulse für internationale Diskussionen und benennt wichtige Desiderata.
While there is a large amount of research in the field of Lexical Semantic Change Detection, only few approaches go beyond a standard benchmark evaluation of existing models. In this paper, we propose a shift of focus from change detection to change discovery, i.e., discovering novel word senses over time from the full corpus vocabulary. By heavily fine-tuning a type-based and a token-based approach on recently published German data, we demonstrate that both models can successfully be applied to discover new words undergoing meaning change. Furthermore, we provide an almost fully automated framework for both evaluation and discovery.
Im Fokus dieses Beitrags steht ein Format, das die Eigenschaften der im Titel dieses Buches so genannten hypermedialen multimodalen Kommunikation in sich vereint: Let's Plays. Den Titel des Beitrags aufnehmend, könnte man hier auch von „vielen Fliegen“ und „einer Klappe“ sprechen, denn Let's Plays bieten eine ganze Reihe von Anknüpfungspunkten, die für den Deutschunterricht relevant sind, aber eben auch - und das ist so charakteristisch für den Einsatz digitaler Formate im Unterricht - anschlussfähig sind für andere Fächer und damit auch den Weg aufzeigen, in eine Schule 3.0, die sich aus starren Fächerkorsetten zu befreien sucht und die Gegebenheiten einer digitalisierten Lebens- und Arbeitswelt etwa in inter- und transdisziplinären Modulen und Projekten abbildet und berücksichtigt.
Insofern reichen auch die Möglichkeiten, Let's Plays in den Deutschunterricht einzubinden, die wir in diesem Beitrag aufzeigen werden, über das Fach Deutsch hinaus und sind dennoch mit Blick auf die Bildungsstandards in der Grundschule und in weiterführenden Schulen passfähig. Sie berühren die Haupt-Kompetenzbereiche: Sprechen und Zuhören, Schreiben, Lesen - Mit Texten und Medien umgehen und Sprache und Sprachgebrauch untersuchen. Diese in den Rahmenlehrplänen vorhandene analytische Trennung spiegelt sich im konkreten Material „Let's Play“ nicht wider. Wir werden deshalb auf einzelne Aspekte eingehen, die als Anregung für die Integration des Gegenstandes in den Deutschunterricht verstanden werden können.
In this paper, we present our experiences and decisions in dealing with challenges in developing, maintaining and operating online research software tools in the field of linguistics. In particular, we highlight reproducibility, dependability, and security as important aspects of quality management – taking into account the special circumstances in which research software
is usually created.
We present empirical evidence of the communicative utility of conventionalization, i.e., convergence in linguistic usage over time, and diversification, i.e., linguistic items acquiring different, more specific usages/meanings. From a diachronic perspective, conventionalization plays a crucial role in language change as a condition for innovation and grammaticalization (Bybee, 2010; Schmid, 2015) and diversification is a cornerstone in the formation of sublanguages/registers, i.e., functional linguistic varieties (Halliday, 1988; Harris, 1991). While it is widely acknowledged that change in language use is primarily socio-culturally determined pushing towards greater linguistic expressivity, we here highlight the limiting function of communicative factors on diachronic linguistic variation showing that conventionalization and diversification are associated with a reduction of linguistic variability. To be able to observe effects of linguistic variability reduction, we first need a well-defined notion of choice in context. Linguistically, this implies the paradigmatic axis of linguistic organization, i.e., the sets of linguistic options available in a given or similar syntagmatic contexts. Here, we draw on word embeddings, weakly neural distributional language models that have recently been employed to model lexical-semantic change and allow us to approximate the notion of paradigm by neighbourhood in vector space. Second, we need to capture changes in paradigmatic variability, i.e. reduction/expansion of linguistic options in a given context. As a formal index of paradigmatic variability we use entropy, which measures the contribution of linguistic units (e.g., words) in predicting linguistic choice in bits of information. Using entropy provides us with a link to a communicative interpretation, as it is a well-established measure of communicative efficiency with implications for cognitive processing (Linzen and Jaeger, 2016; Venhuizen et al., 2019); also, entropy is negatively correlated with distance in (word embedding) spaces which in turn shows cognitive reflexes in certain language processing tasks (Mitchel et al., 2008; Auguste et al., 2017). In terms of domain we focus on science, looking at the diachronic development of scientific English from the 17th century to modern time. This provides us with a fairly constrained yet dynamic domain of discourse that has witnessed a powerful systematization throughout the centuries and developed specific linguistic conventions geared towards efficient communication. Overall, our study confirms the assumed trends of conventionalization and diversification shown by diachronically decreasing entropy, interspersed with local, temporary entropy highs pointing to phases of linguistic expansion pertaining primarily to introduction of new technical terminology.
Parmi les nombreuses contributions de Charles Goodwin à l’étude des interactions sociales, ses travaux sur les gestes de pointage (1986, 2003, 2007) et la vision professionnelle (1994) constituent un apport majeur. Forts de l’enseignement goodwinien, nous examinons le recours aux gestes de pointage lors des instructions de navigation observables dans des leçons de conduite. Nous décrivons quatre exécutions indexicales différentes des gestes de pointage employés pour indiquer un parcours à suivre : les gestes trajectoire, les gestes géométriques, schématiques et contrastifs. Les gestes trajectoire tracent une ligne dans l’espace, révélant ainsi une composante déictique et une composante iconique. Les gestes géométriques instaurent une relation vectorielle avec la configuration routière visible, alors que les gestes schématiques reposent sur une représentation sémiotique stylisée de l’environnement. Ni complètement géométriques, ni schématiques, les gestes contrastifs se basent sur une représentation oppositionnelle de l’espace ambiant. La mobilité des interactants, leur asymétrie épistémique, l’activité didactique, et la séquentialité de l’interaction contribuent à donner leur sens à ces gestes de pointage.
Im E-Wörterbuch „Paronyme – Dynamisch im Kontrast“ werden erstmals leicht verwechselbare Ausdrücke, sogenannte Paronyme (z.B. autoritär / autoritativ, speziell / spezial), in kontrastiven und dynamischen Einträgen beschrieben. Auf zwei Beschreibungsebenen verzahnt es lexikalische Angaben mit enzyklopädischen bzw. konzeptuell-orientierten Details. Korpusanalytische Auseinandersetzungen zeigen, wie stark der Gebrauch einiger Paronyme von den Beschreibungen in traditionellen Lehr- und Nachschlagewerken abweicht. Aber Korpusdaten deuten ebenso auf sprachliche Varianz und Wandel hin, die in speziellen Rubriken festgehalten werden. Neben der Vorstellung des Wörterbuches steht die Frage im Vordergrund, wie die Informationen systematisch aus den Daten gewonnen, analysiert und redaktionell ausgewertet werden, um als Bedeutungs-, Kollokations-, Konstruktions-, Referenz- und Domänenangaben jedes Stichwort so genau wie möglich beschreiben zu können.
Twitter data is used in a wide variety of research disciplines in Social Sciences and Humanities. Although most Twitter data is publicly available, its re-use and sharing raise many legal questions related to intellectual property and personal data protection. Moreover, the use of Twitter and its content is subject to the Terms of Service, which also regulate re-use and sharing. This extended abstract provides a brief analysis of these issues and introduces the new Academic Research product track, which enables authorized researchers to access Twitter API on a preferential basis.
This paper explores how attitudes affect the seemingly objective process of counting speakers of varieties using the example of Low German, Germany’s sole regional language. The initial focus is on the basic taxonomy of classifying a variety as a language or a dialect. Three representative surveys then provide data for the analysis: the Germany Survey 2008, the Northern Germany Survey 2016, and the Germany Survey 2017. The results of these surveys indicate that there is no consensus concerning the evaluation of Low German’s status and that attitudes towards Low German are related to, for example, proficiency in the language. These attitudes are shown to matter when counting speakers of Low German and investigating the status it has been accorded.
Die Entstehung und Geschichte der einzigen deutschlexifizierten Kreolsprache Unserdeutsch (Rabaul Creole German) war bis heute weitgehend unbeschrieben, obwohl die Zeit drängt: Die koloniale High-contact-Varietät, entstanden zu Beginn des 20. Jahrhunderts an einer katholischen Missionsstation im damaligen Schutzgebiet Deutsch-Neuguinea im melanesischen Pazifik, ist inzwischen kritisch gefährdet mit weniger als 100 noch lebenden SprecherInnen fortgeschrittenen Alters. Mit dieser Arbeit wird nun eine detaillierte Rekonstruktion zu den Anfängen und der weiteren Entwicklung von Unserdeutsch bis in die Gegenwart vorgelegt, basierend auf Archivdaten, Interviews und Strukturanalysen. Dabei wird unter anderem die Rolle von im Sprachsystem nachweisbarem Transfer aus den zentralen Kontaktsprachen von Unserdeutsch sowie von L2-Effekten und autochthonen Innovationen untersucht, außerdem die deutsche Superstratvarietät von Unserdeutsch genau bestimmt und der Spracherwerb der ersten Sprechergeneration nachgezeichnet. Die Arbeit verortet die aus kreolistischer Perspektive in mehrfacher Hinsicht besonderen Entstehungsumstände von Unserdeutsch – darunter etwa ihre Genese unter Kindern – in einschlägigen Fachdiskursen.
Korpora und Fremdsprachendidaktik haben – auch jenseits des angeleiteten oder selbstgesteuerten Arbeitens an den Daten – Berührungspunkte mit langer Tradition, durchaus mit nicht-digitalen Ausläufern, deren korpuslinguistische Dimensionen erst in den letzten Jahrzehnten erschlossen wurden. Worthäufigkeitszählungen, auch vergleichend, in beliebig großen oder auf bestimmte Bedürfnisse zugeschnittenen Datensammlungen lassen sich mit weiteren Metriken verknüpfen, die eine differenzierte Bewertung für die didaktische Relevanz ermöglichen. Kollokations-/Kookkurrenzanalysen helfen, typische Formulierungsmuster zu ermitteln. Dieser Beitrag stellt zunächst diese beiden Herangehensweisen dar. Das Manko der getrennten Betrachtung ist, dass keine der beiden isoliert ausreicht, um die Angemessenheit von Formulierungen zu bewerten hinsichtlich muttersprachlicher Natürlichkeit und Weiterentwicklung des Lernstands. Als Abhilfe wird eine Verknüpfung skizziert, die beide Perspektiven zusammenbringt.
Korpus
(2021)
In den Sprach- als auch Literaturwissenschaften versteht man unter Korpora (Plur. Korpora, die / Sing. Korpus, das) ganz allgemein Textsammlungen. Nach Lemnitzer und Zinsmeister (2010, S. 40) ist ein Korpus: „[…] eine Sammlung [authentischer] schriftlicher oder gesprochener Äußerungen in einer oder mehreren Sprachen“. Die Zusammenstellung erfolgt nach verschiedenen wissenschaftlichen Kriterien, die sich am zu untersuchenden Gegenstand orientieren (Bsp. 1: Soll strategische Kommunikation in politischen Reden analysiert werden, so wird ein Korpus aus ‚Politischen Reden‘ zusammengestellt, die strategisch/kommunikative Praktiken enthalten – Bsp. 2: Für die Analyse von Modalpartikeln im Fremdsprachenerwerb wird ein Korpus aus transkribierten Redebeiträgen verschiedener Erwerbsstufen benötigt). Prinzipiell kann ein Korpus auch analog (gedruckt) vorliegen und manuell ausgewertet werden – In der empirischen Linguistik ist ein Korpus aber i. d. R. immer ein digitales (maschinenlesbares) Korpus, das automatisiert (mittels Software) ausgewertet wird.
Die Korpusanalyseplattform KorAP ist von Grund auf sprachenunabhängig konzipiert. Dies gilt sowohl in Bezug auf die Lokalisierung der Benutzeroberfläche als auch hinsichtlich unterschiedlicher Anfragesprachen und der Unterstützung fremdsprachiger Korpora und ihren Annotationen. Diese Eigenschaften dienen im Rahmen der EuReCo Initiative aktuell besonders der Bereitstellung weiterer National- und Referenzkorpora neben DeReKo. EuReCo versucht, Kompetenzen beim Aufbau großer Korpora zu bündeln und durch die Verfügbarmachung vergleichbarer Korpora quantitative Sprachvergleichsforschung zu erleichtern. Hierzu bietet KorAP inzwischen, neben dem Zugang durch die Benutzeroberfläche, einen Web API Client an, der statistische Erhebungen, auch korpusübergreifend, vereinfacht.
Konvergenz und Divergenz
(2021)
Audio-based interpreting (by telephone or comparable devices) has lately become a widespread communicative practice in multilingual encounters, especially as a consequence of the refugee crisis. Despite the growing need for location-independent assistance, its linguistic-communicative requiremehts have hardly been explored. The central question posed by this paper is therefore: How do the participants in interpreter-mediated counselling sessions conducted via the telephone compensate for the lack of the co-presence and which strategies are (preferably) employed when determining turn-taking in such exceptional circumstances?
Das Ziel des Beitrags ist es, die Merkmale von Kommunikationsstörungen in Star-Interviews aus Sicht der Befragten, also der Interviewten festzustellen und zu analysieren. Die empirische Forschungsbasis besteht aus ukrainisch- und deutschsprachigen Videointerviews aus den Jahren 2010 bis 2019, die entweder im Fernsehen gesendet oder für YouTube produziert wurden. Das Forschungsverfahren beinhaltet die integrierte Anwendung von Methoden und Techniken der kommunikativen Linguistik, insbesondere der Diskurs-Analyse. Für die Untersuchung dieser Kommunikationsstörungen wurde eine neue methodische Grundlage entwickelt, und zwar für die Rekonstruktion eines einzelnen Ereignisses in zwei diskursiven Umgebungen, das Feststellen des kommunikativen Kontextes und der Kommunikationssituation in Interviews in vergleichbaren Sprachen. Die Ergebnisse der Studie ermöglichten es, die charakteristischen Merkmale von Kommunikationsstörungen in Star-Interviews auf drei Ebenen der kommunikativen Gattung zu identifizieren: auf der außenstrukturellen, binnenstrukturellen und situativen Ebene. Sowohl gemeinsame Merkmale von Kommunikationsstörungen als auch Unterschiede in den ukrainischen und deutschsprachigen Interviews wurden bestimmt. Die Ergebnisse der Studie zeigen, dass die Arten von Kommunikationsstörungen in Interviews mit Prominenten im Ukrainischen und Deutschen universell sind, sie spiegeln jedoch die nationalen und kulturellen Besonderheiten angesichts der Merkmale beider Sprachen und jeder Sprachkultur und ihrer Realitäten, Normen, Konventionen und Maximen der Kommunikation wider. In beiden Sprachen sind kommunikative Störungen ein typischer und oft unvermeidbarer Bestandteil von Interviews.
Koloniale und postkoloniale Mikrotoponyme. Forschungsperspektiven und interdisziplinäre Bezüge
(2021)
Der Band bietet einen breiten Einblick in aktuelle Forschungsthemen der kolonialen und postkolonialen Mikrotoponomastik. Er zeigt sowohl die interdisziplinären Verbindungen des Forschungsgebietes, z. B. zu Geschichte und Kartographie, als auch vielfältige Fokussierungen in Bezug auf koloniale, kolonial intendierte und postkoloniale Kontexte.
Ist der Explorator ein Störfaktor? Zu den methodischen Grenzen festgeschriebener Aufnahmedesigns
(2021)
Im vorliegenden Beitrag soll das Störpotenzial des Explorators in festgeschriebenen Aufnahmedesigns näher beleuchtet werden. Dabei soll der Frage nachgegangen werden, wann und unter welchen Bedingungen ein Explorator stört bzw. stören kann, und ob es sich tatsächlich um eine Störung handelt oder ob er nicht vielleicht auch positive Funktionen und Folgen für eine Datenerhebung mit sich bringt.
Over the past decade, conducting empirical research in linguistics has become increasingly popular. The first of its kind, this book provides an engaging and practical introduction to this exciting versatile field, providing a comprehensive overview of research aspects in general, and covering a broad range of subdiscipline-specific methodological approaches. Subfields covered include language documentation and descriptive linguistics, language typology, corpus linguistics, sociolinguistics and anthropological linguistics, cognitive linguistics and psycholinguistics, and neurolinguistics. The book reflects on the strengths and weaknesses of each single approach and on how they interact with one-another across the study of language in its many diverse facets. It also includes exercises, example student projects and recommendations for further reading, along with additional online teaching materials. Providing hands-on experience, and written in an engaging and accessible style, this unique and comprehensive guide will give students the inspiration they need to develop their own research projects in empirical linguistics.