Refine
Year of publication
- 2021 (255) (remove)
Document Type
- Part of a Book (89)
- Article (81)
- Conference Proceeding (26)
- Other (24)
- Book (15)
- Report (7)
- Part of Periodical (6)
- Review (4)
- Working Paper (2)
- Course Material (1)
Language
- German (171)
- English (81)
- French (1)
- Multiple languages (1)
- Russian (1)
Is part of the Bibliography
- yes (255) (remove)
Keywords
- Deutsch (96)
- Korpus <Linguistik> (57)
- COVID-19 (46)
- Sprachgebrauch (39)
- Neologismus (31)
- Wortschatz (28)
- Interaktion (27)
- Konversationsanalyse (26)
- Kommunikation (22)
- Grammatik (21)
Publicationstate
- Veröffentlichungsversion (147)
- Zweitveröffentlichung (91)
- Postprint (22)
- Erstveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (114)
- Peer-Review (97)
Publisher
„systemrelevant“ – eine sprachwissenschaftliche Betrachtung des Begriffs aus aktuellem Anlass
(2021)
This study deals with interpretation practices that speakers employ in order to (re)formulate what another person has said or implied. Analyzing interpretations in a public televised mediation that resembles a public debate, I show which kinds of interpretation practices that speakers adopt and how they differ depending the participants' roles. Systematically comparing all interpretations of the mediator vs. the opposing participants’, I argue that interpretations can be described as general practices with specific interactional effects, but that they are designed and exploited in different ways (i.e., for clarification and discourse-organization vs. self- and other-positioning and constructing arguments). I point out that speakers use meta-pragmatic accounts that support the interactional effects of their interpretations.
„Deutsch in Europa“ findet sich nicht nur in den mehrheitlich deutschsprachigen Ländern in der Mitte Europas, sondern auch in mehreren direkt an diese angrenzenden Gebieten der Nachbarstaaten. Die Situation des Deutschen ist in diesen Grenzräumen jeweils sehr unterschiedlich, etwa hinsichtlich der Kontaktsprachen, aber auch hinsichtlich der rechtlichen Rahmenbedingungen, der kollektiven und individuellen Mehrsprachigkeit sowie der Einstellungen der Sprecherinnen und Sprecher u.v.m. Der Beitrag skizziert zunächst überblicksartig die aktuellen Situationen einiger deutscher Grenzminderheiten. Fokussiert wird sodann die Situation in Ost- Lothringen. Anhand von neu erhobenen Daten eines laufenden Projekts am IDS wird gezeigt, dass die Konstruktion der sprachlichen Identität in diesem spezifischen Kontext für die Sprecherinnen und Sprechern eine besondere Herausforderung darstellt.
Zwischen den Jahren oder Eine Zeit zwischen den Zeiten. Sprachliche Betrachtungen zur „Normalität“
(2021)
With recourse to a broader understanding of the concept of translation, the transfer of source texts in one variety into another variety of the same language can also be called translation. This paper focuses on the target language – or rather – the target variety “easy-to-read language”, which is meant to make texts comprehensible for people with communication limitations. Considering its origins in the disability rights movement, the aim is to inform affected persons about their rights and democratic processes, i.e. to translate especially legal texts into the so-called easy-to-read language. Although there is a whole range of rules and guidelines for formulating in easy-to-read language, ”none offers a sufficient approach for translation into easy-to-read language“ (Bredel & Maaß, 2016a, p. 109). Standardization of the variety is also still a long way off. On the one hand, the contribution takes stock of legal regulations in easy-to-read language. On the other hand, four versions of the Federal Participation Law in easy-to-read language are analysed with regard to their external features and the constructions used to explain technical terminology. The analysis shows that legal texts in easy-to-read language are (still) quite limited in number and are also difficult to find. Concerning the second part, the constructions used exhibit a great structural variance, both intra- and intertextually. It is therefore questionable whether the addressees can access the texts independently. Also, it is still necessary to make the rules, the formulations of the rules and the implementations clearer so that the translations fulfil their function.
Das vorliegende Themenheft bündelt theoretische, methodologische und empirische Debatten an der Schnittstelle von Zeichen, Zeichensystem, Zeichenmodalität/-materialität und Medium und möchte sie weiterführen. Die Beiträge befassen sich mit Fragen der begrifflichen und empirischen Grenzziehung zwischen Zeichen und Medien und liefern so Impulse für die Erforschung des Wechselspiels der Gegenstandsbereiche Zeichenhaftigkeit, Medialität und Materialität als Manifestation multimodaler Kommunikation. Ziel des Heftes ist es, die theoretischen und empirischen Diskussionen um Multimodalität und Medialität stärker aufeinander zu beziehen.
This paper will address the challenge of creating a knowledge graph from a corpus of historical encyclopedias with a special focus on word sense alignment (WSA) and disambiguation (WSD). More precisely, we examine WSA and WSD approaches based on article similarity to link messy historical data, utilizing Wikipedia as aground-truth component – as the lack of a critical overlap in content paired with the amount of variation between and within the encyclopedias does not allow for choosing a ”baseline” encyclopedia to align the others to. Additionally, we are comparing the disambiguation performance of conservative methods like the Lesk algorithm to more recent approaches, i.e. using language models to disambiguate senses.
Die Corona-Pandemie betrifft fast alle Facetten des öffentlichen Lebens und hat nicht nur erhebliche Auswirkungen auf den persönlichen Umgang miteinander, sondern beherrscht auch die Berichterstattung im großen Stil. In unserem Beitrag wollen wir zeigen, welche lexikalischen Spuren oder Trends der Coronakrise wir in der deutschen Online-Nachrichtenberichterstattung beobachten können, obwohl wir uns noch mitten in der Pandemie zu befinden scheinen. „Lexikalische Spuren“ bedeutet, dass wir z.B. die am häufigsten verwendeten Wörter, Wortbildungsprodukte rund um „Corona“ oder Häufigkeitskurven einzelner Wortformen analysieren. Auf der Grundlage von Online-Nachrichtenberichten aus 13 deutschsprachigen Quellen, die seit Anfang 2020 gesammelt wurden, zeigen wir unter anderem, wie über wöchentliche Übersichten der am häufigsten verwendeten Wörter zu sehen ist, wann die Corona-Pandemie zum dominierenden Thema in der Nachrichtenberichterstattung wird; wie eine wahre Explosion von Wortbildungsprodukten mit „Corona“ wie „Vor-Corona-Gesellschaft“ oder „Post-Corona Zukunft“ beobachtet werden kann, wie andere Themen – z.B. der Fußball – durch Corona verdrängt werden, wie sich die Diskussion um Auswege aus dem Lockdown in den Daten widerspiegelt, oder wie prominente Virolog/-innen in die gleiche „Frequenzliga“ wie Politiker/-innen aufsteigen.
Leicht hat es die Duden-Redaktion derzeit nicht. Im Sommer erst musste sie sich ungerechtfertigterweise vorhalten lassen, mit der Aufnahme neuer Wörter in die 28. Auflage des Rechtschreibdudens eine links-grüne Agenda zu verfolgen. Vor kurzem hieß es nun, im Online-Duden werde heimlich eine Sprachveränderung betrieben, die zum Verschwinden des generischen Maskulinums führe. Kürzlich hat deshalb der “Verein Deutsche Sprache”, jener umstrittene Verein konservativer Sprachschützer*innen, sogar einen öffentlichen Aufruf gegen den Dudenverlag gestartet. Was ist also dran an diesem Vorwurf?
Who is we? Disambiguating the referents of first person plural pronouns in parliamentary debates
(2021)
This paper investigates the use of first person plural pronouns as a rhetorical device in political speeches. We present an annotation schema for disambiguating pronoun references and use our schema to create an annotated corpus of debates from the German Bundestag. We then use our corpus to learn to automatically resolve pronoun referents in parliamentary debates. We explore the use of data augmentation with weak supervision to further expand our corpus and report preliminary results.
Research on multimodal interaction has shown that simultaneity of embodied behavior and talk is constitutive for social action. In this study, we demonstrate different temporal relationships between verbal and embodied actions. We focus on uses of German darf/kann ich? (“may/can I?”) in which speakers initiate, or even complete the embodied action that is addressed by the turn before the recipient’s response. We argue that through such embodied conduct, the speaker bodily enacts high agency, which is at odds with the low deontic stance they express through their darf/kann ich?-TCUs. In doing so, speakers presuppose that the intersubjective permissibility of the action is highly probable or even certain. Moreover, we demonstrate how the speaker’s embodied action, joint perceptual salience of referents, and the projectability of the action addressed with darf/kann ich? allow for a lean syntactic design of darf/kann ich?-TCUs (i.e., pronominalization, object omission, and main verb omission). Our findings underscore the reflexive relationship between lean syntax, sequential organization and multimodal conduct.
N-grams are of utmost importance for modern linguistics and language technology. The legal status of n-grams, however, raises many practical questions. Traditionally, text snippets are considered copyrightable if they meet the originality criterion, but no clear indicators as to the minimum length of original snippets exist; moreover, the solutions adopted in some EU Member States (the paper cites German and French law as examples) are considerably different. Furthermore, recent developments in EU law (the CJEU's Pelham decision and the new right of press publishers) also provide interesting arguments in this debate. The paper presents the existing approaches to the legal protection of n-grams and tries to formulate some clear guidelines as to the length of n-grams that can be freely used and shared.
Wenn ich am Ende dieses Jahres an die Diskussionen zur deutschen Sprache zurückdenke, die ich bei Medienauftritten und in Veranstaltungen geführt habe, dann ist dabei immer wieder eine ganz bestimmte Frage gestellt worden: Wer entscheidet eigentlich darüber, wie wir sprechen und schreiben, was wir sagen dürfen und was nicht? Wer hat die Entscheidungsbefugnis über die Aufnahme neuer Wörter ins Deutsche, über gendergerechte Sprache oder über Rechtschreibregeln?
Weniger ist mehr! Die IDS-Goethe-Studie in den Integrationskursen und Vorschläge für die Praxis
(2021)
Zeitnah zur großen Fluchtmigration von 2015 hat das Leibniz-Institut für Deutsche Sprache (1DS) gleich zu Beginn des Jahres 2016 das Projekt „Deutsch im Beruf: Die sprachlich-kommunikative Integration von Flüchdingen“ gestartet, um den Migrations-und Integrationsprozess der Geflüchteten von Anfang an dokumentieren und analysieren zu können. In Bezug auf die gegenwärtige Situation der Fluchtmigranten und -migrantinnen sind dabei insbesondere zwei Etappen von großer Bedeutung, die wir in unserem Projekt genauer fokussieren. Für die Integration und Partizipation der Migranten und Migrantinnen spielen zunächst ausreichende Deutschkenntnisse eine große Rolle, die in den mehrmonatigen Integrationskursen vermittelt werden. Hierzu hat das IDS in Kooperation mit dem Goethe-Institut eine zweistufige Sprachstandserhebung (in der Folge IDS-Goethe-Studie) in den allgemeinen Integrationskursen durchgeführt, die die Sprachbiographien, Sozialdaten und die Sprachlernfortschritte der Geflüchteten analysiert, und deren Ergebnisse im vorliegenden Aufsatz präsentiert werden.
Daneben werden im IDS-Projekt u.a. die vielfältigen beruflichen Qualifizierungsmaßnahmen der Bundesagentur für Arbeit gesprächs- und interaktionsanalytisch untersucht, die für die Geflüchteten oftmals als Einstieg ins Arbeitsleben und somit als eine wichtige Integrationsetappe fungieren (vgl. Cindark; Hünlich 2017, Cindark; Deppermann 2018, Cindark 2018, 2019).
Die Coronapandemie hat die Welt seit Anfang 2020 in vielfältiger Weise geprägt. Der Alltag hat sich gewandelt: Schule, Beruf, das tagtägliche Bewegen in der Öffentlichkeit oder in Verkehrsmitteln ist Regeln unterstellt, die es in dieser flächendeckenden und umfassenden Art so noch nicht gegeben hat. In diesem Wandel in der Welt ist auch die Sprache einer stetigen Entwicklung unterworfen. Neue Dinge in der Welt wollen erzählt und ausgetauscht werden. Und so kommt es in der Zeit der Coronapandemie zu zahlreichen Wortneuschöpfungen, Entlehnungen oder Bedeutungserweiterungen von bereits existierenden Wörtern. Das Leibniz-Institut für Deutsche Sprache in Mannheim (IDS) beobachtet diese Entwicklungen und arbeitet u. a. im Projekt »Neuer Wortschatz« an der Dokumentation dieser lexikalischen Spuren, die die Coronapandemie im Wortschatz hinterlässt. Der Beitrag begibt sich auf Spurensuche nach Neuem, nach neu Ausgehandeltem und nach der Frage, wie die (Wort-)Geschichte wohl weitergehen wird.
Öffentliche Sprachdiskurse, wie sie beispielsweise in den Medien stattfinden, werden typischerweise aus einer sprachkritischen Haltung heraus geführt. Inwieweit diese veröffentlichte Meinung tatsächlich die Mehrheitsmeinung der Sprecherinnen und Sprecher widerspiegelt, ist durchaus eine offene Frage. In diesem Beitrag berichten wir aus einer rezenten Erhebung über Spracheinstellungen in Deutschland. Wir zeigen, dass die Art der Frageformulierung einen starken Einfluss auf die Ergebnisse hat, und berichten, welche sprachlichen Veränderungen die Befragten in jüngerer Zeit angeben, wahrgenommen zu haben.
Bislang gibt es keine akkuraten, repräsentativen Statistiken dazu, welche Sprachen in Deutschland gesprochen werden. Zwar wird in verschiedenen Erhebungen nach Muttersprachen oder nach zuhause gesprochenen Sprachen gefragt; aufgrund einiger Mängel im Erhebungsdesign bilden die Ergebnisse der vorliegenden Erhebungen jedoch die sprachliche Realität der in Deutschland lebenden Bevölkerung nicht angemessen ab. Im Beitrag wird anhand von drei Erhebungen gezeigt, dass bereits die Instrumente zur Erhebung von Sprache von Spracheinstellungen geprägt sind und dass dadurch die Gültigkeit der Ergebnisse stark eingeschränkt wird. Diese Mängel gelten für Sprachstatistiken im Hinblick auf die gesamte Bevölkerung Deutschlands – Kinder und Jugendliche eingeschlossen.
Kontroversen wie die um gendergerechten Sprachgebrauch haben eindeutig eine politische Dimension. Das ist aber nur die eine Seite der Medaille. Jenseits der politischen Auseinandersetzung stellt sich die Frage, in welcher Weise die verschiedenen Positionen in der Gesellschaft verankert sind und warum die Kontroversen überhaupt entstehen. Die Analyse der postindustriellen Gesellschaft des Soziologen Andreas Reckwitz bietet dafür die Möglichkeit einer Erklärung.
Vorwort
(2021)
Vorwort
(2021)
Der Beitrag beschreibt die Motivation und Ziele des Europäischen Referenzkorpus EuReCo, einer offenen Initiative, die darauf abzielt, dynamisch definierbare virtuelle vergleichbare Korpora auf der Grundlage bestehender nationaler, Referenz- oder anderer großer Korpora bereitzustellen und zu verwenden. Angesichts der bekannten Unzulänglichkeiten anderer Arten mehrsprachiger Korpora wie Parallel- bzw. Übersetzungskorpora oder rein webbasierte vergleichbare Korpora, stellt das EuReCo eine einzigartige linguistische Ressource dar, die neue Perspektiven für germanistische und vergleichende wie angewandte Korpuslinguistik, insbesondere im europäischen Kontext, eröffnet.
Von Gummistiefelmomenten
(2021)
Mit Entwicklungen in der Welt entsteht auch ein neuer Wortschatz, insbesondere in Zeiten großer gesellschaftlicher Umbrüche oder bedingt durch Krisen, denn neue Dinge, neue Umstände, »neue Normalitäten« müssen bezeichnet werden, damit darüber kommuniziert werden kann. Zugleich steigt die Gebrauchshäufigkeit älterer Wörter, weil sie aktuell für die Verständigung besonders relevant werden. Die in diesem Glossar präsentierten Begriffe thematisieren solche sprachlichen Auswirkungen der Coronakrise.
Vom ZISW zum ZAS
(2021)
Das Leibniz-Zentrum Allgemeine Sprachwissenschaft (ZAS) ist jetzt 25 Jahre alt, im besten Alter sozusagen. Es hat Erfahrungen gesammelt, sich mit theoretischen Forschungen zur Phonetik und Phonologie, Morphologie, Syntax, Semantik und Pragmatik weltweit einen Namen gemacht. Anlässlich seines Jubiläums fragt man sich, wo es seine Ursprünge hat und unter welchen Umständen es ›groß‹ geworden ist. Diesen beiden Fragen versuche ich in diesem Beitrag nachzugehen. Ich tue das, weil ich die Zeitzeugin bin, die das ZAS am längsten begleitet hat.
The German e-dictionary documenting confusables Paronyme – Dynamisch im Kontrast contains lexemes which are similar in sound, spelling and/or meaning, e.g. autoritär/autoritativ, innovativ/innovatorisch. These can cause uncertainty as to their appropriate use. The monolingual guide could be easily expanded to become a multilingual platform for commonly confused items by incorporating language modules. The value of this visionary resource is manifold. Firstly, e-dictionaries of confusables have not yet been compiled for most European languages; consequently, the German resource could serve as a model of practice. Secondly, it would be able to explain the usage of false friends. Thirdly, cognates and loan word equivalents would be offered for simultaneous consultation. Fourthly, users could find out whether, for example, a German pair is semantically equivalent to a pair in another language. Finally, it would inform users about cases where a pair of semantically similar words in one language has only one lexical counterpart in another language. This paper is an appeal for visionary projects and collaborative enterprises. I will outline the dictionary’s layout and contents as shown by its contrastive entries. I will demonstrate potential additions, which would make it possible to build up a large platform for easily misused words in different languages.
Das vom BMBF geförderte Verbundprojekt CLARIAH-DE, an dem über 25 Partnerinstitutionen mitwirken, unter ihnen auch das IDS, hat zum Ziel, mit der Entwicklung einer Forschungsinfrastruktur zahlreiche Angebote zur Verfügung zu stellen, die die Bedingungen der Forschungsarbeit mit digitalen Werkzeugen, Diensten sowie umfangreichen Datenbeständen im Bereich der geisteswissenschaftlichen Forschung und benachbarter Disziplinen verbessern. Die in CLARIAH-DE entwickelte Infrastruktur bietet den Forschenden Unterstützung bei der Analyse und Aufbereitung von Sprachdaten für linguistische Untersuchungen in unterschiedlichsten Anwendungskontexten und leistet somit einen Beitrag zur Entwicklung der NFDI.
Validating the Performativity Hypothesis to Neg-Raising using corpus data: Evidence from Polish
(2021)
The General Data Protection Regulation (GDPR) on personal data protection in the European Union entered into application on 25 May 2018. With its 173 recitals and 99 articles, it may be one of the most ambitious pieces of EU legislation to date. Rather than a guide to GDPR compliance for Digital Humanities researchers, this chapter looks at the use of personal data in DH projects from the data subject’s perspective, and examines to what extent the GDPR kept its promise of enabling the data subject to “take control of his data”. The chapter provides an overview of the right to privacy and the right to data protection, a discussion of the relation between the concept of data control and privacy and data protection law, an introduction to the GDPR, and an explanation of its relevance for scientific research in general and DH in particular. The main section of the chapter analyses two types of data control mechanisms (consent and data subject rights) and their impact on DH research.
Towards comprehensive definitions of data quality for audiovisual annotated language resources
(2021)
Though digital infrastructures such as CLARIN have been successfully established and now provide large collections of digital resources, the lack of widely accepted standards for data quality and documentation still makes re-use of research data a difficult endeavour, especially for more complex resource types. The article gives a detailed overview over relevant characteristics of audiovisual annotated language resources and reviews possible approaches to data quality in terms of their suitability for the current context. Conclusively, various strategies are suggested in order to arrive at comprehensive and adequate definitions of data quality for this specific resource type and possibly for digital language resources in general.
We present zu-excessive structures like Otto ist zu schwer ‘Otto is too heavy’ as instantiations of comparatives that have been reflexivized. Comparatives express asymmetric relations between distinguished referents, but reflexivization identifies argument places (or reduces two argument places to one), leading to a Symmetrie relation. Reflexivization is thus in conflict with the asymmetry property of comparatives and leads to an intermediate semantic representation that is con- tradictory. Two experiments substantiate that zu-excessives share this property with privative adjective and animal-for-statue constructions that similarly give rise to contradictory semantics. The processing of any of the constructions mentioned yields a positivity in the event-related-potential signature characteristic of concep- tual reorganization; however, the observed positivity occurs earlier in the case of zu-excessives than in the other cases. We propose this difference is due to zu signalling the mandatory preparation for an ensuing repair rather than reflecting the repair Operation itself that involves manipulating the Standard of comparison, coded elsewhere in the String (if at all).
Am 24. Februar 2020 wurde in der Schweiz die erste Infektion mit dem Coronavirus nachgewiesen. Zu diesem Zeitpunkt konnte wohl noch niemand ahnen, welche tiefgreifenden Konsequenzen die Corona-Pandemie für die Gesellschaft haben wird. Aus heutiger Perspektive überrascht es uns nicht mehr, dass das Pandemiegeschehen auch starke Auswirkungen auf die Sprache hatte und noch immer hat, denn Sprachgebrauch passt sich stets gesellschaftlichen Veränderungen an. Am Leibniz-Institut für Deutsche Sprache in Mannheim dokumentieren und erforschen wir die ungewöhnlich starken und kurzfristigen Wirkungen der Pandemie auf die deutsche Sprache und fassen unsere Ergebnisse unter anderem in zahlreichen Beiträgen zusammen.
Die Studie untersucht therapeutische Strategien für den Umgang mit und das Management von Patientenwiderstand, der auf Lösungsorientierte Fragen in der Psychotherapie folgt. Patienten reagieren auf Lösungsorientierte Fragen regelmäßig dispräferiert. Die Therapeuten wiederum sollen therapeutisch relevantes Material elizitieren.
Mit Hilfe linguistisch-gesprächsanalytischer Methoden wird untersucht, wie Therapeuten im Anschluss an lösungsorientierte Anfragen mit dispräferierten Antworten umgehen. Das Widerstandsmanagement der Therapeuten umfasst dabei sowohl expansions- und reparaturinitiierende Reaktionen als auch Themenwechsel.
Untersucht werden 15 psychodiagnostische Erstgespräche nach der erweiterten Version der Operationalisierten Psychodynamischen Diagnostik (OPD-2), einem standardisierten und manualisierten diagnostischen Inventar, das die psychodynamischen Kräfte hinter den Erkrankungen der Patienten erfassen soll.
This paper describes the TEI-based ISO standard 2462:2016 “Transcription of spoken language” and other formats used within CLARIN for spoken language resources. It assesses the current state of support for the standard and the interoperability between these formats and with relevant tools and services. The main idea behind the paper is that a digital infrastructure providing language resources and services to researchers should also allow the combined use of resources and/or services from different contexts. This requires syntactic and semantic interoperability. We propose a solution based on the ISO/TEI format and describe the necessary steps for this format to work as an exchange format with basic semantic interoperability for spoken language resources across the CLARIN infrastructure and beyond.
Sometimes legal scholars get relevant but baffling questions from laypersons like: “The reference to a work is personal data, so does the GDPR actually require me to anonymise it? Or, as my voice data is personal data, does the GDPR automatically give me access to a speech recognizer using my voice sample? Or, can I say anything about myself without the GDPR requiring the web host to anonymise or remove the post? What can I say about others like politicians? And, what can researchers say about patients in a research report?” Based on these questions, the authors address the interaction of intellectual property and data protection law in the context of data minimisation and attribution rights, access rights, trade secret protection, and freedom of expression.
This paper reports on the efforts of twelve national teams in building the International Comparable Corpus (ICC; https://korpus.cz/icc) that will contain highly comparable datasets of spoken, written and electronic registers. The languages currently covered are Czech, Finnish, French, German, Irish, Italian, Norwegian, Polish, Slovak, Swedish and, more recently, Chinese, as well as English, which is considered to be the pivot language. The goal of the project is to provide much-needed data for contrastive corpus-based linguistics. The ICC corpus is committed to the idea of re-using existing multilingual resources as much as possible and the design is modelled, with various adjustments, on the International Corpus of English (ICE). As such, ICC will contain approximately the same balance of forty percent of written language and 60 percent of spoken language distributed across 27 different text types and contexts. A number of issues encountered by the project teams are discussed, ranging from copyright and data sustainability to technical advances in data distribution.
The paper explores factors that influence the distribution of constituent words of compounds over the head and modifier position. The empirical basis for the study is a large database of German compounds, annotated with respect to the morphological structure of the compound and the semantic category of the constituents. The study shows that the polysemy of the constituent word, its constituent family size, and its semantic category account for tendencies of the constituent word to occur in either modifier or head position. Furthermore, the paper explores the degree to which the semantic category combination of head and modifier word, e.g., x=substance and y=artifact, indicates the semantic relation between the constituents, e.g., y_consists_of_x.
In psychotherapy, therapists often formulate interpretations of clients' prior talk which are ‘unilateral’ in the sense that therapists index that they are themselves the author of an interpretive inference which may not be acceptable to the client. Based on 100 German-language recordings of brief psychodynamic psychotherapy (4 clients with 25 sessions each), we describe a multimodal practice of constructing extended multi-unit turns of delivering therapeutic interpretations. The practice includes gaze aversion until the main point of the interpretation is reached, perceptive and cognitive formulae, epistemic hedges, inserted accounts, parenthesis, self-repair, and self-reformulations. These design-features work together to index that the therapist produces an interpretation that can be heard as being tentative. The design of the therapists' turns reflexively indexes the expectation that the client might resist the interpretation; at the same time they are constructed to avoid resistance and to invite the client's self-exploration into new directions, often with a focus on emotions.
The teaching slides accompany the following textbook:
Svenja Völkel & Franziska Kretzschmar (2021): Introducing linguistic research. Cambridge: Cambridge University Press.
The slides follow the structure of the book chapters and can be used for teaching in class. They include the basic information per chapter and exercises to work on in class or as homework. More detailed information, additional exercises, suggestions for research projects and recommendations for further reading can be found in the textbook.
Dieses Kapitel untersucht die syntaktischen Funktionen von vollen (nicht-pronominalen) Nominalphrasen (NPs) und die Funktionen der vier Kasus des Deutschen aus quantitativer Perspektive. Es wird vorgeschlagen, das Konzept der syntaktischen Funktion in grundlegendere Merkmale zu zerlegen. Dazu gehören der Typ desjenigen Elements, dem die NP untergeordnet ist, und die Art der Beziehung zwischen der NP und dem übergeordneten Element (ganz allgemein: Komplementation vs. Modifikation).
In this paper we examine the composition and interactional deployment of suspended assessments in ordinary German conversation. We define suspended assessments as lexicosyntactically incomplete assessing TCUs that share a distinct cluster of prosodic-phonetic features which auditorily makes them come off as 'left hanging' rather than cut-off (e.g., Schegloff/Jefferson/Sacks 1977; Jasperson 2002) or trailing-off (e.g., Local/Kelly 1986; Walker 2012). Using CA/IL methodology (Couper-Kuhlen/Selting 2018) and drawing on a large body of video-recorded face-to-face conversations, we highlight the verbal, vocal and bodily-visual resources participants use to render such unfinished assessing TCUs recognizably incomplete and identify six recurrent usage types. Overall, the suspension of assessing TCUs appears to either serve as a practice for circumventing the production of assessments that are interactionally inapposite, or as a practice for coping with local contingencies that render the very doing of an assessment problematic for the speaker. Data are in German with English translations.
Streit um Sprache
(2021)
Dieses Kapitel untersucht die Stellung adnominaler Genitive im Deutschen. Die Stellungsvariation besteht fast ausschließlich für artikellose Eigennamen, weshalb diese im Zentrum der Analyse stehen. Auf Basis von Korpusdaten kann gezeigt werden, dass die Faktoren Belebtheit und Länge des Attributs sowie Kasus der Gesamtphrase einen großen Teil der Variation erklären.
In so-called Let’s Plays, video gaming is presented and verbally commented by Let’s Players on the internet for an audience. When only watched but not played, the most attractive features of video games, immersion and interactivity, get lost – at least for the internet audience. We assume that the accompanying reactions (transmitted via a so-called facecam) and verbal comments of Let’s Players on their game for an audience contribute to an embodiment of their avatars which makes watching a video game more attractive. Following an ethnomethodological conversation analytical (EMCA) approach, our paper focusses on two practices of embodying avatars. A first practice is that Let’s Players verbally formulate their actions in the game. By that, they make their experiences and the 'actions' of avatars more transparent. Secondly, they produce response cries (Goffman) in reaction to game events. By that, they enhance the liveliness of their avatars. Both practices contribute to a co-construction of a specific kind of (tele-)presence.
Die Vernetzung von Computern bewirkt die Entstehung eines Netzes aus Texten und, als Folge davon, sozialen Netzen von Nutzern dieser Texte als Schreibern und Lesern. Netzwerke sprachlicher Objekte gab und gibt es zwar auch ohne Digitalisierung und Vernetzung, jedoch weniger umfangreich und wesentlich schwerer, möglicherweise gar nicht in großer Menge analysierbar. Der vorliegende Beitrag befasst sich mit den verschiedenen Typen sprachlicher Netzwerke: Textgeweben, Interaktionsnetzwerken und sozialen Netzwerken. Es werden zentrale Begrifflichkeiten der Netzwerkanalyse erläutert und anhand von Beispielen gezeigt, wie sprachliche Kommunikation auf der Grundlage der Methoden der Netzwerkanalyse aus einer anderen, neuen Perspektive betrachtet werden kann.
Selten hat ein globales Ereignis nicht nur den Alltag sehr vieler Menschen weltweit schlagartig verändert und in einem längeren Zeitraum zu nachhaltigen Änderungen der Lebensumstände geführt, sondern auch direkte Spuren im Wortschatz und der Art und Weise des Kommunizierens hinterlassen, wie dies durch die Coronakrise der Fall war. Die Beiträge in diesem Band zeichnen diese Reflexionen nach und machen die Veränderungen auf Basis unterschiedlichen Materials (z.B. Pressetexte, Social-Media-Quellen, Gespräche) und zu einem breiten Themenspektrum (Arbeit, Schule, Wirtschaft usw.) nachvollziehbar. Ein deutlicher Fokus liegt dabei auf dem lexikalischen Wandel und zahlreichen Neologismen, die rund um die Coronapandemie aufgekommen sind.
Sprache im Gepäck. Von den vielfältigen Dialekten der Deutschen in der ehemaligen Sowjetunion
(2021)
Im Gepäck der etwa 2,5 Millionen der in den letzten rund dreißig Jahren in die Bundesrepublik eingewanderten (Spät-)Aussiedler aus Staaten der ehemaligen Sowjetunion befand sich ein großes immaterielles Erbe. Dieses war nicht auf alle gleichermaßen verteilt, bei dem einen mehr, bei der anderen weniger spürbar und ist immer weniger geworden. Es handelt sich dabei um die mitgebrachten »russlanddeutschen« Dialekte. Was sind das für Dialekte und wer spricht sie noch?
Spiele und Spielgeräte: Tamagotchi, Sudoku oder doch Puzzle? (Aus der Rubrik Neuer Wortschatz)
(2021)
Deutsche Genitivattribute benötigen eine hinreichend overte Kasusmarkierung an abhängigen Wortarten (Determinierern, Adjektiven), mitunter in Kombination mit einer Markierung am Genitivnomen selbst. Wenn die Struktur der Attributsphrase solche Markierungen unmöglich macht, wird eine Präpositionalphrase mit von genutzt. Es gibt allerdings eine Reihe von Grenzfällen, die Genitivgebrauch erlauben, obwohl keine hinreichende Markierung möglich ist. Die vorliegende Studie liefert zu drei solchen Fällen empirische Daten: 1. Fälle, wo der unflektierte Wortstamm des Adjektivs oder des Genitivnomens einem Genitivsuffix gleicht („Pseudoflexion“), 2. Fälle, wo Determinierer und Genitivnomen schwach flektiert werden („doppelt schwache Flexion“) und 3. Fälle, wo die Determiniererposition durch einen weiteren, pränominalen Genitiv besetzt ist, der keine Kongruenz aufweisen kann („verschachtelte Genitivattribute“). Anhand umfassender Korpusuntersuchungen kann so eingeschätzt werden, welche Rolle diese Grenzfälle im System der deutschen Standardsprache spielen.
Social actions
(2021)
Social actions are recipient-designed actions that occur in the context of interaction sequences. This chapter focuses on sources and practices for the formation and ascription of social actions. While linguists stress the relevance of linguistic social action formats, conversation analysts highlight the relevance of the sequential position of an action, and sociolinguists point to the influence of social identities for action-formation and -ascription. The combination of these three approaches helps us to solve the analytic problem of indirectness, which, however, only rarely becomes a problem for the participants in an interaction themselves. Social properties which recurrently apply when using verbal and bodily resources of action-formation, i.e. the social actions themselves, inferred meanings, projected next actions, the participation framework, the activity type, speaker’s stance, participants’ identities, etc. lead to stable pragmatic connotations of those forms, i.e. action-meanings, which become idiomatic and part of our common-sense competence. Still, social actions are multi-layered and can be ambiguous at times. Therefore, their meaning can be open for negotiation. Intersubjectivity of action ascription is ultimately secured neither by conventions nor by speaker’s intentions, but is accomplished by their treatment in subsequent discourse.
Mobile live video streaming with smartphones is an everyday media practice in which the participants are in a specific multimodal constellation and streamers and viewers have access to various semiotic resources for interactionally establishing alignment. Based on the multimodal sequence analysis of a concise episode of a journalist's livestream coverage of a political event on the streaming platform Periscope, I will address the question of how participation and involvement in live video streams are achieved and organised by the participants. I will show that hosts in the media practice of live video streaming act in an interaction-dominant manner and involve the viewers in the situation through asymmetrical participation coordination via footing shifts.
Signposts for CLARIN
(2021)
An implementation of CMDI-based signposts and its use is presented in this paper. Arnold, Fisseni et al. (2020) present signposts as a solution to challenges in long-term preservation of corpora. Though applicable to digital resources in general, we focus on corpora, especially those that are continuously extended or subject to modification, e.g., due to legal injunctions, but also may overlap with respect to constituents, and may be subject to migrations to new data formats. We describe the contribution signposts can make to the CLARIN infrastructure, notably virtual collections, and document the design for the CMDI profile.
Dieser Aufsatz befasst sich mit pragmatischen Aspekten von Negationsanhebung (NA), die vor allem in Horn (1978) erörtert wurden, und mit performativischen Eigenschaften von NA-Konstruktionen, die ursprünglich in Prince (1976), vor allem mit Bezug auf französische Daten diskutiert wurden. Das Ziel ist, die Kernaussagen von Horn (1978) und Prince (1976) mit Korpusdaten im übereinzelsprachlichen Kontext zu validieren. Als Gegenstand der Untersuchung werden deutsche und polnische NA-Konstruktionen herangezogen und entsprechend zwei verschiedene monolinguale Korpora als Datenquelle benutzt.
Shutdown, Lockdown und Exit
(2021)
The article focuses on determining responsible parties and the division of potential liability arising from sharing language data (LD) containing personal data (PD). A key issue here is to identify who has to make sure and guarantee the GDPR compliance. The authors aim to answer 1) whether an individual researcher is a controller and 2) whether sharing LD results in joint controllership or separate controllership (whether the data's transferee becomes the controller, the joint controller or the processor). The article also analyses the legal relations of parties involved in data sharing and potential liability. The final section outlines data sharing in the CLARIN context. The analysis serves as a preliminary analytical background for redesigning the CLARIN contractual framework for sharing data.
In order to differentiate between figurative and literal usage of verb-noun combinations for the shared task on the disambiguation of German Verbal Idioms issued for KONVENS 2021, we apply and extend an approach originally developed for detecting idioms in a dataset consisting of random ngram samples. The classification is done by implementing a rather shallow, statistics-based pipeline without intensive preprocessing and examinations on the morphosyntactic and semantic level. We describe the overall approach, the differences between the original dataset and the dataset of the KONVENS task, provide experimental classification results, and analyse the individual contributions of our feature sets.
Semiotische Medientheorien
(2021)
Die Dokumentation und Untersuchung deutscher Sprachinselvarietäten war schon immer eine der wichtigsten Aufgaben der germanistischen Sprachwissenschaft. Mittlerweile stellt sich aber immer öfter die Frage der Nachhaltigkeit der erhobenen Spachinseldaten. Insbesondere in Bezug auf die vom Sprachtod bedrohten Varietäten, wie z.B. im Fall der russlanddeutschen Dialekte aus den noch intakten Sprachinseln der ehemaligen Sowjetunion, ist es äußerst wichtig, die existierenden Audioaufnahmen systematisch und dauerhaft zu archivieren. Aber nicht nur die Archivierung, sondern auch der freie und unkomplizierte Zugang zu diesen Materialien ist ein wesentlicher Aspekt im Konzept der Nachhaltigkeit. Wie sollte dieser Zugang aber gestaltet sein und in welcher Form sollen die Daten präsentiert werden? Auf genau diese Frage ist das Projekt „Elektronisches Wörterbuch. Ein Online-Informationsangebot zu Sprache und Dialekten der Russlanddeutschen" eingegangen. In diesem Projekt wurden historische Tonaufnahmen russlanddeutscher Dialekte linguistisch aufbereitet und in Form einer strukturierten Russlanddeutschen Dialektdatenbank (RuDiDat) online veröffentlicht. Diese Datenbank ist frei verfügbar und ermöglicht die Recherche im Korpus des Russlanddeutschen. Der vorliegende Beitrag stellt die Datenbank vor und thematisiert Herausforderungen, die durch unterschiedliche Ausprägungsformen des Russlanddeutschen entstehen könnten, wenn man die im Internet freigegebenen Sprachinseldaten für vergleichende Analysen heranzieht.
The present paper explores how rules are enforced and talked about in everyday life. Drawing on a corpus of board game recordings across European languages, we identify a sequential and praxeological context for rule talk. After a game rule is breached, a participant enforces proper play and then formulates a rule with an impersonal deontic statement (e.g. “It’s not allowed to do this”). Impersonal deontic statements express what may or may not be done without tying the obligation to a particular individual. Our analysis shows that such statements are used as part of multi-unit and multi-modal turns where rule talk is accomplished through both grammatical and embodied means. Impersonal deontic statements serve multiple interactional goals: they account for having changed another’s behavior in the moment and at the same time impart knowledge for the future. We refer to this complex action as an “instruction.” The results of this study advance our understanding of rules and rule-following in everyday life, and of how resources of language and the body are combined to enforce and formulate rules.
Geeignete Such- und Visualisierungswerkzeuge, idealiter in Form von Webapplikationen, sind für den benutzerfreundlichen Zugang zu Sprachressourcen von großer Bedeutung. In diesem Beitrag stellen wir die Webapplikationen Rover und TüNDRA vor, die am CLARIN-D Zentrum Tübingen im Rahmen des BMBF-Projekts CLARIN-D entwickelt wurden.
In diesem Buch werden auf einer großen empirischen Basis die regionalen Sprechweisen von verschiedenen Bevölkerungsgruppen in einem kleinen Gebiet im alemannischen Sprachraum untersucht. Als Datengrundlage dienen aktuelle, spontansprachliche und fragebuchbasierte Daten, die einander gegenübergestellt und diachron mit den Ergebnissen des Südwestdeutschen Sprachatlas (SSA) aus den 1970er Jahren verglichen werden. Es werden vorwiegend datenaggregierende Verfahren angewendet, um die regionale und soziale Gebundenheit der vorgefundenen Variation zu erfassen. Mit Hilfe von Dialektabstandsmessungen werden ausgewählte, überwiegend phonologische Merkmale im Hinblick auf Dialektwandelprozesse untersucht. Außerdem wird gezeigt, dass mit dialektometrischen Verfahren explorative Aggregatanalysen möglich sind, die es erlauben, Sprachräume zu identifizieren und dialektologisch zu beschreiben.
In this paper, the basic assumptions are presented against the background of the development of a corpus-based method to determine suitable headword candidates for the LeGeDe-prototype (LeGeDe= Lexik des gesprochenen Deutsch), a lexicographical resource on spoken German. In a first quantitatively oriented step, potential one-word headword candidates are identified with the help of frequency class comparisons from a corpus for spoken (FOLK) and a subset from a corpus for written German (DEREKO). Qualitative analyses based on a project-specifically defined sample of data from the FOLK corpus lead to multi-word headword candidates. The results of the qualitative analyses were also compared with the results of studies from the research literature as well as (quantitative-orientated) bi- and trigram analyses. In their multi-word form, these candidates are particularly characterized by the fact that they assume a very special interactional function in the (authentic) interaction and have to be described as a whole unit. The paper explains this combined procedure, which was extracted in the LeGeDe-project for the appointment of headword candidates.
Information theory can be used to assess how efficiently a message is transmitted on the basis of different symbolic systems. In this paper, I estimate the information-theoretic efficiency of written language for parallel text data in more than 1000 different languages, both on the level of characters and on the level of words as information encoding units. The main results show that (i) the median efficiency is ∼29% on the character level and ∼45% on the word level, (ii) efficiency on both levels is strongly correlated with each other and (iii) efficiency tends to be higher for languages with more speakers.
In diesem Beitrag werden Präpositionalobjektsätze – also Sätze, die in der Funktion von präpositionalen Objekten stehen, – aus ausgewählten germanischen und romanischen Sprachen sprachvergleichend betrachtet. Dabei zeigen sich zwei verschiedene Strategien, die Verbindung von Präposition und Satz herzustellen: direkt, indem die Präposition einen Satz selegiert, und indirekt über die Anbindung mit einer komplexen Proform. Erstere Strategie sehen wir im Schwedischen (stellvertretend für die nordgermanischen Sprachen) und auch im Französischen und Italienischen (mit einer coverten Präposition). Im Niederländischen und Deutschen findet sich die zweite Strategie, bei der Sätze mithilfe eines Pronominaladverbs angebunden werden. Eine genauere Analyse dieser beiden germanischen Sprachen zeigt, dass im Deutschen Pronominaladverb und Satz eine Konstituente bilden können, während dies im Niederländischen nicht möglich ist. Alle analysierten Sprachen haben gemeinsam, dass das präpositionale Element (Präposition oder Pronominaladverb) abwesend sein kann oder muss. Dabei lässt sich anhand von Pronominalisierung, Topikalisierung und W-Extraktion zeigen, dass das P-Element syntaktisch präsent als leeres Element (covert) realisiert werden muss, da diese Sätze mit und ohne P-Element Eigenschaften der PO-Sätze haben und mit DO-Sätzen kontrastieren.
Die Analyse prosodisch-phonetischer Ressourcen stand neben morpho-syntaktischen, lexiko-semantischen und diskurspragmatischen von Anfang an im Mittelpunkt interaktional-linguistischer Forschung. In den letzten Jahren sind darüber hinaus visuell wahrnehmbare Phänomene zunehmend Gegenstand interaktional-linguistischer Beschreibungen von Kommunikationssituationen geworden.
Der vorliegende Sammelband enthält neun Untersuchungen, die auf Korpora von Alltagsgesprächen oder institutionellen Interaktionssituationen (Unterricht und Parlamentsdebatten) in unterschiedlichen Sprachen (Deutsch, Englisch, Mandarin) beruhen. Die Beiträge zeigen, welchen Anteil unterschiedliche semiotische Ressourcen – interpretiert in ihrer holistischen Gestalt – an der Organisation sozialer Interaktionen haben. Der Band trägt somit dazu bei, die Rolle multimodaler Ressourcenbündel in ihrer Situiertheit, Prozesshaftigkeit und Kontextsensitivität für die Durchführung kommunikativer Aufgaben besser zu verstehen.
Das Projekt „Bürgernahe Sprache in der Finanzverwaltung“ verfolgt das Ziel, Texte aus dem Bereich der Steuerverwaltung in bürgernaher Sprache umzusetzen. Im September 2020 hat das IDS in enger Rückbindung an den Lenkungskreis des Projektes begonnen, eine Pilotstudie zu entwickeln. Hierin wurden ausgewählte Texte (Textbausteine) in einem Online-Umfrageformat mit verschiedenen Bewertungsskalen aufbereitet. Die Beispieltexte in der Studie stammen aus den Erläuterungstexten zum Einkommensteuerbescheid sowie den Ausfüllanleitungen zur Grundsteuer. Die Testpersonen sollten in mehreren unterschiedlichen Aufgabenblöcken ausgewählte Texte in Vorher- und/oder Nachher-Versionen über die Bewertungsskala bewerten. Zusätzlich konnten sie auf jeder Aufgabenseite Anmerkungen in einem Freifeld notieren. Das Ziel der Umfrage ist es, Bürgerinnen und Bürger zu ihren Eindrücken zu befragen und aus den Ergebnissen Rückschlüsse auf die Verständlichkeit der Texte zu ziehen. Ein wichtiges übergeordnetes Ziel der Pilotstudie ist es, die eigentlichen Adressatinnen und Adressaten der Texte in die Projektarbeit mit einzubeziehen. Die Einschätzungen und Anmerkungen der Beteiligten geben für den weiteren Projektverlauf hilfreiche Hinweise und werden in die weiteren Überlegungen und praktischen Umsetzungen einfließen. Dieser Bericht fasst die Ergebnisse aus der Pilotstudie zusammen. Er gibt zu den verschiedenen Blöcken, die die Probandinnen und Probanden bearbeitet haben, Einblick, wie die Testpersonen die ihnen präsentierten Texte bewertet haben. Dabei werden die quantitativ ausdrückbaren Ergebnisse durch grafische Darstellungen visualisiert und in textueller Form zusammengefasst. Die Antworten auf die offenen Fragen geben einen qualitativen Eindruck der Anmerkungen, die die Probandinnen und Probanden in Freifeldern hinterlassen haben.
Contents:
1. Julien Abadji, Pedro Javier Ortiz Suárez, Laurent Romary and Benoît Sagot: "Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus", S.1-9.
2. Markus Gärtner, Felicitas Kleinkopf, Melanie Andresen and Sibylle Hermann: "Corpus Reusability and Copyright - Challenges and Opportunities", S.10-19.
3. Nils Diewald, Eliza Margaretha and Marc Kupietz: "Lessons learned in Quality Management for Online Research Software Tools in Linguistics", S.20-26.
This paper deals with a specific type of lexeme, namely binary preposition-noun combinations containing temporal references like am Ende [at (the) end] or für Sekunden [for seconds]. The main characteristic of these combinations is the recurrent internal zero gap. Despite the fact that the omission of the determiner can often be explained by grammatical rules, the zero gaps indicate a higher degree of lexicalization. Therefore, we interpret these expressions as minimal phraseological units with holistic meanings and functions. The corpusdriven exploration of typical context patterns (e.g. using collocation profiles and the lexpan slot filler analysis) shows that a) even such minimal expressions are based on semi-abstract schemes and b) temporal expressions can also fulfill modal or discursive functions, usually with fuzzy borders and overlapping structures. In the case of modalization or pragmatization one can regard such PNs as distinct lexicon entries.