Refine
Year of publication
- 2022 (223) (remove)
Document Type
- Part of a Book (104)
- Article (56)
- Book (20)
- Conference Proceeding (19)
- Other (12)
- Review (7)
- Doctoral Thesis (2)
- Preprint (2)
- Part of Periodical (1)
Language
- German (141)
- English (79)
- French (2)
- Multiple languages (1)
Is part of the Bibliography
- yes (223) (remove)
Keywords
- Deutsch (87)
- Korpus <Linguistik> (56)
- Kommunikation (25)
- Nationalsozialismus (23)
- Interaktion (22)
- Konversationsanalyse (19)
- Sprachgebrauch (19)
- Gesprochene Sprache (18)
- Wörterbuch (18)
- Sprachdaten (16)
Publicationstate
- Veröffentlichungsversion (140)
- Zweitveröffentlichung (70)
- Postprint (33)
- Ahead of Print (1)
Reviewstate
Publisher
- de Gruyter (42)
- IDS-Verlag (20)
- V&R unipress (19)
- Leibniz-Institut für Deutsche Sprache (IDS) (16)
- Wilhelm Fink (15)
- European Language Resources Association (ELRA) (9)
- Leibniz-Institut für Deutsche Sprache (8)
- Peter Lang (8)
- Cambridge University Press (5)
- Benjamins (4)
The shortening of linguistic expressions naturally involves some sort of correspondence between short forms and (some portion of) the respective full forms. Based mostly on data from English and Hebrew this article explores the hypothesis that such correspondence concerns necessary sameness of symbolic form, referring either to graphemic or to a specific level of phonological representation. That level indicates a degree of abstractness defined by language-specific contrastiveness (i.e. “phonemic”). Reference to written form can be shown to be highly systematic in certain contexts, including cases where full forms consist of multiple stems. Specific asymmetries pertaining to the targeting of material by correspondence (e.g. initial vs. non-initial position) appear to be alike for both types of representation, a claim supported by a study based on a nomenclature strictly confined to writing (chemical element symbols).
When comparing different tools in the field of natural language processing (NLP), the quality of their results usually has first priority. This is also true for tokenization. In the context of large and diverse corpora for linguistic research purposes, however, other criteria also play a role – not least sufficient speed to process the data in an acceptable amount of time. In this paper we evaluate several state of the art tokenization tools for German – including our own – with regard to theses criteria. We conclude that while not all tools are applicable in this setting, no compromises regarding quality need to be made.
The public as linguistic authority: Why users turn to internet forums to differentiate between words
(2022)
This paper addresses the question of why we face unsatisfactory German dictionary entries when looking up and comparing two similar lexical terms that are loan words, new words, (near) synonyms, or confusables. It explains how users are aware of existing reference works but still search or post on language forums, often after consulting a dictionary and experiencing a range of dictionary based problems. Firstly, these dictionary based difficulties will be scrutinised in more detail with respect to content, function, presentation, and the language of definitions. Entries documenting loan words and commonly confused pairs from different lexical reference resources serve as examples to show the short comings. Secondly, I will explain why learning about your target group involves studying discussion forums. Forums are a valuable source for detailed user studies, enabling the examination of different communicative needs, concrete linguistic questions, speakers’ intuitions, and people’s reactions to posts and comments. Thirdly, with the help of two examples I will describe how the study of chats and forums had a major impact on the development of a recently compiled German dictionary of confusables. Finally, that same problem solving approach is applied to the idea of a future dictionary of neologisms and their synonyms.
Recent years have seen a growing interest in linguistic phenomena that challenge the received division of labour between lexicon and grammar, and hence often fall through the cracks of traditional dictionaries and grammars. Such phenomena call for novel, pattern based types of linguistic reference works (see various papers in Herbst 2019). The present paper introduces one such resource: MAP (“Musterbank argumentmarkierender Präpositionen”), a web based corpus linguistic patternbank of prepositional argument structure constructions in German. The paper gives an overview of the design and functionality of the MAP prototype currently developed at the Leibniz Institute for the German Language in Mannheim. We give a brief account of the data and our analytic workflow, illustrate the descriptions that make up the resource and sketch available options for querying it for specific lexical, semantic and structural properties of the data.
Der vorliegende Beitrag untersucht aus interaktionslinguistischer Perspektive, wie Prinzipien deliberativer Demokratie in den Schlichtungsgesprächen zu Stuttgart 21 umgesetzt wurden. Wir konzentrieren uns dabei auf Interventionen, in denen der Schlichter Heiner Geißler die Wahrung von Verständlichkeit und Interessen der Bürger/-innen anmahnt, sowie Verletzungen der Wahrheitsnorm sanktioniert. Wir zeigen, wie Bürger/-innen sowie Normen und Werte rhetorisch als Ressource für das Einhalten von Verfahrensregeln genutzt werden, aber auch den Interessen des Schlichters selbst dienen. Dabei werden die Verfahrenswerte nicht immer einheitlich priorisiert. Die zugrunde liegende politische Diskussion wird zu Gunsten der Durchsetzung des Konstrukts ‚Faktenschlichtung‘ ausgeklammert.
Das Vokabular von Songtexten im gesellschaftlichen Kontext – ein diachron-empirischer Beitrag
(2022)
Der Beitrag untersucht den Stellenwert gesellschaftlich relevanter Thematiken in deutschsprachigen Songtexten der zurückliegenden fünf Jahrzehnte. Dabei zeigt sich, dass neben individuellen Befindlichkeiten auch politische, sozialkritische oder umweltbezogene Themen signifikant angesprochen werden. Wir kontrastieren Songtexte mit anderen Testsorten und wenden dabei quantitative Methoden auf umfangreiche, breit stratifizierte Datensamples an, um die Phänomenbeschreibungen präzisierbar, generalisierbar und reproduzierbar zu machen. Das longitudinale Korpusdesign bietet Potenzial für diachrone Vergleiche. Im Sinne eines erweiterten „Mixed Methods“-Ansatzes exploriert die Studie zudem ausgewählte Aspekte qualitativ und bettet sie in den zeitlichen Kontext ein.
This paper investigates the long-term diachronic development of the perfect and preterite tenses in German and provides a novel analysis by supplementing Reichenbach’s (1947) classical theory of tense by the notion of underspecification. Based on a newly compiled parallel corpus spanning the entire documented history of German, we show that the development in question is cyclic: It starts out with only one tense form (preterite) compatible with both current relevance and narrative past readings in (early) Old High German and, via three intermediate stages, arrives at only one tense form again (perfect) compatible with the same readings in modern Upper German dialects. We propose that in order to capture all attested stages we must allow tenses to be unspecified for R (reference time), with R merely being inferred pragmatically. We then propose that the transitions between the different stages can be explained by the interplay between semantics and pragmatics.
FAIR-Prinzipien und Qualitätskriterien für Transkriptionsdaten. Empfehlungen und offene Fragen
(2022)
Dieser Beitrag behandelt die mittlerweile als Bestandteil guter wissenschaftlicher Praxis anerkannten FAIR-Prinzipien in Bezug auf die Transkription und Annotation gesprochener Sprache und multimodaler Interaktion. Forschungsdaten - und somit Transkriptionsdaten - sollen heute Findable, Accessible, Interoperable und Reusable sein. Der Beitrag versucht dementsprechend, empirische Methoden im Prozess der Digitalisierung und generische Prinzipien des digitalen Forschungsdatenmanagements zusammenzubringen, um für diesen Kontext einem operationalisierten Begriff der „FAIRness“ näher zu kommen und möglichst konkrete Empfehlungen aufzustellen. Der Beitrag sollte aber gleichzeitig zur Diskussion anregen, denn konkrete Anforderungen in Bezug auf das Forschungsdatenmanagement und die Datenqualität müssen auch im Rahmen der FAIR-Prinzipien von den Fachgemeinschaften selbst herausgearbeitet werden.
Lexikalische Wiederholungen nehmen in der Lehre von den rhetorischen Stilfiguren viel Raum ein; in der Linguistik des schriftsprachlichen Deutsch spielen sie dagegen kaum ein Rolle. Die Arbeit überprüft, inwieweit sich die Funktionsweise zweier Figuren der meist unmittelbaren Ausdruckswiederholung, der Geminatio und der Anadiplose, auf der Basis von Standardannahmen zur Syntax, Semantik und Pragmatik des Deutschen erklären lässt.
Zugrunde liegt der Arbeit eine Sammlung von über 700 Instanzen der Geminatio und Anadiplose aus deutschsprachigen Gedichten des 17. bis 21. Jahrhunderts. Es wird daran gezeigt, wie die Geminatio unter Ausnutzung von satztopologischen und NP-internen Positionierungen und darauf aufbauenden bedeutungskompositionellen und implikaturenbasierten Prozessen der Bedeutungkonstitution zum ikonischen Ausdruck der Gradierung von Eigenschaften dient. Die Anadiplose wiederum entpuppt sich als Mittel zur Hervorhebung von Themen und Propositionen, die pragmatisch und informationsstrukturell auf ihrer Einbindung in Herausstellungskonstruktionen und Satzverknüpfungen gründet.
Damit liefern die beiden rhetorischen Figuren kaum Argumente für die Abweichungstheorie literarischer Sprache, derzufolge die Sprachverwendung in literarischen und insbesondere lyrischen Texten oft nicht den Regeln und dem Usus des nicht-literarischen Deutsch folgt. Die Funktionsweise der Geminatio und der Anadiplose ist gut in das syntaktische, semantische und pragmatische System des Deutschen eingebunden. Insbesondere die Geminatio zeigt dabei in Gedichten auch deutliche Parallelen zu entsprechenden Phänomenen im gesprochenen Deutsch.
In this paper, we deal with register-driven variation from a probabilistic perspective, as proposed in Schäfer, Bildhauer, Pankratz, Müller (2022). We compare two approaches to analyse this variation within HPSG. On the one hand, we consider a multiple-grammar approach and combine it with the architecture proposed in the CoreGram project Müller (2015) - discussing its advantages and disadvantages. On the other hand, we take into account a single-grammar approach and argue that it appears to be superior due to its computational efficiency and cognitive plausibility.
In diesem Beitrag wird anhand von per Telefon gedolmetschten Gesprächen zwischen einer deutschsprechenden Asylverfahrensberaterin und arabischsprechenden KlientInnen die Notwendigkeit eines reflektierten computergestützten Transkriptionsverfahrens für interaktionsbezogene Untersuchungen diskutiert. Gesprächstranskription erfordert die Verwendung eines romanisierten, rechtsläufigen Schriftsystems für die schriftliche und grafische Darstellung der zeitlichen Dimensionen, d. h. die Synchronizität, Simultaneität und Reziprozität des sprachlichen Handelns. Durch die Entwicklung einer transparenten Systematik zur Romanisierung und Übersetzung von Gesprächsdaten wird ihre Opazität sowohl für LeserInnen ohne Arabischkenntnisse als auch für Sprachkundige ohne Kenntnisse über die rekonstruierten Varietäten reduziert und ansatzweise eine Lesbarkeit auch für Nicht-Sprachkundige geschaffen. Dies ist für die Datenkuratierung und etwaige Nachnutzungen von besonderer Bedeutung.
Aus Platzgründen musste in der Druckfassung des Artikels „Beobachtungen zu Frequenz und Funktionen von ja in deutscher Spontansprache“ (in: Deutsche Sprache 50, S. 336–363; https://doi.org/10.37307/j.1868-775X.2022.04.04) auf den Abdruck der illustrierenden Abbildungen 2–18 im Abschnitt 5.2 verzichtet werden. Das entsprechende Kapitel inklusive aller Abbildungen ist hier abrufbar.
Head alignment in German compounds: Implications for prosodic constituency and morphological parsing
(2022)
The notion of head alignment was introduced to account for the observation that in a word with multiple feet, one is more prominent than the others. In particular, this notion is meant to capture the characteristic edge-orientation of main stress by requiring the (left or right) word boundary and the respective (left or right) boundary of the head foot to coincide (McCarthy & Prince 1993). In the present paper the notion of head alignment will be applied to compounds, which are also characterized by the property that one of their members, located in a margin position, is most prominent.
The adequacy of an analysis in terms of head alignment hinges on the question of whether observable prominence peaks associate with the boundaries of independently motivated constituents. It will be argued that such links exist for German compounds, indicating reference to at least three distinct compound categories established on morphological grounds: copulative, phrasal, and a default class of “regular” compounds. The evidence for the relevant distinctions sheds light on morphological parsing, indicating that compound categories can be – and often are – determined by properties pertaining to their complete form, rather than by conditions affecting their (original) construction.
The article investigates the hypothesis that prominence phenomena on different levels of linguistic structure are systematically related to each other. More specifically, it is hypothesized that prominence relations in morphosyntax reflect, and contribute to, prominence management in discourse. This hypothesis is empirically based on the phenomenon of agentivity clines, i.e. the observation that the relevance of agentivity features such as volition or sentience is variable across different constructions. While some constructions, including German DO-clefts, show a strong preference for highly agentive verbs, other constructions, including German basic active constructions, have no particular requirements regarding the agentivity of the verb, except that at least one agentivity feature should be present. Our hypothesis predicts that this variable relevance of agentivity features is related to the discourse constraints on the felicitous use of a given construction, which in turn, of course, requires an explicit statement of such constraints. We propose an original account of the discourse constraints on DO-clefts in German using the ‘Question Under Discussion’ framework. Here, we hypothesize that DO-clefts render prominent one implicit question from a set of alternative questions available at a particular point in the developing discourse. This then yields a prominent question-answer pair that changes the thematic structure of the discourse. We conclude with some observations on the possibility of relating morphosyntactic prominence (high agentivity) to discourse prominence (making a Question Under Discussion prominent by way of clefting).
Hier sehen Sie neue Wörter sowie bekannte Wörter mit neuen Bedeutungen, die seit Beginn der COVID-19-Pandemie aufgekommen sind, bei denen wir aber noch beobachten, ob sie eine gewisse Verbreitung in die Allgemeinsprache erfahren werden. Zu jedem dieser Wörter geben wir eine (vorläufige, grobe) Bedeutungserläuterung an und illustrieren die Verwendung mit 1-2 Belegen.
Dieser Beitrag möchte einen Überblick über die Rolle geben, die die Regionalsprache Lettgallisch im Bildungssektor im Baltikum spielt. Zum einen soll in groben Zügen die historische gesellschaftliche Entwicklung des Lettgallischen mit einem Schwerpunkt auf dem Bildungsbereich dargestellt werden, zum anderen werden Entwicklungen der letzten Jahre diskutiert, in denen Diskurse und Einstellungen zum Lettgallischen eine Wandlung durchlaufen. Der theoretische Rahmen dafür sind internationale Diskussionen zu Regional- und Minderheitensprachen sowie Debatten in der Bildungspolitik. Damit soll nicht zuletzt Aufmerksamkeit für das Lettgallische in der deutschsprachigen Wahrnehmung des Baltikums generiert werden, das in einem Kompendium zu Bildungsgeschichte(n) im Baltikum nicht fehlen darf. Nach einer kurzen Einführung in die Region Lettgallen (Latgale) und das Lettgallische folgen aktuelle Beispiele für den sich ändernden Gebrauch des Lettgallischen und seine Einordung in Diskurse zu Minderheitensprachen. Schließlich wird auf jüngste politische Entwicklungen eingegangen, etwa im Kontext der Ausarbeitung neuer Lehrstandards für die staatlichen Schulen in Lettland.
Rede
(2022)
Die auf verschiedenen Ebenen ablaufenden textkommunikativen Funktionalisierungs- und Anpassungsprozesse widerständischer Akteure sowie Konstitutionsprozesse von Akteuren des NS-Apparates anhand der Textsorte ›politische Rede‹ sollen Gegenstand dieses Beitrages sein, innerhalb dessen sowohl historisch relevante als auch bisher von der Forschung kaum oder gar nicht beachtete politische Reden der verschiedenen Akteursgruppen analysiert werden sollen: Insgesamt wurden 32 Reden in die Analyse einbezogen. 23 stammen von Akteuren des NS-Apparates, neun von Mitgliedern des Widerstands.
Tagebuch
(2022)
Die Subjektivität des Tagebuchs als eine Art Archiv historischer Daten ist insofern zum einen im Zeichen einer sprachlichen Sozialgeschichte zu analysieren und zum andern, aus der Retrospektive, von hohem sprach-, diskurs- sowie kommunikationsgeschichtlichem Wert. Die Spezifik und akteursbedingte Variantenvielfalt darzustellen, ist das Ziel dieses Beitrags. Er basiert auf der Auswertung von insgesamt elf Tagebüchern. Zwei sind von NS-Akteuren verfasst, eines von einer NS-affinen Akteurin der Integrierten Gesellschaft, eines von einem dissidenten Akteur der Integrierten Gesellschaft, vier von Mitgliedern des Widerstands und drei Tagebücher von ausgeschlossenen Akteuren.
In diesem Beitrag wird der in den vorliegenden zwei Bänden häufig verwendete Terminus ›Exklusion‹ systematisch und empirisch fundiert als akteursdifferenziertes Beschreibungselement interpretiert. Diese Akteursdifferenzierung(nach NS-Apparat, NS-affin, ausgeschlossen) bedeutet, Exklusion im Sinn einer sprachlich-kommunikativen Praktik bzw. Strategie und unter der Voraussetzung, dass wir es hinsichtlich der entsprechenden sprachlichen Realisate mit Identitätszu- und -abschreibungen zu tun haben, als Identitätsmanagement in den drei Handlungsperspektiven zu beschreiben.
Um die mit dem Ausdruck Volksgemeinschaft gegebene Handlungsanleitung auf sprachlicher Ebene nachzuzeichnen und in diesem Zusammenhang auch die Dynamik des Gemeinschaftsbegriffs zwischen 1933 und 1945 einzufangen, beschreiten wir methodisch den Weg, die Kotextprofile über die morphosyntaktische Einbettung und damit über die Kontextualisierung des Ausdrucks zu erfassen. Akteursbezogen werden dabei diejenigen Handlungsmuster relevant, in denen das Konzept der Volksgemeinschaft besprochen, behauptet oder beschworen wird. Aufgrund der semantischen Polyvalenz der Wortbildung Volksgemeinschaft und ihrer hohen Reichweite in alle gesellschaftliche Bereiche wird für eine textnahe Interpretation erhoben, zu welchen Themenbereichen die unter dem Gemeinschaftsgedanken verhandelten Gegenstände gehören (z. B. Sport, Architektur, Fahrten etc.), aber auch, wie sich der einzelne oder das Kollektiv in diese Wissens- und Handlungsfelder einschreiben.
Gegenstand des nachfolgenden Beitrags sind emotionale Positionierungen. Auf der Grundlage dieser Egodokumente, die 1934 entstanden sind und die von den Jahren vom Ersten Weltkrieg bis zum Jahr 1934, mit der Kernzeit der Weimarer Republik, erzählen, wird nach der Funktion von Gefühlsthematisierungen gefragt. Dabei wird vorausgesetzt, dass gerade in der sogenannten »Bewegungsphase« der NSDAP, der Phase des Aufstiegs zwischen Mitte der 1920er Jahre bis zur Machtübergabe 1933, bei aller Politisierung der Akteure dennoch Emotion und Affekt von großer, den Nationalsozialismus stabilisierender Bedeutung waren. Der nachfolgende emotionsgeschichtlich orientierte Versuch wird also auf der Grundlage retrospektiver sprachlicher Konstituierungen seitens der NSDAP-Mitglieder nach 1933 rekonstruiert. Sie formulieren diese Retrospektiven nach dem aus ihrer Sicht erfolgreichen Ende des »Kampfes«.
Die »Prestigeveranstaltung Olympische Spiele« (ebd.) war Gegenstand eines höchst komplexen multimodalen und multimedialen, in allen semiotischen Dimensionen stattfindenden Diskurses. Aus kulturlinguistischer Sicht war der Diskurs der Olympischen Spiele von 1936 ein sprachliches Realisat, in dem sich Faktoren einer sprachlichen Sozialgeschichte verdichteten. Der Hauptfokus ist im Folgenden auf die Frage gerichtet, wie und mit welchen kommunikativen Praktiken Beteiligte aus entgegengesetzten Diskurspositionen auf die Olympischen Spiele Bezug nahmen, um die aufgrund je spezifischer Haltungen zu den Spielen konträren Ereigniskonstitutionen ›olympische Sommerspiele‹ sichtbar zu machen.
Die nachfolgende Konzeptbeschreibung ist ein Beitrag zur »linguistischen Anthropologie« (vgl. den so betitelten Aufsatz von Fritz Hermanns 1994) zur Zeit des Nationalsozialismus. Es geht um »sprachgeprägte Menschenbilder« (Hermanns 1994: 37). Wir rekonstruieren Zuschreibungen von »Eigenschaften und Verhaltensweisen« (ebd., auch 46). Es handelt sich im Sinn sprachlicher Praktiken um Stereotypisierungen, die sich durch die Kontextualisierung von »kategoriengebundenen Merkmalen« (vgl. Stocker 2005: 74–81) und Geschlechts- bzw. Generationenbezeichnungen ausdrücken.
Mit der Jahrestagung 2021 lenkte das Leibniz-Institut für Deutsche Sprache (IDS) den Blick auf die Wechselbeziehung zwischen Sprachgebrauch bzw. sprachlichem Handeln und der gesellschaftlich-politischen Wirklichkeit. Damit ist der Gegenstandsbereich der Tagung umrissen: Es geht um die politische und gesellschaftliche Dimension von Sprache. Das Institut entspricht mit diesem Tagungsthema in besonderer Weise seiner Aufgabe, die Sprache in der Gegenwart und in ihrer jüngeren Geschichte zu untersuchen.
Vorwort
(2022)
Der folgende Beitrag vollzieht, nach Akteuren und Texten bzw. Kommunikationsformen unterschieden, Bezugnahmen auf die Olympischen Sommerspiele 1936 als eine multiperspektivische Konstruktionen nach. Methodisch werden – für die Perspektive der NS-Akteure – die Zugänge der Raumlinguistik genutzt und entsprechende Referenzen als Verräumlichungs-Akte beschrieben. Unter der Voraussetzung, dass die offizielle Berichterstattung der Olympia-Zeitung die Funktion hatte, einen geistig-kulturellen Zusammenhang zwischen der klassischen Antike und der nationalsozialistischen Gegenwart herzustellen, werden exemplarisch spezifische Raum- und Zeitkonstruktionen analysiert. Mit der Behauptung der Identität der klassischen Antike mit dem Nationalsozialismus wird Rechtfertigungspotenzial geschaffen; unter dem Schutz des Prestiges dieser Kulturepoche und ihrer Hervorbringungen hat man Handlungsspielraum. Für die Perspektive von Dissidenten und Ausgeschlossenen werden Bezugnahmen zeitlinguistisch im Sinn von Chronoferenzen dargestellt. Diese konzipieren die Spiele als ein eine transitorische Realität schaffendes Zeitereignis, mit einem markierten Beginn und Ende, vor allem aber mit temporären Phänomenen, i. e. der auf die Spiele zeitlich begrenzten Aussetzung von Exklusionsmaßnahmen. Im Zeichen von Täuschung und Entlarvung werden die kommunikativen Akte akteursspezifisch zusammengefasst.
Ausgehend von spezifischen historischen Diskursbedingungen und anknüpfend an Ansätze der Positionierungstheorie untersucht der Beitrag sprachliche Praktiken politischer Positionierung von Akteuren der integrierten Gesellschaft während des Nationalsozialismus. Am Beispiel einer Eingabe eines Katholiken sowie eines abgehörten Zellengesprächs zweier Wehrmachtssoldaten wird diskursanalytisch herausgearbeitet, wie verschiedene Identitätsdilemmata sprachlich verhandelt wurden und wie die Akteure dabei auf vorliegende politische Positionierungsangebote zurückgriffen, zugleich aber versuchten, ihre Positionen individuell auszugestalten.
Forschungskontext
(2022)
Die folgenden Beiträge von Heidrun Kämper, Britt-Marie Schuster, Nicole Wilk, Friedrich Markewitz, Mark Dang-Anh und Stefan Scholl stehen im Kontext zweier von der DFG geförderter Forschungsprojekte, die unter dem Gesichtspunkt einer sprachlichen Sozialgeschichte 1933 bis 1945 – als Tandemprojekte – seit 2018 von Britt-Marie Schuster, Nicole Wilk und Friedrich Markewitz in Paderborn und von Mark Dang-Anh, Stefan Scholl und Heidrun Kämper am IDS realisiert werden. Es sind jeweils Dreijahresprojekte, die 2021 abgeschlossen werden. Zur Einordnung der genannten Beiträge soll zuvor kurz in die Projektkonzeption eingeführt und ein Überblick über die Forschungsgegenstände gegeben werden.
Kontrastive Korpuslinguistik
(2022)
Dieser Beitrag beschreibt die Motivation und Ziele hinter der Initiative Europäisches Referenzkorpus EuReCo. Ausgehend von den Desiderata, die sich aufgrund der Defizite verfügbarer Forschungsdaten wie monolinguale Korpora, Parallelkorpora und Vergleichskorpora für den Sprachvergleich ergeben, werden die bisherigen und die laufenden Arbeiten im Rahmen von EuReCo präsentiert und anhand vergleichender deutsch-rumänischer Kookkurrenzanalysen neue Perspektiven für kontrastive Korpuslinguistik, die die EuReCo-Initiative öffnet, skizziert.
Kontrastive Korpuslinguistik versteht sich als eine Bezeichnung für sprachvergleichende Studien, deren Ergebnisse mit Analysen sprachlicher Daten erreicht und empirisch fundiert sind. Die Bezeichnung contrastive corpus linguistics für eine neue, sich entwickelnde Disziplin wurde 1996 von Karin Aijmer und Bengt Altenberg (Schmied 2009: 1142) eingeführt. Der Einsatz der sprachlichen Korpora bei der Beschreibung kontrastiver Studien bedeutet in den 1990er-Jahren für die kontrastive Linguistik eine Wiederbelebung, nachdem die weit gesteckten Ziele und Hoffnungen in den 50er- und 60er-Jahren, die mit der Fremdsprachendidaktik zusammenhingen, vor etwa 50 Jahren aufgegeben wurden.
KonsortSWD ist das NFDI Konsortium für die Sozial-, Verhaltens-, Bildungs- und Wirtschaftswissenschaften. Für die äußerst vielfältigen Datentypen und Forschungsmethoden bauen die Beteiligten im Rahmen der NFDI eine bereits bestehende Forschungsdateninfrastruktur aus und ergänzen neue integrierende Dienste. Basis sind die heute 41 vom Rat für Sozial- und Wirtschaftsdaten akkreditierten Forschungsdatenzentren (FDZ). FDZ sind Spezialsammlungen zu jeweils spezifischen Forschungsdaten, z.B. aus der qualitativen Sozialforschung, und können so Forschende auf Basis einer ausführlichen Expertise zu diesen Daten beraten. Neben der Unterstützung der FDZ baut KonsortSWD auch neue Dienste in den Bereichen Datenproduktion, Datenzugang und Technische Lösungen auf.
Gesprochene Lernerkorpora: Methodisch-technische Aspekte der Erhebung, Erschließung und Nutzung
(2022)
This article provides an overview of methodological and technical issues that arise in the collection, indexing and use of spoken learner corpora, i. e. corpora containing spoken utterances of learners of a target language. After an introductory discussion of the most important special features of this type of corpus that distinguish it from written language learner corpora and spoken corpora with L1 speakers, we will go into more detail on questions of corpus design. The main part of the paper is then an overview of the methodological and technical procedures of the individual steps of collecting, indexing, providing and using spoken learner corpora. The main aim of this overview is to highlight practices that can be considered best practices according to the current state of research. Finally, we outline the challenges that still exist for this type of corpus.
Gegenstand des Beitrags sind korpuslinguistische Zugänge zur Variation im Auftreten des Fugenelements in Komposita aus zwei Nomen (Arbeit I s I weg). Die qualitative Vorstudie zeigt, dass die Verfügung nach Erstglied auf Vokal (Bühne I n I spiel, See I ufer) entgegen manchen Hinweisen aus bisherigen Korpusuntersuchungen sehr weitgehend linguistisch systematisierbar ist. Die Hauptstudie fokussiert dann die sehr variable Verfügung nach Erstglied auf Konsonant (Arbeit I s I weg vs. Heimat I art). Sie modelliert statistisch den Einfluss von Größen, deren Bedeutung in der bisherigen Forschung nur angenommen, aber nicht überprüft werden konnte. Dabei führt sie auch neue Einflussgrößen ein und gibt deutliche Hinweise darauf, dass die Variation in größerem Ausmaß als bisher vermutet einzelfallspezifisch geregelt ist.
Der Beitrag lässt sich hinsichtlich seines Gegenstands dem Bereich ,Sprache und Emotion' zuordnen. Seine Fragestellung bezieht sich auf die Kodierung von Gefühlen und auf deontisch markierte Ausdrücke. Datengrundlage sind Texte, die bisher von der Linguistik noch nicht erschlossen wurden. Es sind Berichte von Nationalsozialist*innen, die ihren Weg zur NSDAP schildern, in die sie in der späten Weimarer Republik eintraten. Der Beitrag analysiert diese Texte mit einem quantitativ-qualitativen Ansatz, indem er danach fragt, welche Gefühlsbezeichnungen in den untersuchten Texten verwendet werden und worauf sie referieren. Die Beantwortung dieser Fragen besteht in der Darstellung der lexikalisch-semantischen Kodierung von Gefühlen seitens der positiv und negativ emotionalisierten NS-affinen Mitglieder der Gesellschaft. Er leistet damit einen linguistischen Beitrag zur Entstehungsgeschichte des Nationalsozialismus.
Diese Fallstudie untersucht die quantitative Verteilung von direkten und nicht-direkten Formen von Redewiedergabe im Vergleich zwischen zwei Literaturtypen: Hochliteratur - definiert als Werke, die auf der Auswahlliste von Literaturpreisen standen - und Heftromanen - massenproduzierten Erzählwerken, die zumeist über den Zeitschriftenhandel vertrieben werden. Die Studie geht von manuell annotierten Daten aus und überprüft daran die Verlässlichkeit automatischer Annotationswerkzeuge, die im Anschluss eingesetzt werden, um eine Untersuchung von insgesamt 250 Volltexten durchzuführen. Es kann nachgewiesen werden, dass sich die Literaturtypen sowie auch unterschiedliche Genres von Heftromanen hinsichtlich der verwendeten Wiedergabeformen unterscheiden.
Wir stellen eine empirische Studie vor, die der Frage nachgeht, ob und in welchem Ausmaß Wörterbücher und andere lexikographische Ressourcen die Ergebnisse von Textüberarbeitungen verbessern. Studierende wurden in unserer Studie gebeten, zwei Texte zu optimieren und waren dabei zufällig in drei unterschiedliche Versuchsbedingungen eingeteilt: 1. ein Ausgangstext ohne Hinweise auf potenzielle Fehler im Text, 2. ein Ausgangstext, bei dem problematische Stellen im Text hervorgehoben waren und 3. ein Ausgangstext mit hervorgehobenen Problemstellen zusammen mit lexikographischen Ressourcen, die zur Lösung der spezifischen Probleme verwendet werden konnten. Wir fanden heraus, dass die Teilnehmer*innen der dritten Gruppe die meisten Probleme korrigierten und die wenigsten semantischen Verzerrungen während der Überarbeitung einführten. Außerdem waren sie am effizientesten (gemessen in verbesserten Textabschnitten pro Zeit). Wir berichten in dieser Fallstudie ausführlich vom Versuchsaufbau, der methodischen Durchführung der Studie und eventuellen Limitationen unserer Ergebnisse.
Der folgende Leitfaden bietet eine grundlegende Übersicht darüber, welche Schritte bei der Konzeption und Durchführung einer empirischen Untersuchung in der germanistischen Linguistik zu beachten sind. Wir werden den grundlegenden Ablauf und die zugrunde liegenden Konzepte allgemein bzw. modellhaft beschreiben und sie anhand von einfachen Beispielen illustrieren. Eine stärkere Ausgestaltung anhand von Beispielen zu verschiedenen linguistischen Forschungsfragen und -feldern und damit auch mehr Illustrationen, wie die einzelnen Schritte für bestimmte Forschungsfragen umzusetzen sind, finden Sie in den Fallstudien im —> Teil III dieses Bandes. Detailliertere Ausführungen zu den zentralen Konzepten des empirischen Arbeitens in der Linguistik finden Sie in —> Teil VI dieses Bandes. Weiterführende Literatur findet sich am Ende des Beitrags.
Einführung
(2022)
Man findet im Burnout-Diskurs einerseits zahlreiche Passagen in fachinternen/-externen Texten, in denen ein „Noch-nicht-(genug)-Wissen“ oder „unsicheres Wissen“ (Janich 2018: 557) und eine zu wenig trennscharfe, ungenaue Verwendung des Begriffs und das Fehlen einer validen, allgemeingültigen, eindeutigen Definition des Phänomens konstatiert werden. Dieser offensichtlichen Kritik steht allerdings der konvergente Leseeindruck entgegen, der sich in Bezug auf die begriffliche Fassung bzw. Definition von ›Burnout‹ einstellt, wenn man Texte von 1975-2018 zu diesem Phänomen sichtet. Von diesen Beobachtungen ausgehend, analysiert die hier vorgestellte Dissertation: 1.) wie ein psychosomatisches Phänomen, das spezifikationsbedürftig erscheint, in Fach-, Medien- und Vermittlungstexten vor dem Hintergrund fachkultureller, sozialer und diskursiver Bedingungen definiert wird, 2.) wie bestimmte definitorische Merkmale und Definitionsformen sich trotz Kritik über die Zeit im Diskurs durchsetzen und 3.) in welcher Weise sich medizinische/psychologische und fachexterne Ansprüche an die Tätigkeit des Definierens und sprachliche Mittel und diskursive Praktiken des Definierens unterscheiden oder ähneln und sich in Typen diskursiver Praxis des Definierens verdichten lassen.
Dieses Kapitel gibt einen Überblick über Korpora internetbasierter Kommunikation, die als digitale Ressourcen frei zur Verfügung stehen und für eigene linguistische Forschungsarbeiten genutzt werden können. In Abschnitt 1 erläutern wir korpuslinguistische Basiskonzepte, die für die Arbeit mit Korpora internetbasierter Kommunikation benötigt werden, und präzisieren die Sprachgebrauchsdomäne Internetbasierte Kommunikation, die den Gegenstand des hier beschriebenen Ressourcentyps bildet. Abschnitt 2 gibt einen Überblick zu existierenden Korpusressourcen für das Deutsche und stellt ausgewählte Korpora zu weiteren europäischen Sprachen vor. In Abschnitt 3 geben wir abschließend einen kurzen Einblick in aktuelle Forschungsfelder, die sich im Bereich der Korpuslinguistik und Sprachtechnologie in Bezug auf den Aufbau und die Aufbereitung von Korpora internetbasierter Kommunikation stellen.
In diesem Kapitel stellen wir zunächst grundlegende Konzepte von Abfragesystemen und Abfragesprachen für die Suche in Korpora vor. Diese Konzepte sollen Ihnen helfen, die einzelnen Abfragesprachen besser zu verstehen und vergleichen zu können. Die gängigen Abfragesprachen unterscheiden sich in vielen Details. Diese Details und die Möglichkeiten und Grenzen der einzelnen Abfragesprachen stellen wir im zweiten Teil mit vielen Beispielaufgaben und dazu passenden Lösungen in jeweils drei Abfragesprachen vor.
Was darf die sprachwissenschaftliche Forschung? Juristische Fragen bei der Arbeit mit Sprachdaten
(2022)
Sich in der Linguistik mit rechtlichen Themen beschäftigen zu müssen, ist auf den ersten Blick überraschend. Da jedoch in den Sprachwissenschaften empirisch gearbeitet wird und Sprachdaten, insbesondere Texte und Ton- und Videoaufnahmen sowie Transkripte gesprochener Sprache, in den letzten Jahren auch verstärkt Sprachdaten internetbasierter Kommunikation, als Basis für die linguistische Forschung dienen, müssen rechtliche Rahmenbedingungen für jede Art von Datennutzung beachtet werden. Natürlich arbeiten auch andere Wissenschaften, wie z. B. die Astronomie oder die Meteorologie, empirisch. Jedoch gibt es einen grundsätzlichen Unterschied der empirischen Basis: Im Gegensatz zu Temperaturen, die gemessen, oder Konstellationen von Himmelskörpern, die beobachtet werden, basieren Sprachdaten auf schriftlichen, mündlichen oder gebärdeten Äußerungen von Menschen, wodurch sich juristisch begründete Beschränkungen ihrer Nutzung ergeben.
Sobald eine statistische Datenanalyse abgeschlossen ist, müssen in einem weiteren Schritt die Untersuchungsergebnisse aufbereitet und dargestellt werden. Hierzu gibt es verschiedene Möglichkeiten, die davon abhängig sind, welche Art von Analyse man durchgeführt hat. Aus diesem Grund ist der Beitrag gegliedert in die Aufbereitung von Ergebnissen für deskriptive, also beschreibende statistische Analysen (Abschnitt 2) und in die Ergebnisdarstellung von inferenzstatistischen (= schließenden) Auswertungen (Abschnitt 3). Wir gehen dabei auf die Aufbereitung der Daten in Tabellenform ein, werden an einem Beispiel zeigen, wie man die Ergebnisse von statistischen Tests berichtet und einige Visualisierungsmöglichkeiten vorstellen.
Korpora gesprochener Sprache
(2022)
Korpora gesprochener Sprache bestehen aus Audio- oder Videoaufnahmen sprachlicher Produktionen, die über eine Transkription einer linguistischen Analyse zugänglich gemacht werden. Sie kommen zur Untersuchung unterschiedlichster sprachwissenschaftlicher Fragestellungen unter anderem in der Gesprächsforschung, der Dialektologie und der Phonetik zum Einsatz. Dieser Beitrag diskutiert die wichtigsten Eigenschaften von Korpora gesprochener Sprache und stellt einige Vertreter der verschiedenen Kategorien vor.
Wenn alle Forschungsfragen gestellt, alle Hypothesen formuliert, alle Korpora kompiliert und alle Daten von Proband*innen gesammelt wurden, befinden Sie sich auf einer der letzten Etappen Ihrer linguistischen Studie: der Analyse der Daten. In diesem Kapitel werden Sie einige Werkzeuge kennenlernen, die Sie dabei unterstützen können. Hier nehmen wir an, dass Sie in irgendeiner Form eine quantitative statistische Auswertung vornehmen möchten, denn für qualitative Analysen sind die Werkzeuge, die wir Ihnen vorstellen werden, weniger bis gar nicht geeignet.
Transkriptionswerkzeuge sind spezialisierte Softwaretools für die Transkription und Annotation von Audio- oder Videoaufzeichnungen gesprochener Sprache. Dieses Kapitel erklärt einleitend, worin der zusätzliche Nutzen solcher Werkzeuge gegenüber einfacher Textverarbeitungssoftware liegt, und gibt dann einen Überblick über grundlegende Prinzipien und einige weitverbreitete Tools dieser Art. Am Beispiel der Editoren FOLKER und OrthoNormal wird schließlich der praktische Einsatz zweier Werkzeuge in den Arbeitsabläufen eines Korpusprojekts illustriert.
Daten und Metadaten
(2022)
In diesem Kapitel werden Metadaten als Daten definiert, die der Dokumentation und/oder Beschreibung empirischer Sprachdaten dienen. Einleitend werden die verschiedenen Funktionen von Metadaten im Forschungsprozess und ihre Bedeutung für die Konzepte der Ausgewogenheit und Repräsentativität diskutiert. Anhand des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) werden dann Metadaten eines konkreten Korpus vorgestellt, und es wird gezeigt, wie diese bei Korpusanalysen zum Einsatz kommen.
Action ascription can be understood from two broad perspectives. On one view, it refers to the ways in which actions constitute categories by which members make sense of their world, and forms a key foundation for holding others accountable for their conduct. On another view, it refers to the ways in which we accountably respond to the actions of others, thereby accomplishing sequential versions of meaningful social experience. In short, action ascription can be understood as matter of categorisation of prior actions or responding in ways that are sequentially fitted to prior actions, or both. In this chapter, we review different theoretical approaches to action ascription that have developed in the field, as well as the key constituents and resources of action ascription that have been identified in conversation analytic research, before going on to discuss how action ascription can itself be considered a form of social action.
Action ascription is an emergent process of mutual displays of understanding. Usually, the kind of action that is ascribed to a prior turn by a next action remains implicit. Sometimes, however, actions are overtly ascribed, for example, when speakers expose the use of strategies. This happens particularly in conflictual interaction, such as public debates or mediation talks. In these interactional settings, one of the speakers’ goals is to discredit their opponents in front of other participants or an overhearing audience. This chapter investigates different types of overt strategy ascriptions in a public mediation: exposing the opponent’s use of rhetorical devices, exposing the opponent’s use of false premises, and exposing that an opponent is telling only a half-truth. This chapter shows how speakers use ascriptions of acting strategically as accusations to disclose their opponents’ intentions and ‘truths’ that the opponents allegedly conceal and that are detrimental to their position.
Hintergrund
Die sprachlichen Äußerungen sind ein zentrales Medium in Psychotherapien, d. h., Psychotherapie wirkt im Wesentlichen über die Sprache, über das Miteinanderreden. Angesichts der Bedeutung des sprachlichen Austauschs ist es relevant, die Mechanismen, über die Sprache in Psychotherapieprozessen wirkt, genauer zu verstehen. Die linguistische Psychotherapieforschung nutzt hierfür vielfältige Methoden.
Ziel der Arbeit
Vorliegender Beitrag demonstriert exemplarisch 2 mikroanalytische Ansätze.
Material und Methoden
Eine transkribierte Psychotherapiesitzungssequenz wurde aus Perspektive der psychodynamischen Theorie inhaltlich interpretiert und bezüglich sprachlicher Merkmale mithilfe von 2 Methoden mikroanalytisch beurteilt: Die verbalen Techniken (Fokus Therapeutenäußerungen) wurden mithilfe der Psychodynamischen Interventionsliste (PIL) geratet und eine detaillierte Konversationsanalyse (Fokus Dialog) erfolgte.
Ergebnisse
Analysen mit der PIL zeigten, dass im Sitzungsausschnitt überwiegend die Techniken „Bedeutung hinzufügen“ und „Wiederholen, Umschreiben, Zusammenfassen“ verwendet wurden. Thematisch wurde besonders auf den „Vater“ Bezug genommen, gefolgt von der „Therapeutin“. Der zeitliche Bezug lag schwerpunktmäßig in der „Vergangenheit“. Die Gesprächsanalyse rekonstruiert, dass der Wechsel auf die Erlebensebene die Therapiesituation selbst in den Fokus rückt. Mithilfe sequenzieller Handlungszwänge werden extratherapeutische Konstellationen in der Vergangenheit und therapeutische Gegenwart kontrastierbar sowie intersubjektiv bearbeitbar gemacht.
Schlussfolgerung
Die eigene Sprache und den Dialog im Therapieprozess zu beobachten, kann für Therapeuten aufschlussreiche Erkenntnisse über Folgen und Voraussetzungen eigener Interventionen liefern. Forschungen an der interdisziplinären Schnittstelle von Psychotherapie und Linguistik sind lohnenswert.
Meta-communicative practices are generally reflexive in a fairly obvious sense: Inasmuch as speakers use them to talk about or comment on earlier/subsequent talk, they use language self-reflexively. In this paper, we explore a practice that is reflexive not only in this meta-communicative sense but also in a sequential-interactional one: Prefacing a conversational turn with I was gonna say. We show that the I was gonna say-preface furnishes the following general semantic-pragmatic affordances: (1) It retroactively relates the speaker’s subsequent talk to preceding talk from a co-participant, (2) it embodies a claim to prior, now-preempted, communicative intent with regard to what their co-participant has (just) said/done, (3) it therefore displays its speaker’s orientation to the relevance or the appropriate placement of the action(s) done in their own subsequent talk at an earlier moment in the interaction, and (4) it reflexively re-invokes, or retrieves, this earlier moment as the relevant sequential context for their action(s). We then go on to illustrate how speakers draw on these sequentially reflexive affordances for managing recurrent interactional contingencies in specific sequential environments. The paper ends with a discussion of the role that reflexivity plays in and for the deployment of this practice.
Um eine bessere Erreichbarkeit und Zugänglichkeit zu bestehenden sowie neuen Angeboten von Lehr- und Schulungsmaterialien im Bereich der Digital Humanities zu ermöglichen, sollten diese in einem zentralen Verzeichnis zur Verfügung gestellt werden. Im Rahmen des CLARIAH-DE Projekts wurde – zunächst für die Umsetzung eines Projektmeilensteins – eine Lösung gesucht, die eine übergreifende Suche in frei zugänglichen und nachnutzbaren Lehr- und Schulungsmaterialien zu Forschungsmethoden, Verfahren sowie Werkzeugen im Bereich der Digital Humanities in unterschiedlichen Plattformen und Repositorien bietet.
Dictionaries have been part and parcel of literate societies for many centuries. They assist in communication, particularly across different languages, to aid in understanding, creating, and translating texts. Communication problems arise whenever a native speaker of one language comes into contact with a speaker of another language. At the same time, English has established itself as a lingua franca of international communication. This marked tendency gives lexicography of English a particular significance, as English dictionaries are used intensively and extensively by huge numbers of people worldwide.
Germany’s diverse history in the 20th century raises the question of how social upheavals were constituted in and through political discourse. By analysing basic concepts, the research network “The 20th century in basic concepts” (based at the Leibniz institutes IDS, ZfL, ZZF) aims to identify continuities and discontinuities in political and social discourse. In this way, historical sediments of the present are to be uncovered and those challenges identified that emerged in the course of the 20th century and continue to shape political discourse until the present.
Kammerspiel
(2022)
CLARIN, the "Common Language Resources and Technology Infrastructure", has established itself as a major player in the field of research infrastructures for the humanities. This volume provides a comprehensive overview of the organization, its members, its goals and its functioning, as well as of the tools and resources hosted by the infrastructure. The many contributors representing various fields, from computer science to law to psychology, analyse a wide range of topics, such as the technology behind the CLARIN infrastructure, the use of CLARIN resources in diverse research projects, the achievements of selected national CLARIN consortia, and the challenges that CLARIN has faced and will face in the future.
The book will be published in 2022, 10 years after the establishment of CLARIN as a European Research Infrastructure Consortium by the European Commission (Decision 2012/136/EU).
The normative layer of CLARIN is, alongside the organizational and technical layers, an essential part of the infrastructure. It consists of the regulatory framework (statutory law, case law, authoritative guidelines, etc.), the contractual framework (licenses, terms of service, etc.), and ethical norms. Navigating the normative layer requires expertise, experience, and qualified effort. In order to advise the Board of Directors, a standing committee dedicated to legal and ethical issues, the CLIC, was created. Since its establishment in 2012, the CLIC has made considerable efforts to provide not only the BoD but also the general public with information and guidance. It has published many articles (both in proceedings of CLARIN conferences and in its own White Paper Series) and developed several LegalTech tools. It also runs a Legal Information Platform, where accessible information on various issues affecting language resources can be found.
Based on the privative derivational suffix -los, we test statements found in the literature on word formation using a – at least in this field – novel empirical basis: a list of affective-emotional ratings of base nouns and associated -los derivations. In addition to a frequency analysis based on the German Reference Corpus, we show that, in general, emotional polarity (so-called valence, positive vs. negative emotions) is reversed by suffixation with -los. This change is stronger for more polarized base nouns. The perceived intensity of emotion (so-called arousal) is generally lower for -los derivations than for base nouns. Finally, to capture the results theoretically, we propose a prototypical -los construction in the framework of Construction Morphology.
Dieses Kapitel lotet Möglichkeiten und Methoden aus, digitale Diskursanalysen nationalsozialistischer Quellentexte durchzuführen. Digitale Technologie wird dabei als heuristisches Werkzeug betrachtet, mit dem der Sprachgebrauch während des Nationalsozialismus im Rahmen größerer Quellenkorpora untersucht werden kann. In einem theoretischen Abschnitt wird grundsätzlich dafür plädiert, während des Analyseprozesses hermeneutisches Sinnverstehen mit breitflächigen korpusbasierten Abfragen zu kombinieren. Verdeutlicht wird diese Herangehensweise an zwei empirischen Beispielen: Anhand eines Korpus von Hitler- und Goebbels-Reden wird dem Auftauchen und der diskursiven Ausgestaltung des nationalsozialistischen Konzepts „Lebensraum“ nachgespürt. Schritt für Schritt wird offengelegt, welche Analysewege durch das Abfragen von Schlüsseltexten, Keywords, Konkordanzen und Kollokationen verfolgt werden können. Das zweite Beispiel zeigt anhand von Eingaben, die aus der Bevölkerung an Staats- und Parteiinstanzen gerichtet wurden, wie solche Quellen mithilfe eines digitalen Tools manuell annotiert werden können, um sie danach auf Musterhaftigkeiten im Sprachgebrauch hin auswerten zu können.
This paper presents a compositional annotation scheme to capture the clusivity properties of personal pronouns in context, that is their ability to construct and manage in-groups and out-groups by including/excluding the audience and/or non-speech act participants in reference to groups that also include the speaker. We apply and test our schema on pronoun instances in speeches taken from the German parliament. The speeches cover a time period from 2017-2021 and comprise manual annotations for 3,126 sentences. We achieve high inter-annotator agreement for our new schema, with a Cohen’s κ in the range of 89.7-93.2 and a percentage agreement of > 96%. Our exploratory analysis of in/exclusive pronoun use in the parliamentary setting provides some face validity for our new schema. Finally, we present baseline experiments for automatically predicting clusivity in political debates, with promising results for many referential constellations, yielding an overall 84.9% micro F1 for all pronouns.
Einleitung
(2022)
Der nationalsozialistische Interaktions- und Kommunikationsraum war mithin bevölkert von kommunikativ konstruierten Sozialfiguren. Hierbei gab es sowohl positiv Konnotierte (z. B. Volksgenosse, Nationalsozialist, Parteigenosse, SA-Mann, Alter Kämpfer) als auch negativ Konnotierte (z. B. Asozialer, Judenfreund, Schwarzer, Roter, Freimaurer). Diese stereotypisierten Sozialfiguren, an die wiederum vielfältige positive wie negative Attribuierungen geknüpft waren, stellten gleichsam Diskurspositionen dar, die anderen zugewiesen wurden oder eingenommen werden konnten – sofern den individuellen Voraussetzungen nach möglich – und die mit unterschiedlichen Graden der In- bzw. Exklusion einhergingen. Die folgenden Ausführungen konzentrieren sich auf zwei dieser Figuren, die spezifischer als Grenzfiguren begriffen werden können: Meckerer und Märzgefallene. Es wird untersucht, wie diese beiden Grenzfiguren sprachlich konstruiert, in welchen Kontexten und Kommunikationssituationen sie angeeignet und verwendet wurden. In beiden Fällen wird der Fokus dabei über den wörtlichen Ausdruck hinaus auf zeitgenössisch ähnliche oder eng verwandte Bezeichnungen ausgeweitet.
Sich beschweren – Kommunikation von Unzufriedenheit in Eingaben an Staats- und Parteiinstanzen
(2022)
Sich in eigener Sache zu beschweren oder einen ausgemachten Missstand anzusprechen, war neben dem Bitten und dem Huldigen die in Eingaben an Behörden und Politiker während des Nationalsozialismus am häufigsten anzutreffende Kommunikationspraktik. Die folgende, ihrem vorläufigen Charakter nach explorative, Analyse nimmt diese in den Blick und konzentriert sich dabei auf häufig anzutreffende Sprachhandlungsmuster, die für die Kommunikationspraktik des Sich-Beschwerens in Beschwerdeschreiben an offizielle Stellen konstitutiv waren. Untersuchungsgrundlage ist ein Korpus von ca. 500 Beschwerdeschreiben, die im Stadtarchiv Mannheim, dem Generallandesarchiv Karlsruhe, dem Landeshauptarchiv Koblenz sowie den »Akten der Partei-Kanzlei« (Microfiche-Edition) erhoben wurden.
Führer
(2022)
Die folgende Analyse trägt der Zentralität des Führerkonzepts während des Nationalsozialismus Rechnung und skizziert – orientiert an der leitenden Akteurseinteilung in zentrale Repräsentanten des NS-Apparats, verschiedene Akteursgruppen der integrierten Gesellschaft und der Ausgeschlossenen sowie Akteure des Widerstands – ein differenziertes Bild des zeitgenössischen Sprachgebrauchs und der unterschiedlichen Verwendungsweisen des Führerkonzepts. Führer wird als nationalsozialistisches Leitkonzept konturiert, das eng mit weiteren Leitkonzepten wie Volk, Nation und Reich verknüpft war. Es besaß einerseits hohe integrative und affektive Kraft, diente andererseits – auf Seiten der Ausgeschlossenen, Dissidenten und des Widerstands – als Einsatzpunkt von Distanzierung und Kritik.
Kampf
(2022)
In darauf aufbauender, aber auch sich davon differenzierender Art und Weise, findet das Konzept Kampf ebenso im politischen Diskurs des Nationalsozialismus Anwendung. Während im Zweiten Weltkrieg vor allem die Bedeutung von ›Kampf als Gefecht‹ im militärischen Kontext hervorgebracht wurde, sind die Verwendungen von ›Kampf als Bemühung‹, ›Kampf als Engagement‹ bis hin zu ›Kampf als Heroismus‹ (vgl. Klemperer 2018: 13), verknüpft mit ›Kampf als Kontroverse‹, vordergründig für das Verständnis der politischen Bedeutung des Kampfkonzepts im Nationalsozialismus. Im Folgenden werden nach einer einführenden begriffsgeschichtlichen Betrachtung ausgehend von diskursiv realisierten Wortformen der Lexeme Kampf und kämpfen konzeptkonstituierende Gebrauchsweisen für die verschiedenen Akteursklassen NS-Apparat, integrierte Gesellschaft, Ausgeschlossene und Widerstand dargelegt.
Brief
(2022)
Der folgende Beitrag untersucht Briefe aus der Zeitspanne des Nationalsozialismus, die von unterschiedlichen Akteur*innen in unterschiedlichen Beteiligungsrollen verfasst worden sind. Es handelt sich um von Soldaten und ihren Angehörigen verfasste Feldpost-, um von Gegner*innen des Nationalsozialismus geschriebene Haftbriefe sowie um Eingaben an Staats- und Parteiinstanzen, die Teil des institutionellen Briefverkehrs sind. Alle diese Formen des Briefschreibens besitzen eine längere Tradition. Ihre Nutzung während der NS-Zeit ist jedoch durch spezifische Ausprägungen gekennzeichnet, die in den jeweiligen Abschnitten beleuchtet werden.
Standards in CLARIN
(2022)
This chapter looks at a fragment of the ongoing work of the CLARIN Standards Committee (CSC) on producing a shared set of recommendations on standards, formats, and related best practices supported by the CLARIN infrastructure and its participating centres. What might at first glance seem to be a straightforward goal has over the years proven to be rather complex, reflecting the robustness and heterogeneity of the emerging distributed digital research infrastructure and the various disciplines and research traditions of the language-based humanities that it serves and represents, and therefore part of the chapter reviews the various initiatives and proposals that strove to produce helpful standards-related guidance. The focus turns next to a subtask initiated in late 2019, its scope narrowed to one of the core activities and responsibilities of CLARIN backbone centres, namely the provision of data deposition services. Centres are obligated to publish their recom-mendations concerning the repertoire of data formats that are best suited for their research profiles. We look at how this requirement has been met by the particular centres and suggest that having centres maintain their information in the Standards Information System (SIS) is the way to improve on the current state of affairs.
This chapter will present lessons learned from CLARIN-D, the German CLARIN national consortium. Members of the CLARIN-D communities and of the CLARIN-D consortium have been engaged in innovative, data-driven, and community-based research, using language resources and tools in the humanities and neigh-bouring disciplines. We will present different use cases and users’ stories that demonstrate the innovative research potential of large digital corpora and lexical resources for the study of language change and variation, for language documentation, for literary studies, and for the social sciences. We will emphasize the added value of making language resources and tools available in the CLARIN distributed research infrastructure and will discuss legal and ethical issues that need to be addressed in the use of such an infrastructure. Innovative technical solutions for accessing digital materials still under copyright and for data mining such materials will be presented. We will outline the need for close interaction with communities of interest in the areas of curriculum development, data management, and training the next generation of digital humanities scholars. The importance of community-supported standards for encoding language resources and the practice of community-based quality control for digital research data will be presented as a crucial step toward the provisioning of high quality research data. The chapter will conclude with a discussion of impor-tant directions for innovative research and for supporting infrastructure development over the next decade and beyond.
CLARIN stands for “Common Language Resources and Technology Infrastructure”. In 2012 CLARIN ERIC was established as a legal entity with the mission to create and maintain a digital infrastructure to support the sharing, use, and sustainability of language data (in written, spoken, or multimodal form) available through repositories from all over Europe, in support of research in the humanities and social sciences and beyond. Since 2016 CLARIN has had the status of Landmark research infrastructure and currently it provides easy and sustainable access to digital language data and also offers advanced tools to discover, explore, exploit, annotate, analyse, or combine such datasets, wherever they are located. This is enabled through a networked federation of centres: language data repositories, service centres, and knowledge centres with single sign-on access for all members of the academic community in all participating countries. In addition, CLARIN offers open access facilities for other interested communities of use, both inside and outside of academia. Tools and data from different centres are interoperable, so that data collections can be combined and tools from different sources can be chained to perform operations at different levels of complexity. The strategic agenda adopted by CLARIN and the activities undertaken are rooted in a strong commitment to the Open Science paradigm and the FAIR data principles. This also enables CLARIN to express its added value for the European Research Area and to act as a key driver of innovation and contributor to the increasing number of industry programmes running on data-driven processes and the digitalization of society at large.
Enabling appropriate access to linguistic research data, both for many researchers and for innovative research applications, is a challenging task. In this chapter, we describe how we address this challenge in the context of the German Reference Corpus DeReKo and the corpus analysis platform KorAP. The core of our approach, which is based on and tightly integrated into the CLARIN infrastructure, is to offer access at different levels. The graduated access levels make it possible to find a low-loss compromise between the possibilities opened up and the costs incurred by users and providers for each individual use case, so that, viewed over many applications, the ratio between effort and results achieved can be effectively optimized. We also report on experiences with the current state of this approach.
Im Folgenden soll es um kommunikative Praktiken in einem geheimen US-Kriegsgefangenenlager gehen, in dem deutsche Wehrmachtssoldaten inhaftiert waren, die dort verhört und deren Zellengespräche heimlich abgehört, mitgeschnitten und protokolliert wurden. Anhand von Auszügen aus verschiedenen Dokumententypen soll ein Schlaglicht auf die medial zugerichteten Praktiken des Verhörlagers geworfen werden. Die These, der in diesem Kapitel nachgegangen wird, lautet, dass die Protokollier- und Dokumentationspraktiken der Gefangennehmenden ebenso wie die durch sie dokumentierten Situationen die soziale Ordnung im Verhörlager wesentlich prägten und sich folglich aus ihnen figurierende Praktiken der sozialen Kategorisierung ablesen lassen, die einen Rückschluss auf die brüchige Übergangssituation zwischen politischen Systemen bzw. politisch geprägten Arrangements und Konstellationen, in denen die Beteiligten sich befanden, ermöglichen. Somit kennzeichnen die bearbeiteten kommunikativen Praktiken auch, wenngleich nicht durchgehend und auch nicht sonderlich explizit, Bezugnahmen auf und Auseinandersetzungen mit dem Nationalsozialismus, die zeitlich während des Nationalsozialismus, aber räumlich (und somit territorial, auch in einem ordnungspolitischen Sinne) außerhalb des Nationalsozialismus stattfanden.
Preface
(2022)
We address the task of distinguishing implicitly abusive sentences on identity groups (“Muslims contaminate our planet”) from other group-related negative polar sentences (“Muslims despise terrorism”). Implicitly abusive language are utterances not conveyed by abusive words (e.g. “bimbo” or “scum”). So far, the detection of such utterances could not be properly addressed since existing datasets displaying a high degree of implicit abuse are fairly biased. Following the recently-proposed strategy to solve implicit abuse by separately addressing its different subtypes, we present a new focused and less biased dataset that consists of the subtype of atomic negative sentences about identity groups. For that task, we model components that each address one facet of such implicit abuse, i.e. depiction as perpetrators, aspectual classification and non-conformist views. The approach generalizes across different identity groups and languages.
Einleitung
(2022)
Ethical issues in Language Resources and Language Technology are often invoked, but rarely discussed. This is at least partly because little work has been done to systematize ethical issues and principles applicable in the fields of Language Resources and Language Technology. This paper provides an overview of ethical issues that arise at different stages of Language Resources and Language Technology development, from the conception phase through the construction phase to the use phase. Based on this overview, the authors propose a tentative taxonomy of ethical issues in Language Resources and Language Technology, built around five principles: Privacy, Property, Equality, Transparency and Freedom. The authors hope that this tentative taxonomy will facilitate ethical assessment of projects in the field of Language Resources and Language Technology, and structure the discussion on ethical issues in this domain, which may eventually lead to the adoption of a universally accepted Code of Ethics of the Language Resources and Language Technology community.
This edited volume offers up-to-date research on the interactive building and managing of relationships in organized helping. Its contributions address this core of helping in psychotherapy, coaching, doctor-patient interaction, and digital helping interaction and document and analyze essential communicative practices of relationship management. A summarizing contribution identifies common dimensions of relationship management across the different helping contexts and thereby provides a framework for understanding and researching how interactive practices and helping relationships are interconnected. The volume brings together researchers and practitioners and merges academic approaches to studying relationships with practical knowledge about verbal helping in these settings. The book is intended for scholars in the field of organized helping as well as for students and researchers of communication and discourse / conversation analysis in professional and organized contexts. It is also addressed to practitioners interested in learning more about the micro- and meso-management of their working relationships.
Contents:
1. Vasile Pais, Maria Mitrofan, Verginica Barbu Mititelu, Elena Irimia, Roxana Micu and Carol Luca Gasan: Challenges in Creating a Representative Corpus of Romanian Micro-Blogging Text. Pp. 1-7
2. Modest von Korff: Exhaustive Indexing of PubMed Records with Medical Subject Headings. Pp. 8-15
3. Luca Brigada Villa: UDeasy: a Tool for Querying Treebanks in CoNLL-U Format. Pp. 16-19
4. Nils Diewald: Matrix and Double-Array Representations for Efficient Finite State Tokenization. Pp. 20-26
5. Peter Fankhauser and Marc Kupietz: Count-Based and Predictive Language Models for Exploring DeReKo. Pp. 27-31
6. Hanno Biber: “The word expired when that world awoke.” New Challenges for Research with Large Text Corpora and Corpus-Based Discourse Studies in Totalitarian Times. Pp. 32-35
Die Arbeit wurde vom Verein für Gesprächsforschung mit dem Dissertationsförderpreis 2020 ausgezeichnet.
Bis heute gehört die Frage, wie InteraktionsteilnehmerInnen verstehen, welche von mehreren möglichen Lesarten eines sprachlichen Formats im jeweiligen Kontext gilt, zu den größten Herausforderungen der Konversationsanalyse. Aufbauend auf den Erkenntnissen über soziales Handeln in der Interaktion in Sprechakttheorie und Konversationsanalyse beschäftigt sich diese Arbeit mit dem Verhältnis zwischen rekurrenten sprachlichen Formaten und sozialen Handlungen. Im Fokus stehen interrogative und deklarative Modalverbformate: soll ich...?, kannst du...?, willst/magst/möchtest du...?, du kannst... und ich kann...
Eine umfassende, korpusdatengestützte Untersuchung zu diesen Formaten im Deutschen fehlte bisher. In der Forschung zu anderen Sprachen wurden vergleichbare Formate eingehender untersucht, aber fast ausschließlich in Bezug auf direktiv-kommissive Handlungen, wie Bitten, Aufforderungen, Angebote, Vorschläge etc., während das breitere Handlungsspektrum und -potenzial der Formate nicht aufgezeigt wurde.
Die vorliegende Untersuchung zeigt auf,
1. welches Handlungsspektrum die untersuchten Formate aufweisen,
2. wie die Komposition eines Turns, dessen Position (i.e., in der laufenden Sequenz, in der Interaktion, in der Aktivität oder in der Interaktionsgeschichte) sowie weitere kontextuelle Faktoren (wie z.B. die Verteilung von epistemischen und deontischen Rechten) dazu beitragen, wie das Format als diese oder jene Handlung in der Interaktion verstanden wird, und
3. welches Handlungspotenzial bzw. welche globale Handlungsbedeutung das jeweilige Format aufweist.
Die Untersuchung bedient sich der Methodik der Konversationsanalyse und der Interaktionalen Linguistik und beruht auf mehr als 500 Belegen aus Videoaufnahmen natürlicher Interaktion aus dem FOLK-Korpus.
Die vorliegende Arbeit zeigt, welche Handlungen mit den untersuchten Formaten vollzogen werden und welche Rolle unterschiedliche Faktoren (wie die Position des Turns, die Verteilung von deontischen und epistemischen Rechten, und die Verantwortung für das Projekt, auf das sich die Handlung bezieht, das Agens der künftigen Handlung, das nonverbale Verhalten von Interagierenden während der Realisierung des fokalen Turns etc.) dafür spielen, wie das jeweilige Format verstanden wird. Überdies wird nachgewiesen, welche weiteren linguistischen Merkmale (wie z.B. Vorkommen von Adverbien und Modal- bzw. Abtönungspartikeln, Argumentrealisierung, Wortfolge, Semantik des Vollverbs etc.) zusätzlich zum Modalverbformat für Handlungskonstitution und -zuschreibung relevant sein können und wann. Somit werden Faktoren herausgearbeitet, die für die weitere Entwicklung des Konzeptes ‚Format für soziale Handlungen‘ notwendig sind.
Die Arbeit zeigt, dass eine umfassende Analyse des gesamten Handlungsspektrums der Verwendung sprachlicher Formen auf Basis eines großen Korpus notwendig ist, um die für bestimmte Handlungsfunktionen relevanten Realisierungs- und Kontextbedingungen korrekt identifizieren zu können und vorschnellen Schlüssen über die Assoziation von linguistischen Formaten mit bestimmten Handlungen vorzubeugen. Trotz unterschiedlicher feingranularer Funktionen der Formate ist allerdings stets eine Kernbedeutung feststellbar, die zum Handlungspotenzial des jeweiligen Formats beiträgt.