Refine
Year of publication
Document Type
- Part of a Book (4500)
- Article (2965)
- Book (996)
- Conference Proceeding (688)
- Part of Periodical (308)
- Review (257)
- Other (151)
- Working Paper (83)
- Doctoral Thesis (68)
- Report (35)
Language
- German (8077)
- English (1765)
- Russian (145)
- French (38)
- Multiple languages (22)
- Spanish (16)
- Portuguese (14)
- Italian (9)
- Polish (7)
- Ukrainian (5)
Keywords
- Deutsch (5140)
- Korpus <Linguistik> (940)
- Wörterbuch (605)
- Konversationsanalyse (451)
- Rezension (423)
- Grammatik (405)
- Rechtschreibung (374)
- Gesprochene Sprache (361)
- Sprachgebrauch (356)
- Interaktion (338)
Publicationstate
- Veröffentlichungsversion (3889)
- Zweitveröffentlichung (1641)
- Postprint (395)
- Preprint (10)
- Erstveröffentlichung (8)
- Ahead of Print (7)
- (Verlags)-Lektorat (4)
- Hybrides Open Access (2)
- Verlags-Lektorat (1)
- Verlagsveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (3835)
- Peer-Review (1595)
- Verlags-Lektorat (94)
- Peer-review (56)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (44)
- Review-Status-unbekannt (14)
- Peer-Revied (12)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (10)
- (Verlags-)Lektorat (9)
- (Verlags-)lektorat (5)
Publisher
- de Gruyter (1334)
- Institut für Deutsche Sprache (1091)
- Schwann (638)
- Narr (484)
- Leibniz-Institut für Deutsche Sprache (IDS) (263)
- De Gruyter (244)
- Niemeyer (200)
- Lang (184)
- Narr Francke Attempto (170)
- IDS-Verlag (144)
In this chapter, we will investigate smartphone-based showing sequences in everyday social encounters, that is, moments in which a personal mobile device is used for presenting (audio-)visual content to co-present participants. Despite a growing interest in object-centred sequences and mundane technology use, detailed accounts of the sequential, multimodal, and material dimensions of showing sequences are lacking. Based on video data of social interactions in different languages and on the framework of multimodal interaction analysis, this chapter will explore the link between mobile device use and social practices. We will analyse how smartphone showers and their recipients coordinate the manipulation of a technological object with multiple courses of action, and reflect upon the fundamental complexity of this by-now routine joint activity.
Prediction is a central mechanism in the human language processing architecture. The psycholinguistic and neurolinguistic literature has seen a lively debate about what form prediction may take and what status it has for language processing in the human mind and brain. While predictions are a ubiquitous finding, the implications of these results for models of language processing differ. For instance, eyetracking data suggest that predictions may rely on sublexical orthographic information in natural reading, while electrophysiological data provide mixed evidence for form-based predictions during reading. Other research has revealed that humans rapidly adapt to text specifics and that their predictive capacity varies, broadly speaking, in accordance with inter- and intra-individual language proficiency, which cuts across the speaker groups (e.g. L1 vs. L2 speakers, skilled vs. untrained readers) traditionally used for experimental contrasts. There is therefore evidence that the kind and strength of linguistic predictions depend on (at least) three sources of variability in language processing: speaker, text genre and experimental method.
The aim of this Research Topic is to develop a better understanding of prediction in light of the three sources of variability in language processing, by providing an overview of state-of-the art research on predictive language processing and by bringing together research from various disciplines.
First, intra-and inter-individual differences and their influence on predictive processes remain underrepresented in experimental research on predictive processing. How do language users differ in their predictive abilities and strategies, and how are these differences shaped by e.g. biological, social and cultural factors?
Second, while language users experience great stylistic diversity in their daily language exposure and use, the majority of language processing research still focuses on a very constrained register of well-controlled sentences composed in the standard language. How are predictions shaped by extra- and meta-linguistic context, such as register/genre or accent/speaker identity, and how may this influence the processing of experimental items in another language or text variety?
Third, the Research Topic invites contributions that make use of a multi-method approach, such as combined behavioral and electrophysiological measures or experimental methods combined with measures extracted from corpus data. What opportunities and challenges do we face when integrating multiple approaches to examine linguistic, experimental and individual differences in human predictive capacity?
We welcome contributions from all areas of empirical psycho- and neurolinguistics, but contributions must explicitly address variability and variation in language and language processing. Relevant topics include individual differences and the impact of genre, modality, register and language variety. Contributions that go beyond single word and single sentence paradigms are especially desirable. Experimental, corpus-based, meta-analytic and review papers, as well as theoretical/opinion pieces are welcome; however, papers of the latter type should support their arguments with substantial empirical evidence from the literature. Particularly desirable are contributions which combine topics and/or methods, such as the impact of an individual's native dialect on processing of constructions that show variability in the standard language (e.g. choice of auxiliary, agreement of mass nouns, etc.) or experimental methods combined with measures extracted from corpus data such as information-theoretic surprisal.
Vor 30 Jahren gab es in Westdeutschland nur ganz wenige Lexikologen und Lexikografen, die sich mit Neologismen befassten. Infolgedessen hatte man damals kein richtiges Neologismenwörterbuch: Heute sieht es ganz anders aus. Allein am Institut für Deutsche Sprache sind zwei Neologismenwörterbücher in Printausgabe entstanden, nämlich „Neuer Wortschatz. Neologismen der 90er Jahre im Deutschen" und „Neuer Wortschatz. Neologismen im Deutschen 2001-2010". Hinzu kommt OWID, auf dem ihre Online-Version und jüngste Neologismen den Benutzern zur Verfügung stehen. Parallel dazu gibt es zahlreiche Aufsätze bzw. Beiträge über Neologie (Neologismenlexikologie) und Neographie (Neologismenlexikographie). In dieser Arbeit werden die Termine des Wortschatz- und Sprachwandels, hinsichtlich der Neologismen und Archaismen in der deutschen Sprache näher untersucht. Dabei erfolgt zu den letzteren beiden Phänomenen eine genauere Betrachtung.
Nachdem die Erforschung der Wortbildungsregularitäten des Deutschen in den zentralen Bereichen zu erheblichen Fortschritten und weithin konsensfähigen Ergebnissen geführt hat, wendet sich die Forschung in den letzten Jahren verstärkt neuen Aspekten zu, wobei textlinguistische und in verschiedener Weise anwendungsorientierte Fragen eine erhebliche Rolle spielen, daneben aber auch andere, häufig theoriespezifischere Herangehensweisen gewählt werden. Wie viele andere Bereiche der Sprachwissenschaft hat sich auch die Wortbildungsforschung mit der neuen Möglichkeit auseinanderzusetzen, elektronische Korpora als empirische Basis zu nutzen.
Der Band dokumentiert die Ergebnisse der Tagung zur Wortbildung an der Universität Santiago de Compostela im Sommer 2006, und gerade bei einer transnationalen - und im Gefolge auch germanistisch-hispanistisch transdisziplinären - Tagung liegt es nahe, die typologisch vergleichenden Aspekte zu betonen, die ebenfalls in letzter Zeit erheblich an Bedeutung gewonnen haben. Mit der Schwerpunktsetzung auf den (deutsch-spanischen) Vergleich, auf textuelle und auf am Bereich DaF anwendungsorientierte Fragestellungen ergänzen die im vorliegenden Band dokumentierten Ergebnisse dieser Tagung die derzeit wieder recht lebhafte Diskussion um Fragen der Wortbildung.
Basierend auf Gesprächsaufnahmen, Beobachtungsprotokollen und Interviews untersucht die Studie, was die Identitätsarbeit von Aussiedlern in der Kommunikation mit Hiesigen erschwert bzw. unterstützt, wie sich die Betroffenen auf die Lebenswirklichkeit in Deutschland einstellen, welche Rolle institutionelle Eingliederungsmaßnahmen spielen und welche Probleme dabei der Identitätsentwurf "als Deutsche(r) unter Deutschen leben" bereitet.
Simultandolmetschen ist eine komplexe und kognitive Aktivität, bei der verschiedene Prozesse gleichzeitig ablaufen. Neben monolingualer Textverarbeitung braucht man auch dolmetschspezifische Strategien, die erworben werden müssen. Die Notstrategien werden erst dann angewendet, wenn die Kapazitätsgrenze des Dolmetschers erreicht ist.
Die grammatische Kategorie eingebetteter Sätze zählt seit über 50 Jahren zu den zentralen Themen der theoretischen Syntax. Dabei dreht sich die Diskussion speziell um die Frage, ob manche oder vielleicht alle eingebetteten Sätze als Nominalphrasen zu behandeln sind, sei es, weil sie einen (stummen) nominalen Kopf haben (D oder N), oder sei es, weil der Satzeinleiter selbst als nominal zu betrachten ist. Die Beiträge des Sonderhefts nehmen diese Fragestellung erneut auf und explorieren sie unter verschiedenen, syntaktischen wie semantischen Aspekten im Lichte neuerer theoretischer Ansätze. Das Spektrum an Sprachen, die genauer untersucht oder argumentativ für die Zwecke der Analyse herangezogen werden, umfasst neben Deutsch – einschließlich dialektaler Varietäten wie Bairisch und Alemannisch – Englisch, Niederländisch (einschließlich der Brabanter Varietät), Alt- und Neugriechisch, Jula (Niger-Kongo), Schwedisch, Baskisch sowie eine Reihe anderer genetisch und typologisch unterschiedlicher Sprachen.
We introduce DeReKoGram, a novel frequency dataset containing lemma and part-of-speech (POS) information for 1-, 2-, and 3-grams from the German Reference Corpus. The dataset contains information based on a corpus of 43.2 billion tokens and is divided into 16 parts based on 16 corpus folds. We describe how the dataset was created and structured. By evaluating the distribution over the 16 folds, we show that it is possible to work with a subset of the folds in many use cases (e.g., to save computational resources). In a case study, we investigate the growth of vocabulary (as well as the number of hapax legomena) as an increasing number of folds are included in the analysis. We cross-combine this with the various cleaning stages of the dataset. We also give some guidance in the form of Python, R, and Stata markdown scripts on how to work with the resource.
Computational language models (LMs), most notably exemplified by the widespread success of OpenAI's ChatGPT chatbot, show impressive performance on a wide range of linguistic tasks, thus providing cognitive science and linguistics with a computational working model to empirically study different aspects of human language. Here, we use LMs to test the hypothesis that languages with more speakers tend to be easier to learn. In two experiments, we train several LMs—ranging from very simple n-gram models to state-of-the-art deep neural networks—on written cross-linguistic corpus data covering 1293 different languages and statistically estimate learning difficulty. Using a variety of quantitative methods and machine learning techniques to account for phylogenetic relatedness and geographical proximity of languages, we show that there is robust evidence for a relationship between learning difficulty and speaker population size. However, contrary to expectations derived from previous research, our results suggest that languages with more speakers tend to be harder to learn.
Recent years have seen a growing interest in grammatical variation, a core explanandum of grammatical theory. The present volume explores questions that are fundamental to this line of research: First, the question of whether variation can always and completely be explained by intra- or extra-linguistic predictors, or whether there is a certain amount of unpredictable – or ‘free’ – grammatical variation. Second, the question of what implications the (in-)existence of free variation would hold for our theoretical models and the empirical study of grammar. The volume provides the first dedicated book-length treatment of this long-standing topic. Following an introductory chapter by the editors, it contains ten case studies on potentially free variation in morphology and syntax drawn from Germanic, Romance, Uralic and Mayan.
Allusion
(2023)
Assessment
(2023)
Most broadly, an assessment is a type of social action by which an interactant expresses an evaluative stance towards someone or something (e.g., an object, an event, an action, an experience, a state of affairs, a place, a circumstance, etc.). The target of an assessment is typically called the ‘assessable’.
Collaborative work in NFDI
(2023)
The non-profit association National Research Data Infrastructure (NFDI) promotes science and research through a National Research Data Infrastructure. Its aim is to develop and establish an overarching research data management (RDM) for Germany and to increase the efficiency of the entire German science system. After a two-and-a-half year build up phase, the process of adding new consortia, each representing a different data domain, has ended in March 2023. NFDI now has 26 disciplinary consortia (and one additional basic service collaboration). Now the full extent of cross-consortial interaction is beginning to show.
KoMuX, der Kompositamuster-Explorer, (www.owid.de/plus/komux) ist eine Webanwendung, die es ermöglicht, mehr als 50.000 nominale Komposita des Deutschen gezielt nach abstrakten oder lexikalisch-teilspezifizierten Mustern zu durchsuchen. Unterschiedliche Visualisierungen helfen dabei, Strukturen und Zusammenhänge innerhalb der Ergebnismenge zu erfassen.
Retro-sequence
(2023)
The Data Governance Act was proposed in late 2020 as part of the European Strategy for Data, and adopted on 30 May 2022 (as Regulation 2022/868). It will enter into application on 24 September 2023. The Data governance Act is a major development in the legal framework affecting CLARIN and the whole language community. With its new rules on the re-use of data held by the public sector bodies and on the provision of data sharing services, and especially its encouragement of data altruism, the Data Governance Act creates new opportunities and new challenges for CLARIN ERIC. This paper analyses the provisions of the Data Governance Act, and aims at initiating the debate on how they will impact CLARIN and the whole language community.
For many reasons, Mennonite Low German is a language whose documentation and investigation is of great importance for linguistics. To date, most research projects that deal with this language and/ or its speakers have had a relatively narrow focus, with many of the data cited being of limited relevance beyond the projects for which they were collected. In order to create a resource for a broad range of researchers, especially those working on Mennonite Low German, the dataset presented here has been transformed into a structured and searchable corpus that is accessible online. The translations of 46 English, Spanish, or Portuguese stimulus sentences into Mennonite Low German by 321 consultants form the core of the MEND-corpus (Mennonite Low German in North and South America) in the Archive for Spoken German. In addition to describing the origin of this corpus and discussing possibilities and limitations for further research, we discuss the technical structure and search possibilities of the Database for Spoken German. Among other things, this database allows for a structured search of metadata, a context-sensitive token search, and the generation of virtual corpora that can be shared with others. Moreover, thanks to its text-sound alignment, one can easily switch from a particular text section of the corpus to the corresponding audio section. Aside from the desire to equip the reader with the technical knowledge necessary to use this corpus, a further goal of this paper is to demonstrate that the corpus still offers many possibilities for future research.
Conventional terminology resources reach their limits when it comes to automatic content classification of texts in the domain of expertlayperson communication. This can be attributed to the fact that (non-normalized) language usage does not necessarily reflect the terminological elements stored in such resources. We present several strategies to extend a terminological resource with term-related elements in order to optimize automatic content classification of expert-layperson texts.
We present a collection of (currently) about 5.500 commands directed to voice-controlled virtual assistants (VAs) by sixteen initial users of a VA system in their homes. The collection comprises recordings captured by the VA itself and with a conditional voice recorder (CVR) selectively capturing recordings including the VA-directed commands plus some surrounding context. Next to a description of the collection, we present initial findings on the patterns of use of the VA systems during the first weeks after installation, including usage timing, the development of usage frequency, distributions of sentence structures across commands, and (the development of) command success rates. We discuss the advantages and disadvantages of the applied collection-specific recording approach and describe potential research questions that can be investigated in the future, based on the collection, as well as the merit of combining quantitative corpus linguistic approaches with qualitative in-depth analyses of single cases.
Linguistische Studien arbeiten häufig mit einer Differenzierung zwischen gesprochener und geschriebener Sprache bzw. zwischen Kommunikation der Nähe und Distanz. Die Annahme eines Kontinuums zwischen diesen Polen bietet sich für eine Verortung unterschiedlichster Äußerungsformen an, inklusive unkonventioneller Textsorten wie etwa Popsongs. Wir konzipieren, implementieren und evaluieren ein automatisiertes Verfahren, das mithilfe unkorrelierter Entscheidungsbäume entsprechende Vorhersagen auf Textebene durchführt. Für die Identifizierung der Pole definieren wir einen Merkmalskatalog aus Sprachphänomenen, die als Markierer für Nähe/Mündlichkeit bzw. Distanz/Schriftlichkeit diskutiert werden, und wenden diesen auf prototypische Nähe-/Mündlichkeitstexte sowie prototypische Distanz-/Schrifttexte an. Basierend auf der sehr guten Klassifikationsgüte verorten wir anschließend eine Reihe weiterer Textsorten mithilfe der trainierten Klassifikatoren. Dabei erscheinen Popsongs als „mittige Textsorte“, die linguistisch motivierte Merkmale unterschiedlicher Kontinuumsstufen vereint. Weiterhin weisen wir nach, dass unsere Modelle mündlich kommunizierte, aber vorab oder nachträglich verschriftlichte Äußerungen wie Reden oder Interviews vollkommen anders verorten als prototypische Gesprächsdaten und decken Klassifikationsunterschiede für Social-Media-Varianten auf. Ziel ist dabei nicht eine systematisch-verbindliche Einordung im Kontinuum, sondern eine empirische Annäherung an die Frage, welche maschinell vergleichsweise einfach bestimmbaren Merkmale („shallow features“) nachweisbar Einfluss auf die Verortung haben.
"Das im Januar 2022 gestartete Projekt "Sprachanfragen" (https://www.ids-mannheim.de/gra/projekte2/sprachanfragen/) verfolgt erstmalig das Ziel, Sprachanfragedaten zu erfassen, aufzubereiten und ein wissenschaftsöffentliches Monitorkorpus aus ihnen zu erstellen. Dazukommend wird eine Rechercheschnittstelle entwickelt, mit der die Sprachanfragen systematisch wissenschaftlich analysierbar gemacht werden. Das Poster gibt einen Überblick über das Projekt, zeigt erste Ergebnisse und bietet einen Ausblick auf Überlegungen zur Konzeption eines Chatbots zur automatisierten Beantwortung von Sprachanfragen." Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.
This article investigates mundane photo taking practices with personal mobile devices in the co-presence of others, as well as “divergent” self-initiated smartphone use, thereby exploring the impact of everyday technologies on social interaction. Utilizing multimodal conversation analysis, we examined sequences in which young adults take pictures of food and drinks in restaurants and cafés. Although everyday interactions are abundant in opportunities for accomplishing food photography as a side activity, our data show that taking pictures is also often prioritized over other activities. Through a detailed sequential analysis of video recordings and dynamic screen captures of mobile devices, we illustrate how photographers orient to the momentary opportunities for and relevance of photo taking, that is, how they systematically organize their photographing with respect to the ongoing social encounter and the (projected) changes in the material environment. We investigate how the participants multimodally negotiate the “mainness” and “sideness” (Mondada, 2014) of situated food photography and describe some particular features of participants’ conduct in moments of mundane multiactivity.
Seit Mitte der 1990er Jahre wird am Institut für deutsche Sprache (IDS) in Mannheim erforscht, wie der hochkomplexe Gegenstandsbereich „Grammatik“ unter Ausnutzung hypertextueller Navigationsstrukturen wissenschaftlich fundiert und anschaulich vermittelt werden kann. Eine zentrale Bedeutung kommt folglich einer konsistenten, theorieübergreifenden Vernetzung sämtlicher Textinhalte zu. Um eine automatisierbare Bezugnahme zwischen mit unterschiedlichem terminologischem Vokabular formulierten, aber das gleiche sprachliche Phänomen beschreibenden Inhalten zu befördern, bildet eine onomasiologisch konzipierte Terminologiedatenbank das Rückgrat des Online-Systems. Der Beitrag beschreibt Konzeption und Aufbau der skizzierten linguistischen Fachterminologie.
Das Ziel des Beitrages ist es, das Schweigen und seine sprachliche Gestaltung in Bezug auf die Makro- und Mikrostruktur des literarischen Textes zu erforschen. Den theoretischen Hintergrund bilden linguistische und literaturwissenschaftliche Arbeiten, die kommunikative, pragmatische, semantische, kulturelle sowie literaturhistorische Aspekte des Schweigens behandeln und seine Abgrenzung von der Stille hervorheben, die als Naturphänomen zu verstehen ist. Hingewiesen wird ausgehend vom Modell der literarischen Kommunikation auf die Rolle des Schweigens in der Triade Autor-Text-Leser sowie auf seine Realisierungsmöglichkeiten in der Struktur und Sprache des Erzähltextes. Dabei richtet sich die Aufmerksamkeit nicht nur auf das Schweigen als Nicht-Sprechen, sondern auch auf die nichtssagende Rede, die im Rahmen der Kommunikationssituation die Semantik des Schweigens aktualisiert. Die zwei gegensätzlichen Schweigeformen kommen in den Berliner Romanen von Robert Walser (1878-1956) zum Vorschein und unterliegen der genauen Analyse aus der Perspektive der Makro- und Mikrostilistik. Untersucht werden das Erzählprinzip der Geschwätzigkeit in Geschwister Tanner (1907), die Ironie in Der Gehülfe (1908) und die fragmentarische Erzählweise in Jakob von Gunten (1909), durch die das Schweigen sowohl auf der thematischen Ebene als auch in der Struktur und Sprache des Textes realisiert wird. Als narrative Strategie beeinflusst Schweigen die Form und den Inhalt Walsers Berliner Romane und erzielt somit die vom Autor gewünschte Wirkung auf den Leser.
Developments within the field of Second Language Acquisition (SLA) have meant that scholars are increasingly engaging with corpora and corpus-based resources, providing a source of “‘authentic’ language” to learners and educators (Mitchell 2020: 254), and contributing to “state-of-the-art research methodologies” (Deshors and Gries 2023: 164). However, there are areas in which progress can still be made, particularly in the area of metadata, such as information about the speaker and contexts of the language use, as well as increased variety in the text types and genres of corpora used to develop SLA materials (Paquot 2022: 36). This post discusses one such possibility for increasing the variety of text types and providing a rich source of authentic language that can be used to create engaging SLA materials, particularly for young people learning German, namely the use of the NottDeuYTSch corpus (to download the corpus in a variety of formats, see Cotgrove 2018).
Meine folgenden Überlegungen gehen weit über rein „linguistische Theorien und Methoden" hinaus. Sie beziehen sich auch weniger als seine auf innersprachliche Fragen und mehr auf sprachensoziologische und -politische. Allerdings entziehen sie sich auch damit nicht Poppers pauschalem Urteil, die mit „human society and human history" befassten Wissenschaften seien generell unfähig zu Prognosen - im Gegensatz zu manchen (wenn auch nicht allen) Naturwissenschaften. Abgesehen davon räume ich für das Folgende jedoch gerne Abstriche ein vom Grad der von Popper für Prognosen offenbar vorausgesetzten Zuverlässigkeit und Exaktheit. Sie entsprechen auch verbreiteten Auffassungen, dass sich die Weiterentwicklung der Technik zuverlässiger Voraussagen lässt als die der menschlichen Sozialbeziehungen, angesichts unkalkulierbarer „Anarchie und Ignoranz, die das Gefüge unserer Gesellschaft zerstören könnten" (Kaku 2016, S. 33). Bei einer solchen Abschwächung der Ansprüche im Sinne derartiger Vorbehalte erscheint es mir aber dennoch treffender, die folgenden Überlegungen, soweit sie zukunftsgerichtet sind, eher den Prognosen zuzuordnen als den bloßen Prophezeiungen, denen man ja dann - bei ihrer typischen Stütze durch „göttliche Offenbarung" - jegliche theoretische oder faktische, also wissenschaftliche Grundlage absprechen darf. Freilich verliert mit der genannten Abschwächung die Opposition zwischen den Begriffen 'Prognose' und 'Prophezeiung' ihre strenge Disjunktheit und wird in Richtung eines abgestuften oder kontinuierlichen Übergangs aufgelockert. Jedoch widerspricht dies keineswegs gängigem wissenschaftlichen Procedere. Damit nun aber genug an allgemeinen methodischen Vorüberlegungen! Im Übrigen geht es mir im Folgenden weniger um die Auseinandersetzung mit bisherigen Publikationen zum Thema, auch nicht denen des mit diesem Band Geehrten, die - bei einem nicht zu engen Verständnis - in großer Zahl vorliegen, als um die Skizzierung meiner eigenen Einschätzungen.
Wie die Eule erkunden große & kleine Sprach-Checker ihre Neckarstadt-West. Kommt mit auf Entdeckungsreise!
Das Buch „Der Wörter-Sammel-Koffer“ ist ein Werk der Sprach-Checker. Es entstand im Rahmen des Projekts „Die Sprach-Checker - So sprechen wir in der Neckarstadt“ (Leitung: Dr. Christine Möhrs & Elena Schoppa-Briele) des Leibniz-Instituts für Deutsche Sprache (IDS), Mannheim, in Zusammenarbeit mit der Kinderbuchautorin und Illustratorin Anke Faust, dem Campus Neckarstadt-West, den Neckarstadt-Kids sowie der Alten Feuerwache Mannheim.
Aus den vielen witzigen Ideen der Kinder entwickelte sich die Geschichte um die Eule, die anschließend mit Wasserfarben, Farbstiften und viel Phantasie von den Sprach-Checkern illustriert wurde.
OWID und OWIDplus – lexikographisch-lexikologische Online-Informationssysteme des IDS Mannheim
(2023)
Lexikographische und lexikalische Ressourcen zum Deutschen werden an vielen unterschiedlichen Institutionen erarbeitet, z. B. an Akademien der Wissenschaften oder in privatwirtschaftlichen Verlagen. Auch am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim werden solche Materialien erstellt und der (Fach-)Öffentlichkeit unter dem Dach von OWID, dem „Online-Wortschatz-Informationssystem Deutsch“ (owid.de), präsentiert.
Modular pivot
(2023)
A modular pivot is a type of turn-constructional pivot. It is built from syntactically entirely optional items (i.e. linguistic adjuncts) that can occur in both turn-initial and turn-final position and can therefore be used to patch a wide range of otherwise discrete turn-constructional units (TCUs) together (Clayman & Raymond 2015). A prime example of an item that lends itself to be deployed as a modular pivot are address terms (Clayman 2012).
Pivot
(2023)
The term pivot denotes an element of talk that can be understood to belong to two larger units of talk simultaneously, thereby joining them together and acting as a transitional link between them (Schegloff 1979: 275-276). Most commonly, the term is used to refer to lexico-syntactic elements that can be interpreted as ending one turn-constructional unit (TCU) while at the same time launching a next.
Mit dem cGAT-Handbuch stellt das FOLK-Projekt eine Richtlinie für das computergestützte Transkribieren nach GAT 2 zur Verfügung. Das Handbuch wurde anhand der Transkriptionspraxis in FOLK entwickelt und enthält eine Vielzahl von authentischen Beispielen, die mit dem zugehörigen Audio auch über die Datenbank für Gesprochenes Deutsch (DGD) abgerufen werden können.
Der Beitrag gliedert sich in drei Teile. In Abschnitt 2 führe ich zunächst den Begriff der Phraseoschablone ein und erläutere, inwiefern diese Untergruppe der Phraseologismen Eigenschaften von grammatischen Konstruktionen aufweist, deren konzise Erfassung eine notwendige Voraussetzung dafür ist, Beschränkungen bei der Produktivität und der semantischen Variabilität der Phraseologismen zu erklären. Daran anschließend werden in Abschnitt 3 Ergebnisse einer korpuslinguistischen Fallstudie nominaler Reduplikationen mit den Präpositionen an, in und über dargelegt und erörtert. Abschnitt 4 fasst schließlich die erzielten Ergebnisse im übergeordneten Zusammenhang zusammen und gibt einen Ausblick auf weitere Forschungsfragen.
The special issue opens up a construction-grammatical perspective on (German) word formation phenomena and goes back to a DFG-funded conference of the same name, which we held at the University of Düsseldorf in December 2020. The aim is to bundle up for the first time research from the field of German linguistics that is oriented towards construction grammar, and thus to lay the foundation for a 'Construction Word Formation' (cf. Booij 2010) also in the German-speaking world. Furthermore, ‘Construction Word Formation’ as a discipline shall hereby be sharpened. In this context, construction grammar should not be seen as a radical alternative to traditional word formation approaches that completely reinvents the wheel, but rather as a further development that builds on traditional concepts such as the pattern term with prominent consideration of usage-based aspects.
The Encyclopedia of Terminology for Conversation Analysis and Interactional Linguistics is an online resource for students and scholars of CA/IL, publicly available on the EMCA Wiki page. Encyclopedias and glossaries are widespread across various fields and methods, and serve as immensely valuable resources. Given the extent to which the EMCA/IL community has expanded over the years—both terminologically as well as geographically—we hope that this encyclopedia of terminology will be well received by students and practitioners of CA and IL across the globe.
Im Folgenden werden wir uns überwiegend mit der syntaktischen Realisierung der Intensivierung auseinandersetzen, wobei die morphologische anhand des Phänomens der Komposition nicht unkommentiert bleiben wird. Im Vordergrund unserer Analyse stehen überwiegend Fälle lexikalischer und se-mantischer bzw. funktionaler Divergenz zwischen dem Deutschen und dem Italienischen. Die von uns analysierten komparativen Phraseologismen wurden anhand einer Suche in ein- und zweisprachigen Wörterbüchern des Deutschen und des Italienischen ausgewählt. Unser Beitrag ist wie folgt strukturiert: Kapitel 2 gibt einen Überblick über die komparative Phrasem-Konstruktion aus kontrastiver Sicht: Es werden ihre strukturellen (morphosyntaktischen), semantischen und pragmatischen Hauptmerkmale beschrieben. Aufgrund ihrer Frequenz wird überwiegend auf die Subtypen mit einem Verb (Kap. 2.1.) und einem prädikativen Adjektiv (2.2.) als tertium comparations eingegangen. Da die Beziehung zwischen Metapher und Vergleich sehr eng ist, werden in Kapitel 3 die Analogien und Unterschiede zwischen diesen rhetorischen Figuren kurz skizziert. Kapitel 4 ist der interlingualen Analyse der phraseologischen Einheiten gewidmet, bei denen dasselbe Konzept im Deutschen und im Italienischen entweder durch einen (lexikalisierten) Vergleich oder durch eine (lexikalisierte) Metapher realisiert wird. Wie zu sehen sein wird, kann man außerdem intralingual manchmal auch die Kookkurrenz beider sprachlichen Formen feststellen. In Kapitel 5 wird der Objektbereich der komparativen Phrasem-Konstruktionen aus konstruktionsgrammatischer Sicht vertieft, wobei vor allem auf Hierarchisierungen von Konstruktionen, Vererbungsrelationen, Produktivität, kognitive Verfestigung (entrenchment) und Emergenzphänomene eingegangen wird.
Muttersprachler verfügen über eine sprachliche Kompetenz, die sie prinzipiell befähigt, Sprache, d.h. sprachliche Strukturen bzw. Konstruktionen, kommunikativ angemessen - im Normalfall sogar unbewusst - zu rezipieren und zu produzieren. In einer Fremdsprache hingegen ist die Ausgangssituation eine ganz andere: auch wenn von einer sprachlichen Kompetenz in der Muttersprache (und in vorher erworbenen und/oder erlernten Zweit- oder Fremdsprachen) ausgegangen werden kann, muss die sprachliche Kompetenz in der Fremdsprache erst Phase für Phase aufgebaut werden - was in der Fremdsprachendidaktik als Lernersprache bezeichnet wird. Die phraseologische Kompetenz ist ein Bestandteil der muttersprachlichen Sprachkompetenz, durch die Sprecher in der Lage sind, phraseologische Einheiten zu erkennen, zu verstehen und kommunikativ angemessen zu verwenden. Um einen unauffälligen, natürlichen, muttersprachenähnlichen phraseologischen Sprachgebrach in der Fremdsprache gewährleisten zu können, muss erstens erörtert werden, welche Phraseologismen überhaupt zum gegenwärtigen Sprachgebrauch gehören, und zweitens, wie diese Phraseologismen prototypisch von Muttersprachlern (rezeptiv und produktiv) verwendet werden. Für eine angemessene Erfassung und Beschreibung des Gebrauchs solcher Phraseologismen zu entsprechen, richtet sich in der vorliegenden Arbeit das Hauptaugenmerk exemplarisch auf eine der in dieser Liste aufgeführten idiomatischen Redewendungen, nämlich sich ins Zeug legen.
This paper presents an extended annotation and analysis of interpretative reply relations focusing on a comparison of reply relation types and targets between conflictual pages and neutral pages of German Wikipedia (WP) talk pages. We briefly present the different categories identified for interpretative reply relations to analyze the relationship between WP postings as well as linguistic cues for each category. We investigate referencing strategies of WP authors in discussion page postings, illustrated by means of reply relation types and targets taking into account the degree of disagreement displayed on a WP talk page. We provide richly annotated data that can be used for further analyses such as the identification of interactional relations on higher levels, or for training tasks in machine learning algorithms.
Telephone-based remote interpreting has come into widespread use in multilingual encounters, all the more so in times of refugee crises and the large influx of asylum-seekers into Europe. Nevertheless, the linguistic practices in this mode of communication have not yet been examined comprehensively. This article therefore investigates selected aspects of turn-taking and clarification sequences during semi-authentic telephone-interpreted counselling sessions for refugees (Arabic–German). A quantitative analysis reveals that limited audibility makes it more difficult for interpreters to claim their turn successfully; in most cases, however, turn-taking occurs smoothly. The trouble sources that trigger queries are mainly content-related and interpreters vary greatly in the ways they deal with such difficulties. Contrary to what one might expect, the study shows that coordination fails only rarely during telephone-based remote interpreting.
Anders als bei Sonntagspredigten haben die katholischen und evangelischen AutorInnen von Kirche in 1live nur 90 Sekunden zur Verfügung, um ihre christliche Botschaft zu vermitteln. Vorliegender Beitrag untersucht, wie die katholischen und evangelischen AutorInnen dies tun. Welche Inhalte erachten sie für relevant? Welche sprachliche Gestaltung wählen sie? Greifen katholische und evangelische AutorInnen zu den gleichen Inhalten und sprachlichen Mitteln oder zeigen sich konfessionelle Präferenzen und Differenzen? Diesen Fragen soll an einem Korpus aus Kirche in 1live-Radiopredigten aus den Jahren 2012 bis 2021 (= 2.755 Texte mit insgesamt 726.570 Token) mit einem quantitativen und qualitativen Methoden-Mix nachgegangen werden. Die Studie wird im Rahmen des DFG-Projekts „Sprache und Konfession 500 Jahre nach der Reformation“ am Germanistischen Institut der Westfälischen Wilhelms-Universität Münster durchgeführt.
The landscape of digital lexical resources is often characterized by dedicated local portals and proprietary interfaces as primary access points for scholars and the interested public. In addition, legal and technical restrictions are potential issues that can make it difficult to efficiently query and use these valuable resources. As part of the research data consortium Text+, solutions for the storage and provision of digital language resources are being developed and provided in the context of the unified cross-domain German research data infrastructure NFDI. The specific topic of accessing lexical resources in a diverse and heterogenous landscape with a variety of participating institutions and established technical solutions is met with the development of the federated search and query framework LexFCS. The LexFCS extends the established CLARIN Federated Content Search that already allows accessing spatially distributed text corpora using a common specification of technical interfaces, data formats, and query languages. This paper describes the current state of development of the LexFCS, gives an insight into its technical details, and provides an outlook on its future development.
Die Studie untersucht die Formen, Funktionalität und Relevanz von binnensprachlichen Variationsphänomenen im schwäbischen Dialektraum anhand der Sprachgebrauchspraktiken in einer neunten Klasse eines Gymnasiums in Ulm. Im Mittelpunkt stehen der Gebrauch koexistenter sprachlicher Formen mit unterschiedlicher Nähe oder Distanz zu den Polen Standard und Dialekt des sprachlichen Kontinuums und daraus ableitbare Hinweise auf die Varietätentektonik im untersuchten Sprachraum. Durch die Kombination von quantitativ und qualitativ orientierten Analyseverfahren werden die Zusammenhänge von formalen Mustern und funktionalen Möglichkeiten von Sprachvariation greifbar gemacht. Dabei wird deutlich, dass der variative Gebrauch der sprachlichen Formen bei den untersuchten Sprechern strukturiert ist und als interaktionskonstitutive linguistische Ressource in Bezug zu unterschiedlichen situativen Kommunikationsanforderungen an die Lehrer und Schüler steht.
The proposed contribution will shed light on current and future challenges on legal and ethical questions in research data infrastructures. The authors of the proposal will present the work of NFDI’s section on Ethical, Legal and Social Aspects (hereinafter: ELSA), whose aim is to facilitate cross-disciplinary cooperation between the NFDI consortia in the relevant areas of management and re-use of research data.
Reduzierte Parenthesen stehen in einer zweifachen Beziehung zur einschließenden Trägerstruktur. Die Trägerstruktur liefert den propositionalen Gehalt eines internen Arguments, das durch das Prädikat der Parenthese selegiert wird, während die Parenthese wie ein Modifikator in Bezug auf die Trägerstruktur fungiert. Die erstere Relation ist anaphorischer Natur, was durch ein pronominales Leerelement im parenthetischen Satz angemessen modelliert wird. Die letztere Relation lässt sich am besten durch die Sättigung eines externen (referenziellen) Arguments des parenthetischen Satzes durch die Trägerstruktur modellieren – analog zu gewöhnlichen Adverbialsätzen. Die strukturelle Bedingung dieser Relation resümiert dann darin, dass die Parenthese in die terminale Zeichenkette der Trägerstruktur eingeschlossen ist. Die Funktion der Parenthese als Modifikator wiederum ist eine Bedingung für die Lizenzierung des Leerelements innerhalb dieser Parenthese. Diese Erklärung wird durch Parallelen zu Phänomenen in Relativ- und in Vergleichsätzen untermauert.
This paper first argues that the distinction between Propositions and States-of-Affairs is significant for understanding a number of linguistic contrasts, including contrasts between nominalizations, complement clauses, readings of modal infinitives, raising constructions, illocutions and moods, relative clauses, and nouns. Subsequently, the paper outlines a cognitive linguistic model of the distinction, according to which Propositions and States-of-Affairs differ in terms of construal. Both prompt Langackerian “processes”, but only Propositions prompt a construal of these processes as referential. The paper argues that this model has a number of advantages over a traditional, denotational understanding of the distinction.
The present article proposes a syntactic and semantic analysis of assertive clauses that comprises their truth-conditional aspects and their speech act potential in communication. What is commonly called “illocutionary force” is differentiated into three structurally and functionally distinct layers: a judgement phrase, representing subjective epistemic and evidential attitudes; a commitment phrase, representing the social commitment related to assertions; and an act phrase, representing the relation to the common ground of the conversation. The article provides several pieces of evidence for this structure: from the interpretation and syntactic position of various classes of epistemic, evidential, affirmative and speech act-related operators, from clausal complements embedded by different types of predicates, from embedded root clauses, and from anaphora referring to different clausal projections. The syntactic assumptions are phrased within X-bar theory, and the semantic interpretation makes use of dynamic update of common ground, differentiating between informative and performative updates. The object language is German, with particular reference to verb final and verb second structure.
This article describes an English Zulu learners’ dictionary that is part of a larger set of information tools, namely an online Zulu course, an e-dictionary of possessives (which was implemented earlier) accompanied by training software offering translation tasks on several levels, and an ontology of morphemic items categorizing and describing all parts of speech of Zulu. The underlying lexicographic database contains the usual type of lexicographic data, such as translation equivalents and their respective morphosyntactic data, but its entries have been extended with data related to the lessons of the online course in order to enable the learner to link both tools autonomously. The ‘outer matter’ is integrated into the website in the form of several texts on additional web pages (how-to-use, typical outputs, grammar tables, information on morphosyntactic rules, etc.). The dictionary comprises a modular system, where each module fulfils one of the necessary functions.
This paper describes general requirements for evaluating and documenting NLP tools with a focus on morphological analysers and the design of a Gold Standard. It is argued that any evaluation must be measurable and documentation thereof must be made accessible for any user of the tool. The documentation must be of a kind that it enables the user to compare different tools offering the same service, hence the descriptions must contain measurable values. A Gold Standard presents a vital part of any measurable evaluation process, therefore, the corpus-based design of a Gold Standard, its creation and problems that occur are reported upon here. Our project concentrates on SMOR, a morphological analyser for German that is to be offered as a web-service. We not only utilize this analyser for designing the Gold Standard, but also evaluate the tool itself at the same time. Note that the project is ongoing, therefore, we cannot present final results.
Dieser Band fasst die Vorträge des 9. Hildesheimer Evaluierungs- und Retrieval-Workshops (HIER) zusammen, der am 9. und 10. Juli 2015 an der Universität Hildesheim stattfand. Die HIER Workshop-Reihe begann im Jahr 2001 mit dem Ziel, die Forschungsergebnisse der Hildesheimer Informationswissenschaft zu präsentieren und zu diskutieren. Mittlerweile nehmen immer wieder Kooperationspartner von anderen Institutionen teil, was wir sehr begrüßen. HIER schafft auch ein Forum für Systemvorstellungen und praxisorientierte Beiträge.
Open Science and language data: Expectations vs. reality. The role of research data infrastructures
(2023)
Language data are essential for any scientific endeavor. However, unlike numerical data, language data are often protected by copyright, as they easily meet the threshold of originality. The role of research infrastructures (such CLARIN, DARIAH, and Text+) is to bridge the gap between uses allowed by statutory exceptions and the requirements of Open Science. This is achieved on the one hand by sharing language data produced by research organisations with the widest possible circle of persons, and on the other by mutualizing efforts towards copyright clearance and appropriate licensing of datasets.
Seit der Migrationswelle 2015 steht Deutschland der gesellschaftspolitischen Herausforderung gegenüber, hunderttausende Flüchtlinge in den Arbeitsmarkt zu integrieren. Erfolgreiche Kommunikation am Arbeitsplatz stellt dabei eine Barriere dar, die es durch Verständnissicherung und Interaktionskompetenz zu überwinden gilt.
Diese empirische interaktionslinguistische Arbeit untersucht mittels der multimodalen Gesprächsanalyse die Verständnissicherung in Interaktionen am Arbeitsplatz. Anhand von Reparatursequenzen werden im ersten Analyseteil der Arbeit Praktiken der Integration von Geflüchteten im Prozess der Verständnissicherung untersucht und Unterschiede zwischen l1- und l2-Sprechern herausgestellt. Im zweiten Teil erfolgt eine longitudinale Studie, welche die Entwicklung der Reparatursequenzen der l2-Sprecher fokussiert, um aufzuzeigen, wie sich ihre Interaktionskompetenz und somit auch ihre Partizipation und Integration während ihres Beschäftigungsverhältnisses entwickelt.
Corpus-based identification and disambiguation of reading indicators for German nominalizations
(2010)
Corpus data is often structurally and lexically ambiguous; corpus extraction methodologies thus must be made aware of ambiguities. Therefore, given an extraction task, all relevant ambiguities must be identified. To resolve these ambiguities, contextual data responsible for one or another reading is to be considered. In the context of our present work, German -ung-nominalizations and their sortal readings are under examination. A number of these nominalizations may be read as an event or a result, depending on the semantic group they belong to. Here, we concentrate on nominalizations of verbs of saying (henceforth: "verba dicendi"), identify their context partners and their influence on the sortal reading of the nominalizations in question. We present a tool which calculates the sortal reading of such nominalizations and thus may improve not only corpus extraction, but also e.g. machine translation. Lastly, we describe successful attempts to identify the correct sortal reading, conclusions and future work.
Präpositionale Wortverbindungen (PWVs) und präpositionale lexikalisch geprägte Muster - speziell der Typ der binären Konstruktionen - sind ein in der (kontrastiven) Mehrwortforschung bislang kaum beachteter Typ, wie bereits mehrfach betont. Wenn in den deutschen PWVs die interne Stelle zwischen der Präposition und dem Nomen überproportional häufig nicht mit einem Artikel besetzt ist, ist bei solchen Kombinationen mit einem potenziell hohen Lexikalisierungsgrad zu rechnen. Solche PWVs kann man als autonome Einheiten auffassen, und dementsprechend soll man sie auch als feste Wortverbindungen untersuchen. Die formale und inhaltliche Grundlage für das kontrastive Modell bildet das UWV-Modell (vgl. Steyer 2000, 2013) und das Konzept lexikalisch geprägter Muster (siehe Steyer in diesem Band). Im Folgenden wird diese Herangehensweise auf die Äquivalenzfindung im Sprachenpaar Deutsch (DE) - Slowakisch (SK) angewendet. Einen zentralen Stellenwert nimmt die Kontrastierung von Kollokationsfeldern, von rekurrenten lexikalischen Erweiterungsmustern und komplexeren Wortverbindungsmuster ein. Es handelt sich um ein monodirektional angelegtes Modell Deutsch -> Fremdsprache, die korpusbasierte kontrastive Aufbereitung und Beschreibung schließt jedoch eine Bi- oder auch Multidirektionalität nicht aus. Die komplexe Äquivalenzproblematik und die entsprechenden Konvergenzen und Divergenzen werden in diesem Beitrag anhand folgender ausgewählter Kontrastbereiche im Vergleich Deutsch -> Zielsprache Slowakisch diskutiert: a) Verhältnis des deutschen Lemmas zu seinem prototypischen Äquivalent bzw. den prototypischen Äquivalenten, b) Bedeutung(en) und Gebrauchsspezifika der PWVs, c) interne und externe Variabilität der zugrundeliegenden Muster der PWVs und ihrer äquivalenten PWV-Muster; d) typische Einbettungen der äquivalenten PWVs in Satzkonstruktionen und semantische Merkmale verbaler Satelliten.
This article targets a distinctive kind of root structures in German formed by minimally two phrases but lacking an overt verbal predicate like i.a. die Guten ins Tröpfchen, die Schlechten ins Kröpfchen, jedem ein Bier or in den Müll mit dem Dreck. Certain instantiations of these patterns have been dubbed verblose Direktiva by Jacobs (2008) who provides an account in terms of construction grammar. Müller (2011), on the other hand, proposes an anti-passive analysis of the phenomenon. However, these apparent verbless root structures show conspicuous parallels in form and interpretation to another type of non-finite root structures in German, namely root infinitives. Both exclude an overt subject expression and both have a modal interpretation. Referring to these parallels, an analysis is elaborated which employs a empty verbal category. The overt consituents, then, are hosted by the (possibly extended) projection of the empty verb. Furthermore, this analysis captures a broader range of data, in particular instances formed by concatenated NPDAT-NPAKK or NPAKK-PP.
Eine Wörterbuchforschung für das Sprachenpaar Deutsch-Spanisch an der Schnittstelle zwischen Phraseologie und Konstruktionsgrammatik existiert bislang praktisch nicht. Ziel der vorliegenden Arbeit ist es daher, einen Beitrag zur Schließung dieser Lücke zu leisten, und zwar am Beispiel der „Idiomatik Deutsch-Spanisch" (IDSP) (Schemann et al. 2013). Die Phraseologieforschung befasst sich zwar schon lange mit nicht-kompositionalen Konstruktionen (die heterogen benannt werden z.B. Satzmuster, Phraseoschablonen, Phrasem- Konstruktionen, Schemata), die empirische Fundierung ist aber eher noch unsystematisch und bezogen auf die Lexikografie eher noch im Anfang begriffen. Es wird zum einen gezeigt, welchen großen Stellenwert solchen Mustern in der „Idiomatik Deutsch-Spanisch" (ebd.) zukommt. Zum anderen wird ein Vorschlag unterbreitet, mit dem die im Wörterbuch verzeichneten Phraseme und Muster unter einer dem Aspekt verfestigter Muster und Schemata klassifiziert und gruppiert werden können.
The paper is concerned with the filling of the right edge of a German clause with different constituents: subconstituents of the clause, arguments and modifiers of the NP, appositions and right-dislocated elements. It is argued that these different ways of filling the right edge come about in quite different ways. Subconstituents of the clause are base generated at the right edge in syntax. Constituents of the NP and appositions get to the right edge postsyntactically, i.e., they are linearised there only in the phonological component. Finally, the appearance of right-dislocated constituents is the result of two well-established deletion processes operating on two adjacent clauses.
The different mechanisms allow us to understand differences these elements show regarding positioning inside the right edge, binding and intonation. An important empirical generalisation put forward in the IDS-grammar can be captured. The grammar's controversial assumption that the right edge comprises a part which is disintegrated in between two syntactically integrated parts can be shown to be superfluous.
In current corpuslinguistic investigations, especially the collection of linguistic data and the frequency of linguistic phenomena (i.e. in the "linguistic matter") is in the center of interest of morphological discussions. This paper argues in favor of taking also morphological "antimatter" in account, i.e. surveying the structure of words containing morphological restrictions which cannot be proven systematically. With recourse to Popper's falsificationism and starting with prominent restrictions in the morphology of German, the article discusses theoretical consequences and chances for morphological theory with special emphasis on morphological change, i.e. when antimatter becomes matter and vice versa.
Constructionist approaches to grammar do not draw a clear distinction between lexicon and grammar, as generative "words and rules" accounts do. Rather, they conceptualize grammar and lexicon as a continuum of constructions of greater or lesser complexity and abstraction. In this paper, i explore the implications of this paradigm shift for the applied discipline of grammaticography. If we abandon the distinction between grammar and lexicon, should we also abandon the distinction between grammar, books and dictionaries? Drawing on a case study on the treatment of verbless constructions in the "IDS-Grammatik", it is argued that constructions should play a greater role in grammar books, but that grammar books still need to provide access to general principles of grammar.
This White Paper sets out commonly agreed definitions on activities of consortia within NFDI. It aims to provide a common basis for reporting and reference regarding selected questions of cross-consortial relevance in DFG’s template for the Interim Reports. The questions were prioritised by an NFDI Task Force on Evaluation and Reporting (formerly Task Force Monitoring) as a result of discussing possible answers to the DFG template. In this process the need to agree on a generalizable meaning of terms commonly used in the context of NFDI, and reporting in particular, were identified from cross-consortial perspectives. Questions that showed the highest requirement on clarification are discussed in this White Paper. As NFDI evolves, the Task Force will likely propose further joint approaches for reporting in information infrastructures.
While each of broad relevance, the questions addressed relate to substantially different aspects of consortia’s work. They are thus also structured slightly different.
Sprachanfragen als authentische Primärdaten bergen Erkenntnispotenziale für eine große Bandbreite linguistischer und transferwissenschaftlicher Forschungsfragen und Methoden. Der Beitrag skizziert diese Potenziale und legt dabei den Fokus auf wissenschaftskommunikative Prozesse im Austausch linguistischer Laien und Experten. Anhand erster Ergebnisse einer empirischen korpusgestützten Untersuchung von ca. 50.000 Sprachanfragen wird skizziert, welche Erkenntnisse aus diesen Daten für die Vermittlung von Sprachwissen in einer zunehmend digitalisierten und vernetzten Gesellschaft gewonnen werden können.
Metadaten zu Gesprächen und den beteiligten Sprecher/-innen enthalten Informationen, die für die Beschreibung, Erschließung und Analyse von Korpora wichtig sind. Bisher werden sie jedoch in der Konversationsanalyse und der Interaktionalen Linguistik so gut wie nicht genutzt. Dieser Beitrag zeigt exemplarisch, wie Metadaten des Gesprächskorpus „Forschungs- und Lehrkorpus Gesprochenes Deutsch“ (FOLK) im Rahmen einer interaktionslinguistischen Untersuchung verwendet werden können, um Regularitäten der Verwendung einer untersuchten Gesprächspraktik zu identifizieren und ihren Zusammenhang mit den Eigenschaften von Aktivitäten und Sprecherrollen zu klären. In allgemeinerer Perspektive diskutiert der Beitrag, wie und an welchen Stellen einer interaktionslinguistischen Untersuchung Metadaten von Nutzen sein können und wie ihr Stellenwert im Rahmen dieser Methodologie kritisch reflektiert werden muss.
Filtern, Explorieren, Vergleichen: neue Zugriffsstrukturen und instruktive Potenziale von OWIDplus
(2023)
OWIDplus, das Zusatzangebot zur Wörterbuchplattform OWID, vereint verschiedenste lexikalische Datenbanken, Korpustools und visuell aufbereitete Analysen, die mithilfe von Textsuche und Kategorienfiltern so sortiert werden können, dass Benutzer*innen leicht die für sie interessanten Projekte entdecken können. Eine tiefergehende Beschäftigung mit den Einzelprojekten zeigt, wie bei aller oberflächlicher Ähnlichkeit oder gemeinsamen Themenbereichen ganz unterschiedliche methodische Zugänge zu sprachlichen Daten gewählt worden sind und wie Methodik und Forschungsfrage stets aufeinander abgestimmt werden müssen. Die Vielzahl potenzieller Forschungsfragen führt so unweigerlich zu einer Diversität von Projekten und somit einer Heterogenität, die, so hoffen die Autor*innen, in OWIDplus greifbar wird.
Die sprachlichen Auffälligkeiten, die in Gedichten zu beobachten sind, haben immer wieder Anlass zu verschiedenen Versionen der Abweichungstheorie gegeben, derzufolge die in Gedichten verwendete Sprache von nicht-lyrischer Sprache abweicht. Expressionistische Lyrik ist insbesondere für ihre argumentstrukturellen Innovationen bekannt. Auf der Basis eines Korpus expressionistischer Gedichte wird eine Übersicht über diese Auffälligkeiten gegeben, die die Grundlage für weitere Studien darstellen soll, in denen zu zeigen sein wird, inwieweit unter bestimmten grammatiktheoretischen Annahmen die Abweichungstheorie zurückgewiesen werden kann.
This paper presents the IVK-Ler corpus, a longitudinal, annotated learner corpus of weekly writings produced by a group of 18 adolescents in a preparatory class. The corpus consists of 117 student texts collected between 2020 and 2021 and has a structure layered by student and text number. It includes metadata that enables researchers to analyze and track individual student progress in terms of syntactic competence and literacy. The annotation schema, manual and automatic annotation processes, and corpus representation are described in detail. The corpus currently includes target hypotheses and gold standard part-of-speech tags. Future work could include additional annotation layers for topological fields and dependency relations, as well as semantic and discourse annotations to make the corpus usable for tasks beyond syntactic evaluations.
Der vorliegende Beitrag beschreibt, wie die Verfügbarkeit digitaler Textkorpora den Wandel von einer systemorientierten hin zu einer gebrauchsorientierten Sprachforschung ermöglicht hat. Doch die korpusbasierte Beschreibung des Sprachgebrauchs kann nur so realistisch sein wie die Korpora, mit denen sie arbeitet. Deshalb ist es von großer Bedeutung, auch besondere Textsorten zu berücksichtigen und Herangehensweisen zu entwickeln, das dafür nötige Vertrauen bei den Datenspendern zu erzeugen. Im Zentrum des Beitrags steht deshalb die Diskussion von einigen derartigen Textsorten und den Herausforderungen, die sich mit ihnen in Hinsicht auf den Korpusaufbau verbinden. Der Beitrag endet mit einem Ausblick auf das Forum Deutsche Sprache, das einen solchen Ort des Vertrauens für Spracherhebungen bieten möchte.
Einleitung
(2023)
Der Beitrag betrachtet das Deutsche Referenzkorpus DeReKo in Bezug auf Strategien für seinen Ausbau, den Zugriff über die Korpusanalyseplattform KorAP und seine Einbettung in Forschungsinfrastrukturen und in die deutschsprachige und europäische Korpuslandschaft. Ausgehend von dieser Bestandsaufnahme werden Perspektiven zu seiner Weiterentwicklung aufgezeigt. Zu den Zukunftsvisionen gehören die Verteilung von Korpussressourcen und die Konstruktion multilingualer vergleichbarer Korpora anhand der Bestände der National- und Referenzkorpora, eine Plattform zur Abgabe und Aufbereitung von Sprachspenden als eine Anwendung von Citizen Science sowie eine Komponente zur automatischen Identifikation von übersetzten bzw. maschinenverfassten Texten.
In unserem Beitrag widmen wir uns dem Einsatz von Sprachkorpora für den Kontext
Deutsch als Fremdsprache (DaF), wobei wir unterschiedliche Ressourcen und Anwendungsbereiche beleuchten. Ziel des Beitrags ist es, exemplarisch Korpora für den DaF-Kontext vorzustellen, sowie deren Potenziale beispielhaft herauszustellen. Zu den vorgestellten Ressourcen zählen Lernerkorpora für Deutsch als Zielsprache, Spezial- und Fachkorpora, Vergleichskorpora sowie Korpora der gesprochenen Sprache und Wörterbuchressourcen. Mit Blick auf die unterschiedlichen Korpora und deren Spezifika loten wir lohnende Perspektiven und Anknüpfungspunkte für Forschung und Didaktik aus und geben Hinweise zur vertiefenden Auseinandersetzung.
This paper analyses intensification in German digitally-mediated communication (DMC) using a corpus of YouTube comments written by young people (the NottDeuYTSch corpus). Research on intensification in written language has traditionally focused on two grammatical aspects: syntactic intensification, i.e. the use of particles and other lexical items and morphological intensification, i.e. the use of compounding. Using a wide variety og examples from the corpus, the paper identifies novel ways that have been used for intensification in DMC, and suggests a new taxonomy of classification for future analysis of intensification.
In diesem sprachwissenschaftlichen Projekt wurden Verfahren des Sprecherwechsels und der Bedeutungsaushandlung in authentischen, telefonisch gedolmetschten Beratungsgesprächen untersucht. Die Daten liegen als PDF (nach dem HIAT-Verfahren) und als bearbeitbare Rohdaten in einer .exb-Datei vor. Die Transkripte dokumentieren Beratungsgespräche zwischen arabischsprechenden Klienten und einer Migrations- und Sozialberaterin, zu denen verschiedene Dolmetscher via Telefon herangezogen werden. Die Dolmetscher befinden sich jeweils in einem anderen Raum als die Beraterin und die Klienten. Die Gespräche erfolgten nach vorheriger Anmeldung. Die Beraterin ruft den Dolmetscher jeweils zum vereinbarten Termin an. Die Klienten sind subsidiär geschützte syrische Geflüchtete mit sehr geringen Deutschkenntnissen, die Hilfe beim Familiennachzug, Spracherwerb oder anderen authentischen Anliegen benötigen. Die Dolmetscher sprechen verschiedene regionale Varietäten des Arabischen. Daten, die auf die beteiligten Personen sowie auf die Beratungsstelle schließen lassen, wurden anonymisiert. Technisch bedingte Übertönungen und andere Handlungen der Beteiligten, die wegen der mangelnden Kopräsenz nicht für alle Beteiligten in den beiden Interaktionsräumen hörbar oder in einem Interaktionsraum nur visuell wahrnehmbar sind, wurden in den jeweiligen Annotationsspuren durchgehend annotiert. Dagegen wurden non- und paraverbale Phänomene wie etwa die Atmung ausschließlich im Hinblick auf ihre kommunikative Bedeutung sowie Relevanz für den Sprecherwechsel transkribiert und bei eingeschränkter akustischen Wahrnehmung kenntlich gemacht. Natürliche Phänomene menschlichen Sprechens, wie das Einatmen, Schlucken und Schmatzen, mit denen keine turnbezogene Handlungen einhergehen, blieben unberücksichtigt. Die nonverbalen Handlungen der Aktanten und deren Prosodie werden nur ansatzweise und im Hinblick auf die Untersuchungsfrage angedeutet.
Es werden in Veröffentlichungen ein englisches oder ein deutsches Kürzel als Bezeichnung für das Korpus verwendet (TIGA und TeDo). Die Nummerierung der Dateien ist jedoch immer die selbe.
Weitere Sprachen in dieser Datensammlung sind verschiedene Varietäten des gesprochenen Arabisch. Die Datensammlung stammt aus dem DFG-Projekt ME 3439/3 "Turn-taking und Verständnissicherung beim Telefondolmetschen Deutsch-Arabisch".
This paper shows how experimental methods can advance syntactic description and syntactic theory. The empirical domain is the order of verbs in German verb clusters containing a modal verb in the perfect. Such clusters are special insofar as prescriptive grammar requires the finite verb to appear in cluster-initial instead of cluster-final position (e.g., hat lesen müssen 'has read must' instead of lesen müssen hat 'read must has'). Contrary to this requirement, experiments show that native speakers accept the auxiliary also in later positions as long as it precedes the modal verb. The acceptability data are corroborated by corpus data and experimental data from language production. The relevance of the experimental data for syntactic theory are discussed.
The linear analysis of sentences is part of every grammatical description of German, often based on the theory of 'Topologische Felder' ('topological fields'). According to this theory, German sentences are composed of so-called 'Felder' ('fields') that can be filled by differents kinds of syntactic expressions. One widespread assumption is that some of the fields can be left empty, depending on the kind of sentence, another widespread assumption is that some of the fields are only optional. We will show that not all kinds of empty positions or fields which are adopted in different versions of topological theories are motivated. But this seems to be essential if we take the theory of topological fields serious. The following is an attempt of clarification.
The paper provides a survey about grammatical variation in German and discusses the consequences for grammar books: How can they describe systematic differences between several varieties as well as the core system of German as an individual language? Proceeding from the differentiation between extra- and intralinguistic explanations for grammatical variation and from theoretic considerations on the notion of 'system' the paper discusses different possibilities of modeling the relationship between system and variation. It argues for a modular concept with a core system that provides the option of internal variation and modular systems that contain grammatical phenomena which are specific for certain varieties.
The paper attempts to bridge the gap between semantics and the conceptualization and teaching of grammar at secondary school exemplarily concerning German demonstratives dies- and jen-. I show that existing accounts of these demonstratives in reference grammars and school books are far from being satisfactory, whilst at least for dies-, if not for jen-, there exist comprehensive linguistic analyses. I adapt these to offer a semantic analysis for jen- using corpus data from modern German with pronominal and adnominal jen-, and propose a didactically applicable category of 'shared mental space' of the speaker and the hearer for the demonstratives: I argue that speakers use demonstrative reference to anchor the referent inside resp. outside their and the hearers' shared mental space.
Die Arbeit mit digitalen Daten und empirischen Methoden hat die Möglichkeiten intersubjektiv nachprüfbarer Forschung und Theoriebildung in der Linguistik wie in kaum einer anderen geisteswissenschaftlichen Disziplin verändert. Der Linguistik steht heute eine beeindruckende Anzahl hochwertiger Korpusressourcen zur Verfügung, um Fragestellungen ausgehend vom tatsächlichen Sprachgebrauch in gesprochener und geschriebener Sprache zu bearbeiten und Hypothesen datengestützt zu überprüfen.
Dieser Band bietet Einblicke in Grundlagenfragen, aktuelle Forschungsarbeiten und Entwicklungen im Bereich der korpusgestützten Sprachanalyse – von den theoretischen Grundlagen über die Beschreibung einzelner Korpora und Werkzeuge bis hin zu korpusgestützten Fallstudien und zum Einsatz von Korpora in Lehre und Unterricht. Die 25 Beiträge reflektieren den Stand der gegenwärtigen Forschung und sind nicht nur für Expertinnen und Experten, sondern auch für fortgeschrittene Studierende der Linguistik mit einschlägigem fachlichen Interesse verständlich.
Strategische Kommunikation wird in verschiedenen Bereichen der menschlichen Interaktion verwendet, um eine bestimmte Zielgruppe zu beeinflussen. Sie befindet sich an der Schnittstelle mannigfaltiger Disziplinen, wie z.B. Kommunikations- und Politikwissenschaft, Psychologie, Management und Marketing. Strategische Kommunikation bezieht sich sowohl auf öffentliche und private Kommunikation, professionelle und unprofessionelle Kommunikantinnen und Kommunikanten als auch auf unterschiedliche Kommunikationskanäle.
Oralität ist gegenüber Literalität historisch primär, und der Übergang hin zur Literalität ist sprach- wie kulturwissenschaftlich einschneidend. Unserdeutsch (Rabaul Creole German), eine erst knapp über 100 Jahre junge, originär ausschließlich mündlich verwendete Kreolsprache, befindet sich gegenwärtig an der Schwelle hin zur Verschriftung. Eine Sammlung von rund 180 spontan schriftlich produzierten Äußerungen dieser noch auf allen Ebenen unnormierten Sprache zeigt von den Unserdeutsch-SchreiberInnen intuitiv zugrunde gelegte Graphem-Phonem-Korrespondenzen. Die Schriftbelege lassen dabei Rückschlüsse zu auf graphematische Kontakteinflüsse sowie auf die mentale Repräsentation von Wörtern bei den SprecherInnen. Diese Erkenntnisse sind, neben ihrer sprachtheoretischen Relevanz, vor allem auch für die noch ausstehende Erarbeitung einer Orthographie von Unserdeutsch von Bedeutung.
Kommunikative Misserfolge im Deutschen für ukrainische Deutschlerner aus interkultureller Sicht
(2020)
Begriffe, die meist als nulläquivalente Lexik (Lakunen) für ukrainische Deutschlerner gelten und somit Schwierigkeiten bereiten sowie im Allgemeinen zu Misserfolgen zwischen Kommunizierenden führen können, stehen im Mittelpunkt der folgenden Ausführungen. Um sie zu vermeiden, werden einige Themen und Aufgaben zur Erweiterung der sozial-kommunikativen und interkulturellen Kompetenzen vorgeschlagen.
Der Beitrag beschreibt einen spezifisch diskurslinguistischen Zugang zu der sprachgeschichtlichen Frage nach durch gesellschaftlich-politische Faktoren hervorgerufenen Umbrüchen. Orientiert an den Foucaultschen Kategorien der Serialität und der Diskontinuität werden diese methodischen Implikaturen auf die Umbrüche 1918/19 und 1945ff bezogen. Das Methodenmodell besteht im Wesentlichen aus zwei Aspekten: Als Faktor von hoher Umbruchrelevanz wird zum einen der soziopragmatische Bezug zu Diskursakteuren hergestellt. Exemplarisch werden zum andern diese Epochen kennzeichnende demokratiegeschichtliche Institutionalisierungsakte im Sinne Searles beschrieben. Damit wird ein Beitrag zur diskurslinguistischen Methodenreflexion geleistet.
Der vorliegende Aufsatz widmet sich zwei Kategorien der traditionellen (deutschen) Grammatik: dem Aufforderungssatz, einer der fünf klassischen Satzarten, und dem Imperativ, einer Verbform, die als typisch für Aufforderungssätze gilt. Er greift Beobachtungen aus der jüngeren Fachliteratur auf, die ein zunehmendes Unbehagen mit beiden Kategorien erkennen lassen. In morphologischer Hinsicht zeigt sich, dass nur wenige deutsche Verben eine eindeutige Imperativform besitzen. Manche Verben besitzen keine Imperativform. Bei der Mehrzahl der Verben besteht Homonymie zwischen Imperativformen und Konjunktivformen der 3. Person Singular. Imperativformen werden durch Konjunktivformen verdrängt. In syntaktischer Hinsicht wird argumentiert, dass Imperativsyntagmen keine Satzform haben. Satzförmige Ausdrücke mit Konjunktivformen, die für auffordernde Handlungen stehen, können als Wunschsätze kategorisiert werden. Als Aufforderungssätze bleiben zwei Klassen von Syntagmen im Grenzbereich zwischen nicht-satzförmigen und satzförmigen Ausdrücken übrig, die besondere Eigenschaften hinsichtlich Subjektbesetzung und Subjekt-Verb-Kongruenz zeigen.
Orthographie ist ein Thema, das spätestens seit der Rechtschreibreform 1996 nicht nur die wissenschaftliche Forschung, sondern auch den öffentlichen Diskurs entscheidend geprägt hat. Aus Anlass von „20 Jahren Rat für deutsche Rechtschreibung“ war dieses Thema auch Gegenstand der 59. Jahrestagung des Leibniz-Instituts für Deutsche Sprache.
Als Teil der NFDI vernetzt Text+ ortsverteilt verschiedenste Daten und Dienste für die geisteswissenschaftliche Forschung und stellt sie der wissenschaftlichen Gemeinschaft FAIR zur Verfügung. In diesem Beitrag beschreiben wir die Umsetzung beispielhaft im Bereich der Text+ Datendomäne Sammlungen anhand von Korpora, die in verschiedenen Disziplinen Verwendung finden. Die Infrastruktur ist auf Erweiterbarkeit ausgelegt, so dass auch weitere Ressourcen über Text+ verfügbar gemacht werden können. Enthalten ist auch ein Ausblick auf weitere zu erwartende Entwicklungen. Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.
IDS aktuell. Neues aus dem Leibniz-Institut für Deutsche Sprache in Mannheim. Jg. 2023, Heft 3
(2023)
Hintergrund: Die digitale Transformation prägt gesellschaftliche Systeme weltweit. Digital Health umfasst verschiedene Bereiche, wie z. B. die Verfügbarkeit und Auswertung von Daten, die Möglichkeit der Vernetzung innerhalb der eigenen Berufs- oder Betroffenengruppe und die Art, wie Patient*innen, Angehörige und Behandler*innen miteinander kommunizieren.
Ziel der Arbeit: Digital Health wird mit ihren Auswirkungen auf die Beziehung und die Kommunikation zwischen Patient*innen, Angehörigen und Behandler*innen beleuchtet. Veränderungen, die bereits erkennbar sind, werden beschrieben und Perspektiven aufgezeigt.
Methoden: Das Thema wird aus sozialphilosophischer, sprachwissenschaftlicher und ärztlicher Perspektive in folgenden Bereichen exploriert: digitale vs. analoge Kommunikation, Narration vs. Datensammeln, Internet und soziale Medien als Informationsquelle, Raum für Identitätsbildung und Veränderung der Interaktion von Patient*innen, Angehörigen und Behandler*innen.
Ergebnisse: Die Erweiterung der Interaktion zwischen Patient*innen und Ärzt*innen auf digitale und Präsenzformate sowie die asynchrone und synchrone Kommunikation erhöhen die Komplexität, aber auch die Flexibilität. Die Fokussierung auf „objektive“ Daten kann den Blick auf die Person mit ihrer individuellen Biografie beeinträchtigen, während digitale Räume die Möglichkeiten zur Identitätsbildung aufseiten der Patient*innen und für die Interaktion deutlich erweitern.
Diskussion: Bereits jetzt zeigen sich Vorteile der Digitalisierung (z. B. besseres Selbstmanagement) und Nachteile (Fokussierung auf Daten statt auf die Person). Für den kinder- und jugendärztlichen Bereich bestehen die Notwendigkeiten, professionelle kommunikative Kompetenzen und professionelle Gesundheitskompetenz zu erweitern sowie die Organisation seiner Versorgungseinrichtungen weiterzuentwickeln.
National Socialism, one could argue, was all about belonging: belonging to the ‘Volk’ or the ‘Volksgemeinschaft’, belonging to the ‘Aryan’ or ‘Non-Aryan race’, belonging to the National Socialist ‘movement’, and so on. These categories of belonging worked both inclusionary and exclusionary and they were constituted, proclaimed and enacted to a great part through language. What is more, they had to be performed through communicative acts. For the normative side of National Socialist propaganda and legislation, this seems rather obvious and one-directional. On the side of the general population, however, this entailed a mixture of communicative need to position oneself vis-à-vis National Socialism (mostly in affirmative ways), but also the urge to do so willingly. When we look at the language use of ‘ordinary people’ in different communicative situations and texts during National Socialism, we have to focus on these dimensions of discursive collusion, co-constitution and appropriation. People during National Socialism, such is our hypothesis, navigated through discourses of belonging and by that made them real and effective. Besides diaries, war letters and autobiographical writings, one way to grasp this phenomenon is to analyse petitions, i.e., letters of complaint and request sent in large numbers by ‘ordinary people’ to public authorities of the party and the state. As I will show by some examples, letter-writers tried to inscribe themselves within (what they took for) National Socialist discourses of belonging in order to legitimate their claims. By doing so, they co-constituted and co-created the discursive realm of National Socialism.
One of the fundamental questions about human language is whether all languages are equally complex. Here, we approach this question from an information-theoretic perspective. We present a large scale quantitative cross-linguistic analysis of written language by training a language model on more than 6500 different documents as represented in 41 multilingual text collections consisting of ~ 3.5 billion words or ~ 9.0 billion characters and covering 2069 different languages that are spoken as a native language by more than 90% of the world population. We statistically infer the entropy of each language model as an index of what we call average prediction complexity. We compare complexity rankings across corpora and show that a language that tends to be more complex than another language in one corpus also tends to be more complex in another corpus. In addition, we show that speaker population size predicts entropy. We argue that both results constitute evidence against the equi-complexity hypothesis from an information-theoretic perspective.
In the context of a Nordic Conference on Bilingualism, it can be a rewarding task to look at issues such as language planning, policy and legislation from a perspective of the southern neighbours of the Nordic world. This paper therefore intends to point attention towards a case of societal multilingualism at the periphery of the Nordic world by dealing with recent developments in language policy and legislation with regard to the North Frisian speech community in the German Land of Schleswig-Holstein. As I will show, it is striking to what degree there are considerable differences in the discourse on minority protection and language legislation between the Nordic countries and a cultural area which may arguably be considered to be part of the Nordic fringe - and which itself occasionally takes Scandinavia as a reference point, e.g. in the recent adoption of a pan-Frisian flag modelled on the Nordic cross (Falkena 2006).
The main focus of the paper will be on the Frisian Act which was passed in the Parliament of Schleswig-Holstein in late 2004. It provides a certain legal basis for some political activities with regard to Frisian, but falls short of creating a true spirit of minority language protection and/or revitalisation. In contrast to the traditions of the German and Danish minorities along the German-Danish border and to minority protection in Northern Scandinavia (in particular to Sámi language rights), the approach chosen in the Frisian Act is extremely weak and has no connotation of long-term oriented language-planning, let alone a rights-based perspective.
The paper will then look at policy developments in the time since the Act was passed, e.g. in the Schleswig-Holstein election campaign in 2005, and on latest perceptions of the Frisian language situation in the discourse on North Frisian Policy in Schleswig-Holstein majority society. In the final part of the paper, I will discuss reasons for the differences in minority language policy discourse between Germany and the Nordic countries, and try to provide an outlook on how Frisian could benefit from its geographic proximity to the Nordic world.