Refine
Year of publication
- 2022 (140) (remove)
Document Type
- Part of a Book (56)
- Article (37)
- Conference Proceeding (19)
- Book (13)
- Other (9)
- Doctoral Thesis (2)
- Preprint (2)
- Review (2)
Language
- German (72)
- English (65)
- French (2)
- Multiple languages (1)
Is part of the Bibliography
- yes (140) (remove)
Keywords
- Deutsch (47)
- Korpus <Linguistik> (35)
- Nationalsozialismus (18)
- Wörterbuch (15)
- Kommunikation (12)
- Sprachdaten (12)
- Interaktion (11)
- Lexikografie (10)
- Neologismus (10)
- Diskurs (9)
Publicationstate
- Veröffentlichungsversion (140) (remove)
Reviewstate
Publisher
Wie können Kinder und Jugendliche ihren mehrsprachigen Alltag im Mannheimer Vielfaltsquartier Neckarstadt-West erforschen – gemeinsam mit Forschenden des Leibniz-Instituts für Deutsche Sprache und seinen Kooperationspartnern, dem Campus Neckarstadt-West, der Alten Feuerwache Mannheim gGmbH und dem Verein Neckarstadt Kids e.V.?
Wir wollen die Potenziale von Citizen Science in einem sprachbezogenen Projekt ausloten:
- für die Etablierung vertrauensvoller Zusammenarbeit zwischen den jungen Citizen Scientists und der sprachwissenschaftlichen Forschung,
- für hochwertige Bildungsangebote im Sinne der UN-Nachhaltigkeitsziele und
- für neue Impulse im Bereich der Sprachkontakt- und Mehrsprachigkeitsforschung.
In diesem Beitrag skizzieren wir die Ziele, Fragen und Methoden unseres Projekts und geben Einblicke in die bisher durchgeführten und im Jahr 2023 geplanten Aktionen.
We present a simple tool for extracting text and markup information from printouts of (not only) scientific documents. While the heavy-lifting OCR is done by off-the-shelf tesseract, our focus is on detection, extraction, and basic categorization of color-highlighted text sections, as well as on providing a framework for downstream processing of extraction results. The tool can be useful for document analysis tasks that must, or benefit from being able to, use printed paper.
Seit Mitte der 1990er Jahre wird am Institut für deutsche Sprache (IDS) in Mannheim erforscht, wie der hochkomplexe Gegenstandsbereich „Grammatik“ unter Ausnutzung hypertextueller Navigationsstrukturen wissenschaftlich fundiert und anschaulich vermittelt werden kann. Eine zentrale Bedeutung kommt folglich einer konsistenten, theorieübergreifenden Vernetzung sämtlicher Textinhalte zu. Um eine automatisierbare Bezugnahme zwischen mit unterschiedlichem terminologischem Vokabular formulierten, aber das gleiche sprachliche Phänomen beschreibenden Inhalten zu befördern, bildet eine onomasiologisch konzipierte Terminologiedatenbank das Rückgrat des Online-Systems. Der Beitrag beschreibt Konzeption und Aufbau der skizzierten linguistischen Fachterminologie.
Widerstand als psychoanalytisches Konzept beschreibt die Ambivalenz von Psychotherapiepatient*innen gegenüber dem therapeutischen Veränderungsprozess. Während der*die Patient*in sich mit dem Wunsch, bestimmte Veränderungen zu erzielen, auf die Therapie einlässt, stellen sich diesem Wunsch unbewusste Kräfte entgegen, die versuchen, den Status quo aufrechtzuerhalten. Hintergrund ist die Annahme, dass Widerstand eine Schutzfunktion darstellt, um schmerzhafte Affekte abzuwehren, die integraler Bestandteil eines psychotherapeutischen Prozesses sind. Therapeut*innen sehen sich vor der Aufgabe, Widerstandsphänomene als solche zu erkennen, deren Funktion zu verstehen und einen gemeinsamen Verstehensprozess mit dem*der Patient*in zu ermöglichen. Eine gesprächsanalytische Untersuchung von Widerstand und dessen kommunikativer Bearbeitung bietet eine wertvolle Ergänzung zur psychotherapeutischen Betrachtungsweise. Ein bislang in der Literatur wenig beachtetes Widerstandsphänomen ist Verbosität, womit gemeinhin ausufernde, unfokussierte Erzählungen gemeint sind. Aufbauend auf der bisher einzigen gesprächsanalytischen Untersuchung zu Verbosität als Widerstandsphänomen von Fenner, Spranz-Fogasy und Montan (2022) ist das Ziel der vorliegenden Arbeit, herauszuarbeiten, wie Widerstandsmanagement bei Verbosität verwendet wird. Dafür werden zwei Fallbeispiele gesprächsanalytisch untersucht. Diese stammen aus einem Korpus 34 videographierter ambulanter psychodynamischer Therapiesitzungen. Anhand des ersten Fallbeispiels wird deutlich, dass Verbosität als Widerstandsphänomen nicht nur patient*innenseitig geäußert wird, sondern gemeinsam mit dem*der Therapeut*in interaktiv hergestellt und forciert werden kann. Das zweite Beispiel zeigt, wie Widerstandsmanagement zu einer Auflösung des Widerstands führen kann. Die Analysen verdeutlichen zum einen auch, dass der psychoanalytische Widerstandsbegriff aus gesprächsanalytischer Sicht kritisch zu betrachten ist und zum anderen, dass beide Disziplinen nicht unbedingt zu den gleichen Ergebnissen kommen.
Kontrastiv-multilingual angelegte empirische Studien erfordern eine vergleichbare Datengrundlage. Je nachdem, welche Forschungsfragen im Zentrum der sprachvergleichenden Untersuchungen stehen, bieten sich entweder Parallelkorpora oder vergleichbare einzelsprachliche Korpora als Datengrundlage an. Dieser Beitrag verfolgt hauptsächlich das Ziel, die Herausforderungen aufzuzeigen, die die Arbeit mit vergleichbaren Korpora im multilingualen Sprachvergleich aufwirft. Dabei soll u.a. das Prinzip der Vergleichbarkeit von Korpora thematisiert und methodologische Vorschläge für konkrete empirisch angelegte sprachvergleichende Analysen vorgelegt werden. Die Möglichkeiten und Grenzen der empirisch basierten quantitativen und qualitativen Analysearbeit werden durch die Präsentation einiger exemplarischer Forschungsfragen und -ergebnisse aufgezeigt. Einige Desiderata für zukünftige korpusbasierte Studien auf der Basis von vergleichbaren Korpora im multilingualen Raum schließen den Beitrag ab.
Uneigentliches Reden, insbesondere die Schaffung und Verwendung von Metaphern und Metonymien, ist weit stärker sprachstrukturell lizenziert als es der kreativ-sprachspielerische Effekt vermuten lässt, der durch neue Tropen erzeugt wird. In diesem Beitrag wird es vor allem um das Konzept des paradigmatischen metaphorischen Musters gehen, dem zufolge die Wörter innerhalb eines Wortfelds ein ähnliches, auf abstrakten Merkmalen basierendes metaphorisches Potenzial entfalten. Dazu werde ich zunächst in Abschnitt 2 auf paradigmatische metonymische Muster eingehen, die in verschiedenen Kontexten und unter verschiedenen Bezeichnungen bereits häufiger untersucht wurden. In Abschnitt 3 werden grundlegende Überlegungen zur Metapher vorgestellt, und in Abschnitt 4 entwickle ich anhand verschiedener Beispiele das Konzept des metaphorischen Musters. In Abschnitt 5 wird der Zusammenhang zwischen metaphorischen Mustern und konzeptuellen Metaphern beleuchtet
The CLARIN Concept Registry (CCR) is the common semantic ground for most CMDI-based profiles to describe language-related resources in the CLARIN universe. While the CCR supports semantic interoperability within this universe, it does not extend beyond it. The flexibility of CMDI, however, allows users to use other term or concept registries when defining their metadata components. In this paper, we describe our use of schema.org, a light ontology used by many parties across disciplines.
In dem auf die Forschungsdaten sprach- und textbasierter Disziplinen ausgerichteten NFDI-Konsortium Text+ spielen Normdaten eine zentrale Rolle für die interoperable Beschreibung und semantische Verknüpfung von verteilten Datenquellen. Insbesondere die Gemeinsame Normdatei (GND) ist ein bedeutender Hub im Zentrum eines im Entstehen begriffenen, domänenübergreifenden Wissensgraphen. Diese Funktion soll im Rahmen von Text+ durch den Aufbau einer GND-Agentur für sprach- und textbasierte Forschungsdaten weiterentwickelt und ausgebaut werden. Ziel ist es, niedrigschwellige, qualitätsgesicherte Beteiligungsmöglichkeiten für Forschende zu schaffen und zugleich den Vernetzungsgrad der GND auch durch Terminologie-Mappings zu erweitern. Spezifische Anforderungen und Nutzungspraktiken werden hierbei anhand der Datendomänen von Text+ exemplifziert.
It was recently suggested in a study published in Nature Human Behaviour that the historical loosening of American culture was associated with a trade-off between higher creativity and lower order. To this end, Jackson et al. generate a linguistic index of cultural tightness based on the Google Books Ngram corpus and use this index to show that American norms loosened between 1800 and 2000. While we remain agnostic toward a potential loosening of American culture and a statistical association with creativity/order, we show here that the methods used by Jackson et al. are neither suitable for testing the validity of the index nor for establishing possible relationships with creativity/order.
In a previous study published in Nature Human Behaviour, Varnum and Grossmann claim that reductions in gender inequality are linked to reductions in pathogen prevalence in the United States between 1951 and 2013. Since the statistical methods used by Varnum and Grossmann are known to induce (seemingly) significant correlations between unrelated time series, so-called spurious or non-sense correlations, we test here whether the statistical association between gender inequality and pathogens prevalence in its current form also is the result of mis-specified models that do not correctly account for the temporal structure of the data. Our analysis clearly suggests that this is the case. We then discuss and apply several standard approaches of modelling time-series processes in the data and show that there is, at least as of now, no support for a statistical association between gender inequality and pathogen prevalence.
Sich selbst und andere politisch zu gesellschaftlichen Themen zu positionieren, ist eine elementare sprachliche und soziale Praxis. Ziel der Akademiekonferenz war es, zu verstehen, wie Positionierungen vollzogen werden, ob bzw. inwiefern sie politisch sind und in welchem wechselseitigen Zusammenhang sie zu gesellschaftlichen, sozialen und politischen Arrangements und Ordnungen stehen. Das Thema der politischen Positionierung wurde in sieben Panels durch unterschiedliche geistes- und sozialwissenschaftliche Disziplinen wie Linguistik, Soziologie, Geschichts-, Literatur- oder Politikwissenschaft bearbeitet. Die Fokussierung von sprachlichen Diskurspraktiken in diversen sozialen und politischen Zusammenhängen zog sich dabei als roter Faden durch die Beiträge.
Comprehending conditional statements is fundamental for hypothetical reasoning about situations. However, the online comprehension of conditional statements containing different conditional connectives is still debated. We report two self-paced reading experiments on German conditionals presenting the conditional connectives wenn (‘if’) and nur wenn (‘only if’) in identical discourse contexts. In Experiment 1, participants read a conditional sentence followed by the confirmed antecedent p and the confirmed or negated consequent q. The final, critical sentence was presented word by word and contained a positive or negative quantifier (ein/kein ‘one/no’). Reading times of the two quantifiers did not differ between the two conditional connectives. In Experiment 2, presenting a negated antecedent, reading times for the critical positive quantifier (ein) did not differ between conditional connectives, while reading times for the negative quantifier (kein) were shorter for nur wenn than for wenn. The results show that comprehenders form distinct predictions about discourse continuations due to differences in the lexical semantics of the tested conditional connectives, shedding light on the role of conditional connectives in the online interpretation of conditionals in general.
The question of whether a letter is a grapheme or not is a perennial issue in writing research. The answer depends on which criteria are used to differentiate between letters and graphemes and, ultimately,how the unit ‘grapheme’ is defined. This problem is particularly relevant to complex graphemes, i.e. sequences of letters that behave like a single grapheme in certain respects. Typical for German is the ‹ch›. This paper argues for a scalar concept of graphemes, which compares the grapheme status of each of the units under investigation. For this purpose, new criteria for the identification of complex graphemes are used, which originate from handwriting analysis. There, it is shown that complex graphemes are connected with each other disproportionately often and also have deviating letter forms disproportionately often.
Dieser Beitrag beschreibt die Motivation und Ziele hinter der Initiative Europäisches Referenzkorpus EuReCo. Ausgehend von den Desiderata, die sich aufgrund der Defizite verfügbarer Forschungsdaten wie monolinguale Korpora, Parallelkorpora und Vergleichskorpora für den Sprachvergleich ergeben, werden die bisherigen und die laufenden Arbeiten im Rahmen von EuReCo präsentiert und anhand vergleichender deutsch-rumänischer Kookkurrenzanalysen neue Perspektiven für kontrastive Korpuslinguistik, die die EuReCo-Initiative öffnet, skizziert.
Kontrastive Korpuslinguistik versteht sich als eine Bezeichnung für sprachvergleichende Studien, deren Ergebnisse mit Analysen sprachlicher Daten erreicht und empirisch fundiert sind. Die Bezeichnung contrastive corpus linguistics für eine neue, sich entwickelnde Disziplin wurde 1996 von Karin Aijmer und Bengt Altenberg (Schmied 2009: 1142) eingeführt. Der Einsatz der sprachlichen Korpora bei der Beschreibung kontrastiver Studien bedeutet in den 1990er-Jahren für die kontrastive Linguistik eine Wiederbelebung, nachdem die weit gesteckten Ziele und Hoffnungen in den 50er- und 60er-Jahren, die mit der Fremdsprachendidaktik zusammenhingen, vor etwa 50 Jahren aufgegeben wurden.
Kontrastive Korpuslinguistik
(2022)
Every Regional Dossier begins with an introduction about the region in question, followed by six chapters that each deal with a specific level of the education system (e.g. primary education). Chapters 8 and 9 cover the main lines of research into education of the minority language under discussion, and the prospects for the minority language in general and in education in particular, respectively. Chapter 10 provides a summary of statistics. Lists of (legal) references and useful addresses regarding the minority language are given at the end of the dossier.
Dieser Beitrag möchte einen Überblick über die Rolle geben, die die Regionalsprache Lettgallisch im Bildungssektor im Baltikum spielt. Zum einen soll in groben Zügen die historische gesellschaftliche Entwicklung des Lettgallischen mit einem Schwerpunkt auf dem Bildungsbereich dargestellt werden, zum anderen werden Entwicklungen der letzten Jahre diskutiert, in denen Diskurse und Einstellungen zum Lettgallischen eine Wandlung durchlaufen. Der theoretische Rahmen dafür sind internationale Diskussionen zu Regional- und Minderheitensprachen sowie Debatten in der Bildungspolitik. Damit soll nicht zuletzt Aufmerksamkeit für das Lettgallische in der deutschsprachigen Wahrnehmung des Baltikums generiert werden, das in einem Kompendium zu Bildungsgeschichte(n) im Baltikum nicht fehlen darf. Nach einer kurzen Einführung in die Region Lettgallen (Latgale) und das Lettgallische folgen aktuelle Beispiele für den sich ändernden Gebrauch des Lettgallischen und seine Einordung in Diskurse zu Minderheitensprachen. Schließlich wird auf jüngste politische Entwicklungen eingegangen, etwa im Kontext der Ausarbeitung neuer Lehrstandards für die staatlichen Schulen in Lettland.
Within a rapidly digitalising society, it is important to understand how the learning and teaching of digital skills play out in situ, particularly amongst older adults who acquire these skills later in life. This paper focuses on participants engaged in the process of learning digital skills in adult education courses. Using video recordings from adult education centres in Finland and Germany, we explore how students mobilise their teachers’ assistance when encountering problems with their smartphones, laptops or tablets. Prior research on social interaction has shown that assistance can be recruited through a variety of verbal and embodied formats. In this specific educational setting, participants can use complaints about their digital skills or mobile devices to obtain assistance. Utilising multimodal conversation analysis, we describe two basic sequence types involving students’ complaints, discuss their cross-linguistic characteristics, and reflect on their connection to this educational setting and digital devices.
The QUEST (QUality ESTablished) project aims at ensuring the reusability of audio-visual datasets (Wamprechtshammer et al., 2022) by devising quality criteria and curating processes. RefCo (Reference Corpora) is an initiative within QUEST in collaboration with DoReCo (Documentation Reference Corpus, Paschen et al. (2020)) focusing on language documentation projects. Previously, Aznar and Seifart (2020) introduced a set of quality criteria dedicated to documenting fieldwork corpora. Based on these criteria, we establish a semi-automatic review process for existing and work-in-progress corpora, in particular for language documentation. The goal is to improve the quality of a corpus by increasing its reusability. A central part of this process is a template for machine-readable corpus documentation and automatic data verification based on this documentation. In addition to the documentation and automatic verification, the process involves a human review and potentially results in a RefCo certification of the corpus. For each of these steps, we provide guidelines and manuals. We describe the evaluation process in detail, highlight the current limits for automatic evaluation and how the manual review is organized accordingly.
Metadata provides important information relevant both to finding and understanding corpus data. Meaningful linguistic data requires both reasonable annotations and documentation of these annotations. This documentation is part of the metadata of a dataset. While corpus documentation has often been provided in the form of accompanying publications, machinereadable metadata, both containing the bibliographic information and documenting the corpus data, has many advantages. Metadata standards allow for the development of common tools and interfaces. In this paper I want to add a new perspective from an archive’s point of view and look at the metadata provided for four learner corpora and discuss the suitability of established standards for machine-readable metadata. I am are aware that there is ongoing work towards metadata standards for learner corpora. However, I would like to keep the discussion going and add another point of view: increasing findability and reusability of learner corpora in an archiving context.
Sometimes in interaction, a speaker articulates an overt interpretation of prior talk. Such moments have been studied as involving the repair of a problem with the other’s talk or as formulating an understanding of the matter at hand. Stepping back from the established notions of formulations and repair, we examine the variety of actions speakers do with the practice of offering an interpretation, and the order within this domain. Results show half a dozen usage types of interpretations in mundane interaction. These form a largely continuous territory of action, with recognizably distinct usage types as well as cases falling between these (proto)typical uses. We locate order in the domain of interpretations using the method of semantic maps and show that, contrary to earlier assumptions in the literature, interpretations that formulate an understanding of the matter at hand are actually quite pervasive in ordinary talk. These findings contribute to research on action formation and advance our understanding of understanding in interaction. Data are video- and audio-recordings of mundane social interaction in the German language from a variety of settings.
In this paper, we deal with register-driven variation from a probabilistic perspective, as proposed in Schäfer, Bildhauer, Pankratz, Müller (2022). We compare two approaches to analyse this variation within HPSG. On the one hand, we consider a multiple-grammar approach and combine it with the architecture proposed in the CoreGram project Müller (2015) - discussing its advantages and disadvantages. On the other hand, we take into account a single-grammar approach and argue that it appears to be superior due to its computational efficiency and cognitive plausibility.
Das Lehnwortportal Deutsch (LWPD) ist ein Online-Informationssystem zu Entlehnungen von Wörtern aus dem Deutschen in andere Sprachen. Es beruht auf einer wachsenden Zahl von lexikographischen Ressourcen zu verschiedenen Sprachen und bietet eine einfache ressourcenübergreifende Suchfunktion an. Das Poster präsentiert eine derzeit in Entwicklung befindliche onomasiologische Suchfunktion für das LWPD.
Vorgestellt wird das Korpus deutschsprachiger Songtexte als innovative Sprachdatenquelle für interdisziplinäre Untersuchungsszenarien und speziell für den Einsatz im Fremd- und Zweitsprachenunterricht. Die Ressource dokumentiert Eigenschaften konzeptioneller Schriftlichkeit und konzeptioneller Mündlichkeit und erlaubt empirisch begründete Analysen sprachlicher Phänomene bzw. Tendenzen in den Texten moderner Popmusik. Vorgestellt werden Design, Annotationen und Anwendungsbeispiele des in thematische und autorenspezifische Archive stratifizierten Korpus.
In this article we examine moments in which parents or other caregivers overtly invoke rules during episodes in which they take issue with, intervene against, and try to change a child’s ongoing behavior or action(s). Drawing on interactional data from four different languages (English, Finnish, German, Polish) and using Conversation Analytic methods, we first illustrate the variety of ways in which parents may use such overt rule invocations as part of their behavior modification attempts, showing them to be functionally versatile interactional objects. Their interactional flexibility notwithstanding, we find that parents typically invoke rules when, in the course of the intervention episode, they encounter trouble with achieving an acceptable compliant outcome. To get at the distinct import of rule formulations in this context, we then compare them to two sequential alternatives: parental expressions of an experienced negative affective state, and parental threats. While the former emphasize aspects of social solidarity, the latter seek to enforce compliance by foregrounding a power asymmetry between the parent and the child. Rule formulations, by contrast, are designedly impersonal and appear to be directed at what the parents construe as shortcomings in common-sense practical reasoning on the child’s part. Reflexively, the child is thereby cast as not having properly applied common-sense ‘practical reason’ when engaging in what is treated as the problematic behavior or action. Overt rule invocations can, therefore, be understood as indexical appeals to practical reason.
Cette contribution se concentre sur les locuteurs de l’allemand en situation minoritaire dans le Caucase. Il s’agit de descendants d’anciennes minorités allemandes de l’Empire russe et de l’Union soviétique, qui ont émigré vers les territoires transcaucasiens en plusieurs phases à partir de la fin du xviiie siècle. Les personnes interrogées sont celles qui, en raison de mariages interethniques, ont évité les déportations de 1941 et vivent toujours dans le Caucase du Sud. Avec les méthodes caractéristiques de la sociolinguistique, l’auteure a enregistré, transcrit et analysé des entretiens formels semi-dirigés effectués en 2017 dans le Caucase du Sud avec deux générations de descendants. L’article présente la situation des variétés de l’allemand (dialecte souabe et allemand standard) et de leurs locuteurs dans des constellations de langues en contact dans le Caucase ainsi que les actions menées par différents groupes d’acteurs pour préserver la langue et la culture allemandes en Géorgie.
Le bas allemand, répandu dans le tiers nord de l’Allemagne, est une langue régionale dont l’existence est menacée. Elle compte certes encore un grand nombre de locuteurs, mais ceux-ci présentent une structure d’âge très défavorable. Depuis deux générations, la transmission de la langue au sein des familles n’est plus assurée et l’ensemble des locuteurs est fortement vieillissant. Il existe cependant une pratique de théâtre amateur très vivante dans le nord de l’Allemagne : 3 000 troupes de théâtre jouent en effet en bas allemand. Or ces petites unités organisationnelles touchent justement les jeunes avec leurs offres et leur ouvrent l’accès à la langue régionale. Une enquête menée en ligne en 2017 par le Leibniz-Institut für Deutsche Sprache et l’Institut für niederdeutsche Sprache auprès des troupes de théâtre amateur a montré que ces groupes peuvent offrir un cadre stable pour l’utilisation du bas allemand. De nombreux participants à cette enquête ont indiqué que la possibilité d’utiliser le bas allemand constituait pour eux une motivation importante pour participer à leur troupe de théâtre respective.
This paper presents the Lehnwortportal Deutsch, a new, freely accessible publication platform for resources on German lexical borrowings in other languages, to be launched in the second half of 2022. The system will host digital-native sources as well as existing, digitized paper dictionaries on loanwords, initially for some 15 recipient languages. All resources remain accessible as individual standalone dictionaries; in addition, data on words (etyma, loanwords etc.) together with their senses and relations to each other is represented as a cross-resource network in a graph database, with careful distinction between information present in the original sources and the curated portal network data resulting from matching and merging information on, e. g., lexical units appearing in multiple dictionaries. Special tooling is available for manually creating graphs from dictionary entries during digitization and for editing and augmenting the graph database. The user interface allows users to browse individual dictionaries, navigate through the underlying graph and ‘click together’ complex queries on borrowing constellations in the graph in an intuitive way. The web application will be available as open source.
The public as linguistic authority: Why users turn to internet forums to differentiate between words
(2022)
This paper addresses the question of why we face unsatisfactory German dictionary entries when looking up and comparing two similar lexical terms that are loan words, new words, (near) synonyms, or confusables. It explains how users are aware of existing reference works but still search or post on language forums, often after consulting a dictionary and experiencing a range of dictionary based problems. Firstly, these dictionary based difficulties will be scrutinised in more detail with respect to content, function, presentation, and the language of definitions. Entries documenting loan words and commonly confused pairs from different lexical reference resources serve as examples to show the short comings. Secondly, I will explain why learning about your target group involves studying discussion forums. Forums are a valuable source for detailed user studies, enabling the examination of different communicative needs, concrete linguistic questions, speakers’ intuitions, and people’s reactions to posts and comments. Thirdly, with the help of two examples I will describe how the study of chats and forums had a major impact on the development of a recently compiled German dictionary of confusables. Finally, that same problem solving approach is applied to the idea of a future dictionary of neologisms and their synonyms.
Dictionaries are often a reflection of their time; their respective (socio-)historical context influences how the meaning of certain lexical units is described. This also applies to descriptions of personal terms such as man or woman. Lexicographers have a special responsibility to comprehensively investigate current language use before describing it in the dictionary. Accordingly, contemporary academic dictionaries are usually corpus-based. However, it is important to acknowledge that language is always embedded in cultural contexts. Our case study investigates differences in the linguistic contexts of the use of man and woman, drawing from a range of language collections (in our case fiction books, popular magazines and newspapers). We explain how potential differences in corpus construction would therefore influence the “reality” depicted in the dictionary. In doing so, we address the far-reaching consequences that the choice of corpus-linguistic basis for an empirical dictionary has on semantic descriptions in dictionary entries.Furthermore, we situate the case study within the context of gender-linguistic issues and discuss how lexicographic teams can engage with how dictionaries might perpetuate traditional role concepts when describing language use.
Tok Pisin is a pidgin/creole language spoken since the late 19th century in most of the area that nowadays constitutes Papua New Guinea where it emerged under German colonial rule. Unusual for a pidgin/creole, Tok Pisin is characterized by a extensive lexicographic history. The Tok Pisin Dictionary Collection at the Leibniz Institute for the German Language, described in this article, includes about fifty dictionaries. The collection forms the basis for the sketch of the history of Tok Pisin lexicography as part of colonial history presented here. The basic thesis is that in the history of Tok Pisin, lexicographic strat egies, dictionary structures, and publication patterns reflect the interest (and disinterest) of various groups of colonial actors. Among these colonial actors, European scientists, Catholic missionaries, and the Australian and US militaries played important roles.
In semantic fieldwork, it is common to use a language other than the language under investigation for presenting linguistic materials to the language consultants, e.g. discourse contexts in acceptability judgment tasks. Previous works commenting on the use of a ‘meta-language’ or ‘language of wider communication’ in this sense (AnderBois and Henderson 2015; Matthewson 2004) have argued that this practice is not methodologically inferior to the exclusive use of the object language for elicitation, but that the fieldworker needs to be alert to potential influences of the meta-language or, indeed, the object language, on the elicited judgments. Thus, the choice of a language for presenting discourse contexts is an integral component of fieldwork methodology. This paper provides a research report with a focus on this component. It describes a multilingual fieldwork setting offering several potential meta-languages, which the fieldworker and the consultants master to varying degrees. The choice of the languages in this setting is discussed with regard to methodological, social and practical considerations and related to selected, more general methodological questions regarding semantic fieldwork practice.
This contribution investigates the use of the Czech particle jako (“like”/“as”) in naturally occurring conversations. Inspired by interactional research on unfinished or suspended utterances and on turn-final conjunctions and particles, the analysis aims to trace the possible development of jako from conjunction to a tag-like particle that can be exploited for mobilizing affiliative responses. Traditionally, jako has been described as conjunction used for comparing two elements or for providing a specification of a first element [“X (is) like Y”]. In spoken Czech, however, jako can be flexibly positioned within a speaking turn and does not seem to operate as a coordinating or hypotactic conjunction. As a result, prior studies have described jako as a polyfunctional particle. This article will try to shed light on the meaning of jako in spoken discourse by focusing on its apparent fuzzy or “filler” uses, i.e., when it is found in a mid-turn position in multi-unit turns and in the immediate vicinity of hesitations, pauses, and turn suspensions. Based on examples from mundane, video-recorded conversations and on a sequential and multimodal approach to social interaction, the analyses will first show that jako frequently frames discursive objects that co-participants should respond to. By using jako before a pause and concurrently adopting specific embodied displays, participants can more explicitly seek to mobilize responsive action. Moreover, as jako tends to cluster in multi-unit turns involving the formulation of subjective experience or stance, it can be shown to be specifically designed for mobilizing affiliative responses. Finally, it will be argued that the potential of jako to open up interactive turn spaces can be linked to the fundamental comparative semantics of the original conjunction.
Die »Prestigeveranstaltung Olympische Spiele« (ebd.) war Gegenstand eines höchst komplexen multimodalen und multimedialen, in allen semiotischen Dimensionen stattfindenden Diskurses. Aus kulturlinguistischer Sicht war der Diskurs der Olympischen Spiele von 1936 ein sprachliches Realisat, in dem sich Faktoren einer sprachlichen Sozialgeschichte verdichteten. Der Hauptfokus ist im Folgenden auf die Frage gerichtet, wie und mit welchen kommunikativen Praktiken Beteiligte aus entgegengesetzten Diskurspositionen auf die Olympischen Spiele Bezug nahmen, um die aufgrund je spezifischer Haltungen zu den Spielen konträren Ereigniskonstitutionen ›olympische Sommerspiele‹ sichtbar zu machen.
Gegenstand des nachfolgenden Beitrags sind emotionale Positionierungen. Auf der Grundlage dieser Egodokumente, die 1934 entstanden sind und die von den Jahren vom Ersten Weltkrieg bis zum Jahr 1934, mit der Kernzeit der Weimarer Republik, erzählen, wird nach der Funktion von Gefühlsthematisierungen gefragt. Dabei wird vorausgesetzt, dass gerade in der sogenannten »Bewegungsphase« der NSDAP, der Phase des Aufstiegs zwischen Mitte der 1920er Jahre bis zur Machtübergabe 1933, bei aller Politisierung der Akteure dennoch Emotion und Affekt von großer, den Nationalsozialismus stabilisierender Bedeutung waren. Der nachfolgende emotionsgeschichtlich orientierte Versuch wird also auf der Grundlage retrospektiver sprachlicher Konstituierungen seitens der NSDAP-Mitglieder nach 1933 rekonstruiert. Sie formulieren diese Retrospektiven nach dem aus ihrer Sicht erfolgreichen Ende des »Kampfes«.
When comparing different tools in the field of natural language processing (NLP), the quality of their results usually has first priority. This is also true for tokenization. In the context of large and diverse corpora for linguistic research purposes, however, other criteria also play a role – not least sufficient speed to process the data in an acceptable amount of time. In this paper we evaluate several state of the art tokenization tools for German – including our own – with regard to theses criteria. We conclude that while not all tools are applicable in this setting, no compromises regarding quality need to be made.
Olaf Scholz gendert. Eine Analyse von Personenbezeichnungen in Weihnachts- und Neujahrsansprachen
(2022)
Schlagzeilen wie die in unserer Überschrift blieben im Januar 2022 aus. Dabei enthielt die erste Neujahrsansprache von Olaf Scholz kein einziges generisches Maskulinum, sondern Doppelformen (Mitbürgerinnen und Mitbürger, Expertinnen und Experten), geschlechtsabstrahierende Ausdrücke (Eltern, Familien, Geimpfte, Menschen) und Personalisierungen bzw. Umschreibungen wie uns allen, es haben sich 60 Millionen […] impfen lassen, oder ich möchte allen danken. Die Rede nutzt somit durchgängig verschiedene Formen geschlechtergerechter Sprache, wohl aber so unauffällige Formen, dass dies keine mediale Aufmerksamkeit auf sich gezogen hat. Nebenbei: Dies zeigt, dass es bei den hitzigen öffentlichen Diskussionen rund um das Thema nicht um alle Formen geschlechtergerechter Sprache geht, sondern eigentlich nur um bestimmte Formen, wie z.B. die Verwendung des Gendersterns. Wir stellen hier einige Beobachtungen basierend auf einem annotierten Korpus von Ansprachen vor, die Sie selbst anhand einer Online-App nachvollziehen können.
Aus Platzgründen musste in der Druckfassung des Artikels „Beobachtungen zu Frequenz und Funktionen von ja in deutscher Spontansprache“ (in: Deutsche Sprache 50, S. 336–363; https://doi.org/10.37307/j.1868-775X.2022.04.04) auf den Abdruck der illustrierenden Abbildungen 2–18 im Abschnitt 5.2 verzichtet werden. Das entsprechende Kapitel inklusive aller Abbildungen ist hier abrufbar.
Bauchschmerzen bei Kindern sind häufig, aber glücklicherweise meist ohne schwerwiegende Ursache. Sogar starke oder wiederkehrende Bauchschmerzen haben oftmals keinen organischen Ursprung. Dennoch erfolgt bei Kindern mit häufigen Bauchschmerzen in der Regel eine umfangreiche und für alle Beteiligten belastende diagnostische Abklärung – teilweise sogar ohne seriösen, hilfreichen Befund. Idealerweise sollte bereits im Gespräch mit einem fachkundigen Arzt deutlich werden, ob die Schmerzen somatischen oder psychosomatischen Ursprungs sind, um überflüssige und teure Untersuchungsmaßnahmen einzusparen. An dieser Stelle kommt die Gesprächsforschung zum Einsatz: Für die Unterscheidung von organischen und psychisch bedingten Anfallsereignissen konnte gezeigt werden, dass die entscheidenden Hinweise zur Diagnose nicht nur in den geschilderten Fakten liegen, sondern auch in der Art, wie die Betroffenen selbst über ihr Problem reden und mit dem Arzt interagieren. Diese Hinweise lassen sich zielgenau durch gesprächslinguistische Analysen erfassen (vgl. Opp/Frank-Job/Knerich 2015). Für epileptische vs. dissoziative Anfälle konnte dies bereits belegt und in klinischen Studien validiert werden (vgl. Schwabe/Howell/Reuber 2007). In Anknüpfung an das genannte Projekt wird in dieser Dissertation überprüft, ob und inwieweit die Befunde aus der Anfallsforschung auch auf eine andere Erkrankung und Patientinnengruppe übertragen werden können. Für diesen Zweck werden dyadische Interaktionen junger Patientinnen mit Medizinerinnen während einer spezifischen Form und Phase der Anamnese analysiert: Der analytische Kern der Arbeit thematisiert die Interaktion der Beteiligten beim zeichnerischen Umsetzen von Bauchschmerzen. Dabei zeigt sich die interaktiv hervorgebrachte Positionierung der Patientinnen zur Malaufgabe als zentral und entsprechend diagnostisch relevant: Während Patientinnen, deren Schmerzen organischen Ursprungs sind, dazu tendieren, die Malaufgabe mit redundanten Informationen pflichtgemäß zu erfüllen, neigen Patientinnen, die an funktionellen Beschwerden leiden, hingegen dazu, die Malaufgabe als Chance zur Aktualisierung der Beschwerdenschilderung zu sehen. Diese Erkenntnisse lassen sich in Form einer Diagnosetabelle zusammenfassen und konstituieren damit die Basis für einen gesprächsanalytischen Anwendungsbezug, der die medizinische Forschung und Ausbildung um ein innovatives Diagnostikverfahren bereichern kann.
The article investigates the hypothesis that prominence phenomena on different levels of linguistic structure are systematically related to each other. More specifically, it is hypothesized that prominence relations in morphosyntax reflect, and contribute to, prominence management in discourse. This hypothesis is empirically based on the phenomenon of agentivity clines, i.e. the observation that the relevance of agentivity features such as volition or sentience is variable across different constructions. While some constructions, including German DO-clefts, show a strong preference for highly agentive verbs, other constructions, including German basic active constructions, have no particular requirements regarding the agentivity of the verb, except that at least one agentivity feature should be present. Our hypothesis predicts that this variable relevance of agentivity features is related to the discourse constraints on the felicitous use of a given construction, which in turn, of course, requires an explicit statement of such constraints. We propose an original account of the discourse constraints on DO-clefts in German using the ‘Question Under Discussion’ framework. Here, we hypothesize that DO-clefts render prominent one implicit question from a set of alternative questions available at a particular point in the developing discourse. This then yields a prominent question-answer pair that changes the thematic structure of the discourse. We conclude with some observations on the possibility of relating morphosyntactic prominence (high agentivity) to discourse prominence (making a Question Under Discussion prominent by way of clefting).