Refine
Year of publication
Document Type
- Part of a Book (1761)
- Article (1170)
- Conference Proceeding (442)
- Book (214)
- Other (100)
- Review (61)
- Working Paper (48)
- Part of Periodical (28)
- Doctoral Thesis (25)
- Report (17)
Language
- German (2834)
- English (961)
- French (22)
- Multiple languages (18)
- Russian (14)
- Spanish (11)
- Portuguese (9)
- Ukrainian (5)
- Latvian (3)
- Polish (3)
Keywords
- Deutsch (1505)
- Korpus <Linguistik> (544)
- Konversationsanalyse (208)
- Gesprochene Sprache (176)
- Wörterbuch (176)
- Grammatik (162)
- Interaktion (153)
- Kommunikation (140)
- Sprachgebrauch (139)
- Computerlinguistik (136)
Publicationstate
- Veröffentlichungsversion (3883) (remove)
Reviewstate
- (Verlags)-Lektorat (2490)
- Peer-Review (1008)
- Verlags-Lektorat (79)
- Peer-review (37)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (33)
- Review-Status-unbekannt (12)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (5)
- (Verlags-)Lektorat (4)
- Verlagslektorat (4)
- Peer-Revied (3)
Publisher
- de Gruyter (621)
- Institut für Deutsche Sprache (354)
- Leibniz-Institut für Deutsche Sprache (IDS) (223)
- Narr (206)
- IDS-Verlag (108)
- Lang (97)
- Niemeyer (90)
- De Gruyter (59)
- Verlag für Gesprächsforschung (51)
- Association for Computational Linguistics (44)
Die vorliegende empirisch basierte Studie zu Verwendungsweisen von ‘wenn' in gesprochenem Deutsch versteht sich als kleiner Beitrag zur Konnektorensemantik. Anhand eines Korpus gesprochener Sprache werden im ersten Schritt die Bedeutungsvarianten von wenn auf der Basis der Oppositionspaare ‘faktisch' vs. ‘nicht-faktisch’ und ‘generisch' vs. ‘spezifisch' typologisiert und im Hinblick auf ihre syntaktischen Spezifika untersucht. Im zweiten Schritt wird gezeigt, wie die so ermittelten Typen von wenn-Relationen mit den in Sweetser (1990) ausgefiihrten Verknüpfungsdomänen (Sachverhaltsebene, epistemische Ebene, Sprechaktebene), die durch pragmatische Ambiguität gekennzeichnet sind, korrelieren.
Wenn ich am Ende dieses Jahres an die Diskussionen zur deutschen Sprache zurückdenke, die ich bei Medienauftritten und in Veranstaltungen geführt habe, dann ist dabei immer wieder eine ganz bestimmte Frage gestellt worden: Wer entscheidet eigentlich darüber, wie wir sprechen und schreiben, was wir sagen dürfen und was nicht? Wer hat die Entscheidungsbefugnis über die Aufnahme neuer Wörter ins Deutsche, über gendergerechte Sprache oder über Rechtschreibregeln?
Ob und welche kritischen Phasen für den Zweitspracherwerb existieren, wird im Hinblick auf Erwerbsverlauf und Erwerbsgeschwindigkeit kontrovers diskutiert. Für den Vergleich mit einsprachigen Lernern bietet der frühe Zweitspracherwerb ein ideales Untersuchungsfeld, da hier der Kontakt zur zweiten Sprache mit etwa drei Jahren, noch während des Erstspracherwerbs, einsetzt. Im vorliegenden Beitrag wird am Beispiel der w-Fragen untersucht, wie frühe Zweitsprachlerner die Interpretation von syntaktisch-semantisch komplexen Strukturen meistern. Die längsschnittlichen Daten wurden im Rahmen des Forschungsprojekts MILA mit dem Untertest w-Fragen aus LiSe-DaZ erhoben. Quantitative und qualitative Analysen belegen, dass sich die untersuchten frühen Zweitsprachlerner weder im Erwerbsverlauf noch in den Erwerbsmustern von den einsprachigen Lernern unterscheiden und dass sie ihnen in Bezug auf die Erwerbsgeschwindigkeit sogar überlegen sind. Für den w-Fragen-Erwerb ist folglich das Ende der kritischen Phase nicht vor dem dritten Geburtstag anzusetzen.
Im Mittelpunkt der vorliegenden Untersuchung stehen ausgewählte deutschsprachige Werbeslogans mit hohem Wiedererkennungswert und einer Tendenz zur Usualisierung im aktuellen Sprachgebrauch. Ihre angesichts des häufigen Gebrauchs durch zahlreiche Sprecher begründete bzw. angenommene lexikalische Verfestigung wird korpusinformiert anhand umfangreicher elektronischer Korpora validiert und rekonstruiert. Für die Beschreibung ihrer Verwendungsspezifik als eigenständige satzwertige Wortschatzeinheiten außerhalb der Domäne Werbung wird das Modell der usuellen Wortverbindungen sowie die korpuslinguistische Methodologie angewendet und mit weiteren qualitativen und quantitativen Methoden gekoppelt. In den detaillierten lexikografischen Beschreibungen ausgewählter Slogans werden sprachliche, kontextuelle und funktionale Aspekte dargestellt und die Mikrodiachronie ihres Gebrauchs in Zeitverlaufsgrafiken illustriert.
Forms of verbal violence, such as Hate Speech and Cyberbullying, currently are issues with high societal relevance. In the social discourse they are associated with brutalization of social interaction. Against this background it is necessary to integrate the topic into school lessons. This chapter outlines a teaching unit on verbal violence in the digital age. It has been developed together with students and can therefore be used in German classes but it is also relevant for use in academic teaching.
We propose a new type of subword embedding designed to provide more information about unknown compounds, a major source for OOV words in German. We present an extrinsic evaluation where we use the compound embeddings as input to a neural dependency parser and compare the results to the ones obtained with other types of embeddings. Our evaluation shows that adding compound embeddings yields a significant improvement of 2% LAS over using word embeddings when no POS information is available. When adding POS embeddings to the input, however, the effect levels out. This suggests that it is not the missing information about the semantics of the unknown words that causes problems for parsing German, but the lack of morphological information for unknown words. To augment our evaluation, we also test the new embeddings in a language modelling task that requires both syntactic and semantic information.
What is a sentient agent?
(2018)
This study aims to establish what lexical factors make it more likely for dictionary users to consult specific articles in a dictionary using the English Wiktionary log files, which include records of user visits over the course of 6 years. Recent findings suggest that lexical frequency is a significant factor predicting look-up behavior, with the more frequent words being more likely to be consulted. Three further lexical factors are brought into focus: (1) age of acquisition; (2) lexical prevalence; and (3) degree of polysemy operationalized as the number of dictionary senses. Age of acquisition and lexical prevalence data were obtained from recent published studies and linked to the list of visited Wiktionary lemmas, whereas polysemy status was derived from Wiktionary entries themselves. Regression modeling confirms the significance of corpus frequency in explaining user interest in looking up words in the dictionary. However, the remaining three factors also make a contribution whose nature is discussed and interpreted. Knowing what makes dictionary users look up words is both theoretically interesting and practically useful to lexicographers, telling them which lexical items should be prioritized in lexicographic work.
We report results from an exploratory study of college students’ conceptions of poetry in which we asked them to name three things they expect from a poem. Frequency- and list-based analyses of their responses revealed that they primarily expect poems to rhyme, but they also identified a number of form-, content-, and reception-related genre expectations, which we discuss in relation to relevant previous research. We propose that rhyme’s predominance in college students’ genre expectations reflects its perceptual and cognitive salience during incremental poetry comprehension rather than its frequency in contemporary poetic practice. Our results characterize the genre conceptions of the population that empirical studies of poetry comprehension typically investigate, and thus provide relevant background information for the interpretation of empirical
findings in this field.
This study investigates other-initiated repair and its embodied dimension in casual English as lingua franca (ELF) conversations, thereby contributing to the further understanding of multimodal repair practices in social interaction. Using multimodal conversation analysis, we focus on two types of restricted other-initiation of repair (OIR): partial repeats preceded or followed by the question word what (i.e., what X?/X what?) and copular interrogative clauses (i.e., what is X). Partial repeats with what produced with rising final intonation are consistently accompanied by a head poke and treated as relating to troubles in hearing, with the repair usually consisting of a repeat. In contrast to these partial repeats, copular interrogative clauses are produced with downward final intonation and accompanied by face-related embodied conduct. The what is X OIRs primarily target code-switched lexical items, the understanding of which is critical for maintaining the repair initiator’s involvement in the ongoing sequence. This study also contributes some general reflections on the possible complexity of OIR and repair practices from a multimodal perspective.
Having the necessary skills for staying in contact with friends and relatives through digital devices is crucial in today’s world. As the current COVID-19 pandemic shows, this holds especially true for the elderly. Being quarantined and restricted from physically meeting people, various communication technologies are more important than ever for staying social and informed on current events. In nursing homes, staff members are now finding new ways for staying in touch with family members by assisting residents in making video calls with mobile devices.
But what if elderly people cannot rely on personal assistance for accessing these alternative means of communication? This raises the general question of how older people can and do learn to use such technologies. Although the internet is full of guides and instructional videos on how to use smartphones or tablets, they are a cold comfort to someone who may not even know what an internet browser is.
Especially for digital newcomers, the tried and true method of face-to-face instruction is invaluable. While many older people turn to their children or grandchildren for help in all things digital, courses specifically tailored for elderly users are also increasingly popular.
More and more governmental initiatives and associations indeed acknowledge the already existing interest of elderly citizens in digital tools and their growing need to receive customized training (e.g. “SeniorSurf” and “Kansalaisen digitaidot” in Finland or “Silver Tipps” in Germany). For a researcher of social interaction, these courses can also provide a valuable window for discovering what it looks and sounds like to learn to use essential but sometimes alien technologies.
This paper reports on the latest developments of the European Reference Corpus EuReCo and the German Reference Corpus in relation to three of the most important CMLC topics: interoperability, collaboration on corpus infrastructure building, and legal issues. Concerning interoperability, we present new ways to access DeReKo via KorAP on the API and on the plugin level. In addition we report about advancements in the EuReCo- and ICC-initiatives with the provision of comparable corpora, and about recent problems with license acquisitions and our solution approaches using an indemnification clause and model licenses that include scientific exploitation.
The following analysis explores the nature of everyday activities of people in economic leadership positions. It inquires as to the institutions and people they are in contact with, and the way they communicate with them. First, I will present existing studies in this field and the ethnographic procedure of this study. I will then describe the communicative activities of high-level personnel and their communication networks based on observations. These are then linked to their communicative tasks and types of interaction. Finally, I will discuss some characteristics of the communicative style.
When appearance does not match accent: neural correlates of ethnicity-related expectancy violations
(2017)
Most research on ethnicity in neuroscience and social psychology has focused on visual cues. However, accents are central social markers of ethnicity and strongly influence evaluations of others. Here, we examine how varying auditory (vocal accent) and visual (facial appearance) information about others affects neural correlates of ethnicity-related expectancy violations. Participants listened to standard German and Turkish-accented speakers and were subsequently presented with faces whose ethnic appearance was either congruent or incongruent to these voices. We expected that incongruent targets (e.g. German accent/Turkish face) would be paralleled by a more negative N2 event-related brain potential (ERP) component. Results confirmed this, suggesting that incongruence was related to more effortful processing of both Turkish and German target faces. These targets were also subjectively judged as surprising. Additionally, varying lateralization of ERP responses for Turkish and German faces suggests that the underlying neural generators differ, potentially reflecting different emotional reactions to these targets. Behavioral responses showed an effect of violated expectations: German-accented Turkish-looking targets were evaluated as most competent of all targets. We suggest that bringing together neural and behavioral measures of expectancy violations, and using both visual and auditory information, yields a more complete picture of the processes underlying impression formation.
Recipient design is a key constituent of intersubjectivity in interaction. Recipient design of turns is informed by prior knowledge about and shared experience with recipients. Designing turns in order to be maximally effective for the particular recipient(s) is crucial for accomplishing intersubjectively coordinated action. This paper reports on a specific pragmatic structure of recipient design, i.e. counter-factual recipient design, and how it impinges on intersubjectivity in interaction. Based on an analysis of video-recordings data from driving school lessons in German, two kinds of counterfactual recipient design of instructors' requests are distinguished: pedagogic and egocentric turn-design. Counterfactual, pedagogic turn-design is used strategically to diagnose student skills and to create opportunities for corrective instructions. Egocentric turn-design rests on private, non-shared knowledge of the instructor. Egocentrically designed turns imply expectations of how to comply with requests which cannot be recovered by the student and which lead to a breakdown of intersubjective cooperation. This paper identifies practices, sources and interactional consequences of these two kinds of counterfactual recipient design. In addition, the study enhances our understanding of recipient design in at least three ways. It shows that recipient design does not only concern referential and descriptive practices, but also the indexing intelligible projections of next actions; it highlights the productive, other-positioning effects of recipient design; it argues that recipient design should be analyzed in terms of temporally extended interactional trajectories, linking turn-constructional practices to interactional histories and consecutive trajectories of joint action.
N-grams are of utmost importance for modern linguistics and language theory. The legal status of n-grams, however, raises many practical questions. Traditionally, text snippets are considered copyrightable if they meet the originality criterion, but no clear indicators as to the minimum length of original snippets exist; moreover, the solutions adopted in some EU Member States (the paper cites German and French law as examples) are considerably different. Furthermore, recent developments in EU law (the CJEU's Pelham decision and the new right of newspaper publishers) also provide interesting arguments in this debate. The proposed paper presents the existing approaches to the legal protection of n-grams and tries to formulate some clear guidelines as to the length of n-grams that can be freely used and shared.
N-grams are of utmost importance for modern linguistics and language technology. The legal status of n-grams, however, raises many practical questions. Traditionally, text snippets are considered copyrightable if they meet the originality criterion, but no clear indicators as to the minimum length of original snippets exist; moreover, the solutions adopted in some EU Member States (the paper cites German and French law as examples) are considerably different. Furthermore, recent developments in EU law (the CJEU's Pelham decision and the new right of press publishers) also provide interesting arguments in this debate. The paper presents the existing approaches to the legal protection of n-grams and tries to formulate some clear guidelines as to the length of n-grams that can be freely used and shared.
Research on multimodal interaction has shown that simultaneity of embodied behavior and talk is constitutive for social action. In this study, we demonstrate different temporal relationships between verbal and embodied actions. We focus on uses of German darf/kann ich? (“may/can I?”) in which speakers initiate, or even complete the embodied action that is addressed by the turn before the recipient’s response. We argue that through such embodied conduct, the speaker bodily enacts high agency, which is at odds with the low deontic stance they express through their darf/kann ich?-TCUs. In doing so, speakers presuppose that the intersubjective permissibility of the action is highly probable or even certain. Moreover, we demonstrate how the speaker’s embodied action, joint perceptual salience of referents, and the projectability of the action addressed with darf/kann ich? allow for a lean syntactic design of darf/kann ich?-TCUs (i.e., pronominalization, object omission, and main verb omission). Our findings underscore the reflexive relationship between lean syntax, sequential organization and multimodal conduct.
It is widely assumed that there is a natural, prelinguistic conceptual domain of time whose linguistic organization is universally structured via metaphoric mapping from the lexicon and grammar of space and motion. We challenge this assumption on the basis of our research on the Amondawa (Tupi Kawahib) language and culture of Amazonia. Using both observational data and structured field linguistic tasks, we show that linguistic space-time mapping at the constructional level is not a feature of the Amondawa language, and is not employed by Amondawa speakers (when speaking Amondawa). Amondawa does not recruit its extensive inventory of terms and constructions for spatial motion and location to express temporal relations. Amondawa also lacks a numerically based calendric system. To account for these data, and in opposition to a Universal Space-Time Mapping Hypothesis, we propose a Mediated Mapping Hypothesis, which accords causal importance to the numerical and artefact-based construction of time-based (as opposed to event-based) time interval systems.
This White Paper sets out commonly agreed definitions on activities of consortia within NFDI. It aims to provide a common basis for reporting and reference regarding selected questions of cross-consortial relevance in DFG’s template for the Interim Reports. The questions were prioritised by an NFDI Task Force on Evaluation and Reporting (formerly Task Force Monitoring) as a result of discussing possible answers to the DFG template. In this process the need to agree on a generalizable meaning of terms commonly used in the context of NFDI, and reporting in particular, were identified from cross-consortial perspectives. Questions that showed the highest requirement on clarification are discussed in this White Paper. As NFDI evolves, the Task Force will likely propose further joint approaches for reporting in information infrastructures.
While each of broad relevance, the questions addressed relate to substantially different aspects of consortia’s work. They are thus also structured slightly different.
In der Bund-Länder-Vereinbarung (BLV) zu Aufbau und Förderung einer Nationalen Forschungsdateninfrastruktur (NFDI) (im Folgenden BLV-NFDI) wird in §1 festgehalten, dass mit der Förderung "eine Etablierung und Fortentwicklung eines übergreifenden Forschungsdatenmanagements" und damit eine "Steigerung der Effizienz des gesamten Wissenschaftssystems verfolgt" wird. In der BLV-NFDI werden dazu sieben Ziele vorgegeben, die eine Verfeinerung dieser Hauptziele darstellen. Dieses White Paper formuliert das gemeinsame Verständnis der beteiligten Konsortien für die sieben in der BLV-NFDI vorgegebenen Ziele. Auf der Grundlage dieses Verständnisses hat die Task Force Evaluation und Reporting Vorschläge gemacht, wie das Erreichen der Ziele erfasst, beschrieben und gemessen werden kann.
Who is we? Disambiguating the referents of first person plural pronouns in parliamentary debates
(2021)
This paper investigates the use of first person plural pronouns as a rhetorical device in political speeches. We present an annotation schema for disambiguating pronoun references and use our schema to create an annotated corpus of debates from the German Bundestag. We then use our corpus to learn to automatically resolve pronoun referents in parliamentary debates. We explore the use of data augmentation with weak supervision to further expand our corpus and report preliminary results.
This paper presents a compositional annotation scheme to capture the clusivity properties of personal pronouns in context, that is their ability to construct and manage in-groups and out-groups by including/excluding the audience and/or non-speech act participants in reference to groups that also include the speaker. We apply and test our schema on pronoun instances in speeches taken from the German parliament. The speeches cover a time period from 2017-2021 and comprise manual annotations for 3,126 sentences. We achieve high inter-annotator agreement for our new schema, with a Cohen’s κ in the range of 89.7-93.2 and a percentage agreement of > 96%. Our exploratory analysis of in/exclusive pronoun use in the parliamentary setting provides some face validity for our new schema. Finally, we present baseline experiments for automatically predicting clusivity in political debates, with promising results for many referential constellations, yielding an overall 84.9% micro F1 for all pronouns.
This paper is a contribution to the ongoing discussion on treebank annotation schemes and their impact on PCFG parsing results. We provide a thorough comparison of two German treebanks: the TIGER treebank and the TüBa-D/Z. We use simple statistics on sentence length and vocabulary size, and more refined methods such as perplexity and its correlation with PCFG parsing results, as well as a Principal Components Analysis. Finally we present a qualitative evaluation of a set of 100 sentences from the TüBa- D/Z, manually annotated in the TIGER as well as in the TüBa-D/Z annotation scheme, and show that even the existence of a parallel subcorpus does not support a straightforward and easy comparison of both annotation schemes.
Open peer commentary on the target article “Who Conceives of Society?” by Ernst von Glasersfeld. Excerpt: I will focus on one crucial step in von Glasersfeld’s argumentation, viz. his view that every individual constructs his own private meanings (understood as conceptual structures or elements thereof) for linguistic expressions, so that linguistic interaction and even communication in general is based on a notion of compatibility between different speakers’ private conceptual schemes. The central question here is: “Just what does it mean that different private conceptual schemes (private meanings) are compatible, or what constitutes a viable criterion to this end?” As von Glasersfeld himself stresses twice (§28, §37), the criteria to be looked for can only be “public,” residing in properties of verbal and non-verbal actions of the interacting individuals, properties that can be sensed and processed by the participating system.
Wie die Grenzen fallen
(1989)
Wie ein Event zum Event wird
(2000)
Der Beitrag fasst die Schritte einer Projektvorstellung und aktuelle Reflexionen über ein am Institut für Deutsche Sprache in Mannheim neues, korpusgestütztes Paronymwörterbuch zusammen. Zunächst wird der Begriff der Paronymie in einer Arbeitsdefinition eingegrenzt und es wird gezeigt, welche Lücke mit dem neuen Werk in der Wörterbuchlandschaft geschlossen wird. Im Anschluss werden ausgewählte methodische Aspekte sowie Fragen der Wortartikelinhalte und -präsentation skizziert.
Wie kann man über Gefühle sprechen? Sprachliche Mittel zur Thematisierung von Erleben und Emotionen
(2011)
Wie versteht ein Hörer oder Leser die von einem Sprecher oder Schreiber beabsichtigte Bedeutung? Syntaktische Strukturen sind zu allgemein, um feine Bedeutungsunterscheidungen auszudrücken. Wörter sind oft sehr mehrdeutig, und aufgrund dessen unzuverlässig als „Bedeutungsleitfaden“. Im Gegensatz dazu zeigt die Korpusmusteranalyse, dass die meisten Äußerungen aus Mustern von vergleichsweise geringer Mehrdeutigkeit aufgebaut sind. Daher stellt sich die Frage: Was ist ein Muster? Muster sind häufig verwendete Sprachbausteine, die aus zwei Elementen bestehen: Valenzen und Kollokationen. Während Valenzen relativ stabil sind, sind Kollokationen extrem variabel. In der Korpusmusteranalyse wird eine große Anzahl von Gebrauchsbelegen jedes Wortes studiert, und seine Kollokationen werden, ihren semantischen Typen entsprechend, lexikalischen Sets zugeordnet.
Jedes Wort einer Sprache ist Bestandteil von mindestens einem Muster. Wenn es Teil von mehr als einem Muster ist, können die Bedeutungen seiner Muster meist durch unterschiedliche Kollokations-Präferenzen unterschieden werden.
Kreative Benutzungen sind Abweichungen von normalen Nutzmustern, aber Abweichungen sind selbst regelgeleitet. Daher benötigt man eine Theorie von Normen und Abweichungen. Da die zwei Regelsysteme interagieren, können wir die Theorie als eine „Doppelhelix“ beschreiben.
Der folgende Beitrag stellt einen Ausschnitt einer Grammatik für ein Fragment des Deutschen vor.
Zunächst wird eine formale λ-kategoriale Sprache, λL, eingeführt, zusammen mit einem geeigneten Modell zu ihrer Interpretation. Dann wird eine Obersetzungsfunktion ü angegeben, die Ausdrücke von λL in Ausdrücke von Kategorialdeutsch, Kat D, überführt, wobei sich die Syntax komplexer Ausdrücke in Kat D aus der Syntax der entsprechenden λL Ausdrücke und der Übersetzungsfunktion ergibt, die Semantik aus der der entsprechenden λL-Ausdrücke. Kat D ist keine syntaktisch disambiguierte Sprache, so daß es Kat D-Ausdrücke mit mehreren Ableitungen gibt.
Die unorthodoxen Züge der vorgeschlagenen Grammatik sind einerseits, daß sie reichlichen Gebrauch von der Möglichkeit macht, für einfache Kat D-Ausdrücke komplexe λL-Entsprechungen zu haben, andererseits, daß Verben hier als λ-Abstrakte behandelt werden.
Im Rahmen dieses Modells wird dann zur Illustration ein Mini-Fragment des Deutschen formuliert. Schließlich werden Vorschläge für die semantisch-syntaktische Behandlung der Kopula-Verben sein und werden gemacht.
Digitale Medien haben zu einer folgenreichen Veränderung politischer Diskurse beigetragen: Bürgerinnen und Bürger haben nunmehr die Möglichkeit eines direkten und permanenten Dialogs mit politisch Agierenden. Diese wiederum haben soziale Netzwerke als „wirkungsvolle Kommunikationsform für sich entdeckt“ (Kneuer 2017, S.46). Damit haben sich auch die politischen Partizipationsmöglichkeiten verändert. Neben den konventionellen Partizipationsformen erfahren die Bürgerinnen und Bürger nach der Erweiterung in den 1960er Jahren durch nicht institutionalisierte Formen (Woyke 2013) heute eine weitere Form der politischen Teilhabe durch digitale Medien.
Die textlinguistische Grundthese dieses Beitrags besagt, dass alle Texte elementar aus Zeit gemacht sind. Diese These gilt nicht nur für die Verbalgrammatik, wo sie sich schon wegen der Verbaltempora fast von selbst versteht, sondern auch für die Nominalgrammatik, die im Zentrum dieses Beitrags steht. Das wird am Beispiel von Kafkas Erzählung „Die Verwandlung“ zunächst an den Pronominalisierungen, dann an den Renominalisierungen des Textes gezeigt. Beide sind „Zeit-Zeichen“, die auf unterschiedliche Weise die Geltung eines Nomens in der Textzeit verlängern und gegebenenfalls modifizieren. Auch der Satz ist ein Textstück, in dem die Zeit nicht angehalten wird, sondern fortlaufend den Sinn des Textes verändert.
Die Grammatik behauptet sich seit Langem als Gegenstand des Deutschunterrichts, aber sie wird immer wieder „fragwürdig“: Behalten die Schüler, was sie gelernt haben? Liefert die Schulgrammatik geeignete Instrumente für die Sprachreflexion? Bringt sie den behaupteten Nutzen fürs Sprechen, Schreiben und Lesen? Den offiziellen Begründungen für und den behaupteten guten Wirkungen von Grammatik in der Schule, wie sie in den Bildungsplänen und von der Didaktik vertreten werden, begegnet der Verfasser mit einer gewissen Skepsis. Die stützt sich auch auf eine eigens für diesen Beitrag durchgeführte Befragung von Deutsch Lehrenden und die Durchsicht von Abiturarbeiten im Fach Deutsch. Er plädiert für einen Grammatikunterricht mit weniger (vom Lehrer) aufgesetzter Systematik und Begrifflichkeit und mehr sprachlichen Entdeckungsreisen (der Schüler), ausgelöst durch Lernarrangements, die zum Nachdenken anregen.
Die Stichwortliste bildet eine tragende Säule von gedruckten als auch von Online-Wörterbüchern. Daher ist die Konzeption und Erarbeitung einer Stichwortliste auch eine zentrale Aufgabe in der Anfangsphase des am IDS in Angriff genommenen Paronymwörterbuchs. Welche Überlegungen dabei angestellt, welche Ideen entwickelt und welche Pläne bzw. Entscheidungen schließlich umgesetzt wurden, wird in dem Beitrag aufgezeigt.
Wieviel Variation verträgt die deutsche Standardsprache? Begriffsklärung: Standard und Gegenbegriffe
(2005)
Der Ausdruck „Begriffsklärung“ weckt zu hohe Erwartungen. Es müsste eigentlich „Versuch“ heißen. Die frühere hierarchische Gliederung des Deutschen in Hochsprache, Umgangssprache, Halbmundart, Mundart hätte weniger Mühe mit der Begriffsklärung gehabt. Empirisch untersucht wurden ohnehin nur die Dialekte oder Mundarten. Die Hochsprache war mit Orthographie, Orthophonie und Ortho-Grammatik wenn nicht wohldefiniert, so doch in allen Teilen fixiert. Umgangssprache und Halbmundart galten von beiden Polen her als in der Forschung zu vernachlässigende Mischformen.
Die jüngere Terminologie zur Sprachgliederung: Standard, Substandard, Nonstandard, auf die sich die strukturalistische und die empirische Richtung der Linguistik verständigt haben, sieht zwar schlanker und präziser aus. wird aber sogleich diffus, sobald man sie mit Varietäten weiter untergliedern oder Standard mit dem System- oder Normbegriff präzisieren will.
Die Gliederungsvorschläge und Merkmalszuweisungen stammen in der Regel nicht aus empirischer Objektbeobachtung. Es sind hypothetische Klassifikationsversuche oder „Modelle“, die sich auf eigene Spracherfahrung und -intuition berufen. Daraus resultiert eine Vielfalt von Definitionsanläufen trotz vordergründig einheitlicher Benennung.
Das Tagungsthema wird indessen in Form einer konkreten Frage paraphrasiert: „Wie viel Variation verträgt die deutsche Standardsprache“. Es sollte daher möglich sein, nicht die Vielfalt der angebotenen Definitionen zu betonen, sondern für die Begriffe bzw. Phänomene Standard, Variation, Standardvariation, deutsche Standardsprache eine operationale Definition oder Umschreibung zu finden, die soweit tauglich ist, dass die Frage beantwortet werden kann, welche Art von Variation innerhalb der Standard-Grenzen anzusiedeln ist und welche außerhalb. Die Folgen der theoretischen Zuordnung von „Variation“ zu Standard oder Nonstandard sind von recht praktischer Natur, nicht nur für die Dudenredaktion.
From June 26th to July 2nd 2023 the International Conference on Conversation Analysis (ICCA) took place in Brisbane/Meanjin, Australia – after a long pause due to the Covid-pandemic and for the first time in the southern hemisphere. About 350 participants from about 50 different countries attended the conference. This year’s ICCA came up with 36 panels and about 300 papers that were presented. Four plenary speakers have been invited and 24 pre-conference workshops took place. On Wednesday evening Ilana Mushin, in her role as conference chair, officially opened ICCA. The President of the International Society of Conversation Analysis (ISCA), Tanya Stivers, also welcomed all participants. To get acquainted with the indigenous culture of Queensland, the opening ceremony was enriched with a highly impressive dance performance by First Nations people. After the official inauguration the international community met at the Welcome Reception to look forward together to the days ahead with many opportunities for exchange and networking.
As it will become clear throughout this report, the research topics revolved around not only classic CA concepts, but also importantly concerned embodiment, which continued the line of past conferences (Dix 2019). Another aspect that has been highlighted was conflict and social norms. Due to personal capacities, we can only present a selection of presentations within the scope of this conference report. The selection was influenced by the personal interest of the authors and should not be understood as rating in any sense.
Wir können auch Hochdeutsch – Das Institut für Deutsche Sprache in Mannheim – ein Ort der Ideen
(2015)
Lexikalische Wiederholungen nehmen in der Lehre von den rhetorischen Stilfiguren viel Raum ein; in der Linguistik des schriftsprachlichen Deutsch spielen sie dagegen kaum ein Rolle. Die Arbeit überprüft, inwieweit sich die Funktionsweise zweier Figuren der meist unmittelbaren Ausdruckswiederholung, der Geminatio und der Anadiplose, auf der Basis von Standardannahmen zur Syntax, Semantik und Pragmatik des Deutschen erklären lässt.
Zugrunde liegt der Arbeit eine Sammlung von über 700 Instanzen der Geminatio und Anadiplose aus deutschsprachigen Gedichten des 17. bis 21. Jahrhunderts. Es wird daran gezeigt, wie die Geminatio unter Ausnutzung von satztopologischen und NP-internen Positionierungen und darauf aufbauenden bedeutungskompositionellen und implikaturenbasierten Prozessen der Bedeutungkonstitution zum ikonischen Ausdruck der Gradierung von Eigenschaften dient. Die Anadiplose wiederum entpuppt sich als Mittel zur Hervorhebung von Themen und Propositionen, die pragmatisch und informationsstrukturell auf ihrer Einbindung in Herausstellungskonstruktionen und Satzverknüpfungen gründet.
Damit liefern die beiden rhetorischen Figuren kaum Argumente für die Abweichungstheorie literarischer Sprache, derzufolge die Sprachverwendung in literarischen und insbesondere lyrischen Texten oft nicht den Regeln und dem Usus des nicht-literarischen Deutsch folgt. Die Funktionsweise der Geminatio und der Anadiplose ist gut in das syntaktische, semantische und pragmatische System des Deutschen eingebunden. Insbesondere die Geminatio zeigt dabei in Gedichten auch deutliche Parallelen zu entsprechenden Phänomenen im gesprochenen Deutsch.
Wird aus Sprache Gewalt?
(2019)
Nach dem Mord am Kasseler Regierungspräsidenten Walter Lübcke und weiteren Mordanschlägen in der jüngsten Vergangenheit wurde in Kommentaren und Stellungnahmen immer wieder behauptet, dass hier Sprache in Gewalt umgeschlagen sei. Dies ist einerseits naheliegend vor dem Hintergrund dessen, was wir über die Täter und ihre Äußerungen wissen. Was aber sagt die Wissenschaft dazu? Wie ist aus sprach- und kommunikationswissenschaftlicher Sicht dieser angenommene Zusammenhang zu bewerten?
Wissen im Gespräch
(2018)
Dieser Artikel gibt einen Überblick darüber, wie grundlegend Wissen als Voraussetzung, Gegenstand und Produkt von Verständigungsprozessen für die Organisation von Gesprächen ist. Zunächst wird ein kognitivistischer Zugang zu Wissen mit einem sozialkonstruktivistischen kontrastiert. Es werden zum einen kommunikative Gattungen, die auf die Kommunikation von Wissen spezialisiert sind, dargestellt; zum anderen wird gezeigt, wie Wissen auch dann die Gestaltung der Interaktion bestimmt, wenn der primäre Gesprächszweck nicht in Wissensvermittlung besteht. Vier Dimensionen werden angesprochen: a) Das mit dem Adressaten geteilte Wissen (common ground) ist Grundlage des Adressatenzuschnitts von Äußerungen (recipient design); b) geteiltes Wissen wird in Verständigungsprozessen konstituiert; c) der relative epistemische Status der Gesprächspartner zueinander wird durch Praktiken des epistemic stance-taking verdeutlicht und bestimmt selbst die Interpretation von Äußerungsformaten; d) epistemischer Status, soziale Identität und Beziehungskonstitution sind eng miteinander durch moralische Anspruchs- und Erwartungsstrukturen verknüpft.
Wissenschaftssprache
(1992)
Psychotherapy talk is characterized by epistemic, emotional and professional asymmetries of knowledge, which are continuously adjusted to by the participants in joint process of negotiation. Adjustment is based on structural features of communication: the fundamental sequentiality of verbal interaction, i.e. interrelated succession of utterances of at least two interlocutors, provides for and guarantees the achievement of intersubjectivity and therapeutic efficiency. Solution-oriented questions as a rhetorical practice serve to produce forward-looking awareness, expansion of knowledge and reorganization of knowledge on the patient’s side as well as an increased ability to act. These processes become apparent not only locally in the immediate context of solution-oriented questions but also globally in the course of the interaction as a whole. The data for this research consists of psychodiagnostic interviews conducted according to the concept and manual of the Operationalized Psychodynamic Diagnostics (OPD Task Force 2009).
Wittgenstein über Freud
(1989)
Wo ein Wille ist, ist auch ein Weg - das erste größere Neologismenwörterbuch für das Deutsche
(2011)
Leicht hat es die Duden-Redaktion derzeit nicht. Im Sommer erst musste sie sich ungerechtfertigterweise vorhalten lassen, mit der Aufnahme neuer Wörter in die 28. Auflage des Rechtschreibdudens eine links-grüne Agenda zu verfolgen. Vor kurzem hieß es nun, im Online-Duden werde heimlich eine Sprachveränderung betrieben, die zum Verschwinden des generischen Maskulinums führe. Kürzlich hat deshalb der “Verein Deutsche Sprache”, jener umstrittene Verein konservativer Sprachschützer*innen, sogar einen öffentlichen Aufruf gegen den Dudenverlag gestartet. Was ist also dran an diesem Vorwurf?
eThis paper first attempts a state-of-the art overview of what is known about women in the history of lexicography up to the early twentieth century. It then focusses more closely on the German and German-English lexicographical traditions to 1900, examining them from three different perspectives (following Russell’s 2018 study of women in English lexicography): women as users and dedicatees of dictionaries; women as contributors to and compilers of lexicographical works; and (in a very preliminary way) women and female sexuality as represented in German/English bilingual dictionaries of the eighteenth and early nineteenth centuries. Russell (2018) was able to identify some 24 dictionaries invoking women as patrons, dedicatees or potential users before 1700, and some 150 works in English lexicography by women between 1500 and 1900, besides the contribution of hundreds of women as supporters and helpers, not least as unpaid readers and sub-editors for the Oxford English Dictionary. Equivalent research in other languages is lacking, but this paper presents some of the known examples of women as lexicographers. The evidence tends to support Russell’s finding for English, that women were more likely to find a place in lexicography outside the mainstream: sometimes in a more private sphere (like Hester Piozzi); often in bilingual lexicography (such as Margrethe Thiele, working on a Danish-French dictionary), including missionary and or colonizing activity (such as Cinie Louw in Africa, Daisy Bates in Australia); and in dialect description (Coronedi Berti in Italy, Luisa Lacal and María Moliner in Spain). Within the German-speaking context, women who participated in lexicographical work themselves are hard to identify before the late nineteenth century, though those few women who did have access to education were often engaged in language learning, including translation activity, and they were likely users of bilingual and multilingual dictionaries. Christian Ludwig’s (1706) English-German dictionary – the first of its kind – was dedicated to the Electoral Princess Sophia of Hanover. Elizabeth Weir may have been the first named female compiler of a German dictionary, with her bilingual New German Dictionary (1888). Rather better known are the cases of Agathe Lasch and Luise Pusch, who, as pioneering women in the field of German linguistics, ultimately led major lexicographical projects documenting German regional varieties in the first half of the twentieth century (Middle Low German and Hamburgish in the case of Lasch; the Hessisch Nassau dialect dictionary in the case of Berthold). In the light of existing research on gender and sexuality in the history of English lexicography (e. g. Iamartino 2010; Turton 2019), I conclude with a preliminary exploration how woman and sexuality have been represented in dictionaries of German and English, taking the words Hure and woman in bilingual German-English dictionaries of the eighteenth and nineteenth centuries as my case studies.
Many European languages have undergone considerable changes in orthography over the last 150 years. This hampers the application of modern computer-based analysers to older text, and hence computer-based annotation and studies of text collections spanning a long period. As a step towards a functional analyser for Norwegian texts (Nynorsk standard) from the 19th century, funding was granted in 2020 for creating a full form generator for all inflected forms of headwords found in Ivar Aasen’s dictionary published in 1873 (Aasen 1873) and his grammar from 1864 (Aasen 1864). Creating this word bank led to new insight in Aasen (1873), its structure, internal organisation, and ambition level as well as its link to Aasen (1864). As a test, the full form list generated from this new word bank was used to analyse the word inventory of texts by Aa. O. Vinje, written in the period 1850–1870. The Vinje texts were also analysed using a full form list of modern standard Norwegian, to study the differences in applicability and see how Vinje’s language relates to the written standard of modern Norwegian.
Word Families in Diachrony. An epoch-spanning structure for the word families of older German
(2022)
The ‘Word Families in Diachrony’ project (WoDia), for which a funding application to the DFG is in preparation, aims to provide a database driven online research environment that will enable processes of change in the entire historical vocabulary of German to be investigated by focusing on the changes in word families and the individual means of word formation. WoDia will embed the vocabularies of Old High German (OHG), Middle High German (MHG), Old Saxon (OS), and Middle Low German (MLG) in a database, resulting in a word-family structure for High and Low German from the beginnings up to the 15th century (for High German) and up to the 17th century (for Low German). The basis of the vocabulary is provided by reference dictionaries of the four historical varieties, whereas the word families’ historical structure is based on the word-family dictionary of OHG by Jochen Splett (1992). Each lemma in the database will be assigned, where appropriate, to a word family. The individual word-formation elements and the word-formation hierarchy will be mapped in a structural formula. The etymologically corresponding lemmas and word families of the different periods/varieties of older German will be linked so that an analysis across the varieties will also be possible. The annotations of word families in the database (e. g., relating to word structure) will be supplemented by linking their lemmas to the online dictionaries and to the reference corpora of Old German (OS and OHG), MHG, and MLG.
This article explores the relation between word order and response latency, focusing on responses to question-word questions. Qualitative (multimodal) and quantitative analyses of naturally occurring conversations in French—where question-words can occur in initial, medial, or final position within the question—show that variation in word order affects the timing of responses. It is argued that this is so because word order provides a differential basis for action ascription, creating different temporal opportunities for projecting the recipient’s next relevant action. The frequent occurrence of early responses to questions with an initial question-word, in particular, stresses the importance of the recognition point of an action under way for response timing and shows respondents’ pervasive orientation to sequential progressivity. Findings highlight how lexico-syntactic trajectories of emergent turns, prior talk and actions, material and bodily features of interaction, and participants’ shared expectations conspire in shaping the time-courses of action ascription and action projection.
This paper will address the challenge of creating a knowledge graph from a corpus of historical encyclopedias with a special focus on word sense alignment (WSA) and disambiguation (WSD). More precisely, we examine WSA and WSD approaches based on article similarity to link messy historical data, utilizing Wikipedia as aground-truth component – as the lack of a critical overlap in content paired with the amount of variation between and within the encyclopedias does not allow for choosing a ”baseline” encyclopedia to align the others to. Additionally, we are comparing the disambiguation performance of conservative methods like the Lesk algorithm to more recent approaches, i.e. using language models to disambiguate senses.
We describe a simple procedure for the automatic creation of word-level alignments between printed documents and their respective full-text versions. The procedure is unsupervised, uses standard, off-the-shelf components only, and reaches an F-score of 85.01 in the basic setup and up to 86.63 when using pre- and post-processing. Potential areas of application are manual database curation (incl. document triage) and biomedical expression OCR.
Sound units play a pivotal role in cognitive models of auditory comprehension. The general consensus is that during perception listeners break down speech into auditory words and subsequently phones. Indeed, cognitive speech recognition is typically taken to be computationally intractable without phones. Here we present a computational model trained on 20 hours of conversational speech that recognizes word meanings within the range of human performance (model 25%, native speakers 20–44%), without making use of phone or word form representations. Our model also generates successfully predictions about the speed and accuracy of human auditory comprehension. At the heart of the model is a ‘wide’ yet sparse two-layer artificial neural network with some hundred thousand input units representing summaries of changes in acoustic frequency bands, and proxies for lexical meanings as output units. We believe that our model holds promise for resolving longstanding theoretical problems surrounding the notion of the phone in linguistic theory.
The Lyon’s team research task consists in the study of the way in which multilingual resources are mobilized in team work within collaborative activities; how they are exploited in a specific way in order both to enhance collaboration and to respect the specificities of the members’ linguistic competences and practices within the team. Central to our analytical work, which is inspired by ethnomethodological conversation analysis, is the relationship between multilingual resources and the situated organization of linguistic uses and of social practices.
The 2014 issue of KONVENS is even more a forum for exchange: its main topic is the interaction between Computational Linguistics and Information Science, and the synergies such interaction, cooperation and integrated views can produce. This topic at the crossroads of different research traditions which deal with natural language as a container of knowledge, and with methods to extract and manage knowledge that is linguistically represented is close to the heart of many researchers at the Institut für Informationswissenschaft und Sprachtechnologie of Universität Hildesheim: it has long been one of the institute’s research topics, and it has received even more attention over the last few years.
Wort und Wortschatz
(2015)
Das Verständnis darüber, was ein Wort ist, zeigt sich je nach linguistischer Teildisziplin, je nach Untersuchungsinstrument und je nach betrachtetem Medium (Schriftlichkeit, Mündlichkeit) als äußerst wandelbar und kontrovers. Zunächst wird eine Übersicht über die wichtigsten Wortbegriffe in Geschichte und Gegenwart gegeben, um zu zeigen, wie sehr sich ein formaler, am Schriftbild orientierter Wortbegriff von semantisch-kognitiven Wortbegriffen unterscheidet. Anschließend wird dargelegt, wie sich welche sprachwissenschaftlichen Methoden auf die Konstituierung des Phänomens "Wort" auswirken und dass die isolierende Sicht auf das Einzelwort durch die Betrachtung von Relationen zwischen Wörtern abgelöst wurde. Dabei kommt den neueren, computerlinguistisch fundierten Verfahren besondere Relevanz zu. Auf dieser Basis wird gezeigt, welche Aspekte und Ebenen der Wortforschung es aktuell gibt; dabei wird der Interaktion von theoretischen wie anwendungsbezogenen Forschungsperspektiven und dem gesellschaftlichen bzw. Laieninteresse an Wörtern besondere Beachtung geschenkt.
Wortarten
(2018)
Wortbegriff und Orthographie
(1980)
Wortbildung
(2005)
Im vorliegenden Beitrag werden einige zentrale Aspekte der kontrastiven Wortbildungsforschung anhand von Beispielen aus dem niederländisch-deutschen Sprachvergleich besprochen. Als nah verwandte Sprachen zeigen das Niederländische und das Deutsche zwar vergleichbare Strukturen der Komposition und der Derivation, bei näherem Hinsehen sind es aber vor allem die vielfältigen Divergenzen, die ins Auge fallen. Im ersten Teil des Artikels werden verschiedenartige Beispiele für solche Divergenzen besprochen. Anschließend geht es um gegenläufige Entwicklungen, die zu Konvergenz zwischen beiden Sprachen führen. Anhand einer Analyse von Zusammensetzungen vom Typ „wassergekühlt“ (ndl. „watergekoeld“) wird für eine stärkere Berücksichtigung von Konvergenzfaktoren in der kontrastiven Linguistik plädiert. Der zweite Teil des Artikels enthält eine detaillierte Fallstudie zur Adjektivbildung mit dem niederländischen Suffix „-achtig“ und dem deutschen „-haft“, die den Zusammenhang von diachronen Entwicklungen und synchronen Kontrasten aufzeigt. Zudem zeigt sie Konsequenzen und Implikationen der vergleichenden Analyse für die Theorie des Lexikons und der Wortbildung auf. Im Mittelpunkt stehen dabei Rainers (2003) Idee der ,semantischen Fragmentierung‘ von Wortbildungsmustern und die Konzeption eines ,hierarchischen Lexikons‘, wie sie unter anderem von Jackendoff (2008) oder Booij (2010) vertreten wird.