Refine
Year of publication
- 2019 (361) (remove)
Document Type
- Article (124)
- Part of a Book (110)
- Conference Proceeding (39)
- Book (34)
- Review (25)
- Part of Periodical (14)
- Other (9)
- Working Paper (4)
- Doctoral Thesis (1)
- Report (1)
Language
- German (250)
- English (106)
- Multiple languages (2)
- Ukrainian (2)
- Chinese (1)
Keywords
- Deutsch (144)
- Korpus <Linguistik> (65)
- Gesprochene Sprache (26)
- Sprache (19)
- Konversationsanalyse (17)
- Rezension (16)
- Automatische Sprachanalyse (15)
- Grammatik (15)
- Interaktion (15)
- Kommunikation (15)
Publicationstate
- Zweitveröffentlichung (164)
- Veröffentlichungsversion (137)
- Postprint (29)
- Erstveröffentlichung (2)
Reviewstate
- Peer-Review (148)
- (Verlags)-Lektorat (145)
- (Verlags-)Lektorat (2)
- Peer review (1)
- Peer-review (1)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (1)
Publisher
- de Gruyter (66)
- Leibniz-Institut für Deutsche Sprache (IDS) (33)
- Leibniz-Institut für Deutsche Sprache (20)
- Erich Schmidt (18)
- Narr Francke Attempto (11)
- German Society for Computational Linguistics & Language Technology und Friedrich-Alexander-Universität Erlangen-Nürnberg (9)
- Stauffenburg (8)
- Winter (8)
- Institut für Deutsche Sprache (7)
- Lang (6)
Seit 2017 wird im deutschen Mikrozensus eine Frage zur Sprache der Bevölkerung gestellt. Die letzte Spracherhebung in einem deutschen Zensus datiert aus dem Jahr 1939; entsprechend gibt es aktuell keine aussagekräftigen Sprachstatistiken in Deutschland. Die neue Sprachfrage des Mikrozensus weist jedoch erhebliche Mängel auf; offensichtlich wurde sie als Stellvertreterfrage zur Messung kultureller Integration konzipiert. Im vorliegenden Text werden die Fragen diskutiert und ihre ersten Ergebnisse analysiert. Daran anschließend werden andere Varianten von Sprachfragen dargestellt, dabei wird insbesondere auf die vorbildlichen Sprachfragen im kanadischen Zensus eingegangen. Abschließend wird die Sprachfrage der Deutschland-Erhebung 2018 des IDS inklusive ihrer Ergebnisse vorgestellt; die Deutschland-Erhebung 2018 stellt neben dem Mikrozensus bislang die einzige repräsentative Spracherhebung in Deutschland dar.
Language attitudes matter; they influence people’s behaviour and decisions. Therefore, it is crucial to learn more about patterns in the way that languages are evaluated. One means of doing so is using a quantitative approach with data representative of a whole population, so that results mirror dispositions at a societal level. This kind of approach is adopted here, with a focus on the situation in Germany. The article consists of two parts. First, I will present some results of a new representative survey on language attitudes in Germany (the Germany Survey 2017). Second, I will show how language attitudes penetrate even seemingly objective data collection processes by examining the German Microcensus. In 2017, for the first time in eighty years, the German Microcensus included a question on language use ‘at home’. Unfortunately, however, the question was clearly tainted by language attitudes instead of being objective. As a result, the Microcensus significantly misrepresents the linguistic reality of different migrant languages spoken in Germany.
Thema des Beitrags ist die Frage, wie in einer quantitativen Herangehensweise die Spracheinstellungen von linguistischen Laien erfasst werden können. Das IDS hat 2017/18 im Rahmen des Sozio-oekonomischen Panels (SOEP) des Deutschen Instituts für Wirtschaftsforschung (DIW) eine neue bundesweite Repräsentativerhebung zu Spracheinstellungen durchgeführt. Im Beitrag präsentieren wir erste Ergebnisse dieser Erhebung und verknüpfen sie mit früheren Erhebungen. In drei Abschnitten befassen wir uns mit der Bewertung von regionalen Varietäten des Deutschen und der Bewertung des Standards, mit Meinungen zu sprachlichem Gendern sowie, aus einer methodischen Perspektive, mit der Erhebung von sprachlichen Daten im deutschen Mikrozensus.
Although the N400 was originally discovered in a paradigm designed to elicit a P300 (Kutas and Hillyard, 1980), its relationship with the P300 and how both overlapping event-related potentials (ERPs) determine behavioral profiles is still elusive. Here we conducted an ERP (N = 20) and a multiple-response speed-accuracy tradeoff (SAT) experiment (N = 16) on distinct participant samples using an antonym paradigm (The opposite of black is white/nice/yellow with acceptability judgment). We hypothesized that SAT profiles incorporate processes of task-related decision-making (P300) and stimulus-related expectation violation (N400). We replicated previous ERP results (Roehm et al., 2007): in the correct condition (white), the expected target elicits a P300, while both expectation violations engender an N400 [reduced for related (yellow) vs. unrelated targets (nice)]. Using multivariate Bayesian mixed-effects models, we modeled the P300 and N400 responses simultaneously and found that correlation between residuals and subject-level random effects of each response window was minimal, suggesting that the components are largely independent. For the SAT data, we found that antonyms and unrelated targets had a similar slope (rate of increase in accuracy over time) and an asymptote at ceiling, while related targets showed both a lower slope and a lower asymptote, reaching only approximately 80% accuracy. Using a GLMM-based approach (Davidson and Martin, 2013), we modeled these dynamics using response time and condition as predictors. Replacing the predictor for condition with the averaged P300 and N400 amplitudes from the ERP experiment, we achieved identical model performance. We then examined the piecewise contribution of the P300 and N400 amplitudes with partial effects (see Hohenstein and Kliegl, 2015). Unsurprisingly, the P300 amplitude was the strongest contributor to the SAT-curve in the antonym condition and the N400 was the strongest contributor in the unrelated condition. In brief, this is the first demonstration of how overlapping ERP responses in one sample of participants predict behavioral SAT profiles of another sample. The P300 and N400 reflect two independent but interacting processes and the competition between these processes is reflected differently in behavioral parameters of speed and accuracy.
Preface
(2019)
Der vorliegende Beitrag beschäftigt sich mit dem Gebrauch von konnektintegrierbaren Konnektoren im gesprochenen Deutsch. Die Analyse wird am Beispiel der Adverbkonnektoren deshalb und deswegen als Korrelate zum Subjunktor weil und ausgehend von theoretischen Prämissen aus der traditionellen Grammatik und aus der Gesprächsforschung durchgeführt. Der Gebrauch der genannten Konnektoren wird innerhalb einer Auswahl von Korpusdaten gesprochener Sprache beobachtet, die mehrere verschiedene Gattungen der alltäglichen bzw. der institutionellen Kommunikation umfasst.
This paper aims at investigating the usage of present subjunctive (Konjunktiv I), which is traditionally labelled as a feature of standard written language and therefore as typically occurring in communication genres based on it such as press texts and reporting, in everyday spoken German. Through an analysis of corpus data performed according to theory and method of Interactional Linguistics and encompassing private, institutional and public interactional domains, the paper will show how this particular verb form expresses different epistemic stances according to its syntactic embedment.
This paper focuses on so called syntactic projection phenomena in the German language. This term from the German Gesprächsforschung is used to define the fact that an utterance or part of it foreshadows another one. This paper aims at pointing out how such projection phenomena are consciously exploited for rhethorical purposes. This will be observed on the basis of excerpts from the Stuttgart 21 mediation talks. The linguistic analysis carried out in this paper will focus on syntactic projection phenomena involving the use of causal adverbial connectives deshalb and deswegen.
Im Streit um Migration soll der Gebrauch von Disclaimern in erster Linie ein positives Bild des Produzenten liefern oder wenigstens Ansprüche auf die Berechtigung seiner kritischen Stellungnahme erheben, ohne dass der Produzent als Rassist abgestempelt wird. Im vorliegenden Beitrag werden die Ergebnisse einer Fallstudie über den Gebrauch eines solchen Disclaimers in Deutschland und in Italien zusammengefasst, nämlich von „Ich bin kein Rassist, aber“ und seiner italienischen Entsprechung „Non sono razzista, ma“. Es wird gezeigt, (i) wie diese Disclaimer zum Ausdruck ausländerkritischer Stellungnahmen verwendet werden und (ii) wie ihre Verwendung in der Öffentlichkeit wahrgenommen wird.
Bild-Makros bzw. 4Memes sind ein präsentes Internetphänomen im Social Web. In sozialen Netzwerken wie Facebook werden diese multimodalen, kulturell geprägten Kommunikate nicht nur veröffentlicht und verbreitet, sondern zudem von NutzerInnen u.a. in Form von Kommentaren rezipiert und interaktiv ausgehandelt. Diese kommunikative Einheit aus einem einerseits eindimensionalen, statischen Kommunikat mit einer andererseits dynamischen, interaktiven Aushandlung stellt dabei eine interdisziplinäre Herausforderung für eine differenzierte (medien-)linguistische Betrachtung dar, der mit einer Kombination von Sehflächenanalyse, Gattungsanalyse sowie Konversations- bzw. Gesprächsanalyse begegnet wird. In dieser Arbeit wird anhand erhobener Daten von Facebook-Gemeinschaftsseiten gezeigt, welche formalen, syntaktisch-semantischen und pragmatisch-funktionalen Mechanismen bei der Kombination der Zeichenressourcen Text und Bild zur Bedeutungskonstitution des (humoristischen) Medienprodukts zusammenspielen, dessen Verständnis auch auf intertextuellem, kulturellem (Kontext- und Gattungs)Wissen basiert. Im Anschluss daran wird dargelegt, wie sich über geteiltes Wissen verfügende RezipientInnen mit technischen und sprachlichen Folgehandlungen auf ein Bild-Makro beziehen und welche sprachlichen Mittel und kommunikativen Verfahren wie Fokussierungsaufforderung und -bestätigung, Bewertung und Übertragung auf die gemeinsame Lebenswelt Anwendung finden.
In this paper, we describe a data processing pipeline used for annotated spoken corpora of Uralic languages created in the INEL (Indigenous Northern Eurasian Languages) project. With this processing pipeline we convert the data into a loss-less standard format (ISO/TEI) for long-term preservation while simultaneously enabling a powerful search in this version of the data. For each corpus, the input we are working with is a set of files in EXMARaLDA XML format, which contain transcriptions, multimedia alignment, morpheme segmentation and other kinds of annotation. The first step of processing is the conversion of the data into a certain subset of TEI following the ISO standard ’Transcription of spoken language’ with the help of an XSL transformation. The primary purpose of this step is to obtain a representation of our data in a standard format, which will ensure its long-term accessibility. The second step is the conversion of the ISO/TEI files to a JSON format used by the “Tsakorpus” search platform. This step allows us to make the corpora available through a web-based search interface. As an addition, the existence of such a converter allows other spoken corpora with ISO/TEI annotation to be made accessible online in the future.
As the Web ought to be considered as a series of sources rather than as a source in itself, a problem facing corpus construction resides in meta-information and categorization. In addition, we need focused data to shed light on particular subfields of the digital public sphere. Blogs are relevant to that end, especially if the resulting web texts can be extracted along with metadata and made available in coherent and clearly describable collections.
Speech planning is a sophisticated process. In dialog, it regularly starts in overlap with an incoming turn by a conversation partner. We show that planning spoken responses in overlap with incoming turns is associated with higher processing load than planning in silence. In a dialogic experiment, participants took turns with a confederate describing lists of objects. The confederate’s utterances (to which participants responded) were pre-recorded and varied in whether they ended in a verb or an object noun and whether this ending was predictable or not. We found that response planning in overlap with sentence-final verbs evokes larger task-evoked pupillary responses, while end predictability had no effect. This finding indicates that planning in overlap leads to higher processing load for next speakers in dialog and that next speakers do not proactively modulate the time course of their response planning based on their predictions of turn endings. The turn-taking system exerts pressure on the language processing system by pushing speakers to plan in overlap despite the ensuing increase in processing load.
Since 2013 representatives of several French and German CMC corpus projects have developed three customizations of the TEI-P5 standard for text encoding in order to adapt the encoding schema and models provided by the TEI to the structural peculiarities of CMC discourse. Based on the three schema versions, a 4th version has been created which takes into account the experiences from encoding our corpora and which is specifically designed for the submission of a feature request to the TEI council. On our poster we would present the structure of this schema and its relations (commonalities and differences) to the previous schemas.
Wie werden Wörter im Deutschen und im Englischen geschrieben? Wo sind Gemeinsamkeiten, wo sind Unterschiede? Diese Fragen werden aus morphologisch-graphematischer Perspektive bearbeitet. Es geht hier also nicht um Bezüge zwischen Schrift und Lautform (traditionell oft im Fokus der Graphematik), sondern um Korrespondenzen zwischen Schrift und Morphologie. Das betrifft zum einen den Aufbau von Morphemen. Welche Beschränkungen lassen sich hier für die Abfolge der Buchstaben formulieren? Was sind minimale, was sind prototypische Stämme und Affixe? Zum anderen geht es um Fragen der Einheitlichkeit (Wie uniform wird ein Morphem in der Schrift repräsentiert?) und der Eindeutigkeit (Wie distinkt verweist eine Schreibung auf ein Morphem?). Insgesamt zeigt sich, dass im Englischen eher Affixe verlässlich kodiert werden (oft eindeutig und einheitlich), während im Deutschen häufig Stämme einheitlich kodiert werden. Das sind zwei grundsätzlich unterschiedliche Strategien der Leseerleichterung.
Umfrage zu Sprachen und Dialekten in Pfalzdorf, Louisendorf und Neulouisendorf. Erste Ergebnisse
(2019)
Vorwort
(2019)
In Adjektivreihungen ohne Determinierer ('in neuem korpuslinguistisch-em/-en Licht') und in Fügungen aus Pronominaladjektiv und attributivem Adjektiv ('mancher ausbildend-er/-e Betrieb') treten Schwankungen zwischen Parallel- und Wechselflexion auf, die von einem komplexen Zusammenspiel verschiedener grammatischer und außergrammatischer Faktoren beeinflusst werden. Auf der Basis einer explorativen Korpusstudie werden im vorliegenden Beitrag zunächst einschlägige Einflussgrößen identifiziert und deren Effektstärken geschätzt. Im Anschluss wird gezeigt, dass entgegen bisherigen Annahmen nach Pronominaladjektiven keine allgemeine Tendenz zur schwachen Flexion vorliegt, sondern mit Ausnahme des Kontextes Dat. Sg. Mask./Neutr. diachron eine Ausbreitung der Parallelflexion (stark/stark) beobachtbar ist.
Most authors agree that modal particles - a dass of function words widely considered characteristic of Modem German - cannot receive prosodic stress, though the reasons for this restriction have not yet been satisfactorily explained. This paper argues that unstressability follows from the general contribution of modal particles to compositional utterance meaning, which requires them to take scope over focus-background structures. Form and function of modal particle meanings are modelled and illustrated for five representative examples - the particles wohl, ja, eigentlich, eben and halt. It is argued that these as well as other particles, whenever they occur under prosodic stress, cannot preserve the meaning nor the syntactic behaviour of modal particles. All instances of stressed particles in German must therefore be categorized in other functional classes.
In this paper, we investigate the temporal interpretation of propositional attitude complement clauses in four typologically unrelated languages: Washo (language isolate), Medumba (Niger-Congo), Hausa (Afro-Asiatic), and Samoan (Austronesian). Of these languages, Washo and Medumba are optional-tense languages, while Hausa and Samoan are tenseless. Just like in obligatory-tense languages, we observe variation among these languages when it comes to the availability of so-called simultaneous and backward-shifted readings of complement clauses. For our optional-tense languages, we argue that a Sequence of Tense parameter is active in these languages, just as in obligatory-tense languages. However, for completely tenseless clauses, we need something more. We argue that there is variation in the degree to which languages make recourse to res-movement, or a similar mechanism that manipulates LF structures to derive backward-shifted readings in tenseless complement clauses. We additionally appeal to cross-linguistic variation in the lexical semantics of perfective aspect to derive or block certain readings. The result is that the typological classification of a language as tensed, optionally tensed, or tenseless, does not alone determine the temporal interpretation possibilities for complement clauses. Rather, structural parameters of variation cross-cut these broad classes of languages to deliver the observed cross-linguistic picture.
This article investigates the use of überhaupt and sowieso in German and Dutch. These two words are frequently classified as particles, if only because of their pragmatic functions. The frequent use of particles is considered a specific trait common to German and Dutch, and the description of their semantics and pragmatics is notoriously difficult. It is unclear whether both particles have the same meaning in Dutch (where they are loanwords) and German, whether they can fulfil the same syntactic functions and to what extent the (semantic and pragmatic) functions of überhaupt und sowieso overlap. There has already been linguistic research on überhaupt and sowieso by Fisseni (2009) using the world-wide web and by Bruijnen and Sudhoff (2013) using the EUROPARL corpus. In the present study we critically evaluated the corpus study, integrating information on original utterance language and discussing the adequacy of this corpus. Moreover, we conducted an experimental survey collecting subjective-intuitive judgements in three dimensions, thus gathering more data on sparse and informal constructions.
By using these complementary methods, we obtain a more nuanced picture of the use of überhaupt and sowieso in both languages: On the one hand, the data show where the use of both words is more similar and on the other hand, differences between the languages can also be discerned.
A "polyglottal" speech synthesis - modifications for a replica of Kempelen's speaking machine
(2019)
Kertész, András (2017): The historiography of generative linguistics. Tübingen: Narr. [Rezension]
(2019)
Akkusativobjekt
(2019)
indirektes Objekt
(2019)
Modern theoretical linguistics lives by the insight that the meanings of complex expressions derive from the meanings of their parts and the way these are composed. However, the currently dominating theories of the syntax-semantics interface hastily relegate important aspects of meaning which cannot readily be aligned with visible structure to empty projecting heads non-reductively (mainstream Generative Grammar) or to the syntactic construction holistically (Construction Grammar). This book develops an alternative, compositional analysis of the hidden aspectual-temporal, modal and comparative meanings of a range of productive constructions of which pseudorefl exive, excessive and directional complement constructions take center stage. Accordingly, a contradiction-inducing hence semantically problematic part of literally coded meaning is locally ignored and systematically realized „expatriately“ with respect to parts of structure that achieve the indexical anchoring of propositional contents in terms of times, worlds and standards of comparison, thus yielding the observed hidden meanings.
Direktes Objekt
(2019)
Relativpronomenselektion und grammatische Variation: 'was' vs. 'das' in attributiven Relativsätzen
(2019)
This contribution presents a quantitative approach to speech, thought and writing representation (ST&WR) and steps towards its automatic detection. Automatic detection is necessary for studying ST&WR in a large number of texts and thus identifying developments in form and usage over time and in different types of texts. The contribution summarizes results of a pilot study: First, it describes the manual annotation of a corpus of short narrative texts in relation to linguistic descriptions of ST&WR. Then, two different techniques of automatic detection – a rule-based and a machine learning approach – are described and compared. Evaluation of the results shows success with automatic detection, especially for direct and indirect ST&WR.
In this paper, we present our work-inprogress to automatically identify free indirect representation (FI), a type of thought representation used in literary texts. With a deep learning approach using contextual string embeddings, we achieve f1 scores between 0.45 and 0.5 (sentence-based evaluation for the FI category) on two very different German corpora, a clear improvement on earlier attempts for this task. We show how consistently marked direct speech can help in this task. In our evaluation, we also consider human inter-annotator scores and thus address measures of certainty for this difficult phenomenon.
In diesem Beitrag wird das Redewiedergabe-Korpus (RW-Korpus) vorgestellt, ein historisches Korpus fiktionaler und nicht-fiktionaler Texte, das eine detaillierte manuelle Annotation mit Redewiedergabeformen enthält. Das Korpus entsteht im Rahmen eines laufenden DFG-Projekts und ist noch nicht endgültig abgeschlossen, jedoch ist für Frühjahr 2019 ein Beta-Release geplant, welches der Forschungsgemeinschaft zur Verfügung gestellt wird. Das endgültige Release soll im Frühjahr 2020 erfolgen. Das RW-Korpus stellt eine neuartige Ressource für die Redewiedergabe-Forschung dar, die in dieser Detailliertheit für das Deutsche bisher nicht verfügbar ist, und kann sowohl für quantitative linguistische und literaturwissenschaftliche Untersuchungen als auch als Trainingsmaterial für maschinelles Lernen dienen.
Im vorliegenden Aufsatz untersuche ich gesprächsanalytisch Ausbildungsinteraktionen in einer beruflichen Qualifizierungsmaßnahme, die wir im Rahmen des IDS-Projekts „Deutsch im Beruf: Die sprachlich-kommunikative Integration von Flüchtlingen“ wissenschaftlich begleitet haben. Unser Projekt startete gleich zu Beginn des Jahres 2016, also kurz nachdem die große Gruppe der Fluchtmigranten 2015 nach Deutschland kam. Somit können wir bei unserer Studie den Integrationsprozess der Geflüchteten von Anfang an dokumentieren und die wichtigsten Integrationsetappen bezüglich ihrer sprachlichen und kommunikativen Anforderungen, Implikationen und Abläufe detailliert analysieren. Sehr früh haben sich dabei neben den sprachlichen Integrationskursen vor allem die vielfältigen, bundesweit angebotenen beruflichen Qualifizierungsmaßnahmen als die Orte herauskristallisiert, an denen die ersten wichtigen Weichen hinsichtlich der beruflichen und sozialen Integration der Flüchtlinge gestellt werden. Ziel unseres Vorhabens ist die Untersuchung der mündlichen Kommunikation in beruflichen Kontexten in Bezug auf die sprachlichen und kommunikativen Anforderungen, die spezifischen Praktiken, die zur Bearbeitung dieser Anforderungen eingesetzt werden, und die typischen Probleme, die in der Interaktion durch mangelnde Sprachbeherrschung, Verständigungsprobleme und erwartungsinkongruente Interaktionspraktiken entstehen.
Die aus einer Doktorarbeit hervorgegangene, ausgesprochen reife Monographie von Julia Kaiser ist ein solides Stück linguistischer Arbeit. Die Lektüre spricht an, erweitert den Wissenshorizont und bereichert somit viele Linguisten – von den Epigonen des Strukturalismus über Anhänger der Dependenzoder Konstruktionsgrammatik bis hin zu den Vertretern der modernen Semantik. Im Fokus der Arbeit stehen „infinitivlose“ (= absolut verwendete) Modalverben (MV) im gesprochenen Deutsch. Im Einzelnen wird auf Vollverb-Verwendungen, Ellipsen, Analepsen, MV mit Richtungsbestimmungen und idiomatisierte absolute Verwendungen eingegangen.
Introduction
(2019)
The present paper examines a variety of ways in which the Corpus of Contemporary Romanian Language (CoRoLa) can be used. A multitude of examples intends to highlight a wide range of interrogation possibilities that CoRoLa opens for different types of users. The querying of CoRoLa displayed here is supported by the KorAP frontend, through the querying language Poliqarp. Interrogations address annotation layers, such as the lexical, morphological and, in the near future, the syntactical layer, as well as the metadata. Other issues discussed are how to build a virtual corpus, how to deal with errors, how to find expressions and how to identify expressions.
This paper investigates two verbal constructions containing the German verb verdienen (‘to earn / deserve’), e.g. er verdient sich sein Brot ‘he earns his living’ (lit. he earns himself his bread) und er verdient gewürdigt zu werden ‘he deserves to be appreciated". It is shown that the notion of analogy allows for motivating some important features of particular constructions with verdienen. Two interpretations of analogy are employed: analogy in the sense of non-hierarchical family resemblance on the one hand, and analogy leading to changes by mapping a structure from one domain to another on the other hand. It is suggested that both verdienen in combination with sich and verdienen in combination with a verbal complement can be accounted for by focusing on their formal and semantic similarities connecting them to other constructions coming from the same construction family. Moreover, it is shown that versprechen and vermögen could be regarded as analogical models for verdienen.
Der Beitrag fokussiert ausgewählte Vorkommen des nicht-phorischen es. Es wird argumentiert, dass das formale Subjekt-es im Vergleich zum formalen Objekt-es insofern eine größere Variabilität zeigt, als Ersteres lexikalische und grammatische Konstruktionen konstituiert, während Letzteres nur in lexikalischen Konstruktionen erscheint. Zur Differenzierung wird der Begriff der Idiomatizität herangezogen, deren Beschaffenheit in sprachvergleichender Perspektive, mit Ungarisch als Kontrastsprache exemplarisch gezeigt wird.
Wenn Menschen heute auf der Straße protestieren, sind immer auch digitale Medien im Spiel. Ob zur Mobilisierung oder Koordination, zur Vor- oder Nachbereitung: Proteste sind durch die sprachlichen Interaktionen und medialen Praktiken der Teilnehmenden bestimmt. Mark Dang-Anh widmet sich der situativen Protestkommunikation in digitalen Medien mit einem Fokus auf Interaktionen im Mikrobloggingdienst Twitter. Anhand zweier Falluntersuchungen von Protesten gegen rechte Aufmärsche analysiert er die vielschichtigen Relationen zwischen Sprache, Medien und der sozialen Praxis des Protestierens.
Die Universität als Vorbild/Spiegelbild/Zerrbild für Spracheinstellungen und Sprachgebrauch heute?
(2019)
Der folgende Beitrag beschäftigt sich mit der Frage, wie weit der mündliche Sprachgebrauch an der Universität und die damit verbundenen Spracheinstellungen Vorbild, Spiegelbild oder aber Zerrbild des alltäglichen Sprachgebrauchs und allgemeiner Spracheinstellungen sind. Aus heuristischen Gründen liegt der Fokus dabei auf Sprachformen jenseits des Standards, die üblicherweise nicht mit einem universitären Sprachgebrauch in Verbindung gebracht werden. Die Datenerhebung dokumentiert exemplarisch die Situation an der Universität Salzburg, die Auswertung kombiniert in einem Mixed-Methods-Ansatz quantitative und qualitative Methoden.
Nearly all of the very large corpora of English are “static”, which allows a wide range of one-time, pre-processed data, such as collocates. The challenge comes with large “dynamic” corpora, which are updated regularly, and where preprocessing is much more difficult. This paper provides an overview of the NOW corpus (News on the Web), which is currently 8.2 billion words in size, and which grows by about 170 million words each month. We discuss the architecture of NOW, and provide many examples that show how data from NOW can (uniquely) be extracted to look at a wide range of ongoing changes in English.
We propose a Cross-lingual Encoder-Decoder model that simultaneously translates and generates sentences with Semantic Role Labeling annotations in a resource-poor target language. Unlike annotation projection techniques, our model does not need parallel data during inference time. Our approach can be applied in monolingual, multilingual and cross-lingual settings and is able to produce dependencybased and span-based SRL annotations. We benchmark the labeling performance of our model in different monolingual and multilingual settings using well-known SRL datasets. We then train our model in a cross-lingual setting to generate new SRL labeled data. Finally, we measure the effectiveness of our method by using the generated data to augment the training basis for resource-poor languages and perform manual evaluation to show that it produces high-quality sentences and assigns accurate semantic role annotations. Our proposed architecture offers a flexible method for leveraging SRL data in multiple languages.
In an earlier publication it was claimed that there is no useful relationship between Swahili-English dictionary look-up frequencies and the occurrence frequencies for the same wordforms in Swahili-English corpora, at least not beyond the top few thousand wordforms. This result was challenged using data for German by a different team of researchers using an improved methodology. In the present article the original Swahili-English data is revisited, using ten years’ worth of it rather than just two, and using the improved methodology. We conclude that there is indeed a positive relationship. In addition, we show that online dictionary look-up behaviour is remarkably similar across languages, even when, as in our case, one is dealing with languages from very dissimilar language families. Furthermore, online dictionaries turn out to have minimum look-up success rates, below which they simply cannot go. These minima are language-sensitive and vary depending on the regularity of the searched-for entries, but are otherwise constant no matter the size of randomly sampled dictionaries. Corpus-informed sampling always improves on any random method. Lastly, from the point of view of the graphical user interface, we argue that the average user of an online bilingual dictionary is better served with a single search box, rather than separate search boxes for each dictionary side.
How do people communicate in mobile settings of interaction? How does mobility affect the way we speak? How does mobility exert influence on the manner in which talk itself is consequential for how we move in space? Recently, questions of this sort have attracted increasing attention in the human and social sciences. This Special Issue contributes to the emerging body of studies on mobility and talk by inspecting an ordinary and ubiquitous phenomenon in which communication among mobile participants is paramount: participation in traffic. This editorial presents previous work on mobility in natural settings, as carried out by interactionally oriented researchers. It also shows how the investigation into traffic participation adds new perspectives to research on language and communication.
This paper asks whether and in which ways managing coordination tasks in traffic involve the accomplishment of intersubjectivity. Taking instances of coordinating passing an obstacle with oncoming traffic as the empirical case, four different practices were found.
1. Intersubjectivity can be presupposed by expecting others to stick to the traffic code and other mutually shared expectations.
2. Intersubjective solutions emerge step by step by mutual responsive-anticipatory adaptation of driving decisions.
3. Intersubjectivity can be accomplished by explicit interactive negotiation of passages.
4. Coordination problems can be solved without relying on intersubjectivity by unilateral, responsive-anticipatory adaptation to others’ behaviors.
Kultur ist nicht nur zu einem Schlüsselbegriff der Geisteswissenschaften geworden, sondern wird auch entterminologisiert als Alltagsbegriff benutzt. In diesem Beitrag wird untersucht, wie der Ausdruck Kultur (einschließlich Derivationen und Komposita) in der mündlichen Interaktion verwendet wird. Auf Basis von 82 Instanzen im Korpus FOLK des IDS Mannheim wurde festgestellt, dass der Ausdruck von SprecherInnen in zumeist semiformellen bis formellen Interaktionstypen benutzt wird. Es findet sich ein breites Spektrum unterschiedlicher, teils ineinander übergehender Bedeutungen, welches dem der wissenschaftlichen Literatur der Kulturtheorie ähnlich ist. Dabei lassen sich jeweils relevante Kernbedeutungen identifizieren, mit denen mehr oder weniger vage assoziierte Bedeutungen verbunden sind. Kultur zeigt sich als kontroverser Begriff: Die Referenz von Kultur, die Wertung und seine Relevanz als Erklärungsressource sind häufig umstritten.
This article examines a recurrent format that speakers use for defining ordinary expressions or technical terms. Drawing on data from four different languages - Flemish, French, German, and Italian - it focuses on definitions in which a definiendum is first followed by a negative definitional component (‘definiendum is not X’), and then by a positive definitional component (‘definiendum is Y’). The analysis shows that by employing this format, speakers display sensitivity towards a potential meaning of the definiendum that recipients could have taken to be valid. By negating this meaning, speakers discard this possible, yet unintended understanding. The format serves three distinct interactional purposes: (a) it is used for argumentation, e.g. in discussions and political debates, (b) it works as a resource for imparting knowledge, e.g. in expert talk and instructions, and (c) it is employed, in ordinary conversation, for securing the addressee's correct understanding of a possibly problematic expression. The findings contribute to our understanding of how epistemic claims and displays relate to the turn-constructional and sequential organization of talk. They also show that the much quoted ‘problem of meaning’ is, first and foremost, a participant's problem.
Mein Beitrag entstand im Rahmen meiner biografie- und interaktionsanalytischen Studie zu sozialen und sprachlichen Erfahrungen junger „Rückkehrer/innen“, d. h. junger Frauen und Männer türkischer Herkunft, die in Deutschland oder Österreich aufwuchsen, und als Jugendliche bzw. junge Erwachsene in die Türkei migrierten. Furkan, der Informant, den ich hier vorstelle, schildert Ausgrenzungserfahrungen in Deutschland aufgrund seiner ethnischen Herkunft und Anpassungsprobleme in der Türkei aufgrund sprachlicher und sozialer Auffälligkeiten. Ziel meiner Analyse ist es, die verschiedenen Phasen seiner Lebensgeschichte in beiden Lebenswelten zu beschreiben, den Zusammenhang zwischen Ausgrenzungserlebnissen, ihrer Deutung und ihrer narrativen Bewältigung zu rekonstruieren und die Unterschiede zwischen der Schilderung in beiden Lebenswelten herauszuarbeiten. Auf dieser Basis lässt sich die narrative Bewältigung der Erlebnisse in Kindheit und früher Jugend in Deutschland mit Erzählformen für Traumata in Beziehung setzen.
Narrativer Entwurf einer positiven Selbstkategorie in unterschiedlichen Sozial- und Sprachwelten
(2019)
Dieser Beitrag entstand im Rahmen meiner biografie- und interaktionsanalytischen Studie zu sozialen und sprachlichen Erfahrungen junger „RückkehrerInnen“, d.h. junger Frauen und Männer türkischer Herkunft, die in Deutschland oder Österreich aufwuchsen, und als Jugendliche bzw. junge Erwachsene in die Türkei migrierten. Arda, der Informant, den ich im Folgenden vorstellen werde, beschreibt unterschiedliche Sozialwelten in Deutschland und in der Türkei. Dabei räumt er der Beschreibung von zwei grundsätzlich unterschiedlichen Lebenswelten, die seine Kindheit in Deutschland prägen, großen Raum ein: zum einen der Lebenswelt des Türkenviertels in Kreuzberg, wo er geboren ist und bis zur Einschulung lebte, und zum anderen der deutschen Lebenswelt, in die seine Familie später umgezogen ist und in der er die Grundschule besucht und absolviert hat. Nach der Übersiedlung in die Türkei erlebt Arda eine moderne türkische Lebenswelt, an die er sich anpassen muss. In seinem neuen Leben erfährt er den schmerzlichen Verlust der deutschen Alltagssprache. Zur Beschreibung verwendet er komplexe Verfahren ethnischer und sozialer Kategorisierung und negativer bzw. positiver Selbstpositionierungen zu den verschiedenen Welten. Ziel meiner Analysen ist es nach einem Überblick über die soziolinguistische Forschung zu sozialer Kategorisierung, die Kategorisierungsprozesse und deren charakteristische Eigenschaften und Handlungsweisen, die Arda verwendet, zu rekonstruieren und die sprachlichen Mittel und Verfahren zu beschreiben, die zur Positionierung und zur Selbst- und Fremdkategorisierung verwendet werden.
The user interfaces for corpus analysis platforms must provide a high degree of accessibility for ordinary users and at the same time provide the possibility to answer complex research questions. In this paper, we present the design concepts behind the user interface of KorAP, a corpus analysis platform that has evolved into the main gateway to CoRoLa, the Reference Corpus of Contemporary Romanian Language. Based on established principles of user interface design, we show how KorAP addresses the challenge of providing a user-friendly interface for heterogeneous corpus data to a wide range of users with different research questions.
Статтю присвячено дослідженню комунікативних невдач у мовленнєвому жанрі відеоінтерв’ю крізь призму української національної ідентичності. Визначено тематику, типи і жанрово-мовну специфіку українського відеоінтерв’ю як зразка діалогічного мовлення. Встановлено специфіку комунікативних невдач у цьому жанрі (зі спортсменами, політиками і культурними діячами) з огляду на позиції комунікантів, структурні рівні досліджуваного жанру та максими спілкування.
Der Sprachwissenschaft und der Soziologie eröffnen sich angesichts der Digitalisierung vielversprechende Räume zur produktiven Zusammenarbeit. In unserem Beitrag zeigen wir, dass eine sozialstrukturelle Perspektive auf die Online-Kommunikation neue Erkenntnisse uber das Verhältnis von sprachlichem Kapital und sozialer Ungleichheit generieren kann. In Teilen der Sozialtheorie dominiert die Auffassung, dass die sprachliche Praxis ein überwiegend eigendynamisches, von sozialstrukturellen Determinanten weitestgehend unabhängiges System sei. Fur ein umfassendes Verständnis der neuen digitalen Interaktionssphären erscheint jedoch eine systematische Berücksichtigung lagebedingter sprachlicher Fähigkeiten notwendig. Der Beitrag wird dies am Beispiel sozialer Medien veranschaulichen.
Mangelhafter Adressatenzuschnitt in ukrainischen und deutschen politischen Youtube-Interviews
(2019)
The article investigates Ukrainian and German YouTube interviews from the point of view of contrastive linguistics. The purpose of this paper is to separate out the interview as a communicative genre and to determine the main aspects of research on discrepancies in expectations among interview participants, in particular to clarify the role of poor recipient design as the cause of communication failures. Results indicate that poor recipient design is the most common source of communication failures in both languages.
The article deals with communicative failures of journalists in “YouTube” celebrity video interviews in the Ukrainian and German linguacultures from the point of view of social interaction and the theory of speech genres at all structural levels of the communicative genre construction, establishing common and distinctive features in both linguacultures. The analysis made it possible to conclude that behind a language (speech) failure there is a violation caused by a journalist, a respondent, or an external noise.
Materia prima. Zur Semantik des Begriffs in naturkundlichen Sachschriften des 16. Jahrhunderts
(2019)
Katharina Dück widmet sich in diesem Buch dem umfangreichen Doktrinenschatz des Begriffs „Materia prima“ im Spannungsfeld von Theorie und wiederholbarer Praxis in deutschsprachigen alchemisch-naturkundlichen Sachschriften des 16. Jahrhunderts. Sie trägt damit neue Aspekte zur Debatte des Materialismus in der Frühen Neuzeit bei. Untersucht werden Texte sogenannter Meisterdenker als auch Zeugnisse derer, die bisher wenig berücksichtigt wurden. Dem Corpus Paracelsicum und der Strömung des Paracelsismus wird besondere Beachtung gezollt. Drei rasterartig umrissene Grundmuster, denen die „Materia prima“-Vorstellungen zugeordnet sind, werden ausführlich vorgestellt und dabei Kontinuitäten sowie Transformationen von vorhandenen Materie-Konzepten festgestellt.
Gute Argumente. Wo beginnen?
(2019)
Gerade allgemeinere Verben zeigen eine Variationsbreite der Verwendung, die nicht leicht zu einem einheitlichen Bild zu fassen ist. Am Beispiel des Verbs beginnen wird gezeigt, wie hier die Interaktion zwischen der Struktur der Aktanten und den grammatischen Regelmäßigkeiten funktioniert. Dabei wird versucht, in der Kombination von Valenzinformationen, Argumentstrukturpositionierungen und Musterbildungen im Gebrauch ein zusammenhängendes Bild dieses Verbs in seinen verschiedenen Verwendungen zu entwerfen.
Central complements: good arguments are self-explanatory.
Together with its central complements, verbs model basic patterns of interaction. The constellations of these complements in turn correspond to central patterns of the argument structure. Nominative and accusative complements formally occupy the first and second positions (subject and object), but they also have certain semantic preferences. The formal function of the dative is less pronounced, where it occurs (ditransitive verbs) the semantic imprint of the frame („transfer“) is very strong. This corresponds to the meaning of a core group of corresponding verbs. Other verbs that allow this pattern are used more often in other valence structures and the ditransitive use appears as a systematic way of personal extension of object‑related activities. This will be discussed with reference to the verbs zeigen and (in a different way) lehren.
Die Zeitung und die Welt
(2019)
Man muss glaube ich unterscheiden. Poetisch zu sein ist das eine, literarisch das andere. Das lässt sich auch auf die zugehörigen schwierigen Substantive beziehen, die Literarizität und die Poetizität. Und dann kann man auch über die poetische Funktion nachdenken, einem Postulat aus der Ergänzung der Bühler’schen Funktionstrias im Kontext des Prager Funktionalismus, die wir Roman Jakobson verdanken. Dass man unterscheiden muss, gilt vor allem oder auch noch mehr in einer nicht mehr (so) regelgeleiteten Moderne – und für eine sprachwissenschaftlich basierte Antwort.
In diesem Beitrag soll ein Nachschlagewerk zur arealen Variation in der Grammatik des Deutschen kurz vorgestellt werden: die in Form eines Online-Wikis erschienene „Variantengrammatik des Standarddeutschen“. Sie ist das Hauptergebnis einer langjährigen Zusammenarbeit der Projektgruppe „Variantengrammatik“ unter der Leitung der Autorin und der Autoren dieses Beitrags. Für das Projekt wurde ein areal gewichtetes und annotiertes Korpus erstellt, das aus Lokal- und Regionalteilen der Online-Ausgaben von 68 regional verbreiteten Zeitungen besteht. Die ausgewählten Zeitungen sind nach fünfzehn Arealen des zusammenhängenden deutschsprachigen Raums unterteilt. Das tokenisierte, lemmatisierte und nach Wortarten annotierte Gesamtkorpus, auf das sich die Variantengrammatik stützt, umfasst ca. 600 Millionen Wörter.
Lebenslauf bis 2019
(2019)
Ulrich Engel schildert die einzelnen Stationen seines Lebens: als Kind im Vorkriegsdeutschland und als junger Soldat, anschließend seine Lehrertätigkeit und wissenschaftliche Laufbahn, insbesondere seine Funktion als Direktor des Instituts für Deutsche Sprache in Mannheim. Er hebt seine Tätigkeit als Leiter von mehreren Projekten von kontrastiven zweisprachigen Grammatiken sowie Valenzwörterbüchern hervor. Dabei schildert er seinen familiären Hintergrund als Spiegel des gesellschaftlich‑politischen Wandels im Vor‑ und Nachkriegsdeutschland.
Theories of lexical decomposition assume that lexical meanings are complex. This complexity is expressed in structured meaning representations that usually consist of predicates, arguments, operators, and other elements of propositional and predicate logic. Lexical decomposition has been used to explain phenomena such as argument linking, selectional restrictions, lexical-semantic relations, scope ambiguities, and the inference behavior of lexical items. The article sketches the early theoretical development from noun-oriented semantic feature theories to verb-oriented complex decompositions. It also deals with a number of theoretical issues, including the controversy between decompositional and atomistic approaches to meaning, the search for semantic primitives, the function of decompositions as definitions, problems concerning the interpretability of decompositions, and the debate about the cognitive status of decompositions.
Starting from early approaches within Generative Grammar in the late 1960s, the article describes and discusses the development of different theoretical frameworks of lexical decomposition of verbs. It presents the major subsequent conceptions of lexical decompositions, namely, Dowty’s approach to lexical decomposition within Montague Semantics, Jackendoff’s Conceptual Semantics, the LCS decompositions emerging from the MIT Lexicon Project, Pustejovsky’s Event Structure Theory, Wierzbicka’s Natural Semantic Metalanguage, Wunderlich’s Lexical Decompositional Grammar, Hale and Kayser’s Lexical Relational Structures, and Distributed Morphology. For each of these approaches, (i) it sketches their origins and motivation, (ii) it describes the general structure of decompositions and their location within the theory, (iii) it explores their explanative value for major phenomena of verb semantics and syntax, (iv) and it briefly evaluates the impact of the theory. Referring to discussions in article 7 [Semantics: Foundations, History and Methods] (Engelberg) Lexical decomposition, a number of theoretical topics are taken up throughout the paper concerning the interpretation of decompositions, the basic inventory of decompositional predicates, the location of decompositions on the different levels of linguistic representation (syntactic, semantic, conceptual), and the role they play for the interfaces between these levels.
Argumentstrukturmuster. Ein elektronisches Handbuch zu verbalen Argumentstrukturen im Deutschen
(2019)
Valency-based and construction-based approaches to argument structure have been competing for quite a while. However, while valency-based approaches are backed up by numerous valency dictionaries as comprehensive descriptive resources, nothing comparable exists for construction-based approaches. The paper at hand describes the foundations of an ongoing project at the Institut für Deutsche Sprache in Mannheim. Aim of the project is the compilation of an online available description of a net of German argument structure patterns. The main purpose of this resource is to provide an empirical basis for an evaluation of the adequacy of valency- versus construction-based theories of argument structure. The paper at hand addresses the theoretical background, in particular the concepts of pattern and argument structure, and the corpus-based method of the project. Furthermore, it describes the coverage of the resource, the microstructure of the articles, and the macrostructure which is conceived of as a net of argument structure patterns based on family resemblance.
We report on a new project building a Natural Language Processing resource for Zulu by making use of resources already available. Combining tagging results with the results of morphological analysis semi-automatically, we expect to reduce the amount of manual work when generating a finely-grained gold standard corpus usable for training a tagger. From the tagged corpus, we plan to extract verb-argument pairs with the aim of compiling a verb valency lexicon for Zulu.
Question Answering Systems for retrieving information from Knowledge Graphs (KG) have become a major area of interest in recent years. Current systems search for words and entities but cannot search for grammatical phenomena. The purpose of this paper is to present our research on developing a QA System that answers natural language questions about German grammar.
Our goal is to build a KG which contains facts and rules about German grammar, and is also able to answer specific questions about a concrete grammatical issue. An overview of the current research in the topic of QA systems and ontology design is given and we show how we plan to construct the KG by integrating the data in the grammatical information system Grammis, hosted by the Leibniz-Institut für Deutsche Sprache (IDS). In this paper, we describe the construction of the initial KG, sketch our resulting graph, and demonstrate the effectiveness of such an approach. A grammar correction component will be part of a later stage. The paper concludes with the potential areas for future research.
Distributional models of word use constitute an indispensable tool in corpus based lexicological research for discovering paradigmatic relations and syntagmatic patterns (Belica et al. 2010). Recently, word embeddings (Mikolov et al. 2013) have revived the field by allowing to construct and analyze distributional models on very large corpora. This is accomplished by reducing the very high dimensionality of word cooccurrence contexts, the size of the vocabulary, to few dimensions, such as 100-200. However, word use and meaning can vary widely along dimensions such as domain, register, and time, and word embeddings tend to represent only the most prevalent meaning. In this paper we thus construct domain specific word embeddings to allow for systematically analyzing variations in word use. Moreover, we also demonstrate how to reconstruct domain specific co-occurrence contexts from the dense word embeddings.
Der vorliegende Beitrag setzt sich mit dem computergestützten Transkriptionsverfahren arabisch-deutscher Gesprächsdaten für interaktionsbezogene Untersuchungen auseinander. Zunächst werden wesentliche methodische Herausforderungen der gesprächsanalytischen Arbeit adressiert: Hinsichtlich der derzeitigen Korpustechnologie ermöglicht die Verwendung von arabischen Schriftzeichen in einem mehrsprachigen, bidirektionalen Transkript keine analysegerechte Rekonstruktion von Reziprozität, Linearität und Simultaneität sprachlichen Handelns. Zudem ist die Verschriftung von arabischen Gesprächsdaten aufgrund der unzureichenden (gesprächsanalytischen) Beschäftigung mit den standardfernen Varietäten und gesprochensprachlichen Phänomenen erschwert. Daher widmet sich der zweite Teil des Beitrags den bisher erarbeiteten und erprobten Lösungsansätzen ̶ einem stringenten, gesprächsanalytisch fundierten Transkriptionssystem für gesprochenes Arabisch.
The paper deals with the process of computer-aided transcription regarding Arabic-German data material for interaction-based studies. First of all, it sheds light upon some major methodological challenges posed by the conversation-analytic approaches: due to current corpus technology, the reciprocity, linearity, and simultaneity of linguistic activities cannot be reconstructed in an analytically proper way when using the Arabic characters in multilingual and bidirectional transcripts. The difficulty of transcribing Arabic encounters is also compounded by the fact that Spoken Arabic as well as its varieties and phenomena have not been standardised enough (for conversation-analytic purposes). Therefore, the second part of this paper is dedicated to preliminary, self-developed solutions, namely a systematic method for transcribing Spoken Arabic.
Lektürehinweis
(2019)
Das Handbuch ist eine periodische und mehrsprachige Online-Publikation. Die bisher veröffentlichten Bände wurden bereits über 8.500 Mal heruntergeladen. Für Leserinnen und Leser, die das haptische Leseerlebnis bevorzugen, ist die Publikation zudem im Printformat erhältlich. Zu ausgewählten Konzepten der Sprachkritik werden sukzessive enzyklopädische Artikel veröffentlicht, die ein sprachkritisches Schlüsselkonzept betreffen und die für die europäische Perspektive von kultureller Bedeutung sind. Das Ziel ist demnach, eine Konzeptgeschichte der europäischen Sprachkritik zu präsentieren. Zum einen liefert das Handbuch einen spezifischen Blick auf die jeweiligen Sprachkulturen. Zum anderen werden diese vergleichend in den Blick genommen.
Einleitung
(2019)
Der vorliegende Band „Sprachinstitutionen und Sprachkritik“ weist eine unmittelbare Verbindung zu den ersten drei Bänden unserer Handbuchreihe und der Frage auf, wie sich das viel diskutierte und diskursiv konstituierte Konzept der sprachlichen Normierung und Standardisierung einer Nationalsprache im Vergleich der Sprachkulturen entwickelt hat und wie es sich aktuell wandelt. Diese Gesichtspunkte lassen aufschlussreiche Verbindungen zum ersten Handbuchband „Sprachnormierung und Sprachkritik“ erkennen, aber auch zum zweiten („Standardisierung und Sprachkritik“) und zum dritten Handbuchband („Sprachpurismus und Sprachkritik“).
Zwischen Perspektiven
(2019)