Refine
Year of publication
- 2018 (152) (remove)
Document Type
- Article (71)
- Part of a Book (46)
- Conference Proceeding (21)
- Review (7)
- Book (4)
- Part of Periodical (2)
- Periodical (1)
Keywords
- Deutsch (49)
- Korpus <Linguistik> (29)
- Konversationsanalyse (16)
- Gesprochene Sprache (13)
- Interaktion (13)
- Multimodalität (11)
- Grammatik (10)
- Computerlinguistik (9)
- Interaktionsanalyse (9)
- conversation analysis (8)
Publicationstate
- Veröffentlichungsversion (90)
- Zweitveröffentlichung (50)
- Postprint (27)
Reviewstate
- Peer-Review (152) (remove)
Publisher
- de Gruyter (16)
- European language resources association (ELRA) (13)
- Erich Schmidt (11)
- Verlag für Gesprächsforschung (8)
- Znanstvena založba Filozofske fakultete Univerze v Ljubljani / Ljubljana University Press, Faculty of Arts (7)
- Heidelberg University Publishing (5)
- Springer (5)
- Association for Computational Linguistics (4)
- Institut für Deutsche Sprache (4)
- Cambridge University Press (3)
Am Beispiel der polyfunktionalen Mehrworteinheit <was weiß ich> wird das Zusammenspiel von pragmatischer und phonetischer Ausdifferenzierung in Pragmatikalisierungsprozessen untersucht. Hierzu werden spontan-sprachliche Belege aus dem Korpus „Deutsch heute“ analysiert. Die beobachtete phonetische Variationsbreite deutet auf eine komplexe Beziehung zu den jeweiligen pragmatischen Funktionen hin.
This paper investigates the conditions that govern the choice between the German neuter singular relative pronouns das ‘that’ and was ‘what’. We show that das requires a lexical head noun, while in all other cases was is usually the preferred option; therefore, the distribution of das and was is most successfully captured by an approach that does not treat was as an exception but analyzes it as the elsewhere case that applies when the relativizer fails to pick up a lexical gender feature from the head noun. We furthermore show how the non-uniform behavior of different types of nominalized adjectives (positives allow both options, while superlatives trigger was) can be attributed to semantic differences rooted in syntactic structure. In particular, we argue that superlatives select was due to the presence of a silent counterpart of the quantifier alles ‘all’ that is part of the superlative structure.
This paper argues that there is a correlation between functional and purely grammatical patterning in language, yet the nature of this correlation has to be explored. This claim is based on the results of a corpus-driven study of the Slavic aspect, drawing on the socalled Distributional Hypothesis. According to the East-West Theory of the Slavic aspect, there is a broad east-west isogloss dividing the Slavic languages into an eastern group and a western group. There are also two transitional zones in the north and south, which share some properties with each group (Dickey 2000; Barentsen 1998, 2008). The East-West Theory uses concepts of cognitive grammar such as totality and temporal definiteness, and is based on various parameters of aspectual usage in discourse, including contexts such as habituals, general factuals, historical (narrative) present, performatives, sequenced events in the past etc. The purpose of the above-mentioned study is to challenge the semantic approach to the Slavic aspect by comparing the perfective and imperfective verbal aspect on the basis of purely grammatical co-occurrence patterns (see also Janda & Lyashevskaya 2011). The study focused on three Slavic languages: Russian, which, following the East-West Theory, belongs to the eastern group, Czech, which belongs to the western group, and Polish, which is considered as transitional in its aspectual patterning.
We present a testsuite for POS tagging German web data. Our testsuite provides the original raw text as well as the gold tokenisations and is annotated for parts-of-speech. The testsuite includes a new dataset for German tweets, with a current size of 3,940 tokens. To increase the size of the data, we harmonised the annotations in already existing web corpora, based on the Stuttgart-Tübingen Tag Set. The current version of the corpus has an overall size of 48,344 tokens of web data, around half of it from Twitter. We also present experiments, showing how different experimental setups (training set size, additional out-of-domain training data, self-training) influence the accuracy of the taggers. All resources and models will be made publicly available to the research community.
In a number of languages, agreement in specificational copular sentences can or must be with the second of the two nominals, even when it is the first that occupies the canonical subject position. Béjar & Kahnemuyipour (2017) show that Persian and Eastern Armenian are two such languages. They then argue that ‘NP2 agreement’ occurs because the nominal in subject position (NP1) is not accessible to an external probe. It follows that actual agreement with NP1 should never be possible: the alternative to NP2 agreement should be ‘default’ agreement. We show that this prediction is false. In addition to showing that English has NP1, not default, agreement, we present new data from Icelandic, a language with rich agreement morphology, including cases that involve ‘plurale tantum’ nominals as NP1. These allow us to control for any confound from the fact that typically in a specificational sentence with two nominals differing in number, it is NP2 that is plural. We show that even in this case, the alternative to agreement with NP2 is agreement with NP1, not a default. Hence, we conclude that whatever the correct analysis of specificational sentences turns out to be, it must not predict obligatory failure of NP1 agreement.
We present a study on gaps in spoken language interaction as a potential candidate for syntactic boundaries. On the basis of an online annotation experiment, we can show that there is an effect of gap duration and gap type on its likelihood of being a syntactic boundary. We discuss the potential of these findings for an automation of the segmentation process.
A syntax-based scheme for the annotation and segmentation of German spoken language interactions
(2018)
Unlike corpora of written language where segmentation can mainly be derived from orthographic punctuation marks, the basis for segmenting spoken language corpora is not predetermined by the primary data, but rather has to be established by the corpus compilers. This impedes consistent querying and visualization of such data. Several ways of segmenting have been proposed,
some of which are based on syntax. In this study, we developed and evaluated annotation and segmentation guidelines in reference to the topological field model for German. We can show that these guidelines are used consistently across annotators. We also investigated the influence of various interactional settings with a rather simple measure, the word-count per segment and unit-type. We observed that the word count and the distribution of each unit type differ in varying interactional settings and that our developed segmentation and annotation guidelines are used consistently across annotators. In conclusion, our syntax-based segmentations reflect interactional properties that are intrinsic to the social interactions that participants are involved in. This can be used for further analysis of social interaction and opens the possibility for automatic segmentation of transcripts.
This paper aims to describe different patterns of syntactic extensions of turns-at-talk in mundane conversations in Czech. Within interactional linguistics, same-speaker continuations of possibly complete syntactic structures have been described for typologically diverse languages, but have not yet been investigated for Slavic languages. Based on previously established descriptions of various types of extensions (Vorreiter 2003; Couper-Kuhlen & Ono 2007), our initial description shall therefore contribute to the cross-linguistic exploration of this phenomenon. While all previously described forms for continuing a turn-constructional unit seem to exist in Czech, some grammatical features of this language (especially free word order and strong case morphology) may lead to problems in distinguishing specific types of syntactic extensions. Consequently, this type of language allows for critically evaluating the cross-linguistic validity of the different categories and underlines the necessity of analysing syntactic phenomena within their specific action contexts.
Just like most varieties of West Germanic, virtually all varieties of German use a construction in which a cognate of the English verb 'do' (standard German 'tun') functions as an auxiliary and selects another verb in the bare infinitive, a construction known as 'do'-periphrasis or 'do'-support. The present paper provides an Optimality Theoretic (OT) analysis of this phenomenon. It builds on a previous analysis by Bader and Schmid (An OT-analysis of 'do'-support in Modern German, 2006) but (i) extends it from root clauses to subordinate clauses and (ii) aims to capture all of the major distributional patterns found across (mostly non-standard) varieties of German. In so doing, the data are used as a testing ground for different models of German clause structure. At first sight, the occurrence of 'do' in subordinate clauses, as found in many varieties, appears to support the standard CP-IP-VP analysis of German. In actual fact, however, the full range of data turn out to challenge, rather than support, this model. Instead, I propose an analysis within the IP-less model by Haider (Deutsche Syntax - generativ. Vorstudien zur Theorie einer projektiven Grammatik, Narr, Tübingen, 1993 et seq.). In sum, the 'do'-support data will be shown to have implications not only for the analysis of clause structure but also for the OT constraints commonly assumed to govern the distribution of 'do', for the theory of non-projecting words (Toivonen in Non-projecting words, Kluwer, Dordrecht, 2003) as well as research on grammaticalization.
The grammatical information system grammis combines descriptive texts on German grammar with dictionaries of specific word classes and grammatical terminology. In this paper, we describe the first attempts at analyzing user behavior for an online grammar of the German language and the implementation of an analysis and data extraction tool based on Matomo, a web analytics tool. We focus on the analysis of the keywords the users search for, either within grammis or via an external search platform like Google, and the analysis of the interaction between the text components within grammis and the integrated dictionaries. The overall results show that about 50% of the searches are for grammatical terms, and that the users shift from texts to dictionaries, mainly by using the integrated links to the dictionary of terminology within the texts. Based on these findings, we aim to improve grammis by extending its integrated dictionaries.
Das hier zu besprechende Buch, das Ergebnisse einer gleichnamigen Tagung zusammenfasst, die im Juni 2013 in Zürich stattfand, macht eines offenkundig: Wer in jenem Sommer nicht dabei war, hat etwas verpasst. Umso glücklicher darf man sein, dass Angelika Linke und Juliane Schröter die Arbeit, die mit der Herausgabe eines Sammelbandes verbunden ist, auf sich genommen haben. Mehr noch: In einem programmatischen ersten Kapitel geben sie einen systematischen Einblick in das tragfähige Forschungsfeld „Sprachliche Relationalität“ (vgl. S. 1–6), das ganz im Sinne der emotiven Wende in der Sprachwissenschaft konkrete theoretische Anschlussfähigkeit signalisiert, wo bislang eine „fast unübersehbare Menge an Veröffentlichungen“ (Schwarz-Friesel 2013: 16) zwar zeigte, wie attraktiv die Thematik ist, aber auch wie unstrukturiert sich die Zuwendung dazu gestaltet. Dass der Band nun weitere „exemplarische Besetzungen“ (S. 21) des Forschungsfeldes zur Diskussion stellt, wird hier keinesfalls als Nachteil angesehen, sondern als methodisch folgerichtiger empirischer Zugang zur Erschließung eines Forschungsfeldes unter den zielsetzenden Leitfragen „Wie werden im Medium von Sprachgebrauch und Sprache Konzeptualisierungen, Kategorisierungen und Differenzierungen menschlicher Beziehungen ausgebildet, verfestigt und auch wieder verändert?“ und „Welche sprachgeformten Beziehungskonzepte, -kategorien und -unterschiede sind typisch für bestimmte historische Epochen bzw. für bestimmte soziale Gruppierungen?“
In HDK-1 und in HDK-2 werden Perfektpartizipien wie angenommen und vorausgesetzt in der ‚absoluten‘ Verwendung ohne Auxiliar als vollständig grammatikalisierte Konnektoren mit konditionaler Semantik behandelt. Zwar werden sie von semantisch unterschiedlichen Verben gebildet, in der Verwendung als Konnektor lassen sich aber zumindest hinsichtlich der Wahrheitsbedingungen kaum semantische Unterschiede mehr erkennen. Deutliche Unterschiede zeigen sich aber im Sprachgebrauch: Basierend auf einer groß angelegten Korpusstudie wird gezeigt, dass sich angenommen und vorausgesetzt stark unterscheiden hinsichtlich a) ihrer Präferenz für die Einbettung von V2- vs. dass-Nebensätzen, b) des präferierten Verbmodus im Nebensatz, c) der topologischen Präferenz des untergeordneten Satzes sowie d) der Kookkurrenz mit anderen Ausdrücken. Es wird versucht, diese Unterschiede mit einem pragmatisch-funktionalen Ansatz zu erklären.
The workshop presents ATHEN 1 (Annotation and Text Highlighting Environment), an extensible desktop-based annotation environment which supports more than just regular annotation. Besides being a general purpose annotation environment, ATHEN supports indexing and querying support of your data as well as the ability to automatically preprocess your data with Meta information. It is especially suited for those who want to extend existing general purpose annotation tools by implementing their own custom features, which cannot be fulfilled by other available annotation environments. On the according gitlab, we provide online tutorials, which demonstrate the use of specific features of ATHEN
Bisherige linguistische Studien zum mündlichen Erzählen beziehen sich vornehmlich auf die Beschreibung verbaler und vokaler Verfahren. Erzählen findet jedoch häufig unter den Bedingungen der zeitlich-räumlichen Ko-Präsenz der SprecherInnen statt, die den Gebrauch von körperlichen und materiellen Ressourcen ermöglicht. Der vorliegende einleitende Beitrag des Themenheftes modelliert Erzählen daher als körpergebundene und verkörperlichte Praktik, die es im Rahmen von interaktionalen und sequenzorientierten Analyseansätzen zu beschreiben gilt. Im Anschluss an die Darstellung von Entwicklungslinien der soziolinguistischen und interaktional-gesprächsanalytischen Untersuchung konversationellen Erzählens wird ein Überblick über bisherige Befunde zur multimodalen Ausgestaltung des Erzählens in der face-to-face-Interaktion gegeben. Abschließend werden grundlegende Fragestellungen skizziert, deren Beantwortung im Rahmen einer multimodalen Erzählanalyse die tatsächliche Alltagspraxis des Erzählens umfassender zu erschließen vermag.
This paper presents the results of a survey on dictionary use in Europe, the largest survey of dictionary use to date with nearly 10,000 participants in nearly thirty countries. The paper focuses on the comparison of the results of the Slovenian participants with the results of the participants from other European countries. The comparisons are made both with the European averages, and with the results from individual countries, in order to determine in which aspects Slovenian participants share similarities with other dictionary users (and non-users) around Europe, and in which aspects they differ. The findings show that in many ways the Slovenian users are similar to their European counterparts, with some noticeable exceptions, including (much) stronger preference for digital dictionaries over print ones, above-average reliance on other people when dictionary does not contain the relevant information, and the largest difference between the price of a dictionary and the amount willing to spend on it.
In this paper we use methods for creating a large lexicon of verbal polarity shifters and apply them to German. Polarity shifters are content words that can move the polarity of a phrase towards its opposite, such as the verb “abandon” in “abandon all hope”. This is similar to how negation words like “not” can influence polarity. Both shifters and negation are required for high precision sentiment analysis. Lists of negation words are available for many languages, but the only language for which a sizable lexicon of verbal polarity shifters exists is English. This lexicon was created by bootstrapping a sample of annotated verbs with a supervised classifier that uses a set of data- and resource-driven features. We reproduce and adapt this approach to create a German lexicon of verbal polarity shifters. Thereby, we confirm that the approach works for multiple languages. We further improve classification by leveraging cross-lingual information from the English shifter lexicon. Using this improved approach, we bootstrap a large number of German verbal polarity shifters, reducing the annotation effort drastically. The resulting German lexicon of verbal polarity shifters is made publicly available.
Die „21. Arbeitstagung zur Gesprächsforschung“ mit dem Rahmenthema „Vergleichende Gesprächsforschung“ fand vom 21.-23. März 2018 am Institut für Deutsche Sprache in Mannheim statt. Das Ziel der Tagung war es, Forscherinnen und Forscher zusammenzubringen, die authentische Interaktionsdaten aus vergleichender Perspektive untersuchen. Das Rahmenthema der Tagung ergab sich aus dem steigenden Interesse an vergleichenden Fragestellungen innerhalb konversations- und gesprächsanalytischer Untersuchungen. Die Tagung nahm gezielt Vorgehensweisen und Methoden bei der Durchführung vergleichender Untersuchungen in den Blick. Die Vorträge1, Projektpräsentationen und Datensitzungen erörterten 1. das Vergleichen als analytische Grundoperation der Konversations- und Gesprächsanalyse, 2. Vergleiche alternativer Ressourcen und Praktiken für spezifische Handlungen und Aktivitäten in der Interaktion sowie 3. methodologische Herausforderungen einer vergleichenden Gesprächsforschung.
Der Beitrag beschäftigt sich mit der Interaktion zwischen blinden und sehenden Personen bei der kooperativen Anfertigung einer Audiodeskription. Eine Audio-deskription ist die verbale Beschreibung visueller Inhalte für Sehbeeinträchtigte und stellt eine Sonderform der Translation dar. Auf der Basis von Videodaten wird die Kooperation eines Dreierteams mit den Verfahren der multimodalen Interaktionsanalyse untersucht. Ein Charakteristikum dieser Kooperation besteht darin, dass eines der Teammitglieder blind ist und die beiden anderen sehen können. Das Erkenntnisinteresse richtet sich besonders auf die professionelle Beteiligung des blinden Teammitglieds an der Interaktion. Die Analyse zeigt, wie Blindheit als Ressource für die kooperative Herstellung der Audiodeskription genutzt wird und wie die Beteiligten in einer visuell asymmetrischen Situation interagieren. Der Beitrag ist eine der seltenen Untersuchungen, die sich mit professioneller Interaktion zwischen Blinden und Sehenden beschäftigen. Er diskutiert Aspekte von genereller Relevanz für die weitere Entwicklung der empirischen Interaktionsforschung, vor allem in Bezug auf eine Erweiterung von Beteiligungsperspektiven in Richtung Inklusion.
The present submission reports on a pilot project conducted at the Institute for the German Language (IDS), aiming at strengthening the connection between ISO TC37SC4 “Language Resource Management” and the CLARIN infrastructure. In terminology management, attempts have recently been made to use graph-theoretical analyses to get a better understanding of the structure of terminology resources. The project described here aims at applying some of these methods to potentially incomplete concept fields produced over years by numerous researchers serving as experts and editors of ISO standards. The main results of the project are twofold. On the one hand, they comprise concept networks dynamically generated from a relational database and browsable by the user. On the other, the project has yielded significant qualitative feedback that will be offered to ISO. We provide the institutional context of this endeavour, its theoretical background, and an overview of data preparation and tools used. Finally, we discuss the results and illustrate some of them.
German is a language with complex morphological processes. Its long and often ambiguous word forms present a bottleneck problem in natural language processing. As a step towards morphological analyses of high quality, this paper introduces a morphological treebank for German. It is derived from the linguistic database CELEX which is a standard resource for German morphology. We build on its refurbished, modernized and partially revised version. The derivation of the morphological trees is not trivial, especially for such cases of conversions which are morpho-semantically opaque and merely of diachronic interest. We develop solutions and present exemplary analyses. The resulting database comprises about 40,000 morphological trees of a German base vocabulary whose format and grade of detail can be chosen according to the requirements of the applications. The Perl scripts for the generation of the treebank are publicly available on github. In our discussion, we show some future directions for morphological treebanks. In particular, we aim at the combination with other reliable lexical resources such as GermaNet.
Inequalities between men and women are common and well-documented. Objective indexes show that men are better positioned than women in societal hierarchies—there is no single country in the world without a gender gap. In contrast, researchers have found that the women-are-wonderful effect—that women are evaluated more positively than men overall—is also common. Cross-cultural studies on gender equality reveal that the more gender egalitarian the society is, the less prevalent explicit gender stereotypes are. Yet, because self-reported gender stereotypes may differ from implicit attitudes towards each gender, we reanalysed data collected across 44 cultures, and (a) confirmed that societal gender egalitarianism reduces the women-are-wonderful effect when it is measured more implicitly (i.e. rating the personality of men and women presented in images) and (b) documented that the social perception of men benefits more from gender egalitarianism than that of women.
Data Management is one of the core activities of all CLARIN centres providing data and services for the academia. In PARTHENOS, European initiatives and projects in the area of the humanities and social sciences assembled to compare policies and procedures. One of the areas of interest is data management. The data management landscape shows a lot of proliferation, for which an abstraction level is introduced to help centres, such as CLARIN centres, in the process of providing the best possible services to users with data management needs.
Many studies on dictionary use presuppose that users do indeed consult lexicographic resources. However, little is known about what users actually do when they try to solve language problems on their own. We present an observation study where learners of German were allowed to browse the web freely while correcting erroneous German sentences. In this paper, we are focusing on the multi-methodological approach of the study, especially the interplay between quantitative and qualitative approaches. In one example study, we will show how the analysis of verbal protocols, the correction task and the screen recordings can reveal the effects of intuition, language (learning) awareness, and determination on the accuracy of the corrections. In another example study, we will show how preconceived hypotheses about the problem at hand might hinder participants from arriving at the correct solution.
This paper discusses changes in lexicographic traditions with respect to contrastive dictionary entries and dynamic, on-demand e-lexicographic descriptions. The new German online dictionary Paronyme - Dyna- misch im Kontrast is concerned with easily confused words (paronyms), such as effektivtefficient and sensibel/ sensitiv. New approaches to the empirical analysis and lexicographic presentation of words such as these are required, and this dictionary is committed to overcoming the discrepancy between traditional practice and insights from language use. As a corpus-guided reference work, it strives to adequately reflect not only authentic use in situations of actual communication, but also cognitive ideas such as conceptual structure, categorization and knowledge. Looking up easily confused lexical items requires contrastive entries where users can instantly compare meaning, contexts and reference. Adaptable access to lexicographic details and variable search options offer different foci and perspectives on linguistic information, and authentic examples reflect prototypical structures. These are essential in order to meet all the different interests of users. This paper will illustrate the contrastive structure of the new e-dictionary and demonstrate which information can be compared. It also focusses on various dynamic modes of dictionary consultation, which enable users to shift perspectives on paronyms accordingly.
Several studies have examined effects of explicit task demands on eye movements in reading. However, there is relatively little prior research investigating the influence of implicit processing demands. In this study, processing demands were manipulated by means of a between-subject manipulation of comprehension question difficulty. Consistent with previous results from Wotschack and Kliegl, the question difficulty manipulation influenced the probability of regressing from late in sentences and re-reading earlier regions; readers who expected difficult comprehension questions were more likely to re-read. However, this manipulation had no reliable influence on eye movements during first-pass reading of earlier sentence regions. Moreover, for the subset of sentences that contained a plausibility manipulation, the disruption induced by implausibility was not modulated by the question manipulation. We interpret these results as suggesting that comprehension demands influence reading behavior primarily by modulating a criterion for comprehension that readers apply after completing first-pass processing.
In the past two decades, more and more dictionary usage studies have been published, but most of them deal with questions related to what users appreciate about dictionaries, which dictionaries they use and what type of information they need in specific situations — presupposing that users actually consult lexicographic resources. However, language teachers and lecturers in linguistics often have the impression that students do not use enough high-quality dictionaries in their everyday work. With this in mind, we launched an international cooperation project to collect empirical data to evaluate what it is that students actually do while attempting to solve language problems. To this end, we applied a new methodological setting: screen recording in conjunction with a thinking-aloud task. The collected empirical data offers a broad insight into what users really do while they attempt to solve language-related tasks online.
Except for some recent advances in spoken language lexicography (cf. Verdonik & Sepesy Maučec 2017, Hansen & Hansen 2012, Siepmann 2015), traditional lexicographic work is mainly oriented towards the written language. In this paper, we describe a method we used to identify relevant headword candidates for a lexicographic resource for spoken language that is currently being developed at the Institute for the German Language (IDS, Mannheim). We describe the challenges of the headword selection for a dictionary of spoken language, and having made considerations regarding our headword concept, we present the corpus-based procedures that we used in order to facilitate the headword selection. After presenting the results regarding the selection of one-word lemmas, we discuss the opportunities and limitations of our approach.
Der Beitrag untersucht auf der Grundlage der multimodal-raumanalytischen Interaktionsanalyse die Abendmahlfeier in drei lutherisch-protestantischen Gottesdiensten. Die Videoaufnahmen hierzu stammen aus Sarepta (Russland) und Rimbach und Zotzenbach (Deutschland). Nach einer kurzen Einordnung des Beitrags in den relevanten Forschungszusammenhang wird das spezifische raumanalytische Erkenntnisinteresse am Abendmahl als kollektive Positionierungsanforderung erläutert. Drei Fallanalysen rekonstruieren zunächst die interaktionsarchitektonischen Voraussetzungen für die kollektive Bewegung der Gemeinde ins kirchenräumliche Vorne. Diese Bewegung, die Positionierung der Gemeinde zur Einnahme des Abendmahls (der Konsum von Wein und Brot) und der Rückweg zu den Kirchenbänken sind raumbezogene Teilaufgaben, die in der konkreten Situation bearbeitet werden müssen. Die Bewegung der Gemeinde wird in den drei analysierten Gottesdiensten auf sehr unterschiedliche Weise organisiert. Die Rekonstruktion dieser Unterschiede ermöglicht die Formulierung von drei unterschiedlichen Vollzugsmodellen primär auf der Basis der zwei folgenden Aspekte: Relevant ist zum einen das Ausmaß und die Form der Vergemeinschaftung
(als symbolischer Nachvollzugs des überlieferten Abendmahls von Jesus Christus mit seinen Jüngern am Gründonnerstag) und zum anderen die Spezifik, in der die Teilnehmer konkret den Wein und das Brot konsumieren. Auf diesem Wege konnten ein Modell der Vergemeinschaftung mit Kollektivversorgung (Sarepta), ein Modell der Teil-Vergemeinschaftung mit Teil-Gruppenversorgung (Zotzenbach) sowie ein Individualisierungsmodell mit Einzelversorgung (Rimbach) identifiziert werden. Als strukturprägende Einflussgrößen werden einerseits die Möglichkeiten, die die Architektur für den Vollzug des Abendmahls zur Verfügung stellt, und andererseits die Anzahl der Teilnehmer deutlich. Ab einer gewissen Anzahl entsteht eine Art Ökonomisierungszwang, der sich negativ auf die Qualität der Vergemeinschaftung auswirkt. Von Reinhold Schmitt stammt die Idee, das Abendmahl als Koordinations- und Positionierungsaufgabe zu konzeptualisieren. Er hat auch die multimodal-interaktionsanalytische Methodologie entwickelt, die dem Beitrag zugrunde liegt. Darüber hinaus hat er die Videoaufnahmen in Rimbach und Zotzenbach erstellt und transkribiert. Anna Petrova hat die Gottesdienste in Sarepta dokumentiert und transkribiert. Die methodische und theoretische Konzeption des Beitrags stammt von beiden Autoren. Auch die Analysen der ausgewählten Fälle haben sie gemeinsam durchgeführt.
Der Artikel widmet sich den politischen Fernsehinterviews im Ukrainischen und Deutschen aus der Perspektive der Persönlichkeit des Interviewers und der Schwierigkeiten, die vor und während des Fernsehinterviews auftreten. Kommunikative Abweichungen (Deviationen) werden als Unterschiede in den Erwartungen des Interviewers im Vergleich zu den Erwartungen des Befragten und des Adressaten aufgezeigt und analysiert. Besonderes Augenmerk wird auf das Beziehungsdreieck, bestehend aus Interviewer, Befragter und Adressat, gelegt. Bei der Beziehung zwischen diesen drei Größen spielen die Elemente Alter, Geschlecht, Status, Wissen, Interessen und Erwartungen eine wichtige Rolle und tragen zum Erfolg des Interviews bei. Dementsprechend übernimmt der Journalist drei Rollen: als Vertreter des Publikums, als Promotor des Eingeladenen (des Befragten) oder als Vertreter von sich selbst. Durch kommunikative Deviationen werden die Unterschiede in den Erwartungen der Kommunikatoren in einem Interview verstanden. In diesem Artikel wird nur auf die Abweichungen in den Fernsehinterviews in beiden Sprachen eingegangen, wenn der Interviewer andere Erwartungen an das Interview hat als der Befragte oder der Adressat (der Zuschauer), was für das erste ein Misserfolg ist, d.h. für den Interviewer. Es werden kommunikative Abweichungen des Interviewers gegenüber dem Befragten und dem Adressaten skizziert und die Strategien zur Überwindung von Misserfolgen eines Fernsehinterviews vorgeschlagen. Kommunikative Abweichungen als Verstöße gegen die Erwartungen des Interviewers in all seinen Erscheinungsformen können vermieden oder zumindest reduziert werden, wenn alle Elemente der Kommunikation auf informativer und emotionaler und sehr oft auf kommunikativ-situativer Ebene samt technischen Besonderheiten berücksichtigt werden.
We present a language learning application that relies on grammars to model the learning outcome. Based on this concept we can provide a powerful framework for language learning exercises with an intuitive user interface and a high reliability. Currently the application aims to augment existing language classes and support students by improving the learner attitude and the general learning outcome. Extensions beyond that scope are promising and likely to be added in the future.
Deutsche Geschichte-Digital: Ergebnisse der TEI-Konvertierung und Integration in Pilotprojekten
(2018)
Der Beitrag widmet sich den Geflüchteten als Teil der deutschlernenden Teilnehmer/innen in den staatlich verordneten Integrationskursen (IKs). Unsere Erhebung unter 305 Geflüchteten aus Syrien und anderen Ländern legt ihren Schwerpunkt auf die sprachlichen Hintergründe. Dabei werden soziodemografische Daten mit Angaben zum Spracherwerb in Beziehung gesetzt und als kollektive Sprachbiografien dargestellt. Des Weiteren beschreiben wir sieben Teilnehmergruppen von Geflüchteten in den IKs, die sich vor allem auf Grund der Faktoren Alter, Bildungsgrad und Arbeitserfahrung unterscheiden, für die aber auch Merkmale im Hinblick auf Herkunft und Mehrsprachigkeit eine Rolle spielen. Ferner werden Angaben zur Sozialsituation in Deutschland mit Einschätzungen zum Deutscherwerb in Beziehung gesetzt. Ein Vergleich mit anderen Studien verdeutlicht die Verschiebungen in der Zusammensetzung des IK. Unser Beitrag kann als Anregung verstanden werden, die Passgenauigkeit im Sinne der Deutschlernenden zu überdenken.
Dieser Beitrag stellt einen Versuch dar, ein graphematisches Prinzip auf Handschriften anzuwenden und argumentiert, dass die Betrachtung von Handschriften unterstützende Evidenzen für graphematische Theorien liefern kann. Exemplarisch wird dazu die graphematische Längenhierarchie ausgewählt. Die Längenhierarchie ist ein gut beschriebenes Phänomen in der deutschen Schriftsprache. Bislang wurde sie jedoch nur für Druckschriften aufgestellt. Der vorliegende Artikel untersucht die Möglichkeit, eine Längenhierarchie für Handschriften aufzustellen und stützt sich dabei besonders auf die Schulausgangsschriften. Insbesondere werden Unterschriften betrachtet, die als eine Extremform der Handschriftlichkeit interpretiert werden. Ich gehe davon aus, dass nichts so häufig handgeschrieben wird wie die eigene Unterschrift und dass deshalb dort Prinzipien eines „ökonomischen Schreibens“ am deutlichsten auftreten werden, d.h. dass die Schreibungen, die besonders wichtig für das Lesen sind auch besonders deutlich geschrieben werden und die rezeptiv vernachlässigbaren Strukturen weniger deutlich. Hierzu wird die Alltagsbeobachtung analysiert, dass in Unterschriften oft die langen Buchstaben besonders deutlich und die kompakten Buchstaben eher undeutlich produziert werden, sie werden nivelliert. Es zeigt sich, dass die Häufigkeiten der Nivellierungen jedes Buchstabens auf eine skalare Verteilung der Buchstaben hindeuten. Damit wird die Idee einer Längenhierarchie und einer graphematischen Silbe als Leseerleichterung gestützt.
Dieser Beitrag widmet sich der Analyse des Zusammenspiels sprachlich-hörbarer und sichtbar-kinesischer Praktiken, die beim alltäglichen Erzählen eingesetzt werden. Im Rahmen einer konversationsanalytisch basierten Untersuchung von Videoaufnahmen deutscher Alltagsgespräche wird die Bandbreite alltäglicher narrativer Praktiken in der face-to-face-Kommunikation aufgezeigt. Dies erfolgt exemplarisch anhand zweier Beispiele, in denen Einstieg, Ausgestaltung sowie Beendigung der Erzählung unter unterschiedlichen sequentiellen und multimodalen Bedingungen vollzogen werden. Die Untersuchung unterstreicht einerseits die Indexikalität alltäglicher narrativer Praktiken, andererseits die Notwendigkeit einer interaktionalen Narratologie, die diese Praktiken als Produkt sprachlicher, verkörperter und räumlicher Ressourcen sowie der Zusammenarbeit mehrerer Teilnehmer analysiert und konzeptualisiert.
Our corpus study is concerned with subject-verb agreement in contemporary German, more precisely the variation in verb number. We focus on subjects consisting of noun phrases coordinated by the conjunction und (‘and’). In our samples, both nouns are in singular. Number resolution – i.e., plural verb despite of the singular nouns – can be regarded as the default choice in contemporary German. However, our data show that eliding the second determiner in the subject enhances the probability of using the singular verb. This ellipsis effect is highly significant in German and Austrian texts. It seems to be weaker in Swiss texts. Regression analyses reveal that the ellipsis effect is stronger than both the highly significant influence of subject individuation and the significant effect of subject agentivity.
We present evidence for the analysis of the vowels in English <say> and <so> as biphonemic diphthongs /ɛi/ and /əu/, based on neutralization patterns, regular alternations, and foot structure. /ɛi/ and /əu/ are hence structurally on a par with the so called “true diphthongs” /ɑi/, /ɐu/, /ɔi/, but also share prosodic organization with the monophthongs /i/ and /u/. The phonological evidence is supported by dynamic measurements based on the American English TIMIT database.
Calculations of F2-slopes proved to be especially suited to distinguish the relevant groups in accordance with their phonologically motivated prosodic organizations.
Negation is an important contextual phenomenon that needs to be addressed in sentiment analysis. Next to common negation function words, such as not or none, there is also a considerably large class of negation content words, also referred to as shifters, such as the verbs diminish, reduce or reverse. However, many of these shifters are ambiguous. For instance, spoil as in spoil your chance reverses the polarity of the positive polar expression chance while in spoil your loved ones, no negation takes place. We present a supervised learning approach to disambiguating verbal shifters. Our approach takes into consideration various features, particularly generalization features.
We study German affixoids, a type of morpheme in between affixes and free stems. Several properties have been associated with them – increased productivity; a bleached semantics, which is often evaluative and/or intensifying and thus of relevance to sentiment analysis; and the existence of a free morpheme counterpart – but not been validated empirically. In experiments on a new data set that we make available, we put these key assumptions from the morphological literature to the test and show that despite the fact that affixoids generate many low-frequency formations, we can classify these as affixoid or non-affixoid instances with a best F1-score of 74%.
Cette contribution propose une analyse qualitative et quantitative des reformulations sur des données interactionnelles. Pour la constitution du corpus d’étude, nous nous appuyons sur un outil de détection automatique des hétéro-répétitions, considérées comme indices de reformulation. Après avoir illustré les éléments qui ont présidé à la conception de l’outil, nous présentons le paramétrage de cette ressource, que nous avons testée sur quatre enregistrements de la base de données CLAPI. Cette étude souligne la pertinence de l’approche interactionnelle dans l’analyse des hétéro-répétitions, en en montrant les fonctionnalités multiples, notamment dans les pratiques de reformulation dans la conversation.
A general concept of perspective is proposed, using the mathematical notion of vector spaces as metaphor. The concept is applied to different phenomena which use perspective: spatiotemporal perspective, lexical semantics (prototypes and features), perspectivation in syntax and lexical inferences. Criteria for constructing a superordinate perspective for two given perspectives are developed.
Einleitung
(2018)
Deutschland sieht sich in den nächsten Jahren vor enorme Herausforderungen gestellt. Mit der Fluchtmigration von knapp 1,5 Millionen Menschen alleine zwischen den Jahren 2014 und 2017 stehen nahezu in jedem gesellschaftlichen Bereich, und hier insbesondere in den Sektoren Bildung und Arbeit, große Integrationsaufgaben an. Steven Vertovec (2015), der Leiter des Max-Planck-Instituts zur Erforschung multireligiöser und multiethnischer Gesellschaften, bezeichnet die Fluchtmigration von 2015 auch deshalb als die „zweite Wende“ für Deutschland, die das Land nachhaltig verändern wird. Nach seiner Einschätzung sind die erwartbaren gesellschaftlichen Transformationen von solch einer Größenordnung, dass die Formulierung „seit der Flüchtlingskrise“ eine ebenso geläufige Redewendung sein wird wie die Formulierung „seit der Wende“. Um diese gegenwärtigen Migrations- und Integrationsprozesse von Anfang an dokumentieren und analysieren zu können, wurde am Institut für Deutsche Sprache (IDS) zu Beginn des Jahres 2016 das Projekt „Deutsch im Beruf: Die sprachlich-kommunikative Integration von Flüchtlingen“ gestartet, dessen erste Ergebnisse das vorliegende Themenheft präsentiert.
Two empirical studies were carried out in the project „Lexik des gesprochenen Deutsch” (LeGeDe) at the Institute for the German Language (IDS) in Mannheim. The main goal of these studies was to shed light on people’s expectations of the planned lexicographical online-resource. In the first study, selected experts were interviewed in the form of a guided interview. In the second study, a broader online survey was conducted, which should reach a wider range of potential users. This contribution introduces the basic concepts of the project LeGeDe, outlines the two studies and presents selected results on four subject blocks: (i) sociodemographic data, (ii) personal use of (online) dictionaries, (iii) individual experience with the lexis of spoken language and (iv) expectations concerning a lexicographical online-resource for spoken German.
Erzählen multimodal
(2018)
The paper describes preliminary studies regarding the usage of Example-Based Querying for specialist corpora. We outline an infrastructure for its application within the linguistic domain. Example-Based Querying deals with retrieval situations where users would like to explore large collections of specialist texts semantically, but are unable to explicitly name the linguistic phenomenon they look for. As a way out, the proposed framework allows them to input prototypical everyday language examples or cases of doubt, which are automatically processed by CRF and linked to appropriate linguistic texts in the corpus.
Auf der Grundlage videodokumentierter Kirchenbesichtigungen, bei denen exothetisches Sprechen als Erhebungsmethode eingesetzt wurde, analysiert der Aufsatz Gemeinsamkeiten und Unterschiede in den Kirchenbesichtigungen von Aurelia, Saskia und Anton. Alle haben dieselbe Kirche besichtigt und ihre visuelle Wahrnehmung des Kirchenraums – das war die explizit formulierte Aufgabe – durch verbale Kommentare und Beschreibungen begleitet. Übergeordnetes Ziel der Analyse des exothetischen Sprechens war die Rekonstruktion der den Besichtigungen zugrundeliegenden Konzepte, die zum Großteil in mitgebrachten Relevanzen begründet sind. Nach der Skizzierung unseres zentralen Erkenntnisinteresses und der Verortung unseres Ansatzes im relevanten Forschungskontext arbeiten wir zunächst die Gemeinsamkeiten der exothetischen Formen und ihre Funktionen in den drei Kirchenbesichtigungen heraus. Dann konzentrieren wir uns auf die Unterschiede und jeweiligen Besonderheiten der drei Besichtigungen und arbeiten dabei drei eigenständige, in sich schlüssige Besichtigungskonzepte heraus. Diese drei Konzepte zeichnen sich durch die jeweils eigenständige Konstitution des Kirchenraums bei dessen Besichtigung aus. Wir konnten zeigen, dass der Kirchenraum als religiöser Funktionsraum konstituiert wird (Aurelia), als Ort von Christusdarstellungen (Saskia) und als architekturgeschichtlicher Zusammenhang (Anton). Die modellhafte Eigenständigkeit der Konzepte wurde ausschließlich durch das exothetische Sprechen deutlich. Dies weist die wahrnehmungsbegleitende Thematisierung als wichtiges Erhebungs- und Analyseverfahren für den Zugang zur situierten Kognition im Zusammenhang mit dem Vollzug komplexer kultureller Praktiken aus.
In this paper, we present our approach to automatically extracting German terminology in the domain of grammar using texts from the online information system grammis as our corpus. We analyze existing repositories of German grammatical terminology and develop Part-of-speech patterns for our extraction thereby showing the importance of unigrams in this domain. We contrast the results of the automatic extraction with a manually extracted standard. By comparing the performance of well-known statistical measures, we show how measures based on corpus comparison outperform alternative methods.
To date, little is known about prosodic accommodation and its conversational functions in instances of overlapping talk in conversation. A major conversational action that happens in overlap is turn competition. It is not known whether participants accommodate prosodic parameters locally in the overlapped turn (initialisation) or access a repertoire of prosodic patterns that refer to general prosodic parameter norms (normalisation) when competing for the turn in overlap. This paper investigates the initialisation and normalisation of fundamental frequency (f0) and assesses its role as a resource for turn competition in overlap. We drew instances of overlapping talk from a corpus of conversational multi-party interactions in British English. We annotated the overlaps on a competitiveness scale and categorised them by overlap onset position and conversational function. We automatically extracted f0 parameters from the speech signal and processed them into f0 accommodation features that represent the normalising or the initialising use of f0. Using decision tree classification we found that f0 accommodation is only relevant as a turn competitive resource in overlaps that start clearly before a speaker transition. In this turn context, we found that normalising and initialising f0 features can both be relevant turn competitive resources. Their deployment depends on the conversational function of overlap.
We present the conceptual foundations and basic features of fLexiCoGraph, a generic software package for creating and presenting curated human-oriented lexicographical resources that are roughly modeled according to Měchura’s (2016) idea of graph-augmented trees. The system is currently under development and will be made accessible as open source software. As a sample use case we discuss an existing online database of loanwords borrowed from German into other languages which is based on a growing number of language-specific loanword dictionaries (Lehnwortportal Deutsch). The paper outlines the conceptual foundations of fLexiCoGraph’s hybrid graph/XML data model. To establish a database, XML-based resources may be imported or even input manually. An additional graph database layer is then constructed from these XML source documents in a freely configurable, but automated way; subsequently, the resulting graph can be manipulated and enlarged through a visual user interface in such a way that keeps the relationship to the source document information explicit at all times. We sketch the tooling support for different kinds of graph-level editing processes, including mechanisms for dealing with updated XML source documents and coping with duplicate or inconsistent information, and briefly discuss the browser interface for end users.
Psychological research has neglected people whose accent does not match their appearance. Most research on person perception has focused on appearance, overlooking accents that are equally important social cues. If accents were studied, it was often done in isolation (i.e., detached from appearance). We examine how varying accent and appearance information about people affects evaluations. We show that evaluations of expectancy-violating people shift in the direction of the added information. When a job candidate looked foreign, but later spoke with a native accent, his evaluations rose and he was evaluated best of all candidates (Experiment 1a). However, the sequence in which information was presented mattered: When heard first and then seen, his evaluations dropped (Experiment 1b). Findings demonstrate the importance of studying the combination and sequence of different types of information in impression formation. They also allow predicting reactions to ethnically mixed people, who are increasingly present in modern societies.
Die Bedeutung von Forschungsdatenmanagement im wissenschaftspolitischen Diskurs und im wissenschaftlichen Arbeitsalltag nimmt stetig zu. Nationale und internationale Forschungsinfrastrukturen, Verbünde, disziplinäre Datenzentren und institutionelle Kompetenzzentren nähern sich den Herausforderungen aus unterschiedlichen Perspektiven. Dieser Beitrag stellt das Data Center for the Humanities an der Universität zu Köln als Beispiel für ein universitäres Datenzentrum mit fachlicher Spezialisierung auf die Geisteswissenschaften vor.
Complement phrases are essential for constructing well-formed sentences in German. Identifying verb complements and categorizing complement classes is challenging even for linguists who are specialized in the field of verb valency. Against this background, we introduce an ML-based algorithm which is able to identify and classify complement phrases of any German verb in any written sentence context. We use a large training set consisting of example sentences from a valency dictionary, enriched with POS tagging, and the ML-based technique of Conditional Random Fields (CRF) to generate the classification models.
Mit politischer, wirtschaftlicher und gesellschaftlicher Öffnung im Rahmen von Globalisierung und Internationalisierung gelangen trotz weitreichender Dominanz von Anglizismen verstärkt auch Neologismen aus anderen Sprach- und Kulturräumen in den deutschen Gegenwartswortschatz. Der Beitrag beschreibt, wie sich diese Neuentlehnungen - Italianismen und neue Fremdwörter aus anderen europäischen und außereuropäischen Sprachen - orthografisch entwickeln und wie sie sich zu den amtlichen Regeln der deutschen Rechtschreibung verhalten. Auf der Grundlage großer digitaler Textkorpora wird der Schreibusus professioneller und informeller Schriftlichkeit analysiert - mit dem Ziel einheitlicher Kodifizierung und Integration in das Regelsystem der deutschen Orthografie.
Grammar and corpora 2016
(2018)
In recent years, the availability of large annotated and searchable corpora, together with a new interest in the empirical foundation and validation of linguistic theory and description, has sparked a surge of novel and interesting work using corpus-based methods to study the grammar of natural languages. However, a look at relevant current research on the grammar of the Germanic, Romance, and Slavic languages reveals a variety of different theoretical approaches and empirical foci, which can be traced back to different philological and linguistic traditions. Still, this current state of affairs should not be seen as an obstacle but as an ideal basis for a fruitful exchange of ideas between different research paradigms.
In recent years, the availability of large annotated and searchable corpora, together with a new interest in the empirical foundation and validation of linguistic theory and description, has sparked a surge of novel and interesting work using corpus-based methods to study the grammar of natural languages. However, a look at relevant current research on the grammar of the Germanic, Romance, and Slavic languages reveals a variety of different theoretical approaches and empirical foci, which can be traced back to different philological and linguistic traditions. Still, this current state of affairs should not be seen as an obstacle but as an ideal basis for a fruitful exchange of ideas between different research paradigms.
In diesem Panel geht es um die Förderung der geisteswissenschaftlichen Forschung durch eine planvolle Erhebung, Archivierung, Veröffentlichung und die dadurch ermöglichte Nachnutzung von Forschungsdaten, die sowohl zur Qualitätssicherung in der Forschung beitragen als auch nicht zuletzt neue Fragestellungen erlauben. Aus unterschiedlichen Perspektiven soll in dem Panel beleuchtet werden, welchen Mehrwert das Datenmanagement für die Forschung in den digitalen Geisteswissenschaften hat, wie man diesen Mehrwert erreicht und auch die Veröffentlichung der Forschungsdaten als ein selbstverständliches Element der Dissemination der Forschungsergebnisse etabliert und wie man gleichzeitig den Aufwand für die Forschung abschätzen kann.
Der Beitrag untersucht Gemeinsamkeiten und Unterschiede in der grammatischen Gestaltung adversativer Satzverknüpfungen in der deutschen und der italienischen Schriftsprache. Die Analyse der verfügbaren Sprachmittel und ihrer Nutzung in Korpusdaten kann dazu beitragen, Auffälligkeiten in Texten italienischer Deutschschreiber zu erklären.
The actual or anticipated impact of research projects can be documented in scientific publications and project reports. While project reports are available at varying level of accessibility, they might be rarely used or shared outside of academia. Moreover, a connection between outcomes of actual research project and potential secondary use might not be explicated in a project report. This paper outlines two methods for classifying and extracting the impact of publicly funded research projects. The first method is concerned with identifying impact categories and assigning these categories to research projects and their reports by extension by using subject matter experts; not considering the content of research reports. This process resulted in a classification schema that we describe in this paper. With the second method which is still work in progress, impact categories are extracted from the actual text data.
Wir diskutieren in diesem Beitrag Implikationen, mit denen man zu tun bekommt, wenn man kleinste Formen situativer Vergesellschaftung – wir sprechen von kommunikativen Minimalformen – untersucht. Kommunikative Minimalformen sind kurzzeitige, nur wenige Sekunden dauernde, gemeinsam konstituierte Interaktionsereignisse. Ungeachtet ihrer Kürze weisen sie zum einen eine komplexe Interaktionsstruktur auf. Zum anderen besitzen sie auch eine klare soziale Implikation und eigene Wertigkeit. In dem hier untersuchten Fall, bei dem Passanten durch ein offenes Fenster in einen Privatraum blicken und dabei ertappt werden, zeigt sich diese soziale Implikativität als moralische Kommunikation im Sinne der interaktiven Bearbeitung eigenen Fehlverhaltens.
Response particles manage intersubjectivity. This conversation analytic study describes German eben (“exactly”). With eben, speaker A locally agrees with the immediately prior turn of B (the “confirmable”) and establishes a second indexical link: A relates B’s confirmable to a position A herself had already displayed (the “anchor”). Through claiming temporal priority, eben speakers treat a just-formulated position as self-evident and mark independence. Further evidence for the three-part structure “anchor-confirmable-eben” that eben sets in motion retrospectively comes from instances where eben speakers supply a missing/opaque anchor via a postpositioned display of independent access. Data are in German with English translation.
We address the detection of abusive words. The task is to identify such words among a set of negative polar expressions. We propose novel features employing information from both corpora and lexical resources. These features are calibrated on a small manually annotated base lexicon which we use to produce a large lexicon. We show that the word-level information we learn cannot be equally derived from a large dataset of annotated microposts. We demonstrate the effectiveness of our (domain-independent) lexicon in the crossdomain detection of abusive microposts.
This paper argues that conversation analysis has largely neglected the fact that meaning in interaction relies on inferences to a high degree. Participants treat each other as cognitive agents, who imply and infer meanings, which are often consequential for interactional progression. Based on the study of audio- and video-recordings from German talk-in-interaction, the paper argues that inferences matter to social interaction in at least three ways. They can be explicitly formulated; they can be (conventionally) indexed, but not formulated; or they may be neither indexed nor formulated yet would be needed for the correct understanding of a turn. The last variety of inferences usually remain tacit, but are needed for smooth interactional progression. Inferences in this case become an observable discursive phenomenon if misunderstandings are treated by the explication of correct (accepted) and wrong (unaccepted) inferences. The understanding of referential terms, analepsis, and ellipsis regularly rely on inferences. Formulations, third-position repairs, and fourth-position explications of erroneous inferences are practices of explicating inferences. There are conventional linguistic means like discourse markers, connectives, and response particles that index specific kinds of inferences. These practices belong to a larger class of inferential practices, which play an important role for indexing and accomplishing intersubjectivity in talk in interaction.
Instruction practices in German driving lessons: Differential uses of declaratives and imperatives
(2018)
Building on а corpus of 70 hours of German driving lessons, this paper studies the use of declaratives vs. imperatives for instruction. It shows how these linguistic resources are adapted to different praxeological, temporal and participant-related environments. Declaratives are used for first instructions, task-setting and post- trial discussions. They exhibit complex syntax and do not call for immediate compliance. Their high degree of explicitness conveys how the action is to be carried out. Imperative instructions overwhelmingly correct ongoing actions of students or respond to their failure to produce expected actions. They exhibit minimal argument structure. They are reminders which presuppose that the student monitors the scene and can perform the action unproblematically. They index that requests have to be complied with immediately or even urgently.
Der vorliegende Aufsatz untersucht Ausbildungsinteraktionen in zwei beruflichen Qualifizierungsmaßnahmen für Flüchtlinge. Solche Maßnahmen werden seit 2015 verstärkt angeboten, um die Geflüchteten möglichst umfassend und zügig auf eine Arbeitsaufnahme in Deutschland vorzubereiten. Im Kontext einer ethnografischen Studie untersuchen wir mit Methoden der multimodalen Interaktionsanalyse, a) wie in Anleitungsgesprächen Verständigungsprobleme zwischen deutschen Anleitern und auszubildenden Flüchtlingen entstehen und b) welche sprachlich-kommunikativen Praktiken zu ihrer Bearbeitung eingesetzt werden. Dabei lassen sich ebenso gelungene wie Probleme erzeugende Kommunikationspraktiken feststellen. Da die meisten Geflüchteten zu Beginn der untersuchten Maßnahmen noch keine Integrationskurse besucht hatten und nur über wenige Deutschkenntnisse verfügten, liegt der primäre Fokus der Analyse auf der Beteiligungsweise der Ausbilder, betrachtet diese aber im sequenziellen Kontext der Interaktionsbeteiligung der auszubildenden Flüchtlinge. Die Untersuchung beruht auf 22 Stunden Videoaufnahmen praktischer Ausbildungen.
International Journal of Applied Linguistics: Special Issue on Instructions in Driving Lessions
(2018)
The sentiment polarity of a phrase does not only depend on the polarities of its words, but also on how these are affected by their context. Negation words (e.g. not, no, never) can change the polarity of a phrase. Similarly, verbs and other content words can also act as polarity shifters (e.g. fail, deny, alleviate). While individually more sparse, they are far more numerous. Among verbs alone, there are more than 1200 shifters. However, sentiment analysis systems barely consider polarity shifters other than negation words. A major reason for this is the scarcity of lexicons and corpora that provide information on them. We introduce a lexicon of verbal polarity shifters that covers the entirety of verbs found in WordNet. We provide a fine-grained annotation of individual word senses, as well as information for each verbal shifter on the syntactic scopes that it can affect.
The European digital research infrastructure CLARIN (Common Language Resources and Technology Infrastructure) is building a Knowledge Sharing Infrastructure (KSI) to ensure that existing knowledge and expertise is easily available both for the CLARIN community and for the humanities research communities for which CLARIN is being developed. Within the Knowledge Sharing Infrastructure, so called Knowledge Centres comprise one or more physical institutions with particular expertise in certain areas and are committed to providing their expertise in the form of reliable knowledge-sharing services. In this paper, we present the ninth K Centre – the CLARIN Knowledge Centre for Linguistic Diversity and Language Documentation (CKLD) – and the expertise and services provided by the member institutions at the Universities of London (ELAR/SWLI), Cologne (DCH/IfDH/IfL) and Hamburg (HZSK/INEL). The centre offers information on current best practices, available resources and tools, and gives advice on technological and methodological matters for researchers working within relevant fields.
This presentation introduces a new collaborative project: the International Comparable Corpus (ICC) (https://korpus.cz/icc), to be compiled from European national, standard(ised) languages, using the protocols for text categories and their quantities of texts in the International Corpus of English (ICE).
This paper offers an exploratory Interactional Linguistic account of the role that inferences play in episodes of ordinary conversational interaction. To this end, it systematically reconsiders the conversational practice of using the lexico-syntactic format oh that’s right to implicitly claim “just-now” recollection of something previously known, but momentarily confused or forgotten. The analyses reveal that this practice typically occurs as part of a larger sequential pattern that the participants orient to and which serves as a procedure for dealing with, and generating an account for, one participant’s production of an inapposite action. As will be shown, the instantiation and progressive realization of this sequential procedure requires local inferential work from the participants. While some facets of this inferential work appear to be shaped by the particular context of the ongoing interaction, others are integral to the workings of the sequence as such. Moreover, the analyses suggest that participants’ understanding of oh that’s right as embodying an implicit memory claim rests on an inference which is based on a kind of semanticpragmatic compositionality. The paper thus illustrates how inferences in conversational interaction can be systematically studied and points to the merits of combining an interactional and a linguistic perspective.
Das Journal für Medienlinguistik (jfml) ist eine medienlinguistische Open-Access-Zeitschrift. Im Sinne einer offenen, interaktiven und unabhängigen Wissenschaftskultur erfolgt die Qualitätssicherung des jfml durch ein Open Peer Review und die medienlinguistische Expertise des Editorial Boards. Das jfml veröffentlicht deutsch- und englischsprachige Artikel, Rezensionen und Tagungsberichte, die fortlaufend erscheinen.
Pädiatrische Gespräche unterscheiden sich gegenüber anderen ärztlichen Gesprächen mit Patienten hinsichtlich der Gesprächsaufgaben und der Beteiligungskonstellationen. In einer triadischen Konstellation mit Arzt, Patient und Eltern(teil) müssen unterschiedliche Kenntnisse und Zuständigkeiten aller Beteiligten ausreichend abgeglichen und Verständigung und Gesprächsergebnisse gesichert werden. In diesem Beitrag wird zunächst die Forschungslage umrissen und das Handlungsschema pädiatrischer Erstkonsultationen kurz dargelegt. Daran anschließend werden anhand einer Fallanalyse die vielschichtigen und komplexen Aufgabenstellungen der Beteiligten bei der Herstellung und Durchführung der körperlichen Untersuchung beleuchtet.
Language shift after migration has been reported to occur within three generations. While this pattern holds in many cases there is also some counter evidence. In this paper, family documents from a German immigration community in Canada are investigated to trace individual decisions of language choice that contributed to an extended process of shift taking four generations and more than a century.
The transfer of research data management from one institution to another infrastructural partner is all but trivial, but can be required,for instance, when an institution faces reorganisation or closure. In a case study, we describe the migration of all research data, identify the challenges we encountered, and discuss how we addressed them. It shows that the moving of research data management to another institution is a feasible, but potentially costly enterprise. Being able to demonstrate the feasibility of research data migration supports the stance of data archives that users can expect high levels of trust and reliability when it comes to data safety and sustainability.
The relation between speed and curvature provides a characterization of the spatio-temporal orchestration of kinematic movements. For hand movements, this relation has been reported to follow a power law with exponent -1/3. The same power law has been claimed to govern articulatory movements. We studied the functional form of speed as predicted by curvature using electromagnetic articulography, focusing on three sensors: the tongue tip, the tongue body, and the lower lip. Of specific interest to us was the question of whether the speed-curvature relation is modified by articulatory practice, gauged with words’ frequencies of occurrence. Although analyses imposing linearity a priori indeed supported a power law, relaxation of this linearity assumption revealed that the effect of curvature on speed levels off substantially for lower values of curvature. A modification of the power law is proposed that takes this curvature into account. Furthermore, controlling statistically for number of phones and word duration, we observed that the speed-curvature function was further modulated by an interaction of lexical frequency by curvature, such that for increasing frequency, speed decreased slightly for low curvatures while it increased slightly for high curvatures. The modulation of the balance between speed and curvature by lexical frequency provides further evidence that the skill of articulation improves with practice on a word-to-word basis, and challenges theories of speech production.
Fondé en 1964, l’Institut für Deutsche Sprache (IDS) est aujourd’hui l’institution extra-universitaire la plus importante pour la recherche et la documentation dans le domaine de l’allemand contemporain. L’article met en perspective les travaux lexicologiques et lexicographiques qu’accomplit l’IDS en fonction de son cadre institutionnel, des changements paradigmatiques dans la recherche et des transformations sociétales.
DaF-Lernende sollen – laut z. B. dem „Gemeinsamen europäischen Referenzrahmen für Sprachen“ – auf C1 Niveau über lexikalische Kompetenzen in der Interaktion verfügen und aus einem Repertoire von Diskursmitteln eine geeignete Wendung für konkrete Kommunikationsbedürfnisse auswählen können. Wir betrachten diese Annahme im vorliegenden Beitrag als Ausgangspunkt und stellen darauf aufbauend die Frage, welche Diskursmittel und lexikalischen Einheiten typisch für die mündliche Interaktion sind und daher auch spezifische Beachtung im DaF-/DaZ-Unterricht finden sollten. Zu hinter-fragen ist, wie die Anforderungen an DaF-Lernende zu lexikalischen Besonderheiten im Mündlichen in Richtlinien wie dem GeR oder „Profile Deutsch“ formuliert werden und wie diese Anforderungen in Lehr- und Nachschlagewerken für diese Zielgruppe aufgegriffen werden. Unsere Untersuchungen zeigen, dass die Möglichkeiten noch ausbaufähig sind, was aus unserer Sicht zum Beispiel über eine verstärkte Nutzung der inzwischen vorhandenen Korpora zum gesprochenen Deutsch denkbar sein kann. In diesem Zusammenhang wird auch eine direkte Verbindung zu dem Forschungsprojekt LeGeDe (IDS Mannheim) hergestellt, das u. a. die Konzipierung einer innovativen korpusbasierten Ressource zur Lexik des gesprochenen Deutsch in der Interaktion als Prototyp anvisiert und damit einen Ausschnitt aus einem Repertoire an standardnahen lexikalischen Elementen und Diskursmitteln zusammen mit lexikalisch und interaktions-linguistisch relevanten Informationen in multimedialer Form anbieten möchte. Dieses Vorhaben kommt, laut der Ergebnisse entsprechender Befragungen, u. a. auch den Erwartungen der Probanden aus der Lernerperspektive entgegen und findet daher sowohl für die Forschung als auch für die Lehre entsprechende Anwendungsmöglichkeiten.
In mid-2017, as part of our activities within the TEI Special Interest Group for Linguists (LingSIG), we submitted to the TEI Technical Council a proposal for a new attribute class that would gather attributes facilitating simple token-level linguistic annotation. With this proposal, we addressed community feedback complaining about the lack of a specific tagset for lightweight linguistic annotation within the TEI. Apart from @lemma and @lemmaRef, up till now TEI encoders could only resort to using the generic attribute @ana for inline linguistic annotation, or to the quite complex system of feature structures for robust linguistic annotation, the latter requiring relatively complex processing even for the most basic types of linguistic features. As a result, there now exists a small set of basic descriptive devices which have been made available at the cost of only very small changes to the TEI tagset. The merit of a predefined TEI tagset for lightweight linguistic annotation is the homogeneity of tagging and thus better interoperability of simple linguistic resources encoded in the TEI. The present paper introduces the new attributes, makes a case for one more addition, and presents the advantages of the new system over the legacy TEI solutions.
Der vorliegende, in das Themenheft einführende Text will einen Überblick über die Ursprünge, die wesentlichen Entwicklungen und die Perspektiven dieses jungen Forschungsgebietes geben. Er ist zunächst wissenschaftshistorisch angelegt, wird also zu Beginn auf einige Vorläuferstudien verweisen und dann versuchen, die Entwicklung der Auseinandersetzung mit den LL in ihren Grundlinien darzustellen und zentrale Themen und Anwendungsfelder, Methoden sowie Begriffe und Termini vorstellen. Im letzten Teil wird auf Forschungsdesiderate bzw. -perspektiven verwiesen. Dabei wird auch immer wieder die Relevanz dieses Ansatzes für den Deutschunterricht und andere Lehrsituationen angesprochen.
Mit dem hier besprochenen Band liegt eine Monographie zu Pennsylvania Dutch(Pennsylvania German, Pennsylvania-Deutsch; im Weiteren auch PD) vor, die sowohl die Entstehungsbedingungen und -verläufe und den soziohistorischen, soziopolitischen und religionsbezogenen Kontext seiner Entwicklung als auch seine sprachlichen und literarischen Formen, seine historische und heutige gesellschaftliche Stellung und Verwendung umfassend und gründlich darstellt. Louden wendet sich dabei nicht nur an ein linguistisches Fachpublikum, sondern auch an LeserInnen ohne eine speziell linguistische Vorbildung. Dementsprechend werden für die Darstellung relevante linguistische Konzepte eingeführt und erklärt. Ein umfassendes Stichwortverzeichnis macht die Monographie gut erschließbar, und die umfangreiche Bibliographie ermöglicht es, sich weitergehend zu allen angesprochenen Themen zu informieren. Die Endnoten werden strategisch gut eingesetzt, da sie nicht nur fachwissenschaftliche ‚Unterfütterung‘ bieten, sondern auch dazu genutzt werden, alle zitierten Quellentexte sowohl auf Englisch als auch in der (pennsylvania-)deutschen Originalfassung zur Verfügung zu stellen.
Mit dem hier besprochenen Band liegt eine Monographie zu Pennsylvania Dutch (Pennsylvania German, Pennsylvania-Deutsch; im Weiteren auch PD) vor, die sowohl die Entstehungsbedingungen und -verläufe und den soziohistorischen, soziopolitischen und religionsbezogenen Kontext seiner Entwicklung als auch seine sprachlichen und literarischen Formen, seine historische und heutige gesellschaftliche Stellung und Verwendung umfassend und gründlich darstellt. Louden wendet sich dabei nicht nur an ein linguistisches Fachpublikum, sondern auch an LeserInnen ohne eine speziell linguistische Vorbildung. Dementsprechend werden für die Darstellung relevante linguistische Konzepte eingeführt und erklärt. Ein umfassendes Stichwortverzeichnis macht die Monographie gut erschließbar, und die umfangreiche Bibliographie ermöglicht es, sich weitergehend zu allen angesprochenen Themen zu informieren. Die Endnoten werden strategisch gut eingesetzt, da sie nicht nur fachwissenschaftliche ‚Unterfütterung‘ bieten, sondern auch dazu genutzt werden, alle zitierten Quellentexte sowohl auf Englisch als auch in der (pennsylvania-)deutschen Originalfassung zur Verfügung zu stellen.
All linguistics should be media linguistics, but it is not. This thesis is presented by using linguistic landscapes as an example. LL research does not belong to the traditional core of either mainstream linguis-tics or media linguistics. This is why not everything within power has been done yet to make full use of their thematic, conceptual and methodological possibilities. Visible signs in public space, however, are an everyday phenomenon. You have to pull out all the stops to research them extensively. The distinction between linguistics and media linguistics turns out to be counterproductive. But this does not only apply to the case of linguistic landscapes. It also stands for any comprehensive investigation of language and language use. (Ex-ceptions may be very narrow questions for specific purposes.) The above thoughts are supported by a database of the project „Metro-polenzeichen“ with more than 25.000 systematically collected, ge-ocoded and tagged photographs.
MULLE is a tool for language learning that focuses on teaching Latin as a foreign language. It is aimed for easy integration into the traditional classroom setting and syllabus, which makes it distinct from other language learning tools that provide standalone learning experience. It uses grammar-based lessons and embraces methods of gamification to improve the learner motivation. The main type of exercise provided by our application is to practice translation, but it is also possible to shift the focus to vocabulary or morphology training.
We present an approach for modeling German negation in open-domain fine grained sentiment analysis. Unlike most previous work in sentiment analysis, we assume that negation can be conveyed by many lexical units (and not only common negation words) and that different negation words have different scopes. Our approach is examined on a new dataset comprising sentences with mentions of polar expressions and various negation words. We identify different types of negation words that have the same scopes. We show that already negation modeling based on these types largely outperforms traditional negation models which assume the same scope for all negation words and which employ a window-based scope detection rather than a scope detection based on syntactic information.
Über 400 Wissenschaftler/innen aus insgesamt 25 verschiedenen Herkunftsländern kamen dieses Jahr zur 54. Jahrestagung des Instituts für Deutsche Sprache (IDS). Unter dem Titel „Neues vom heutigen Deutsch. Empirisch – methodisch – theoretisch“ konnten sich die Besucher/innen insgesamt 14 Fachvorträge anhören. In diesem Jahr wurde der Titel weit gefasst, um Themenvielfalt zu ermöglichen. „Neues“ bezeichnet dabei zum einen Neues von der deutschen Sprache, zum anderen aber auch neue Methoden, theoretische Ansätze und empirische Schwierigkeiten.
New exceptions for Text and Data Mining and their possible impact on the CLARIN infrastructure
(2018)
The proposed paper discusses new exceptions for Text and Data Mining that have recently been adopted in some EU Member States, and probably will soon be adopted also at the EU level. These exceptions are of great significance for language scientists, as they exempt those who compile corpora from the obligation to obtain authorisation from rightholders. However, corpora compiled on the basis of such exceptions cannot be freely shared, which in a long run may have serious consequences for Open Science and the functioning of research infrastructure such as CLARIN ERIC.
In this paper, we discuss an efficient method of (semi-automatic) neologism detection for German and its application for the production of a dictionary of neologisms, focusing on the lexicographic process. By monitoring the language via editorial (print and online) media evaluation and interpreting the findings on the basis of lexicographic competence, many, but not all neologisms can be identified which qualify for inclusion in the Neologismenworterbuch (2006-today) at the Institute for the German Language in Mannheim (IDS). In addition, an automated corpus linguistic method offers neologism candidates based on a systematic analysis of large amounts of text to lexicographers. We explain the principles of the corpus linguistic compilation of a list of candidates and show how lexicographers work with the results, combining them with their own findings in order to continuously enlarge this specialized online dictionary of new words in German.
The aim of this paper is to present the results of an empirical analysis of the use of non-alphabetic graphic signs (e.g. asterisks, slashes, plus signs etc.) in the context of repairs in Russian and German informal electronic communication. The data for the analysis were taken from the “Mobile Communication Database MoCoDa” (http://mocoda.spracheinteraktion.de/), which contains Russian and German private electronic communication via SMS, WhatsApp and other short message services, and the “Dortmunder Chat-Korpus” (http://www.chatkorpus.tu-dortmund.de/korpora.html). This paper describes the functions of various graphic resources in the context of repairs in both data collections and compares the occurrences of these functions in current Russian and German computer-mediated communication. It concludes that particular signs in both data sets share the same subset of functions, but they differ in terms of how frequently these resources occur in each form of communication.