Refine
Year of publication
- 2018 (152) (remove)
Document Type
- Article (71)
- Part of a Book (46)
- Conference Proceeding (21)
- Review (7)
- Book (4)
- Part of Periodical (2)
- Periodical (1)
Keywords
- Deutsch (49)
- Korpus <Linguistik> (29)
- Konversationsanalyse (16)
- Gesprochene Sprache (13)
- Interaktion (13)
- Multimodalität (11)
- Grammatik (10)
- Computerlinguistik (9)
- Interaktionsanalyse (9)
- conversation analysis (8)
Publicationstate
- Veröffentlichungsversion (90)
- Zweitveröffentlichung (50)
- Postprint (27)
Reviewstate
- Peer-Review (152) (remove)
Publisher
- de Gruyter (16)
- European language resources association (ELRA) (13)
- Erich Schmidt (11)
- Verlag für Gesprächsforschung (8)
- Znanstvena založba Filozofske fakultete Univerze v Ljubljani / Ljubljana University Press, Faculty of Arts (7)
- Heidelberg University Publishing (5)
- Springer (5)
- Association for Computational Linguistics (4)
- Institut für Deutsche Sprache (4)
- Cambridge University Press (3)
Der vorliegende, in das Themenheft einführende Text will einen Überblick über die Ursprünge, die wesentlichen Entwicklungen und die Perspektiven dieses jungen Forschungsgebietes geben. Er ist zunächst wissenschaftshistorisch angelegt, wird also zu Beginn auf einige Vorläuferstudien verweisen und dann versuchen, die Entwicklung der Auseinandersetzung mit den LL in ihren Grundlinien darzustellen und zentrale Themen und Anwendungsfelder, Methoden sowie Begriffe und Termini vorstellen. Im letzten Teil wird auf Forschungsdesiderate bzw. -perspektiven verwiesen. Dabei wird auch immer wieder die Relevanz dieses Ansatzes für den Deutschunterricht und andere Lehrsituationen angesprochen.
Статтю присвячено комунікативним девіаціям (невдачам) на матеріалі українських і німецьких телеінтерв’ю з П. Порошенком та А. Меркель. Встановлено, що спілкування осіб з різними комунікативними цілями і стратегіями – головні причини девіацій. Проаналізовано комунікативні невдачі, враховуючи позиції адресанта й адресата, а також глядача даних інтерв’ю, визначено спільні та відмінні стратегії у випадку комунікативних девіацій в українській і німецькій лінгвокультурах.
Dieser Aufsatz diskutiert die Frage, inwieweit Unserdeutsch sich aus soziohistorischer und sprachstruktureller Perspektive in die Kategorie Kreolsprache einfügt. Als tertium comparationis dienen dabei Merkmale, die in der einschlägigen Literatur prominent als charakteristisch für Kreolsprachen angenommen werden. Es zeigt sich, dass Unserdeutsch trotz einer Reihe atypischer Entstehungsumstände, die auf den ersten Blick eine große strukturelle Nähe zum deutschen Superstrat, damit ein relativ akrolektales Kreol erwarten ließen, verhältnismäßig gut mit dem Muster eines Average Creole, wie es sich etwa aufgrund der Daten des „Atlas of Pidgin and Creole Language Structures“ (Michaelis et al. 2013) abzeichnet, harmoniert. Eine mögliche Erklärung findet diese augenfällige Diskrepanz in der primären Funktion von Unserdeutsch als Identitätsmarker und der linguistischen Struktur seiner Substratsprache Tok Pisin.
Der Artikel widmet sich den politischen Fernsehinterviews im Ukrainischen und Deutschen aus der Perspektive der Persönlichkeit des Interviewers und der Schwierigkeiten, die vor und während des Fernsehinterviews auftreten. Kommunikative Abweichungen (Deviationen) werden als Unterschiede in den Erwartungen des Interviewers im Vergleich zu den Erwartungen des Befragten und des Adressaten aufgezeigt und analysiert. Besonderes Augenmerk wird auf das Beziehungsdreieck, bestehend aus Interviewer, Befragter und Adressat, gelegt. Bei der Beziehung zwischen diesen drei Größen spielen die Elemente Alter, Geschlecht, Status, Wissen, Interessen und Erwartungen eine wichtige Rolle und tragen zum Erfolg des Interviews bei. Dementsprechend übernimmt der Journalist drei Rollen: als Vertreter des Publikums, als Promotor des Eingeladenen (des Befragten) oder als Vertreter von sich selbst. Durch kommunikative Deviationen werden die Unterschiede in den Erwartungen der Kommunikatoren in einem Interview verstanden. In diesem Artikel wird nur auf die Abweichungen in den Fernsehinterviews in beiden Sprachen eingegangen, wenn der Interviewer andere Erwartungen an das Interview hat als der Befragte oder der Adressat (der Zuschauer), was für das erste ein Misserfolg ist, d.h. für den Interviewer. Es werden kommunikative Abweichungen des Interviewers gegenüber dem Befragten und dem Adressaten skizziert und die Strategien zur Überwindung von Misserfolgen eines Fernsehinterviews vorgeschlagen. Kommunikative Abweichungen als Verstöße gegen die Erwartungen des Interviewers in all seinen Erscheinungsformen können vermieden oder zumindest reduziert werden, wenn alle Elemente der Kommunikation auf informativer und emotionaler und sehr oft auf kommunikativ-situativer Ebene samt technischen Besonderheiten berücksichtigt werden.
The workshop presents ATHEN 1 (Annotation and Text Highlighting Environment), an extensible desktop-based annotation environment which supports more than just regular annotation. Besides being a general purpose annotation environment, ATHEN supports indexing and querying support of your data as well as the ability to automatically preprocess your data with Meta information. It is especially suited for those who want to extend existing general purpose annotation tools by implementing their own custom features, which cannot be fulfilled by other available annotation environments. On the according gitlab, we provide online tutorials, which demonstrate the use of specific features of ATHEN
Projektvorstellung – Redewiedergabe. Eine literatur- und sprachwissenschaftliche Korpusanalyse
(2018)
Das laufende DFG-Projekt „Redewiedergabe“ stellt einen Anwendungsfall quantitativer Sprach-und Literaturwissenschaft dar und beschäftigt sich mit dem Phänomen „Redewiedergabe“ auf der Grundlage großer Datenmengen. Zu diesem Zweck wird zum einen ein Korpus manuell mit Redewiedergabeformen annotiert, zum anderen werden Verfahren zur automatischen Erkennung des Phänomens entwickelt. Ziel ist es, Forschungsfragen nach der Entwicklung von Redewiedergabe vor allem im 19. Jahrhundert zu beantworten.
Nonnative accents are prevalent in our globalized world and constitute highly salient cues in social perception. Whereas previous literature has commonly assumed that they cue specific social group stereotypes, we propose that nonnative accents generally trigger spontaneous negatively biased associations (due to a general nonnative accent category and perceptual influences). Accordingly, Study 1 demonstrates negative biases with conceptual IATs, targeting the general concepts of accent versus native speech, on the dimensions affect, trust, and competence, but not on sociability. Study 2 attests to negative, largely enhanced biases on all dimensions with auditory IATs comprising matched native–nonnative speaker pairs for four accent types. Biases emerged irrespective of the accent types that differed in attractiveness, recognizability of origin, and origin-linked national associations. Study 3 replicates general IAT biases with an affect IAT and a conventional evaluative IAT. These findings corroborate our hypotheses and assist in understanding general negativity toward nonnative accents.
Dieser Beitrag stellt einen Versuch dar, ein graphematisches Prinzip auf Handschriften anzuwenden und argumentiert, dass die Betrachtung von Handschriften unterstützende Evidenzen für graphematische Theorien liefern kann. Exemplarisch wird dazu die graphematische Längenhierarchie ausgewählt. Die Längenhierarchie ist ein gut beschriebenes Phänomen in der deutschen Schriftsprache. Bislang wurde sie jedoch nur für Druckschriften aufgestellt. Der vorliegende Artikel untersucht die Möglichkeit, eine Längenhierarchie für Handschriften aufzustellen und stützt sich dabei besonders auf die Schulausgangsschriften. Insbesondere werden Unterschriften betrachtet, die als eine Extremform der Handschriftlichkeit interpretiert werden. Ich gehe davon aus, dass nichts so häufig handgeschrieben wird wie die eigene Unterschrift und dass deshalb dort Prinzipien eines „ökonomischen Schreibens“ am deutlichsten auftreten werden, d.h. dass die Schreibungen, die besonders wichtig für das Lesen sind auch besonders deutlich geschrieben werden und die rezeptiv vernachlässigbaren Strukturen weniger deutlich. Hierzu wird die Alltagsbeobachtung analysiert, dass in Unterschriften oft die langen Buchstaben besonders deutlich und die kompakten Buchstaben eher undeutlich produziert werden, sie werden nivelliert. Es zeigt sich, dass die Häufigkeiten der Nivellierungen jedes Buchstabens auf eine skalare Verteilung der Buchstaben hindeuten. Damit wird die Idee einer Längenhierarchie und einer graphematischen Silbe als Leseerleichterung gestützt.
Digitale Medien haben zu einer folgenreichen Veränderung politischer Diskurse beigetragen: Bürgerinnen und Bürger haben nunmehr die Möglichkeit eines direkten und permanenten Dialogs mit politisch Agierenden. Diese wiederum haben soziale Netzwerke als „wirkungsvolle Kommunikationsform für sich entdeckt“ (Kneuer 2017, S.46). Damit haben sich auch die politischen Partizipationsmöglichkeiten verändert. Neben den konventionellen Partizipationsformen erfahren die Bürgerinnen und Bürger nach der Erweiterung in den 1960er Jahren durch nicht institutionalisierte Formen (Woyke 2013) heute eine weitere Form der politischen Teilhabe durch digitale Medien.
MULLE is a tool for language learning that focuses on teaching Latin as a foreign language. It is aimed for easy integration into the traditional classroom setting and syllabus, which makes it distinct from other language learning tools that provide standalone learning experience. It uses grammar-based lessons and embraces methods of gamification to improve the learner motivation. The main type of exercise provided by our application is to practice translation, but it is also possible to shift the focus to vocabulary or morphology training.
We present a language learning application that relies on grammars to model the learning outcome. Based on this concept we can provide a powerful framework for language learning exercises with an intuitive user interface and a high reliability. Currently the application aims to augment existing language classes and support students by improving the learner attitude and the general learning outcome. Extensions beyond that scope are promising and likely to be added in the future.
Controlled Natural Languages (CNLs) have many applications including document authoring, automatic reasoning on texts and reliable machine translation, but their application is not limited to these areas. We explore a new application area of CNLs, the use of CNLs in computer-assisted language learning. In this paper we present a a web application for language learning using CNLs as well as a detailed description of the properties of the family of CNLs it uses.
We present WOMBAT, a Python tool which supports NLP practitioners in accessing word embeddings from code. WOMBAT addresses common research problems, including unified access, scaling, and robust and reproducible preprocessing. Code that uses WOMBAT for accessing word embeddings is not only cleaner, more readable, and easier to reuse, but also much more efficient than code using standard in-memory methods: a Python script using WOMBAT for evaluating seven large word embedding collections (8.7M embedding vectors in total) on a simple SemEval sentence similarity task involving 250 raw sentence pairs completes in under ten seconds end-to-end on a standard notebook computer.
Erzählen multimodal
(2018)
Cette contribution propose une analyse qualitative et quantitative des reformulations sur des données interactionnelles. Pour la constitution du corpus d’étude, nous nous appuyons sur un outil de détection automatique des hétéro-répétitions, considérées comme indices de reformulation. Après avoir illustré les éléments qui ont présidé à la conception de l’outil, nous présentons le paramétrage de cette ressource, que nous avons testée sur quatre enregistrements de la base de données CLAPI. Cette étude souligne la pertinence de l’approche interactionnelle dans l’analyse des hétéro-répétitions, en en montrant les fonctionnalités multiples, notamment dans les pratiques de reformulation dans la conversation.
As open class repair initiators (OCRIs, e.g., “what” or “huh”) do not specify the type of repairable, choosing an adequate repair format in the next turn becomes a practical problem for the participants. Whereas in monolingual/L1 speaker conversations participants typically orient towards troubles caused by reduced acoustic intelligibility or by topical/sequential disjunction, in multilingual/L2 interactions possible problems regarding asymmetric language choices and skills can be added – and might be responded to accordingly. Based on videotaped international business meetings and interactions at a customs post, this paper investigates various open class and embodied other-initiations of repair. By means of a conversation analytical and multimodal approach to social interaction, this contribution focuses first on instances of audible OCRIs and illustrates that they are accompanied by embodied conduct. Second, two types of embodied other-initiation of repair are scrutinized: a lifted eyebrows/head display and a freeze display in which movements are suspended. The analysis shows that participants treat these as referring either to troubles in hearing (display 1) or to troubles in understanding the linguistic format (display 2). This leads to the formulation of further desiderata and analytical challenges regarding the multimodal other-initiation of repair in general and in professional international settings in particular.
Dieser Beitrag widmet sich der Analyse des Zusammenspiels sprachlich-hörbarer und sichtbar-kinesischer Praktiken, die beim alltäglichen Erzählen eingesetzt werden. Im Rahmen einer konversationsanalytisch basierten Untersuchung von Videoaufnahmen deutscher Alltagsgespräche wird die Bandbreite alltäglicher narrativer Praktiken in der face-to-face-Kommunikation aufgezeigt. Dies erfolgt exemplarisch anhand zweier Beispiele, in denen Einstieg, Ausgestaltung sowie Beendigung der Erzählung unter unterschiedlichen sequentiellen und multimodalen Bedingungen vollzogen werden. Die Untersuchung unterstreicht einerseits die Indexikalität alltäglicher narrativer Praktiken, andererseits die Notwendigkeit einer interaktionalen Narratologie, die diese Praktiken als Produkt sprachlicher, verkörperter und räumlicher Ressourcen sowie der Zusammenarbeit mehrerer Teilnehmer analysiert und konzeptualisiert.
Der vorliegende Beitrag befasst sich mit Erzählen in seiner massenmedialen Vermittlung in einer Unterhaltungsendung im Fernsehen. Ziel ist es, anhand einer multimodalen und medienlinguistischen Analyse eines exemplarischen Ausschnitts aus der TV-Unterhaltungssendung "Zimmer frei" die Spezifik solcher massenmedialen Erzählungen herauszuarbeiten. Zum einen wird aufgezeigt, dass sich massenmediales Erzählen in seinem sequenziellen Auf- und Ausbau aufgrund seiner Einbindung in ein mediales Unterhaltungsformat in systematischer Weise von Alltagserzählungen unterscheidet. Zum anderen wird veranschaulicht, inwieweit theatrale Inszenierungs- und Aufführungsmittel der Fernsehproduktion die Aktivität des Erzählens mitkonstituieren. Erzählungen im Fernsehen, so die analyseleitende Prämisse, können nicht schlicht als durch das Fernsehen übertragene narrative Aktivitäten konzeptualisiert werden. Vielmehr sind sie durch eine mediale Theatralität mitgeprägt. (Para)verbale, körperliche und mediale Inszenierungs- und Aufführungsverfahren greifen konzertiert ineinander, um Erzählungen als "dramas to an audience" (Goffman 1974:508) hervorzubringen.
Bisherige linguistische Studien zum mündlichen Erzählen beziehen sich vornehmlich auf die Beschreibung verbaler und vokaler Verfahren. Erzählen findet jedoch häufig unter den Bedingungen der zeitlich-räumlichen Ko-Präsenz der SprecherInnen statt, die den Gebrauch von körperlichen und materiellen Ressourcen ermöglicht. Der vorliegende einleitende Beitrag des Themenheftes modelliert Erzählen daher als körpergebundene und verkörperlichte Praktik, die es im Rahmen von interaktionalen und sequenzorientierten Analyseansätzen zu beschreiben gilt. Im Anschluss an die Darstellung von Entwicklungslinien der soziolinguistischen und interaktional-gesprächsanalytischen Untersuchung konversationellen Erzählens wird ein Überblick über bisherige Befunde zur multimodalen Ausgestaltung des Erzählens in der face-to-face-Interaktion gegeben. Abschließend werden grundlegende Fragestellungen skizziert, deren Beantwortung im Rahmen einer multimodalen Erzählanalyse die tatsächliche Alltagspraxis des Erzählens umfassender zu erschließen vermag.
This study investigates the language used by six German Gangsta rappers to establish and maintain their identity and authenticity as rappers, in songs released between 2015 and 2016. Gangsta rap is a subgenre of Hip-Hop that emphasises ‘the rappers’ street credibility in texts describing tough [urban] neighbourhoods, violence, misogyny, and the achievement of material wealth’ (Bower 379). The culture of Gangsta rap attracts overwhelmingly negative mainstream media coverage (Muggs; Roper) and is often accused of corrupting ‘standard’ language (Krummheuer). The lyrical content of the songs is indeed controversial and has been previously covered by many academics (Byrd; Littlejohn and Putnam; Bower; Rollefson), as has the emergence of Hip-Hop in Germany (Elflein; Pennay; Nitzsche and Grünzweig).
This paper aims to describe different patterns of syntactic extensions of turns-at-talk in mundane conversations in Czech. Within interactional linguistics, same-speaker continuations of possibly complete syntactic structures have been described for typologically diverse languages, but have not yet been investigated for Slavic languages. Based on previously established descriptions of various types of extensions (Vorreiter 2003; Couper-Kuhlen & Ono 2007), our initial description shall therefore contribute to the cross-linguistic exploration of this phenomenon. While all previously described forms for continuing a turn-constructional unit seem to exist in Czech, some grammatical features of this language (especially free word order and strong case morphology) may lead to problems in distinguishing specific types of syntactic extensions. Consequently, this type of language allows for critically evaluating the cross-linguistic validity of the different categories and underlines the necessity of analysing syntactic phenomena within their specific action contexts.
Data Management is one of the core activities of all CLARIN centres providing data and services for the academia. In PARTHENOS, European initiatives and projects in the area of the humanities and social sciences assembled to compare policies and procedures. One of the areas of interest is data management. The data management landscape shows a lot of proliferation, for which an abstraction level is introduced to help centres, such as CLARIN centres, in the process of providing the best possible services to users with data management needs.
In diesem Panel geht es um die Förderung der geisteswissenschaftlichen Forschung durch eine planvolle Erhebung, Archivierung, Veröffentlichung und die dadurch ermöglichte Nachnutzung von Forschungsdaten, die sowohl zur Qualitätssicherung in der Forschung beitragen als auch nicht zuletzt neue Fragestellungen erlauben. Aus unterschiedlichen Perspektiven soll in dem Panel beleuchtet werden, welchen Mehrwert das Datenmanagement für die Forschung in den digitalen Geisteswissenschaften hat, wie man diesen Mehrwert erreicht und auch die Veröffentlichung der Forschungsdaten als ein selbstverständliches Element der Dissemination der Forschungsergebnisse etabliert und wie man gleichzeitig den Aufwand für die Forschung abschätzen kann.
The transfer of research data management from one institution to another infrastructural partner is all but trivial, but can be required,for instance, when an institution faces reorganisation or closure. In a case study, we describe the migration of all research data, identify the challenges we encountered, and discuss how we addressed them. It shows that the moving of research data management to another institution is a feasible, but potentially costly enterprise. Being able to demonstrate the feasibility of research data migration supports the stance of data archives that users can expect high levels of trust and reliability when it comes to data safety and sustainability.
What is a sentient agent?
(2018)
Several studies have examined effects of explicit task demands on eye movements in reading. However, there is relatively little prior research investigating the influence of implicit processing demands. In this study, processing demands were manipulated by means of a between-subject manipulation of comprehension question difficulty. Consistent with previous results from Wotschack and Kliegl, the question difficulty manipulation influenced the probability of regressing from late in sentences and re-reading earlier regions; readers who expected difficult comprehension questions were more likely to re-read. However, this manipulation had no reliable influence on eye movements during first-pass reading of earlier sentence regions. Moreover, for the subset of sentences that contained a plausibility manipulation, the disruption induced by implausibility was not modulated by the question manipulation. We interpret these results as suggesting that comprehension demands influence reading behavior primarily by modulating a criterion for comprehension that readers apply after completing first-pass processing.
This paper offers an exploratory Interactional Linguistic account of the role that inferences play in episodes of ordinary conversational interaction. To this end, it systematically reconsiders the conversational practice of using the lexico-syntactic format oh that’s right to implicitly claim “just-now” recollection of something previously known, but momentarily confused or forgotten. The analyses reveal that this practice typically occurs as part of a larger sequential pattern that the participants orient to and which serves as a procedure for dealing with, and generating an account for, one participant’s production of an inapposite action. As will be shown, the instantiation and progressive realization of this sequential procedure requires local inferential work from the participants. While some facets of this inferential work appear to be shaped by the particular context of the ongoing interaction, others are integral to the workings of the sequence as such. Moreover, the analyses suggest that participants’ understanding of oh that’s right as embodying an implicit memory claim rests on an inference which is based on a kind of semanticpragmatic compositionality. The paper thus illustrates how inferences in conversational interaction can be systematically studied and points to the merits of combining an interactional and a linguistic perspective.
Strategien zur Förderung von Mehrsprachigkeit in Deutschlehrwerken für die italienische Scuola Media
(2018)
Mehrsprachigkeitsdidaktik hat sowohl in der Fachdiskussion als auch in den Dokumenten des italienischen Bildungsministeriums eine neue Gewichtung bekommen. Deswegen sollte der Aufbau einer mehrsprachigen Kompetenz ein wichtiger Baustein des Fremdsprachenunterrichts werden. Da Lehrer Lehrwerke als Leitfaden, quasi als „Lehrplan“ benutzen, spielen diese eine wichtige Rolle in der Entwicklung von mehrsprachigem Unterricht. Ziel der vorliegenden Untersuchung ist es, die Lehrwerke für Deutsch als Fremdsprache der 1. Klasse der italienischen Scuola Media zu analysieren, um zu untersuchen, inwieweit Mehrsprachigkeit gefördert wird, da die italienischen Schüler in dieser Klasse zum ersten Mal eine weitere Fremdsprache nach Englisch lernen. Nach einem theoretischen Überblick über wichtige Fragen und Diskussionsfelder zur Mehrsprachigkeitsdidaktik sowie zu Lehrwerken und Lehrwerkanalysen werden die für diese Arbeit formulierten Forschungsfragen thematisiert. Die Ergebnisse werden abschließend präsentiert und diskutiert.
Inequalities between men and women are common and well-documented. Objective indexes show that men are better positioned than women in societal hierarchies—there is no single country in the world without a gender gap. In contrast, researchers have found that the women-are-wonderful effect—that women are evaluated more positively than men overall—is also common. Cross-cultural studies on gender equality reveal that the more gender egalitarian the society is, the less prevalent explicit gender stereotypes are. Yet, because self-reported gender stereotypes may differ from implicit attitudes towards each gender, we reanalysed data collected across 44 cultures, and (a) confirmed that societal gender egalitarianism reduces the women-are-wonderful effect when it is measured more implicitly (i.e. rating the personality of men and women presented in images) and (b) documented that the social perception of men benefits more from gender egalitarianism than that of women.
Aversion to loanwords may express itself in various ways: deliberate and motivated by ideology of linguistic purism or more implicit and motivated by the strength of one’s national identification and ethnolinguistic vitality. A study of Polish philology students assessed their tendency to choose loanwords versus synonymous native words. The results supported a two-path model of linguistic purism. Social identity (strength of identification) directly predicted avoidance of loanwords, whereas ideological concerns (conservative political views) predicted it indirectly, through purist ideology.
Psychological research has neglected people whose accent does not match their appearance. Most research on person perception has focused on appearance, overlooking accents that are equally important social cues. If accents were studied, it was often done in isolation (i.e., detached from appearance). We examine how varying accent and appearance information about people affects evaluations. We show that evaluations of expectancy-violating people shift in the direction of the added information. When a job candidate looked foreign, but later spoke with a native accent, his evaluations rose and he was evaluated best of all candidates (Experiment 1a). However, the sequence in which information was presented mattered: When heard first and then seen, his evaluations dropped (Experiment 1b). Findings demonstrate the importance of studying the combination and sequence of different types of information in impression formation. They also allow predicting reactions to ethnically mixed people, who are increasingly present in modern societies.
In this paper we discuss a type of copular clause – specificational copular clauses – in which subject properties may be split between two nominative noun phrases. In particular, while the first noun phrase occupies the canonical preverbal subject position, in some languages the finite verb can agree with the postverbal nominative. Such agreement might be expected, on some theoretical assumptions, to show person restrictions. We discuss this phenomenon in two SVO Germanic languages – Icelandic and Faroese – and present new data from Faroese showing that the person effect here follows from the existence of distinct probes for Number and Person agreement.
Just like most varieties of West Germanic, virtually all varieties of German use a construction in which a cognate of the English verb 'do' (standard German 'tun') functions as an auxiliary and selects another verb in the bare infinitive, a construction known as 'do'-periphrasis or 'do'-support. The present paper provides an Optimality Theoretic (OT) analysis of this phenomenon. It builds on a previous analysis by Bader and Schmid (An OT-analysis of 'do'-support in Modern German, 2006) but (i) extends it from root clauses to subordinate clauses and (ii) aims to capture all of the major distributional patterns found across (mostly non-standard) varieties of German. In so doing, the data are used as a testing ground for different models of German clause structure. At first sight, the occurrence of 'do' in subordinate clauses, as found in many varieties, appears to support the standard CP-IP-VP analysis of German. In actual fact, however, the full range of data turn out to challenge, rather than support, this model. Instead, I propose an analysis within the IP-less model by Haider (Deutsche Syntax - generativ. Vorstudien zur Theorie einer projektiven Grammatik, Narr, Tübingen, 1993 et seq.). In sum, the 'do'-support data will be shown to have implications not only for the analysis of clause structure but also for the OT constraints commonly assumed to govern the distribution of 'do', for the theory of non-projecting words (Toivonen in Non-projecting words, Kluwer, Dordrecht, 2003) as well as research on grammaticalization.
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), zugänglich über die Datenbank für Gesprochenes Deutsch (DGD), strebt den Status eines Referenzkorpus für den aktuellen mündlichen Sprachgebrauch im deutschen Sprachraum an. Es enthält einen wachsenden Bestand von Audio- und Videoaufnahmen authentischer Gespräche aus verschiedenen Bereichen des gesellschaftlichen Lebens. Die Dokumentation und Repräsentation von Interaktions- und Sprecherinformationen sind bereits seit den Anfängen des Korpusaufbaus integrale Bestandteile von FOLK. Allerdings lag bislang kein ausgearbeitetes, empirisch erprobtes und vollständig in die Korpusinfrastruktur integrierbares Stratifikationskonzept vor. Mit dem vorliegenden Artikel wird ein solches Konzept vorgeschlagen. Es knüpft an frühere Konzeptionen an und wurde anhand der vorhandenen Daten überprüft, korrigiert und erweitert. Dieser Prozess verlief parallel zur Überarbeitung des XML-Schemas zur Metadatendokumentation, um die konkrete Implementierung vorzubereiten. Im Anschluss an eine Skizzierung genereller Aspekte des Korpusdesigns werden die stratifikationsleitenden und ergänzenden Parameter vorgestellt und erläutert. Abschließend werden Ansätze und Strategien zum Korpusausbau diskutiert.
Wir diskutieren in diesem Beitrag Implikationen, mit denen man zu tun bekommt, wenn man kleinste Formen situativer Vergesellschaftung – wir sprechen von kommunikativen Minimalformen – untersucht. Kommunikative Minimalformen sind kurzzeitige, nur wenige Sekunden dauernde, gemeinsam konstituierte Interaktionsereignisse. Ungeachtet ihrer Kürze weisen sie zum einen eine komplexe Interaktionsstruktur auf. Zum anderen besitzen sie auch eine klare soziale Implikation und eigene Wertigkeit. In dem hier untersuchten Fall, bei dem Passanten durch ein offenes Fenster in einen Privatraum blicken und dabei ertappt werden, zeigt sich diese soziale Implikativität als moralische Kommunikation im Sinne der interaktiven Bearbeitung eigenen Fehlverhaltens.
We study German affixoids, a type of morpheme in between affixes and free stems. Several properties have been associated with them – increased productivity; a bleached semantics, which is often evaluative and/or intensifying and thus of relevance to sentiment analysis; and the existence of a free morpheme counterpart – but not been validated empirically. In experiments on a new data set that we make available, we put these key assumptions from the morphological literature to the test and show that despite the fact that affixoids generate many low-frequency formations, we can classify these as affixoid or non-affixoid instances with a best F1-score of 74%.
In this paper we use methods for creating a large lexicon of verbal polarity shifters and apply them to German. Polarity shifters are content words that can move the polarity of a phrase towards its opposite, such as the verb “abandon” in “abandon all hope”. This is similar to how negation words like “not” can influence polarity. Both shifters and negation are required for high precision sentiment analysis. Lists of negation words are available for many languages, but the only language for which a sizable lexicon of verbal polarity shifters exists is English. This lexicon was created by bootstrapping a sample of annotated verbs with a supervised classifier that uses a set of data- and resource-driven features. We reproduce and adapt this approach to create a German lexicon of verbal polarity shifters. Thereby, we confirm that the approach works for multiple languages. We further improve classification by leveraging cross-lingual information from the English shifter lexicon. Using this improved approach, we bootstrap a large number of German verbal polarity shifters, reducing the annotation effort drastically. The resulting German lexicon of verbal polarity shifters is made publicly available.
Both for psychology and linguistics, emotion concepts are a continuing challenge for analysis in several respects. In this contribution, we take up the language of emotion as an object of study from several angles. First, we consider how frame semantic analyses of this domain by the FrameNet project have been developing over time, due to theory-internal as well as application-oriented goals, towards ever more fine-grained distinctions and greater within-frame consistency. Second, we compare how FrameNet’s linguistically oriented analysis of lexical items in the emotion domain compares to the analysis by domain experts of the experiences that give rise (directly or indirectly) to the lexical items. And finally, we consider to what extent frame semantic analysis can capture phenomena such as connotation and inference about attitudes, which are important in the field of sentiment analysis and opinion mining, even if they do not involve the direct evocation of emotion.
We present the pilot edition of the GermEval Shared Task on the Identification of Offensive Language. This shared task deals with the classification of German tweets from Twitter. It comprises two tasks, a coarse-grained binary classification task and a fine-grained multi-class classification task. The shared task had 20 participants submitting 51 runs for the coarse-grained task and 25 runs for the fine-grained task. Since this is a pilot task, we describe the process of extracting the raw-data for the data collection and the annotation schema. We evaluate the results of the systems submitted to the shared task. The shared task homepage can be found at https://projects.cai. fbi.h-da.de/iggsa/
Offensive language in social media is a problem currently widely discussed. Researchers in language technology have started to work on solutions to support the classification of offensive posts. We present the pilot edition of the GermEval Shared Task on the Identification of Offensive Language. This shared task deals with the classification of German tweets from Twitter. GermEval 2018 is the fourth workshop in a series of shared tasks on German processing.
Der Beitrag beschäftigt sich mit der Interaktion zwischen blinden und sehenden Personen bei der kooperativen Anfertigung einer Audiodeskription. Eine Audio-deskription ist die verbale Beschreibung visueller Inhalte für Sehbeeinträchtigte und stellt eine Sonderform der Translation dar. Auf der Basis von Videodaten wird die Kooperation eines Dreierteams mit den Verfahren der multimodalen Interaktionsanalyse untersucht. Ein Charakteristikum dieser Kooperation besteht darin, dass eines der Teammitglieder blind ist und die beiden anderen sehen können. Das Erkenntnisinteresse richtet sich besonders auf die professionelle Beteiligung des blinden Teammitglieds an der Interaktion. Die Analyse zeigt, wie Blindheit als Ressource für die kooperative Herstellung der Audiodeskription genutzt wird und wie die Beteiligten in einer visuell asymmetrischen Situation interagieren. Der Beitrag ist eine der seltenen Untersuchungen, die sich mit professioneller Interaktion zwischen Blinden und Sehenden beschäftigen. Er diskutiert Aspekte von genereller Relevanz für die weitere Entwicklung der empirischen Interaktionsforschung, vor allem in Bezug auf eine Erweiterung von Beteiligungsperspektiven in Richtung Inklusion.
We address the detection of abusive words. The task is to identify such words among a set of negative polar expressions. We propose novel features employing information from both corpora and lexical resources. These features are calibrated on a small manually annotated base lexicon which we use to produce a large lexicon. We show that the word-level information we learn cannot be equally derived from a large dataset of annotated microposts. We demonstrate the effectiveness of our (domain-independent) lexicon in the crossdomain detection of abusive microposts.
The aim of this paper is to present the results of an empirical analysis of the use of non-alphabetic graphic signs (e.g. asterisks, slashes, plus signs etc.) in the context of repairs in Russian and German informal electronic communication. The data for the analysis were taken from the “Mobile Communication Database MoCoDa” (http://mocoda.spracheinteraktion.de/), which contains Russian and German private electronic communication via SMS, WhatsApp and other short message services, and the “Dortmunder Chat-Korpus” (http://www.chatkorpus.tu-dortmund.de/korpora.html). This paper describes the functions of various graphic resources in the context of repairs in both data collections and compares the occurrences of these functions in current Russian and German computer-mediated communication. It concludes that particular signs in both data sets share the same subset of functions, but they differ in terms of how frequently these resources occur in each form of communication.
Mit dem hier besprochenen Band liegt eine Monographie zu Pennsylvania Dutch (Pennsylvania German, Pennsylvania-Deutsch; im Weiteren auch PD) vor, die sowohl die Entstehungsbedingungen und -verläufe und den soziohistorischen, soziopolitischen und religionsbezogenen Kontext seiner Entwicklung als auch seine sprachlichen und literarischen Formen, seine historische und heutige gesellschaftliche Stellung und Verwendung umfassend und gründlich darstellt. Louden wendet sich dabei nicht nur an ein linguistisches Fachpublikum, sondern auch an LeserInnen ohne eine speziell linguistische Vorbildung. Dementsprechend werden für die Darstellung relevante linguistische Konzepte eingeführt und erklärt. Ein umfassendes Stichwortverzeichnis macht die Monographie gut erschließbar, und die umfangreiche Bibliographie ermöglicht es, sich weitergehend zu allen angesprochenen Themen zu informieren. Die Endnoten werden strategisch gut eingesetzt, da sie nicht nur fachwissenschaftliche ‚Unterfütterung‘ bieten, sondern auch dazu genutzt werden, alle zitierten Quellentexte sowohl auf Englisch als auch in der (pennsylvania-)deutschen Originalfassung zur Verfügung zu stellen.
This paper analyses reply relations in computer-mediated communication (CMC), which occur between post units in CMC interactions and which describe references between posts. We take a look at existing practices in the description and annotation of such relations in chat, wiki talk, and blog corpora. We distinguish technical reply structures, indentation structures, and interpretative reply relations, which include reply relations induced by linguistic markers. We sort out the different levels of description and annotation that are involved and propose a solution for their combined representation within the TEI annotation framework.
This paper presents the results of a survey on dictionary use in Europe, the largest survey of dictionary use to date with nearly 10,000 participants in nearly thirty countries. The paper focuses on the comparison of the results of the Slovenian participants with the results of the participants from other European countries. The comparisons are made both with the European averages, and with the results from individual countries, in order to determine in which aspects Slovenian participants share similarities with other dictionary users (and non-users) around Europe, and in which aspects they differ. The findings show that in many ways the Slovenian users are similar to their European counterparts, with some noticeable exceptions, including (much) stronger preference for digital dictionaries over print ones, above-average reliance on other people when dictionary does not contain the relevant information, and the largest difference between the price of a dictionary and the amount willing to spend on it.
The article presents the results of a survey on dictionary use in Europe, focusing on general monolingual dictionaries. The survey is the broadest survey of dictionary use to date, covering close to 10,000 dictionary users (and non-users) in nearly thirty countries. Our survey covers varied user groups, going beyond the students and translators who have tended to dominate such studies thus far. The survey was delivered via an online survey platform, in language versions specific to each target country. It was completed by 9,562 respondents, over 300 respondents per country on average. The survey consisted of the general section, which was translated and presented to all participants, as well as country-specific sections for a subset of 11 countries, which were drafted by collaborators at the national level. The present report covers the general section.
To date, little is known about prosodic accommodation and its conversational functions in instances of overlapping talk in conversation. A major conversational action that happens in overlap is turn competition. It is not known whether participants accommodate prosodic parameters locally in the overlapped turn (initialisation) or access a repertoire of prosodic patterns that refer to general prosodic parameter norms (normalisation) when competing for the turn in overlap. This paper investigates the initialisation and normalisation of fundamental frequency (f0) and assesses its role as a resource for turn competition in overlap. We drew instances of overlapping talk from a corpus of conversational multi-party interactions in British English. We annotated the overlaps on a competitiveness scale and categorised them by overlap onset position and conversational function. We automatically extracted f0 parameters from the speech signal and processed them into f0 accommodation features that represent the normalising or the initialising use of f0. Using decision tree classification we found that f0 accommodation is only relevant as a turn competitive resource in overlaps that start clearly before a speaker transition. In this turn context, we found that normalising and initialising f0 features can both be relevant turn competitive resources. Their deployment depends on the conversational function of overlap.
Die Wortbildungsforschung konzentriert sich auf die Hauptwortarten Substantiv, Adjektiv und Verb; Adverbien vernachlässigt sie. Dieser Beitrag soll eine Lücke schließen. Er beschreibt strukturell, statistisch, sprachgeschichtlich und semantisch 11 zentrale Strukturtypen von Adverbien, nämlich Adverbien, die wir mit Präpositionen des Kernbestands gebildet haben und gelegentlich noch bilden. Und er erklärt, mit welchem Verfahren Adverbien dieser 11 Strukturtypen gebildet werden. Denn wer Wortbildungsprozesse durchschaut, versteht.
Mit politischer, wirtschaftlicher und gesellschaftlicher Öffnung im Rahmen von Globalisierung und Internationalisierung gelangen trotz weitreichender Dominanz von Anglizismen verstärkt auch Neologismen aus anderen Sprach- und Kulturräumen in den deutschen Gegenwartswortschatz. Der Beitrag beschreibt, wie sich diese Neuentlehnungen - Italianismen und neue Fremdwörter aus anderen europäischen und außereuropäischen Sprachen - orthografisch entwickeln und wie sie sich zu den amtlichen Regeln der deutschen Rechtschreibung verhalten. Auf der Grundlage großer digitaler Textkorpora wird der Schreibusus professioneller und informeller Schriftlichkeit analysiert - mit dem Ziel einheitlicher Kodifizierung und Integration in das Regelsystem der deutschen Orthografie.
We present ESDexplorer (https://owid.shinyapps.io/ESDexplorer), a browser application which allows the user to explore the data from a large European survey on dictionary use and culture. We built ESDexplorer with several target groups in mind: our cooperation partners, other researchers, and a more general public interested in the results. Also, we present in detail the architecture and technological realisation of the application and discuss some legal aspects of data protection that motivated some architectural choices.
In the past two decades, more and more dictionary usage studies have been published, but most of them deal with questions related to what users appreciate about dictionaries, which dictionaries they use and what type of information they need in specific situations — presupposing that users actually consult lexicographic resources. However, language teachers and lecturers in linguistics often have the impression that students do not use enough high-quality dictionaries in their everyday work. With this in mind, we launched an international cooperation project to collect empirical data to evaluate what it is that students actually do while attempting to solve language problems. To this end, we applied a new methodological setting: screen recording in conjunction with a thinking-aloud task. The collected empirical data offers a broad insight into what users really do while they attempt to solve language-related tasks online.
Language shift after migration has been reported to occur within three generations. While this pattern holds in many cases there is also some counter evidence. In this paper, family documents from a German immigration community in Canada are investigated to trace individual decisions of language choice that contributed to an extended process of shift taking four generations and more than a century.
Das hier zu besprechende Buch, das Ergebnisse einer gleichnamigen Tagung zusammenfasst, die im Juni 2013 in Zürich stattfand, macht eines offenkundig: Wer in jenem Sommer nicht dabei war, hat etwas verpasst. Umso glücklicher darf man sein, dass Angelika Linke und Juliane Schröter die Arbeit, die mit der Herausgabe eines Sammelbandes verbunden ist, auf sich genommen haben. Mehr noch: In einem programmatischen ersten Kapitel geben sie einen systematischen Einblick in das tragfähige Forschungsfeld „Sprachliche Relationalität“ (vgl. S. 1–6), das ganz im Sinne der emotiven Wende in der Sprachwissenschaft konkrete theoretische Anschlussfähigkeit signalisiert, wo bislang eine „fast unübersehbare Menge an Veröffentlichungen“ (Schwarz-Friesel 2013: 16) zwar zeigte, wie attraktiv die Thematik ist, aber auch wie unstrukturiert sich die Zuwendung dazu gestaltet. Dass der Band nun weitere „exemplarische Besetzungen“ (S. 21) des Forschungsfeldes zur Diskussion stellt, wird hier keinesfalls als Nachteil angesehen, sondern als methodisch folgerichtiger empirischer Zugang zur Erschließung eines Forschungsfeldes unter den zielsetzenden Leitfragen „Wie werden im Medium von Sprachgebrauch und Sprache Konzeptualisierungen, Kategorisierungen und Differenzierungen menschlicher Beziehungen ausgebildet, verfestigt und auch wieder verändert?“ und „Welche sprachgeformten Beziehungskonzepte, -kategorien und -unterschiede sind typisch für bestimmte historische Epochen bzw. für bestimmte soziale Gruppierungen?“
DaF-Lernende sollen – laut z. B. dem „Gemeinsamen europäischen Referenzrahmen für Sprachen“ – auf C1 Niveau über lexikalische Kompetenzen in der Interaktion verfügen und aus einem Repertoire von Diskursmitteln eine geeignete Wendung für konkrete Kommunikationsbedürfnisse auswählen können. Wir betrachten diese Annahme im vorliegenden Beitrag als Ausgangspunkt und stellen darauf aufbauend die Frage, welche Diskursmittel und lexikalischen Einheiten typisch für die mündliche Interaktion sind und daher auch spezifische Beachtung im DaF-/DaZ-Unterricht finden sollten. Zu hinter-fragen ist, wie die Anforderungen an DaF-Lernende zu lexikalischen Besonderheiten im Mündlichen in Richtlinien wie dem GeR oder „Profile Deutsch“ formuliert werden und wie diese Anforderungen in Lehr- und Nachschlagewerken für diese Zielgruppe aufgegriffen werden. Unsere Untersuchungen zeigen, dass die Möglichkeiten noch ausbaufähig sind, was aus unserer Sicht zum Beispiel über eine verstärkte Nutzung der inzwischen vorhandenen Korpora zum gesprochenen Deutsch denkbar sein kann. In diesem Zusammenhang wird auch eine direkte Verbindung zu dem Forschungsprojekt LeGeDe (IDS Mannheim) hergestellt, das u. a. die Konzipierung einer innovativen korpusbasierten Ressource zur Lexik des gesprochenen Deutsch in der Interaktion als Prototyp anvisiert und damit einen Ausschnitt aus einem Repertoire an standardnahen lexikalischen Elementen und Diskursmitteln zusammen mit lexikalisch und interaktions-linguistisch relevanten Informationen in multimedialer Form anbieten möchte. Dieses Vorhaben kommt, laut der Ergebnisse entsprechender Befragungen, u. a. auch den Erwartungen der Probanden aus der Lernerperspektive entgegen und findet daher sowohl für die Forschung als auch für die Lehre entsprechende Anwendungsmöglichkeiten.
Über 400 Wissenschaftler/innen aus insgesamt 25 verschiedenen Herkunftsländern kamen dieses Jahr zur 54. Jahrestagung des Instituts für Deutsche Sprache (IDS). Unter dem Titel „Neues vom heutigen Deutsch. Empirisch – methodisch – theoretisch“ konnten sich die Besucher/innen insgesamt 14 Fachvorträge anhören. In diesem Jahr wurde der Titel weit gefasst, um Themenvielfalt zu ermöglichen. „Neues“ bezeichnet dabei zum einen Neues von der deutschen Sprache, zum anderen aber auch neue Methoden, theoretische Ansätze und empirische Schwierigkeiten.
We present a method for detecting annotation errors in manually and automatically annotated dependency parse trees, based on ensemble parsing in combination with Bayesian inference, guided by active learning. We evaluate our method in different scenarios: (i) for error detection in dependency treebanks and (ii) for improving parsing accuracy on in- and out-of-domain data.
Das Journal für Medienlinguistik (jfml) ist eine medienlinguistische Open-Access-Zeitschrift. Im Sinne einer offenen, interaktiven und unabhängigen Wissenschaftskultur erfolgt die Qualitätssicherung des jfml durch ein Open Peer Review und die medienlinguistische Expertise des Editorial Boards. Das jfml veröffentlicht deutsch- und englischsprachige Artikel, Rezensionen und Tagungsberichte, die fortlaufend erscheinen.
A general concept of perspective is proposed, using the mathematical notion of vector spaces as metaphor. The concept is applied to different phenomena which use perspective: spatiotemporal perspective, lexical semantics (prototypes and features), perspectivation in syntax and lexical inferences. Criteria for constructing a superordinate perspective for two given perspectives are developed.
Die „21. Arbeitstagung zur Gesprächsforschung“ mit dem Rahmenthema „Vergleichende Gesprächsforschung“ fand vom 21.-23. März 2018 am Institut für Deutsche Sprache in Mannheim statt. Das Ziel der Tagung war es, Forscherinnen und Forscher zusammenzubringen, die authentische Interaktionsdaten aus vergleichender Perspektive untersuchen. Das Rahmenthema der Tagung ergab sich aus dem steigenden Interesse an vergleichenden Fragestellungen innerhalb konversations- und gesprächsanalytischer Untersuchungen. Die Tagung nahm gezielt Vorgehensweisen und Methoden bei der Durchführung vergleichender Untersuchungen in den Blick. Die Vorträge1, Projektpräsentationen und Datensitzungen erörterten 1. das Vergleichen als analytische Grundoperation der Konversations- und Gesprächsanalyse, 2. Vergleiche alternativer Ressourcen und Praktiken für spezifische Handlungen und Aktivitäten in der Interaktion sowie 3. methodologische Herausforderungen einer vergleichenden Gesprächsforschung.
This presentation introduces a new collaborative project: the International Comparable Corpus (ICC) (https://korpus.cz/icc), to be compiled from European national, standard(ised) languages, using the protocols for text categories and their quantities of texts in the International Corpus of English (ICE).
In this article, the execution of a ritual as a component of religious communication is analysed. The ritual, in which the church community remembers the deceased, is celebrated in the evangelic church of Sarepta (Volgograd) on the last Sunday of the church year, the so-called ‘eternity Sunday’. The study of the ritual is based on two scientific approaches: ethnomethodology and multimodal interaction analysis. These approaches make it possible to analyse the social and cultural practices of church visitors in conjunction with the organisation of church service. Specifically, it becomes possible to:
a) develop new scientific paradigms when analysing the actual use of the church interior,
b) identify basic religious activities of communication in church,
c) introduce new concepts into scientific use,
d) present the ritual of remembrance in Sarepta as a complex, multimodally constituted religious event,
e) focus the coordination of linguistic, physical and spatial activities of church visitors and clerics at different stages of church service and to understand their respective social content and communicative status.
For analysing the video recordings of the church service, the concepts of ‘architecture-for-interaction’ and ‘social topography’ are used, making it possible to discover new aspects of spatial influence on communication. The concept of ‘architecture-for-interaction’ provides the framework for answering the question of how the church interior in Sarepta contributes to the organisation of the ritual. Forms of situational use of space and the cultural knowledge underlying this use are captured with the concept of ‘social topography’. From a structural viewpoint, the analyzed ritual in Sarepta is based on organization and division of responsibilities, consists of phases of structural non-simultaneity, has a three-positional spatial basis, and is structurally open. Because of these characteristics, the execution of the ritual can be described as ‘participatory rituality’. Participatory rituality allows for a religious socialization which lets the community members participate as active and legitimate participants in religious communication and autonomously contribute to the execution of the ritual.
This abstract discusses the possibility to adopt a CLARIN Data Protection Code of Conduct pursuant art. 40 of the General Data Protection Regulation. Such a code of conduct would have important benefits for the entire language research community. The final section of this abstract proposes a roadmap to the CLARIN Data Protection Code of Conduct, listing various stages of its drafting and approval procedures.
New exceptions for Text and Data Mining and their possible impact on the CLARIN infrastructure
(2018)
The proposed paper discusses new exceptions for Text and Data Mining that have recently been adopted in some EU Member States, and probably will soon be adopted also at the EU level. These exceptions are of great significance for language scientists, as they exempt those who compile corpora from the obligation to obtain authorisation from rightholders. However, corpora compiled on the basis of such exceptions cannot be freely shared, which in a long run may have serious consequences for Open Science and the functioning of research infrastructure such as CLARIN ERIC.
Deutsche Geschichte-Digital: Ergebnisse der TEI-Konvertierung und Integration in Pilotprojekten
(2018)
All linguistics should be media linguistics, but it is not. This thesis is presented by using linguistic landscapes as an example. LL research does not belong to the traditional core of either mainstream linguis-tics or media linguistics. This is why not everything within power has been done yet to make full use of their thematic, conceptual and methodological possibilities. Visible signs in public space, however, are an everyday phenomenon. You have to pull out all the stops to research them extensively. The distinction between linguistics and media linguistics turns out to be counterproductive. But this does not only apply to the case of linguistic landscapes. It also stands for any comprehensive investigation of language and language use. (Ex-ceptions may be very narrow questions for specific purposes.) The above thoughts are supported by a database of the project „Metro-polenzeichen“ with more than 25.000 systematically collected, ge-ocoded and tagged photographs.
Die Bedeutung von Forschungsdatenmanagement im wissenschaftspolitischen Diskurs und im wissenschaftlichen Arbeitsalltag nimmt stetig zu. Nationale und internationale Forschungsinfrastrukturen, Verbünde, disziplinäre Datenzentren und institutionelle Kompetenzzentren nähern sich den Herausforderungen aus unterschiedlichen Perspektiven. Dieser Beitrag stellt das Data Center for the Humanities an der Universität zu Köln als Beispiel für ein universitäres Datenzentrum mit fachlicher Spezialisierung auf die Geisteswissenschaften vor.
Pädiatrische Gespräche unterscheiden sich gegenüber anderen ärztlichen Gesprächen mit Patienten hinsichtlich der Gesprächsaufgaben und der Beteiligungskonstellationen. In einer triadischen Konstellation mit Arzt, Patient und Eltern(teil) müssen unterschiedliche Kenntnisse und Zuständigkeiten aller Beteiligten ausreichend abgeglichen und Verständigung und Gesprächsergebnisse gesichert werden. In diesem Beitrag wird zunächst die Forschungslage umrissen und das Handlungsschema pädiatrischer Erstkonsultationen kurz dargelegt. Daran anschließend werden anhand einer Fallanalyse die vielschichtigen und komplexen Aufgabenstellungen der Beteiligten bei der Herstellung und Durchführung der körperlichen Untersuchung beleuchtet.
This paper analyses reply relations in computer-mediated communication (CMC), which occur between post units in CMC interactions and which describe references between posts. We take a look at existing practices in the description and annotation of such relations in chat, wiki talk, and blog corpora. We distinguish technical reply structures, indentation structures, and interpretative reply relations, which include reply relations induced by linguistic markers. We sort out the different levels of description and annotation that are involved and propose a solution for their combined representation within the TEI annotation framework.
We present a testsuite for POS tagging German web data. Our testsuite provides the original raw text as well as the gold tokenisations and is annotated for parts-of-speech. The testsuite includes a new dataset for German tweets, with a current size of 3,940 tokens. To increase the size of the data, we harmonised the annotations in already existing web corpora, based on the Stuttgart-Tübingen Tag Set. The current version of the corpus has an overall size of 48,344 tokens of web data, around half of it from Twitter. We also present experiments, showing how different experimental setups (training set size, additional out-of-domain training data, self-training) influence the accuracy of the taggers. All resources and models will be made publicly available to the research community.
We present a study on gaps in spoken language interaction as a potential candidate for syntactic boundaries. On the basis of an online annotation experiment, we can show that there is an effect of gap duration and gap type on its likelihood of being a syntactic boundary. We discuss the potential of these findings for an automation of the segmentation process.
A syntax-based scheme for the annotation and segmentation of German spoken language interactions
(2018)
Unlike corpora of written language where segmentation can mainly be derived from orthographic punctuation marks, the basis for segmenting spoken language corpora is not predetermined by the primary data, but rather has to be established by the corpus compilers. This impedes consistent querying and visualization of such data. Several ways of segmenting have been proposed,
some of which are based on syntax. In this study, we developed and evaluated annotation and segmentation guidelines in reference to the topological field model for German. We can show that these guidelines are used consistently across annotators. We also investigated the influence of various interactional settings with a rather simple measure, the word-count per segment and unit-type. We observed that the word count and the distribution of each unit type differ in varying interactional settings and that our developed segmentation and annotation guidelines are used consistently across annotators. In conclusion, our syntax-based segmentations reflect interactional properties that are intrinsic to the social interactions that participants are involved in. This can be used for further analysis of social interaction and opens the possibility for automatic segmentation of transcripts.
Der Beitrag untersucht auf der Grundlage der multimodal-raumanalytischen Interaktionsanalyse die Abendmahlfeier in drei lutherisch-protestantischen Gottesdiensten. Die Videoaufnahmen hierzu stammen aus Sarepta (Russland) und Rimbach und Zotzenbach (Deutschland). Nach einer kurzen Einordnung des Beitrags in den relevanten Forschungszusammenhang wird das spezifische raumanalytische Erkenntnisinteresse am Abendmahl als kollektive Positionierungsanforderung erläutert. Drei Fallanalysen rekonstruieren zunächst die interaktionsarchitektonischen Voraussetzungen für die kollektive Bewegung der Gemeinde ins kirchenräumliche Vorne. Diese Bewegung, die Positionierung der Gemeinde zur Einnahme des Abendmahls (der Konsum von Wein und Brot) und der Rückweg zu den Kirchenbänken sind raumbezogene Teilaufgaben, die in der konkreten Situation bearbeitet werden müssen. Die Bewegung der Gemeinde wird in den drei analysierten Gottesdiensten auf sehr unterschiedliche Weise organisiert. Die Rekonstruktion dieser Unterschiede ermöglicht die Formulierung von drei unterschiedlichen Vollzugsmodellen primär auf der Basis der zwei folgenden Aspekte: Relevant ist zum einen das Ausmaß und die Form der Vergemeinschaftung
(als symbolischer Nachvollzugs des überlieferten Abendmahls von Jesus Christus mit seinen Jüngern am Gründonnerstag) und zum anderen die Spezifik, in der die Teilnehmer konkret den Wein und das Brot konsumieren. Auf diesem Wege konnten ein Modell der Vergemeinschaftung mit Kollektivversorgung (Sarepta), ein Modell der Teil-Vergemeinschaftung mit Teil-Gruppenversorgung (Zotzenbach) sowie ein Individualisierungsmodell mit Einzelversorgung (Rimbach) identifiziert werden. Als strukturprägende Einflussgrößen werden einerseits die Möglichkeiten, die die Architektur für den Vollzug des Abendmahls zur Verfügung stellt, und andererseits die Anzahl der Teilnehmer deutlich. Ab einer gewissen Anzahl entsteht eine Art Ökonomisierungszwang, der sich negativ auf die Qualität der Vergemeinschaftung auswirkt. Von Reinhold Schmitt stammt die Idee, das Abendmahl als Koordinations- und Positionierungsaufgabe zu konzeptualisieren. Er hat auch die multimodal-interaktionsanalytische Methodologie entwickelt, die dem Beitrag zugrunde liegt. Darüber hinaus hat er die Videoaufnahmen in Rimbach und Zotzenbach erstellt und transkribiert. Anna Petrova hat die Gottesdienste in Sarepta dokumentiert und transkribiert. Die methodische und theoretische Konzeption des Beitrags stammt von beiden Autoren. Auch die Analysen der ausgewählten Fälle haben sie gemeinsam durchgeführt.
In a number of languages, agreement in specificational copular sentences can or must be with the second of the two nominals, even when it is the first that occupies the canonical subject position. Béjar & Kahnemuyipour (2017) show that Persian and Eastern Armenian are two such languages. They then argue that ‘NP2 agreement’ occurs because the nominal in subject position (NP1) is not accessible to an external probe. It follows that actual agreement with NP1 should never be possible: the alternative to NP2 agreement should be ‘default’ agreement. We show that this prediction is false. In addition to showing that English has NP1, not default, agreement, we present new data from Icelandic, a language with rich agreement morphology, including cases that involve ‘plurale tantum’ nominals as NP1. These allow us to control for any confound from the fact that typically in a specificational sentence with two nominals differing in number, it is NP2 that is plural. We show that even in this case, the alternative to agreement with NP2 is agreement with NP1, not a default. Hence, we conclude that whatever the correct analysis of specificational sentences turns out to be, it must not predict obligatory failure of NP1 agreement.
Das praxonymbildende Konfix -gate zur Benennung von Skandalen nimmt sowohl im Deutschen als auch im Englischen einen Sonderstatus ein: Es ist in beiden Sprachen eines der wenigen onymischen Wortbildungselemente und hat eine hohe Produktivität. Dennoch wurde das Konfix bislang in der Onomastik nicht, in der Wortbildung nur unsystematisch erforscht und diskutiert. Ausgehend von der Beobachtung, dass -gate nach der politisch brisanten Watergate-Affäre in den 1970er Jahren zunächst für größere politische Skandale, heute jedoch überwiegend zur Benennung trivialer und medial aufgebauschter Skandale verwendet wird (Eierlikör-Gate, Watsch’n- Gate), gehen wir in diesem Beitrag linguistischen Fragen dieser Trivialisierung nach. Dazu fokussiert unsere korpusbasierte Analyse auf die diachrone Entwicklung der verwendeten Erstglieder (Onyme vs. Appellative), sowie die Korre-lation dieser Benennungsstrategien mit unterschiedlichen Skandaltypen (politisch, gesellschaftlich, boulevardesk) und diskutiert Parallelen und Divergenzen zwischen beiden Sprachen. Als Konfix mit besonders hoher Onymizität weist -gate Vorteile gegenüber weniger onymischen Konkurrenzbezeichnungen (-affäre/-Skandal) auf, da auch Ereignisnamen mit appellativischen Erstgliedern eindeutig als Praxonyme erkennbar sind. Appellativische Erstglieder sind wiederum besonders geeignet für triviale Skandale. Direkte Folge der Trivialisierung ist ein deutlicher Typenanstieg bei niedriger Tokenfrequenz. Die semantischen Entwicklungen sind in beiden Sprachen zu beobachten, verlaufen im Deutschen allerdings sichtbar zeitlich verzögert. Die Hauptunterschiede liegen in der deutlicheren Trivialisierung von -gate im Deutschen einerseits sowie einer weniger ausgeprägten Korrelation von Appellativen und Trivialität im Englischen andererseits; letzteres kann darauf zurückgeführt werden, dass Appellative im Englischen vor allem in den 1990ern der Unterscheidung zwischen einer Vielzahl an politischen Skandalen dienten. Insgesamt lassen sich an –gate relevante Fragestellungen sowohl der Onomastik als auch der Wortbildungs- und Lehnwortforschung diskutieren.
This paper studies the morphological productivity of German N+N compounding patterns from a diachronic perspective. It argues that the productivity of compounds increases due to syntactic influence from genitive constructions (“improper compounds”) in Early New High German. Both quantitative and qualitative productivity measures are adapted from derivational morphology and tested on compound data from the Mainz Corpus of (Early) New High German (1500–1710).
Der vorliegende Aufsatz untersucht Ausbildungsinteraktionen in zwei beruflichen Qualifizierungsmaßnahmen für Flüchtlinge. Solche Maßnahmen werden seit 2015 verstärkt angeboten, um die Geflüchteten möglichst umfassend und zügig auf eine Arbeitsaufnahme in Deutschland vorzubereiten. Im Kontext einer ethnografischen Studie untersuchen wir mit Methoden der multimodalen Interaktionsanalyse, a) wie in Anleitungsgesprächen Verständigungsprobleme zwischen deutschen Anleitern und auszubildenden Flüchtlingen entstehen und b) welche sprachlich-kommunikativen Praktiken zu ihrer Bearbeitung eingesetzt werden. Dabei lassen sich ebenso gelungene wie Probleme erzeugende Kommunikationspraktiken feststellen. Da die meisten Geflüchteten zu Beginn der untersuchten Maßnahmen noch keine Integrationskurse besucht hatten und nur über wenige Deutschkenntnisse verfügten, liegt der primäre Fokus der Analyse auf der Beteiligungsweise der Ausbilder, betrachtet diese aber im sequenziellen Kontext der Interaktionsbeteiligung der auszubildenden Flüchtlinge. Die Untersuchung beruht auf 22 Stunden Videoaufnahmen praktischer Ausbildungen.
Deutschland sieht sich in den nächsten Jahren vor enorme Herausforderungen gestellt. Mit der Fluchtmigration von knapp 1,5 Millionen Menschen alleine zwischen den Jahren 2014 und 2017 stehen nahezu in jedem gesellschaftlichen Bereich, und hier insbesondere in den Sektoren Bildung und Arbeit, große Integrationsaufgaben an. Steven Vertovec (2015), der Leiter des Max-Planck-Instituts zur Erforschung multireligiöser und multiethnischer Gesellschaften, bezeichnet die Fluchtmigration von 2015 auch deshalb als die „zweite Wende“ für Deutschland, die das Land nachhaltig verändern wird. Nach seiner Einschätzung sind die erwartbaren gesellschaftlichen Transformationen von solch einer Größenordnung, dass die Formulierung „seit der Flüchtlingskrise“ eine ebenso geläufige Redewendung sein wird wie die Formulierung „seit der Wende“. Um diese gegenwärtigen Migrations- und Integrationsprozesse von Anfang an dokumentieren und analysieren zu können, wurde am Institut für Deutsche Sprache (IDS) zu Beginn des Jahres 2016 das Projekt „Deutsch im Beruf: Die sprachlich-kommunikative Integration von Flüchtlingen“ gestartet, dessen erste Ergebnisse das vorliegende Themenheft präsentiert.
Der Beitrag widmet sich den Geflüchteten als Teil der deutschlernenden Teilnehmer/innen in den staatlich verordneten Integrationskursen (IKs). Unsere Erhebung unter 305 Geflüchteten aus Syrien und anderen Ländern legt ihren Schwerpunkt auf die sprachlichen Hintergründe. Dabei werden soziodemografische Daten mit Angaben zum Spracherwerb in Beziehung gesetzt und als kollektive Sprachbiografien dargestellt. Des Weiteren beschreiben wir sieben Teilnehmergruppen von Geflüchteten in den IKs, die sich vor allem auf Grund der Faktoren Alter, Bildungsgrad und Arbeitserfahrung unterscheiden, für die aber auch Merkmale im Hinblick auf Herkunft und Mehrsprachigkeit eine Rolle spielen. Ferner werden Angaben zur Sozialsituation in Deutschland mit Einschätzungen zum Deutscherwerb in Beziehung gesetzt. Ein Vergleich mit anderen Studien verdeutlicht die Verschiebungen in der Zusammensetzung des IK. Unser Beitrag kann als Anregung verstanden werden, die Passgenauigkeit im Sinne der Deutschlernenden zu überdenken.
Cet article propose un bref aperçu de l’état de l’art en syntaxe de l’allemand. Pour illustrer les évolutions théoriques et méthodologiques majeures, en rupture avec les approches traditionnelles, l’étude a sélectionné cinq points particuliers : la structure du groupe nominal, la syntaxe du verbe en lien avec la valence et les fonctions syntaxiques, les diathèses, les constructions infinitives et la structure de la phrase sous l’angle de la position du verbe et de ses implications syntaxiques.
Fondé en 1964, l’Institut für Deutsche Sprache (IDS) est aujourd’hui l’institution extra-universitaire la plus importante pour la recherche et la documentation dans le domaine de l’allemand contemporain. L’article met en perspective les travaux lexicologiques et lexicographiques qu’accomplit l’IDS en fonction de son cadre institutionnel, des changements paradigmatiques dans la recherche et des transformations sociétales.
Overtaking as an interactional achievement : video analyses of participants' practices in traffic
(2018)
In this article we pursue a systematic and extensive study of overtaking in traffic as an interactional event. Our focus is on the accountable organisation and accomplishment of overtaking by road users in real-world traffic situations. Data and analysis are drawn from multiple research groups studying driving from an ethnomethodological and conversation analytic perspective. Building on multimodal and sequential analyses of video recordings of overtaking events, the article describes the shared practices which overtakers and overtaken parties use in displaying, recognizing and coordinating their manoeuvres. It examines the three sequential phases of an overtaking event: preparation and projection; the overtaking proper; the re-alignment post-phase including retrospective accounts and assessments. We identify how during each of these phases drivers and passengers organize intra-vehicle and inter-vehicle practices: driving and non-driving related talk between vehicle- occupants, the emerging spatiotemporal ecology of the road, and the driving actions of other road users. The data is derived from a two camera set-up recording the road ahead and car interior. The recordings are from three settings: daily commuting, driving lessons, race-car coaching. The events occur on a variety of road types (motorways, country roads, city streets, a race track, etc.), in six languages (English, Finnish, French, German, Italian, and Swedish) and in seven countries (Australia, Finland, France, Germany, Sweden, Switzerland, and the UK). From an exceptionally diverse collection of video data, the study of which is made possible thanks to the innovative collaboration of multiple researchers, the article exhibits the range of practical challenges and communicative skills involved in overtaking.
Except for some recent advances in spoken language lexicography (cf. Verdonik & Sepesy Maučec 2017, Hansen & Hansen 2012, Siepmann 2015), traditional lexicographic work is mainly oriented towards the written language. In this paper, we describe a method we used to identify relevant headword candidates for a lexicographic resource for spoken language that is currently being developed at the Institute for the German Language (IDS, Mannheim). We describe the challenges of the headword selection for a dictionary of spoken language, and having made considerations regarding our headword concept, we present the corpus-based procedures that we used in order to facilitate the headword selection. After presenting the results regarding the selection of one-word lemmas, we discuss the opportunities and limitations of our approach.
We present the conceptual foundations and basic features of fLexiCoGraph, a generic software package for creating and presenting curated human-oriented lexicographical resources that are roughly modeled according to Měchura’s (2016) idea of graph-augmented trees. The system is currently under development and will be made accessible as open source software. As a sample use case we discuss an existing online database of loanwords borrowed from German into other languages which is based on a growing number of language-specific loanword dictionaries (Lehnwortportal Deutsch). The paper outlines the conceptual foundations of fLexiCoGraph’s hybrid graph/XML data model. To establish a database, XML-based resources may be imported or even input manually. An additional graph database layer is then constructed from these XML source documents in a freely configurable, but automated way; subsequently, the resulting graph can be manipulated and enlarged through a visual user interface in such a way that keeps the relationship to the source document information explicit at all times. We sketch the tooling support for different kinds of graph-level editing processes, including mechanisms for dealing with updated XML source documents and coping with duplicate or inconsistent information, and briefly discuss the browser interface for end users.
This paper discusses changes in lexicographic traditions with respect to contrastive dictionary entries and dynamic, on-demand e-lexicographic descriptions. The new German online dictionary Paronyme - Dyna- misch im Kontrast is concerned with easily confused words (paronyms), such as effektivtefficient and sensibel/ sensitiv. New approaches to the empirical analysis and lexicographic presentation of words such as these are required, and this dictionary is committed to overcoming the discrepancy between traditional practice and insights from language use. As a corpus-guided reference work, it strives to adequately reflect not only authentic use in situations of actual communication, but also cognitive ideas such as conceptual structure, categorization and knowledge. Looking up easily confused lexical items requires contrastive entries where users can instantly compare meaning, contexts and reference. Adaptable access to lexicographic details and variable search options offer different foci and perspectives on linguistic information, and authentic examples reflect prototypical structures. These are essential in order to meet all the different interests of users. This paper will illustrate the contrastive structure of the new e-dictionary and demonstrate which information can be compared. It also focusses on various dynamic modes of dictionary consultation, which enable users to shift perspectives on paronyms accordingly.
Zur Vorbereitung eines zweisprachigen Fachworterbuchs zur Tourismusfachsprache werden korpuslinguistische Verfahren eingesetzt, um Auffalligkeiten in der jeweiligen Fachsprache im Vergleich zum allgemeinsprachlichen Gebrauch aufzuspüren. Neben den hervorstechenden Elementen des Vokabulars, den Schlüsselwortern als potentiellen Stichwortern, geht es vor allem um sprach- und fachsprachspezifische typische Formulierungen und deren Ubersetzungsaquivalente. Fur die gemeinsame, interlinguale Betrachtung des Sprachenpaars Deutsch-Italienisch wurde ein kleines Fachsprachenkorpus aufgebaut und innerhalb der Sketch Engine-Umgebung unter Zuhilfenahme der darin integrierten Referenzkorpora ausgewertet. Fur eine weitere intralinguale Untersuchung der deutschsprachigen Komponente wurde auf das Deutsche Referenzkorpus DeReKo und weitere, intern zu Verfügung stehende Instrumente des Instituts für Deutsche Sprache zuruckgegriffen. Neben üblichen Verfahren der quantitativen Ein- oder Mehrwortbewertung wird ein Ansatz ergänzend getestet, der der dunnen Datengrundlage im fachsprachlichen Bereich Rechnung trägt: Diese ergibt sich nicht nur aus der Korpusgrobe, sondern auch daraus, dass bestimmte feste Floskeln (wie ,eine Reiserücktrittsversicherung abschlieben‘) selten rekurrent, vielmehr eher nur einmal pro Text verwendet werden. Auch wenn dieser Ansatz aufgrund infrastruktureller Artefakte in Einzelfallen an seine Grenzen stößt, die hier selbstkritisch nicht verschwiegen werden sollen, so zeigt sich doch an vielen Stellen auch das grobe Potential. Abschließend wird beispielhaft illustriert, wie Evidenzen dieser und der anderen korpuslinguistischen Auswertungen lexikographisch umgesetzt wurden.
In this paper, we discuss an efficient method of (semi-automatic) neologism detection for German and its application for the production of a dictionary of neologisms, focusing on the lexicographic process. By monitoring the language via editorial (print and online) media evaluation and interpreting the findings on the basis of lexicographic competence, many, but not all neologisms can be identified which qualify for inclusion in the Neologismenworterbuch (2006-today) at the Institute for the German Language in Mannheim (IDS). In addition, an automated corpus linguistic method offers neologism candidates based on a systematic analysis of large amounts of text to lexicographers. We explain the principles of the corpus linguistic compilation of a list of candidates and show how lexicographers work with the results, combining them with their own findings in order to continuously enlarge this specialized online dictionary of new words in German.
Many studies on dictionary use presuppose that users do indeed consult lexicographic resources. However, little is known about what users actually do when they try to solve language problems on their own. We present an observation study where learners of German were allowed to browse the web freely while correcting erroneous German sentences. In this paper, we are focusing on the multi-methodological approach of the study, especially the interplay between quantitative and qualitative approaches. In one example study, we will show how the analysis of verbal protocols, the correction task and the screen recordings can reveal the effects of intuition, language (learning) awareness, and determination on the accuracy of the corrections. In another example study, we will show how preconceived hypotheses about the problem at hand might hinder participants from arriving at the correct solution.