Refine
Year of publication
- 2020 (357) (remove)
Document Type
- Part of a Book (139)
- Article (124)
- Conference Proceeding (29)
- Book (17)
- Other (15)
- Part of Periodical (15)
- Review (12)
- Doctoral Thesis (2)
- Working Paper (2)
- Master's Thesis (1)
Language
- German (252)
- English (101)
- French (2)
- Multiple languages (2)
Keywords
- Deutsch (95)
- Korpus <Linguistik> (64)
- COVID-19 (44)
- Sprachgebrauch (41)
- Neologismus (30)
- Forschungsdaten (25)
- Gesprochene Sprache (24)
- Grammatik (23)
- Mundart (23)
- Wortschatz (21)
Publicationstate
- Veröffentlichungsversion (169)
- Zweitveröffentlichung (137)
- Postprint (19)
- Ahead of Print (2)
Reviewstate
Publisher
- Leibniz-Institut für Deutsche Sprache (IDS) (77)
- Narr Francke Attempto (44)
- de Gruyter (43)
- European Language Resources Association (19)
- Erich Schmidt (10)
- CLARIN (6)
- Gesellschaft für deutsche Sprache e.V. (6)
- Heidelberg University Publishing (6)
- Spektrum der Wissenschaft Verlagsgesellschaft (5)
- Association for Computational Linguistics (4)
We evaluate a graph-based dependency parser on DeReKo, a large corpus of contemporary German. The dependency parser is trained on the German dataset from the SPMRL 2014 Shared Task which contains text from the news domain, whereas DeReKo also covers other domains including fiction, science, and technology. To avoid the need for costly manual annotation of the corpus, we use the parser’s probability estimates for unlabeled and labeled attachment as main evaluation criterion. We show that these probability estimates are highly correlated with the actual attachment scores on a manually annotated test set. On this basis, we compare estimated parsing scores for the individual domains in DeReKo, and show that the scores decrease with increasing distance of a domain to the training corpus.
This paper presents the QUEST project and describes concepts and tools that are being developed within its framework. The goal of the project is to establish quality criteria and curation criteria for annotated audiovisual language data. Building on existing resources developed by the participating institutions earlier, QUEST develops tools that could be used to facilitate and verify adherence to these criteria. An important focus of the project is making these tools accessible for researchers without substantial technical background and helping them produce high-quality data. The main tools we intend to provide are the depositors’ questionnaire and automatic quality assurance, both developed as web applications. They are accompanied by a Knowledge base, which will contain recommendations and descriptions of best practices established in the course of the project. Conceptually, we split linguistic data into three resource classes (data deposits, collections and corpora). The class of a resource defines the strictness of the quality assurance it should undergo. This division is introduced so that too strict quality criteria do not prevent researchers from depositing their data.
The present article shows an experimental subject investigation on elements of video telephony in relation to experiencing and feeling connectedness and intimacy within private interpersonal communication. Particular interests are questions about possible relationships between image detail, angle of view or perspective as well as image format or the foreign and personal perception of the communicators. Central to this is the question of whether the practices and interactions of users in dealing with communication technology can be used to derive possible conclusions on negotiation measures or even adaptation services. The obtained results are presented on the basis of an introductory theoretical discussion. It is followed by a summary and analysis as well as an outlook on the further use and significance of the results.
Professional and technical practice and the technical character of social interaction.
The focus on communication in research on professional and scientific language somehow reflects the intention of John L. Austin’s phrase “How to do things with words?” But a description based on the concept of communication ultimately also relies on linguistic idiosyncrasies. We will look at things the other way round and ask first “how to do (professional) things” and then look at the linguistic units used specifically for this purpose. Professionalism in this view takes very different forms for different types of actions (“practices”). Although reliability and professional authority are central features of all linguistic realizations to be considered, they are represented in very different ways. As a result, professionalism not only shows in the high degree of explicitness of technical prose typical for written scientific discussion. It is also reflected in the high degree of implicitness of speech that accompanies and constitutes practical action.
We present a fine-grained NER annotations scheme with 30 labels and apply it to German data. Building on the OntoNotes 5.0 NER inventory, our scheme is adapted for a corpus of transcripts of biographic interviews by adding categories for AGE and LAN(guage) and also adding label classes for various numeric and temporal expressions. Applying the scheme to the spoken data as well as a collection of teaser tweets from newspaper sites, we can confirm its generality for both domains, also achieving good inter-annotator agreement. We also show empirically how our inventory relates to the well-established 4-category NER inventory by re-annotating a subset of the GermEval 2014 NER coarse-grained dataset with our fine label inventory. Finally, we use a BERT-based system to establish some baselines for NER tagging on our two new datasets. Global results in in-domain testing are quite high on the two datasets, near what was achieved for the coarse inventory on the CoNLLL2003 data. Cross-domain testing produces much lower results due to the severe domain differences.
Fragen sind zentrale Interventionen im Coaching. Trotzdem gibt es kaum Erkenntnisse darüber, wie sie zur Veränderung bei Klientinnen und Klienten beitragen. Mit ihrem Fokus auf die sequenzielle Abfolge von Äußerungen wie „Frage – Antwort – Reaktion“ kann die linguistische Gesprächsanalyse dieses Veränderungspotenzial von Fragen beschreiben und so auch für die (Weiterbildungs-)Praxis oder Personalwirtschaft zugänglich machen.
Designed as a contribution to contrastive linguistics, the present volume brings up-to-date the comparison of German with its closest neighbour, Dutch, and other Germanic relatives like English, Afrikaans, and the Scandinavian languages. It takes its inspiration from the idea of a "Germanic Sandwich", i.e. the hypothesis that sets of genetically related languages diverge in systematic ways in diverse domains of the linguistic system. Its contributions set out to test this approach against new phenomena or data from synchronic, diachronic and, for the first time in a Sandwich-related volume, psycholinguistic perspectives. With topics ranging from nickname formation to the IPP (aka 'Ersatzinfinitiv'), from the grammaticalisation of the definite article to /s/-retraction, and from the role of verb-second order in the acquisition of L2 English to the psycholinguistics of gender, the volume appeals to students and specialists in modern and historical linguistics, psycholinguistics, translation studies, language pedagogy and cognitive science, providing a wealth of fresh insights into the relationships of German with its closest relatives while highlighting the potential inherent in the integration of different methodological traditions.
This is an introduction to a special issue of Dictionaries: Journal of the Dictionary Society of North America. It offers a characterization of neology and describes the Globalex-sponsored workshop at which the papers in the issue originated. It provides an overview of the papers, which treat lexicographical neology and neological lexicography in Danish, Dutch, Estonian, Frisian, Greek, Korean, Spanish, and Swahili and address relevant aspects of lexicography in those languages, presenting state-of-the-art research into neology and ideas about modern lexicographic treatment of neologisms in various dictionary types.
Globalisierungsdiskurs
(2020)
In der Grammatikforschung hat sich über die Jahre eine Vielzahl von Perspektiven, Herangehensweisen und Theorien herausgebildet, die mit oft unterschiedlichen – gelegentlich sogar widersprüchlichen – begrifflichen Systematiken arbeiten. Diese terminologische Vielfalt stellt die Entwicklung konsistenter Erklärungsmodelle vor besondere Herausforderungen. Der vorliegende Band zur ars grammatica 2017: Grammatische Terminologie – Inhalte und Methoden enthält Beiträge, die sich im Spannungsfeld zwischen inhaltlicher Betrachtung und methodischer Anwendung mit Eigenschaften und Spezifika grammatischer Fachsprache beschäftigen. Dabei decken die Beiträge ein breites Spektrum ab und reichen von theoretischen Ausführungen der Terminologie(-forschung) über die Herausforderungen intra- und interlingualer Untersuchungen bis hin zu anwendungsorientierten Betrachtungen.
This chapter begins with a sketch of the specifics of our approach, an overview of the contents of the chapters on word formation and some methodological notes. It then discusses the general characteristics of word formations and of their overall inventory, comparing word formations to primary words. Furthermore, the chapter explores the relative frequencies of word formations in different vocabulary areas and traces the word formation profiles of individual parts of speech. Finally, it compiles the characteristic word formation rules for different parts of speech.
Das vorliegende Buch bildet den Abschluss einer Handbuchserie zu Sprachminderheitenkonstellationen unter Beteiligung des Deutschen. Ihren Anfang nahm die Serie 1996 mit einem Band zur Situation der Sprachminderheiten in Mitteleuropa (Hinderling/Eichinger 1996b). Dieser Band, der noch vor dem Fall des Eisernen Vorhangs konzipiert worden war, war bald vergriffen. Es folgten weitere Bände zu anderen Regionen der Welt, die sich von der Struktur her an dem Mitteleuropa-Band orientierten: zunächst die Länder Mittel- und Osteuropas (Eichinger/Plewnia/Riehl 2008), sodann die deutschen Sprachminderheiten in Übersee (Plewnia/Riehl 2018). Das Handbuch des Deutschen in West-und Mitteleuropa (Beyer/Plewnia 2019) war der erste Band einer vollständigen Neufassung des Handbuchs von 1996, wo über die Dichotomie von Mehrheit und Minderheit hinaus auch weitere Ausprägungen gesellschaftlicher Mehrsprachigkeit berücksichtigt wurden.
How Do Speakers Define the Meaning of Expressions? The Case of German x heißt y (“x means y”)
(2020)
To secure mutual understanding in interaction, speakers sometimes explain or negotiate expressions. Adopting a conversation analytic and interaction linguistic approach, I examine how participants explain which kinds of expressions in different sequential environments, using the format x heißt y (“x means y”). When speakers use it to clarify technical terms or foreign words that are unfamiliar to co-participants, they often provide a situationally anchored definition that however is rather context-free and therefore transferable to future situations. When they explain common (but indexical, ambiguous, polysemous, or problematic) expressions instead, speakers always design their explanation strongly connected to the local context, building on situational circumstances. I argue that x heißt y definitions in interaction do not meet the requirements of scientific or philosophical definitions but that this is irrelevant for the situational exigencies speakers face.
Coaching outcome research convincingly argues that coaching is effective and facilitates change in clients. While coaching practice literature depicts questions as key vehicle for such change, empirical findings as regards the local and global change potential of questions are so far largely missing in both (psychological) outcome research and (linguistic and psychological) process research on coaching. The local change potential of questions refers to a turn-by-turn transformation as a result of their sequentiality, the global change potential is related to the power of questions to initiate, process and finalize established phases of change. This programmatic article on questions, or rather questioning sequences, in executive coaching pursues two goals: firstly, it takes stock of available insights into questions in coaching and advocates for Conversation Analysis as a fruitful methodological framework to assess the local change potential of questioning sequences. Secondly, it points to the limitations of a local turn-by-turn approach to unravel the overall change potential of questions and calls for an interdisciplinary approach to bring both local and global effectiveness into relation. Such an approach is premised on conversational sequentiality and psychological theories of change and facilitates research on questioning sequences as both local and global agents of change across the continuum of coaching sessions. We present the TSPP Model as a first result of such an interdisciplinary cooperation.
Der Beitrag untersucht vorhandene Lösungen und neue Möglichkeiten des Korpusausbaus aus Social Media- und internetbasierter Kommunikation (IBK) für das Deutsche Referenzkorpus (DEREKO). DEREKO ist eine Sammlung gegenwartssprachlicher Schriftkorpora am IDS, die der sprachwissenschaftlichen Öffentlichkeit über die Korpusschnittstellen COSMAS II und KorAP angeboten wird. Anhand von Definitionen und Beispielen gehen wir zunächst auf die Extensionen und Überlappungen der Konzepte Social Media, Internetbasierte Kommunikation und Computer-mediated Communication ein. Wir betrachten die rechtlichen Voraussetzungen für einen Korpusausbau aus Sozialen Medien, die sich aus dem kürzlich in relevanten Punkten reformierten deutschen Urheberrecht, aus Persönlichkeitsrechten wie der europäischen Datenschutz-Grundverordnung ergeben und stellen Konsequenzen sowie mögliche und tatsächliche Umsetzungen dar. Der Aufbau von Social Media-Korpora in großen Textmengen unterliegt außerdem korpustechnologischen Herausforderungen, die für traditionelle Schriftkorpora als gelöst galten oder gar nicht erst bestanden. Wir berichten, wie Fragen der Datenaufbereitung, des Korpus-Encoding, der Anonymisierung oder der linguistischen Annotation von Social Media Korpora für DEREKO angegangen wurden und welche Herausforderungen noch bestehen. Wir betrachten die Korpuslandschaft verfügbarer deutschsprachiger IBK- und Social Media-Korpora und geben einen Überblick über den Bestand an IBK- und Social Media-Korpora und ihre Charakteristika (Chat-, Wiki Talk- und Forenkorpora) in DEREKO sowie von laufenden Projekten in diesem Bereich. Anhand korpuslinguistischer Mikro- und Makro-Analysen von Wikipedia-Diskussionen im Vergleich mit dem Gesamtbestand von DEREKO zeigen wir charakterisierende sprachliche Eigenschaften von Wikipedia-Diskussionen auf und bewerten ihren Status als Repräsentant von IBK-Korpora.
IDS aktuell. Neues aus dem Leibniz-Institut für Deutsche Sprache in Mannheim. Jg. 2020, Heft 1
(2020)
IDS aktuell. Neues aus dem Leibniz-Institut für Deutsche Sprache in Mannheim. Jg. 2020, Heft 2
(2020)
IDS aktuell. Neues aus dem Leibniz-Institut für Deutsche Sprache in Mannheim. Jg. 2020, Heft 3
(2020)
IDS aktuell. Neues aus dem Leibniz-Institut für Deutsche Sprache in Mannheim. Jg. 2020, Heft 4
(2020)
This paper presents experiments on sentence boundary detection in transcripts of spoken dialogues. Segmenting spoken language into sentence-like units is a challenging task, due to disfluencies, ungrammatical or fragmented structures and the lack of punctuation. In addition, one of the main bottlenecks for many NLP applications for spoken language is the small size of the training data, as the transcription and annotation of spoken language is by far more time-consuming and labour-intensive than processing written language. We therefore investigate the benefits of data expansion and transfer learning and test different ML architectures for this task. Our results show that data expansion is not straightforward and even data from the same domain does not always improve results. They also highlight the importance of modelling, i.e. of finding the best architecture and data representation for the task at hand. For the detection of boundaries in spoken language transcripts, we achieve a substantial improvement when framing the boundary detection problem as a sentence pair classification task, as compared to a sequence tagging approach.
Der folgende Beitrag verfolgt das Ziel, einen Impuls für die Problematik des Übertrags der linguistischen Fachterminologie in die fachdidaktische Anwendung zu geben. Die daten stammen aus einem Seminar des Praxissemesters in NRW, wo Studierende Unterrichtseinheiten zum Thema Informationsstruktur erstellt haben.
In der Schule tätig greifen Studierende bei der Unterrichtsplanung auf Lehrbücher, Zeitschriften und Online-Vorlagen (Arbeitsblätter und Hilfestellungen für Lehrkräfte) zurück, damit sie möglichst schnell adäquates Material für den eigenen Unterricht vorliegen haben. Die Herausforderung beginnt beim Übertragen der fachwissenschaftlichen
Erkenntnisse in die Recherche mit der nicht immer eindeutigen Terminologie. Im Beitrag wird darauf eingegangen, welche Termini zur Informationsstruktur überhaupt zum Ziel führen und auf welche Alternativen man ausweichen muss, um passende Ergebnisse zu haben.
Interaktionale Semantik
(2020)
Interaktive Emergenz und Stabilisierung. Zur Entstehung kollektiver Kreativität in Theaterproben
(2020)
Ein multilinguales linguistisches Begriffssystem wird in Form einer Datenbank implementiert, die dem Benutzer den semasiologischen und onomasiologischen Zugriff erlaubt, ihn also zu einem gegebenen Terminus den Begriff und seine Definition und zu einem gegebenen Begriff die Termini in den beteiligten Sprachen finden lässt. Die Mehrfachzuordnung von Begriffen zu Termini ist dabei auf interlingualer Ebene nicht wesentlich verschieden von der Situation in einer monolingualen Ontologie. Für die Normierung einer interlingualen Ontologie werden Grundsätze zur Bildung von Begriffen und von Termini vorgeschlagen. Zwischen den Begriffen bestehen eine Menge von vordefinierten konzeptuellen Relationen, die sie in systematische Beziehungen zueinander setzen und es sowohl dem Verwalter ermöglichen, das System konsistent zu halten, als auch dem Benutzer, im Begriffssystem zu navigieren.
Der Beitrag behandelt die Frage, wie sich das spezifisch Neue internetbasierter Kommunikation unter linguistischer Perspektive fassen und in Traditionen des sprachlichen Handelns einordnen lässt. Es wird gezeigt, dass sich die internetbasierte Kommunikation weder als Interaktion noch als Textkommunikation hinreichend beschreiben lasst, zugleich aber Merkmale mit beiden Formen teilt. Mit dem Konzept der Textformen-basierten Interaktion wird ein Vorschlag formuliert, wie dieses Dilemma aufgelöst werden kann: Das Innovationspotenzial internetbasierter Kommunikationstechnologien liegt gerade darin, dass diese durch Indienstnahme von Textformen die Möglichkeiten von Interaktion erweitern. Das hat einerseits Konsequenzen fur die linguistische Analyse und lässt sich andererseits fruchtbar machen fur die Entwicklung von Standards fur die Repräsentation von Korpora.
Interoperability in an Infrastructure Enabling Multidisciplinary Research: The case of CLARIN
(2020)
CLARIN is a European Research Infrastructure providing access to language resources and technologies for researchers in the humanities and social sciences. It supports the use and study of language data in general and aims to increase the potential for comparative research of cultural and societal phenomena across the boundaries of languages and disciplines, all in line with the European agenda for Open Science. Data infrastructures such as CLARIN have recently embarked on the emerging frameworks for the federation of infrastructural services, such as the European Open Science Cloud and the integration of services resulting from multidisciplinary collaboration in federated services for the wider domain of the social sciences and humanities (SSH). In this paper we describe the interoperability requirements that arise through the existing ambitions and the emerging frameworks. The interoperability theme will be addressed at several levels, including organisation and ecosystem, design of workflow services, data curation, performance measurement and collaboration. For each level, some concrete outcomes are described.
In diesem Beitrag stellen wir die Ergebnisse einer Studie über die Intonation von Frageaktivitäten in deutschen Alltagsgesprächen vor. Unsere Untersuchung erforscht, inwieweit die Intonation zur Kontextualisierung von konversationellen Fragen beiträgt. In der Analyse stützen wir uns auf das autosegmental-metrische Modell von Peters und das taxonomische Modell der interaktionalen Prosodieforschung von Selting. Diese Modelle beschreiben jeweils phonologische oder pragmatische Aspekte der Frageintonation, zwei Dimensionen, die für sich genommen, keine vollständige Beschreibung liefern können. Auf der Grundlage authentischer Gesprächsdaten aus dem Korpus FOLK argumentieren wir für die Kompatibilität des autosegmental-metrischen Modells von Peters und des taxonomischen Modells der Frageintonation von Selting. Die Merkmale aus beiden Modellen lassen sich zu Bündeln kombinieren, die es erlauben, die Intonation von Fragen zu erfassen.
I’ve got a construction looks funny – representing and recovering non-standard constructions in UD
(2020)
The UD framework defines guidelines for a crosslingual syntactic analysis in the framework of dependency grammar, with the aim of providing a consistent treatment across languages that not only supports multilingual NLP applications but also facilitates typological studies. Until now, the UD framework has mostly focussed on bilexical grammatical relations. In the paper, we propose to add a constructional perspective and discuss several examples of spoken-language constructions that occur in multiple languages and challenge the current use of basic and enhanced UD relations. The examples include cases where the surface relations are deceptive, and syntactic amalgams that either involve unconnected subtrees or structures with multiply-headed dependents. We argue that a unified treatment of constructions across languages will increase the consistency of the UD annotations and thus the quality of the treebanks for linguistic analysis.
Jesus in der Alltagssprache
(2020)
Journal for language technology and computational linguistics. Special Issue on offensive language
(2020)
Recent years have seen a sharp increase in studies of offensive language (and related notions such as abusive language, hate speech, verbal aggression etc.) as well as of patterns of online behavior such as cyberbullying and trolling. Multiple efforts have been launched for the exploration of computational approaches and the establishment of benchmark datasets for various languages (Basile et al. (2019), Wiegand et al. (2018), Zampieri et al. (2019)).
Heute wird mehr geschrieben als je zuvor und die digitale Kommunikation trägt wesentlich dazu bei; ein großer Teil des heutigen Schreibens ist dialogisches Schreiben im Alltag. Konsequenterweise wird die Online-Kommunikation zunehmend Thema in Bildungskontexten und in der Deutschdidaktik. Offen ist aber weiterhin, wie Texte des interaktionsorientierten Schreibens bewertet werden sollen, die sich von solchen des textorientierten Schreibens in vielerlei Hinsicht unterscheiden können. Während es für textorientiertes Schreiben Normen gibt, die in Sprachkodizes erfasst sind, ist es nicht klar, was der Bezugspunkt für interaktionsorientierte Texte sein könnte. In diesem Beitrag analysieren wir die Verwendung von Konnektoren in der Online-Kommunikation und die Repräsentation von online-spezifischen Besonderheiten in Sprachressourcen. Die Ergebnisse zeigen, dass spezifische Online-Verwendungsweisen von Konnektoren in Sprachkodizes kaum berücksichtigt und beschrieben werden.
In dem Beitrag werden Kommunikationsstörungen in Sportvideointerviews im Ukrainischen und Deutschen im Zeitraum von 2000-2018 untersucht. Für die Typologie der Kommunikationsstörungen werden der Faktor ihres Auftretens und die strukturelle Ebene ihrer Entwicklung betrachtet. Dabei zeigt sich, dass je nach Typ und Besonderheiten der Kommunikationsstörungen Sportvideointerviews mehr Gemeinsames als Unterschiedliches in beiden Sprachen aufweisen. Sowohl kommunikative als auch rein sprachliche Störungen treten bei den Interviewern und Interviewten im Ukrainischen und bei den Interviewten als Nichtmuttersprachler im Deutschen auf.
Kommunikative Misserfolge im Deutschen für ukrainische Deutschlerner aus interkultureller Sicht
(2020)
Begriffe, die meist als nulläquivalente Lexik (Lakunen) für ukrainische Deutschlerner gelten und somit Schwierigkeiten bereiten sowie im Allgemeinen zu Misserfolgen zwischen Kommunizierenden führen können, stehen im Mittelpunkt der folgenden Ausführungen. Um sie zu vermeiden, werden einige Themen und Aufgaben zur Erweiterung der sozial-kommunikativen und interkulturellen Kompetenzen vorgeschlagen.
Der Beitrag stellt zunächst die drei grundlegenden methodischen Verfahren der Konversationsanalyse und der mittlerweile deren Vorgehen folgenden diskursiven Psychologie dar: die Transkription, die detaillierte Sequenzanalyse am Einzelfall und die (komparative) Analyse von Datenkollektionen. Nach einer Übersicht über grundlegende Befunde zur Organisation von Interaktionen wird auf drei psychologische Untersuchungsbereiche eingegangen: Die Konstitution von Identität in Gesprächen, die Rolle von Kognitionen in der sozialen Interaktion und die Erforschung von Psychotherapiegesprächen.
Am Leibniz-Institut für Deutsche Sprache (IDS) wurde im Programmbereich „Lexikografie und Sprachdokumentation“ ein neuartiges Wörterbuch entwickelt, das leicht verwechselbare Ausdrücke in ihrem aktuellen öffentlichen Sprachgebrauch deskriptiv beschreibt. Im Jahr 2018 erschien das elektronische Nachschlagewerk „Paronyme – Dynamisch im Kontrast“, das sich durch folgende drei Aspekte auszeichnet:
1) Erstens liegen mehrstufige kontrastive Beschreibungsebenen und flexible Darstellungsformen vor;
2) zweitens sind die Bedeutungserläuterungen kognitiv-konzeptuell angelegt, um einer langen Forderung nach einer stärker kognitiv ausgerichteten Lexikografie Rechnung zu tragen;
3) drittens werden Datengrundlagen und Analysemethoden genutzt, mit denen umfassend Paronyme ermittelt und diese anschließend erstmals empirisch ausgewertet werden konnten.
Der Mythos „Künstliche Intelligenz“ wird besonders von der sogenannten „transhumanistischen“ Community im Silicon Valley propagiert, deren Vertreter wie der Physiker Ray Kurzweil davon ausgehen, dass wir in spätestens 30 Jahren mit KIs kommunizieren könnten, wie mit einem Menschen (Kurzweil 2005). Saudi Arabien hat 2017 bereits dem anthropomorphen Roboter mit Sprachinterface Sophia die Staatsbürgerschaft zugesprochen (Arab News 2017). Künstliche Intelligenzen wie Apples Assistenzsystem Siri oder Amazons Alexa halten derzeit Einzug in unseren Alltag. Chatbots und Social-Bots wie der Twitter-Bot Tay nehmen Einfluss auf öffentliche Diskurse und interaktives Spielzeug mit Dialogfunktion führt bereits unsere Jüngsten an die Interaktion mit dem artifiziellen Gegenüber heran. Hier entsteht eine völlig neue Form der Dialogizität, die wir aus linguistischer Perspektive noch kaum verstehen. Unabhängige Studien zur Mensch-Maschine-Interaktion stellen also ein großes Desiderat dar.
EFNIL, the European Federation of National Institutions for Language, promotes the standard languages and the linguistic diversity of the European countries as an essential characteristic of their cultural diversity and wealth. The 17th annual conference of EFNIL in Tallinn dealt with the relation between language and economy.
• Language politics often have economic intentions, the language use of the individual is embedded in economic conditions, languages seem to differ in their economic value. In recent years, economists and sociolinguists have developed models of describing these interdependencies.
• The interaction in multilingual settings needs professional handling. There are traditional instances such as language teaching or translation and new professional fields of the digital age such as multilingual databases. Lots of economic needs and opportunities appear in this field.
• Digitization and societal diversity are two elements leading to more successful interaction, assisted by the use of automatic everyday translation, the development of plain language etc.
This volume presents an extensive overview of the interplay of language and economy.
This article examines the language contact situation as well as the language attitudes of the Caucasian Germans, descendants of German-born inhabitants of the Russian Empire and the Soviet Union who emigrated in 1816/17 to areas of Transcaucasia. After deportations and migrations, the group of Caucasian Germans now consists of those who have since emigrated to Germany and those who still live in the South Caucasus. It’s the first time that sociolinguistic methods have been used to record data from the generation who experienced living in the South Caucasus and in Germany as well as from two succeeding generations. Initial results will be presented below with a focus on the language contact constellations of German varieties as well as on consequences of language contact and language repression, which both affect language attitudes.
Gegenstand dieses Beitrags ist die Entwicklung des graphentheoretischen Analysetools Laniakea, das zur Visualisierung von Phänomenen und Veränderungen in terminologischen Netzwerken entwickelt wurde. Wir führen theoretische Grundlagen, Designentscheidungen und technische Details der Implementierung des Tools aus. Darüber hinaus wird auch eine Beschreibung von Erfahrungen im Fokus des Beitrages stehen, die bei der Anwendung von Laniakea bei der Überarbeitung der terminologischen Ressourcen des Grammatischen Informationssystems grammis, gesammelt wurden.
Das vorliegende "Verzeichnis grundlegender grammatischer Fachausdrücke" beruht auf einem Konsens, den das "Gremium für Schulgrammatische Terminologie" unter Berücksichtigung fachwissenschaftlicher, fachdidaktischer und unterrichtspraktischer Gesichtspunkte hergestellt hat. Ziel dieses Verzeichnisses ist es, Anhaltspunkte zu geben für die Konzeption von Lehrplänen und Schulbüchern für das Fach Deutsch. Das Verzeichnis bietet eine Grundlage zur Vereinheitlichung der Termini sowie des mit einem Terminus verbundenen Begriffsverständnisses.
Le bilinguisme en Moselle-Est. Un projet de documentation linguistique de la situation actuelle.
(2020)
Qui parle aujourd'hui quelle langue avec qui et à quelle occasion? Quelles idées les habitants de la Moselle germanophone associent-ils aux dialectes et aux langues? Comment le Platt lorrain est-il transmis? à quoi cela ressemble-t-il dans les différents coins de la Moselle ? Pour répondre à ces questions, le Leibniz- Institut für Deutsche Sprache (IDS) a lancé un projet de documentation sonore pour la recherche linguistique.
Lean syntax: how argument structure is adapted to its interactive, material, and temporal ecology
(2020)
It has often been argued that argument structure in spoken discourse is less complex than in written discourse. This paper argues that lean argument structure, in particular, argument omission, gives evidence of how the production and understanding of linguistic structures is adapted to the interactive, material, and temporal ecology of talk-in-interaction. It is shown how lean argument structure builds on participants' ongoing bodily conduct, joint perceptual salience, joint attention, and their Orientation to expectable next actions within a joint project. The phenomena discusscd in this paper are verb-derived discourse markers and tags, analepsis in responsive actions, and ellipsis in first actions, such as requests and instructions. The study draws from transcripts and audio- and video-recordings of naturally occurring interaction in German from the Research and Teaching Corpus of Spoken German (FOLK).
In this paper we investigate the problem of grammar inference from a different perspective. The common approach is to try to infer a grammar directly from example sentences, which either requires a large training set or suffers from bad accuracy. We instead view it as a problem of grammar restriction or sub-grammar extraction. We start from a large-scale resource grammar and a small number of examples, and find a sub-grammar that still covers all the examples. To do this we formulate the problem as a constraint satisfaction problem, and use an existing constraint solver to find the optimal grammar. We have made experiments with English, Finnish, German, Swedish and Spanish, which show that 10–20 examples are often sufficient to learn an interesting domain grammar. Possible applications include computer-assisted language learning, domain-specific dialogue systems, computer games, Q/A-systems, and others.
This thesis describes work in three areas: grammar engineering, computer-assisted language learning and grammar learning. These three parts are connected by the concept of a grammar-based language learning application. Two types of grammars are of concern. The first we call resource grammars, extensive descriptions a natural languages. Part I focuses on this kind of grammars. The other are domain-specific or application-specific grammars. These grammars only describe a fragment of natural language that is determined by the domain of a certain application. Domain-specific grammars are relevant for Part II and Part III. Another important distinction is between humans learning a new natural language using computational grammars (Part II) and computers learning grammars from example sentences (Part III). Part I of this thesis focuses on grammar engineering and grammar testing. It describes the development and evaluation of a computational resource grammar for Latin. Latin is known for its rich morphology and free word order, both have to be handled in a computationally efficient way. A special focus is on methods how computational grammars can be evaluated using corpus data. Such an evaluation is presented for the Latin resource grammar. Part II, the central part, describes a computer-assisted language learning application based on domain-specific grammars. The language learning application demonstrates how computational grammars can be used to guide the user input and how language learning exercises can be modeled as grammars. This allows us to put computational grammars in the center of the design of language learning exercises used to help humans learn new languages. Part III, the final part, is dedicated to a method to learn domain- or application-specific grammars based on a wide-coverage grammar and small sets of example sentences. Here a computer is learning a grammar for a fragment of a natural language from example sentences, potentially without any additional human intervention. These learned grammars can be based e.g. on the Latin resource grammar described in Part II and used as domain-specific lesson grammars in the language learning application described Part II.
Lexikonprojektion und Konstruktion: Experimentelle Studien zu Argumentalternationen im Deutschen
(2020)
Debates on lexicalist vs. constructionist modelling of argument alternations are typically based on data from single constructions, each including different types of verbs. Evidence from constructions with an identical set of verb types that systematically differ in their meaning is lacking, even though such evidence is imperative for specifically investigating the dependence of argument alternations on the interaction between construction and lexical meanings. We present two acceptability studies where verb lexeme meanings and constructions - specifically active voice, impersonal passive and the construction with man 'one' in German - vary systematically. Prima facie our results support a constructionist explanation, because each construction exhibits a unique acceptability cline. However, across constructions, an adequate explanation has to consider verb-based lexical meanings. The most plausible explanation is that the semantic features licensed by the construction are matched with the semantic features provided by the verb lexeme.
Providing online repositories for language resources is one of the main activities of CLARIN centres. The legal framework regarding liability of Service Providers for content uploaded by their users has recently been modified by the new Directive on Copyright in the Digital Single Market. A new category of Service Providers, Online Content-Sharing Service Providers (OCSSPs), was added. It is subject to a complex and strict framework, including the requirement to obtain licenses from rightholders for the hosted content. This paper provides the background and effect of these changes to law and aims to initiate a debate on how CLARIN repositories should navigate this new legal landscape.
Ziel des vorliegenden Beitrages ist es, LingTermNet, ein Online-Repositorium für linguistische Fachtermini, vorzustellen. Methodologisch und hinsichtlich seiner lexikografischen Umsetzung basiert LingTermNet auf framesemantischen Prinzipien, die auch dem Berkeleyer FrameNet-Projekt zugrunde liegen. Dargestellt werden zunächst leitende theoretische Annahmen; im Zentrum steht sodann die Präsentation von Aufbau und Struktur der Ressource. Im Unterschied zu ‘traditionellen’ Wörterbüchern entstehen Einträge in LingTermNet auf der Grundlage von framesemantischen Annotationen, deren Auswertung auf zwei Ebenen lexikografisch aufgearbeitet werden: Die framesemantische Ebene dokumentiert Frames und ihre Beziehungen untereinander, die lemmaspezifische Ebene basiert auf framesemantischen Untersuchungserkenntnissen, wobei die Einträge hier klassischen Wörterbuchdefinitionen ähneln.
Linguistic Variation and Change in 250 Years of English Scientific Writing: A Data-Driven Approach
(2020)
We trace the evolution of Scientific English through the Late Modern period to modern time on the basis of a comprehensive corpus composed of the Transactions and Proceedings of the Royal Society of London, the first and longest-running English scientific journal established in 1665. Specifically, we explore the linguistic imprints of specialization and diversification in the science domain which accumulate in the formation of “scientific language” and field-specific sublanguages/registers (chemistry, biology etc.). We pursue an exploratory, data-driven approach using state-of-the-art computational language models and combine them with selected information-theoretic measures (entropy, relative entropy) for comparing models along relevant dimensions of variation (time, register). Focusing on selected linguistic variables (lexis, grammar), we show how we deploy computational language models for capturing linguistic variation and change and discuss benefits and limitations.
Maske oder Mundschutz?
(2020)
In the present article we argue that all communication is medial in the sense that every human sign-based interaction is shaped by medial aspects from the outset. We propose a dynamic, semiotic concept of media that focuses on the process-related aspect of mediality, and we test the applicability of this concept using as an example the second presidential debate between Clinton and Trump in 2016. The analysis shows in detail how the sign processing during the debate is continuously shaped by structural aspects of television and specific traits of political communication in television. This includes how the camerawork creates meaning and how the protagonists both use the affordances of this special mediality. Therefore, it is not adequate in our view to separate the technical aspects of the medium, the ‘hardware’, from the processual aspects and the structural conditions of communication. While some aspects of the interaction are directly constituted by the medium, others are more indirectly shaped and influenced by it, especially by its institutional dimension – we understand them as second-order media effects. The whole medial procedure with its specific mediality is a necessary, but not a sufficient condition of meaning-making. We distinguish the medial procedure from the semiotic modes employed, the language games played and the competence of the players involved.
In der Diskussion um Methodologie und Methoden finden unterschiedliche
wissenschaftliche Arbeitsbereiche und Forschungsaktivitäten stets einen gemeinsamen Nenner. Ulrike Froschauer hat sich lange Jahre ausführlich und intensiv mit den Fragestellungen der Organisationssoziologie beschäftigt. Die vorliegenden Buchveröffentlichungen wie beispielsweise „Organisationen in Bewegung. Beiträge zur interpretativen Organisationsanalyse“ (2012) oder „Organisationen im Wechselspiel von Dynamik und Stabilität“ (2015) geben einen guten Zugang zu ihrem wissenschaftlichen Wirken. Das Arbeitsfeld unserer Forschungsgruppe ist ein anderes, nämlich das der Medienwissenschaft, speziell der Medienrezeptionsforschung. In den 1980er Jahren haben wir hierzu das integrationswissenschaftliche Modell der „Strukturanalytischen Rezeptionsforschung“ entwickelt und dieses über die Jahre hinweg an unterschiedlichen Forschungsorten in zahlreichen Einzelstudien weiter ausgearbeitet. Verbunden hat uns, die Wiener Organisationssoziologin Ulrike Froschauer und die Baseler Mediensoziolog_innen, das anhaltende Interesse an method(-olog-)ischen Fragen.
The theme of the AFinLA 2020 Yearbook Methodological turns in applied language studies is discussed in this introductory article from three interrelated perspectives, variously addressed in the three plenary presentations at the AFinLA Autumn Symposium 2019 as well as in the thirteen contributions to the yearbook. In the first set of articles presented, the authors examine the role and impact of technological development on the study of multimodal digital and non-digital contexts and discourses and ensuing new methods. The second set of studies in the yearbook revisits issues of language proficiency, critically discussing relevant concepts and approaches. The third set of articles explores participation and participatory research approaches, reflecting on the roles of the researcher and the researched community.
Im vorliegenden Beitrag gehen wir von der Prämisse aus, dass die Angemessenheit sprachlicher Formen nicht pauschal, sondern anhand des jeweiligen Kontexts zu beurteilen ist. Anhand einer Online-Fragebogenstudie mit durch weil eingeleiteten Nebensätzen untersuchen wir die Hypothese, dass Varianten, die nicht dem Schriftstandard entsprechen, in Kommunikationsformen, die sich weniger an standard- und schriftsprachlichen Normen orientieren, als (mindestens) ebenso angemessen oder zumindest unterschiedlich wahrgenommen werden wie eine schriftstandardsprachliche Variante. Wir untersuchen dies anhand von drei Aufgaben: Rezeption, Produktion und Assoziation zu bestimmten Medien und Textsorten. Wir können zeigen, dass die schriftnormgerechte Variante durchweg als am akzeptabelsten eingeschätzt wird. In allen drei Aufgaben finden sich aber auch eindeutige und übereinstimmende Effekte, die nahelegen, dass die verschiedenen Varianten in Abhängigkeit der Textsorte doch unterschiedlich eingeschätzt, produziert und assoziiert werden.
Nonnative-accented speakers face prevalent discrimination. The assumption that people freely express negative sentiments toward nonnative speakers has also guided common research methods. However, recent studies did not consistently find downgrading, so that prejudice against nonnative accents might even be questioned at first sight. The present theoretical article will bridge these contradictory findings in three ways: (a) We illustrate that nonnative speakers with foreign accents frequently may not be downgraded in commonly used first-impression and employment scenario paradigms. It appears that relatively controlled responding may be influenced by norms and motivations to respond without prejudice, whereas negative biases emerge in spontaneous responding. (b) We present an integrative view based on knowledge on modern forms of prejudice to develop modern notions of accent-ism, which allow for predictions when accent biases are (not) likely to surface. (c) We conclude with implications for interventions and a tailored research agenda.
Dieser Beitrag analysiert auf der Grundlage der Wikipedia-Korpora des Leibniz-Instituts für Deutsche Spra-che morphosyntaktische Phänomene im deutsch-italienischen Vergleich. Konkret fokussiert die Fallstudie Konfixe, die ursprünglich lateinischen bzw. griechischen Ursprungs waren und zunächst überwiegend für den Bereich der Medizinfachsprache entlehnt wurden. Mittlerweile werden diese mit veränderter Semantik jedoch auch für gemeinsprachliche Wortbildungsprodukte eingesetzt: So finden sich -phob- (D) und -fob- (IT) sowie -man- (D) und -man- (IT) in gemeinsprachlichen Wortbildungsprodukten, die formale und funk-tionale Äquivalenzen im Deutschen und Italienischen aufweisen. Wikipedia-Autor/-innen nutzen die als Krankheitsmetaphern zu deutenden Termini wie Lösch(o)manie oder cancellomania auf den Diskussionsseiten der Online-Enzyklopädie dazu, das Verhalten anderer Autor/-innen in der kollaborativen Textproduktion der Wikipedia metadiskursiv zu normieren.
This paper discusses a theoretical and empirical approach to language fixedness that we have developed at the Institut für Deutsche Sprache (IDS) (‘Institute for German Language’) in Mannheim in the project Usuelle Worterbindungen(UWV) over the last decade. The analysis described is based on the Deutsches Referenzkorpus (‘German Reference Corpus’; DeReKo) which is located at the IDS. The corpus analysis tool used for accessing the corpus data is COSMAS II (CII) and – for statistical analysis – the IDS collocation analysis tool (Belica, 1995; CA). For detecting lexical patterns and describing their semantic and pragmatic nature we use the tool lexpan (or ‘Lexical Pattern Analyzer’) that was developed in our project. We discuss a new corpus-driven pattern dictionary that is relevant not only to the field of phraseology, but also to usage-based linguistics and lexicography as a whole.
In diesem Beitrag werden exemplarisch verschiedene potenzielle Gebrauchsmuster mit dem deutschen Lemma wissen gesammelt und ihre in der Fachliteratur vorgelegten interaktionslinguistisch-funktionalen Beschreibungen für einen Strukturierungsversuch genutzt. Im Zentrum steht ein multifunktionaler handlungsorientierter Ansatz zur Beschreibung von Interaktion im Gespräch. Der Beitrag greift dabei Überlegungen auf, die im Rahmen des Forschungsprojekts Lexik des gesprochenen Deutsch (= LeGeDe) zur Erstellung einer korpusbasierten lexikogra- fischen Ressource lexikalischer Besonderheiten des gesprochenen Deutsch in der Interaktion thematisiert wurden.
Schlüsselwörter: Muster, Lexik des gesprochenen Deutsch, Interaktion, Internetlexikografie
Nachruf auf Helmut Frosch
(2020)
Nachruf auf Ulrich Engel
(2020)