OPUS 4 | Search

Grammar and corpora 2016 (2018)

In recent years, the availability of large annotated and searchable corpora, together with a new interest in the empirical foundation and validation of linguistic theory and description, has sparked a surge of novel and interesting work using corpus-based methods to study the grammar of natural languages. However, a look at relevant current research on the grammar of the Germanic, Romance, and Slavic languages reveals a variety of different theoretical approaches and empirical foci, which can be traced back to different philological and linguistic traditions. Still, this current state of affairs should not be seen as an obstacle but as an ideal basis for a fruitful exchange of ideas between different research paradigms.

Wortschatz: Theorie, Empirie, Dokumentation (2018)

Die Lexikologie befindet sich in einer Phase des Umbruchs. Die Diskussion der Abgrenzung von Grammatik und Lexikon, die verstärkte Berücksichtigung von Varianzphänomenen, die Beobachtung quantitativer Verteilungen lexikalischer Phänomene in großen Textkorpora und die Entwicklung internetlexikographischer Formate verändern unser traditionelles Bild vom Lexikon in erheblichem Maße. Der vorliegende Band orientiert sich an lexikalischen Phänomenen, deren Untersuchung diese Entwicklung prägt, und wirft Schlaglichter auf die gegenwärtige lexikologische Theorie und Praxis.

Handbuch europäische Sprachkritik online (HESO). Band 2: Standardisierung und Sprachkritik (2018)

In dem vorliegenden Handbuchband werden aus sprachkritischer Sicht Standardisierungsprozesse im Deutschen, Englischen, Französischen, Italienischen und Kroatischen behandelt sowie Instanzen und Bereiche der Standardisierung verglichen. Hierbei geht es sowohl um Aspekte der Diachronie, welche die Herausbildung von Normen für die geschriebene und gesprochene Sprache betreffen, als auch um synchrone Gesichtspunkte wie aktuelle plurizentrische Normtendenzen, Fragen der Orthographie und der Kodifizierung.

Proceedings of the LREC 2018 workshop. 1st workshop on computational impact detection from text data. 08 May 2018 – Miyazaki, Japan (2018)

How can we measure the impact – such as awareness for economic, ecological, and political matters – of information, such as scientific publications, user-generated content, and reports from the public administration, based on text data? This workshop brings together research from different theoretical paradigms and methodologies for the extraction of impact-relevant indicators from natural language text data and related meta-data. The papers in this workshop represent different types of expertise in different methods for analyzing text data; spanning the whole spectrum of qualitative, quantitative, and mixed methods techniques, as well as domain expertise in the field of impact measurement. The program was built to create an interdisciplinary half-day workshop where we discuss possibilities, limitations, and synergistic effects of different approaches.

Visualisierung sprachlicher Daten. Visual Linguistics – Praxis – Tools (2018)

Visualisierungen spielen in den Wissenschaften eine wichtige Rolle im Forschungsprozess. Sie dienen der Illustration von gewonnener Erkenntnis, aber auch als eigenständiges Mittel der Erkenntnisgewinnung. Auch in der Linguistik sind solche Visualisierungen bedeutend. Beispielsweise in Form von Karten, Baumgraphen und Begriffsnetzen. Bei korpuslinguistischen Methoden sind explorative Visualisierungen oft ein wichtiges Mittel, um die Daten überblickbar und interpretierbar zu machen. Das Buch reflektiert die theoretischen Grundlagen wissenschaftlicher Visualisierungen in der Linguistik, zeigt Praxisbeispiele und stellt auch Visualisierungswerkzeuge vor.

Monolingual and bilingual language acquisition: Harvesting the fruits from the grammar tree (2017)

The authors are pleased to present to the readers of the Zeitschrift für Sprachwissenschaft a Special Issue in honor of Rosemarie Tracy. Contents: 0. Frontmatter 1. Petra Schulz, Ira Gawlitzek, Angelika Wöllstein: Introduction, S. 1 2. Natascha Müller: Different sources of delay and acceleration in early child bilingualism, S. 7 3. Hubert Haider, Christina Schörghofer-Essl, Karin Seethaler: Quantifying kids prefer intersecting sets - a pilot study, S. 31 4. Petra Schulz, Rabea Schwarze: How strong is the ban on non-finite verbs in V2? Evidence from early second language learners of German with and without SLI, S. 51 5. Monika Rothweiler, Manuela Schönenberger, Franziska Sterner: Subject-verb agreement in German in bilingual children with and without SLI, S. 79 6. Holger Hopp: The processing of English which-questions in adult L2 learners: Effects of L1 transfer and proficiency, S. 107 7. Oksana Laleko, Maria Polinsky: Silence is difficult: On missing elements in bilingual grammars, S. 135 8. Artemis Alexiadou: Building verbs in language mixing varieties, S. 165

Grammatik im Korpus. Korpuslinguistisch-statistische Analysen morphosyntaktischer Variationsphänomene (2019)

Die Arbeiten in diesem Band zeigen anhand ausgewählter morphosyntaktischer Phänomene exemplarisch auf, wie ein korpuslinguistischer Zugang genutzt werden kann, um die Vielfalt und Variabilität des Sprachgebrauchs in einer größeren Detailschärfe zu beschreiben, als dies bisher möglich war. Ausgangspunkt ist die Überlegung, dass sprachliche Variation als integraler Bestandteil der (Standard-)Sprache anzusehen ist und somit auch deskriptiv erfasst werden muss. Dabeigeht es zunächst um eine möglichst genaue Beschreibung der Verteilung und Häufigkeit verschiedener Ausprägungen ausgewählter Variablen. Eine umfassende Beschreibung eines Variationsphänomens beinhaltet zudem die Ermittlung und Gewichtung der Faktoren, die die Distribution der Variantensteuern. In diesem Zusammenhang werden Hypothesen aus der einschlägigen Forschungsliteratur unter Verwendung moderner statistischer Verfahren überprüft. Darüber hinaus enthalten die vorliegenden Studien eine explorative Komponente, die sich mit der Aufdeckung neuer Muster, Regularitäten und linguistischer Zusammenhänge befasst. Dabei werden verschiedene korpuslinguistische und statistische Ansätze und Verfahren erprobt und evaluiert.

Diskursmarker im Deutschen. Reflexionen und Analysen (2017)

Der vorliegende Band ist die erste Publikation in Buchform, die sich umfassend den Diskursmarkern im gesprochenen Deutsch widmet. Vor dem Hintergrund des Forschungsstands zu anderen Sprachen gibt er einen repräsentativen Überblick über Formen und Funktionen von Diskursmarkern in der deutschen Gegenwartssprache. Die zwölf Beiträge befassen sich mit dem Diskursmarkerbegriff und seiner definitorischen Abgrenzung sowie mit den interaktionalen Funktionen von Diskursmarker-Subklassen und ausgewählten Einzelmarkern. Alle Beiträge stützen sich auf Originalaufnahmen mündlicher Interaktionen. Teilweise werden ergänzend schriftlich konstituierte Daten herangezogen.

Handbuch europäische Sprachkritik online (HESO). Band 4: Sprachinstitutionen und Sprachkritik (2019)

Sprachinstitutionen haben in den einzelnen hier behandelten Sprachen in unterschiedlichem Maße die sprachkultivierende, sprachnormierende und auch sprachkritische Auseinandersetzung befördert. Zu den bekanntesten und in gewissem Sinne auch symbolträchtigsten Sprachinstitutionen zählen zweifellos Sprachakademien wie die Accademia della Crusca oder die Académie française. Neben Sprachakademien stehen mitunter auch Sprachgesellschaften für eine nicht nur sprachnormierende, sondern in Teilen auch sprachpuristische Auseinandersetzung.

Variation im europäischen Kontrast. Untersuchungen zum Satzanfang im Deutschen, Französischen, Norwegischen, Polnischen und Ungarischen (2016)

Der Sammelband zur typologisch und kontrastiv vergleichenden grammatischen Erforschung und Beschreibung des Satzanfangs des Deutschen und vier seiner Kontrastsprachen ist ein Ergebnis eines Forschungsnetzwerks, bestehend aus dem Institut für Deutsche Sprache (Mannheim) und Forschergruppen verschiedener europäischer Universitäten. Unter Berücksichtigung insbesondere morphosyntaktischer und informationsstruktureller Aspekte werden die satztopologischen Unterschiede der typologisch recht heterogenen Sprachen bzw. Sprachfamilien unter verschiedenen Gesichtspunkten beleuchtet. Die Untersuchungen werden korpusbasiert durchgeführt, wobei sich die Hälfte der Beiträge auf aufbereitete POS-getaggte Wikipedia-Korpora stützt. Die quantitativ ausgerichteten Korpusanalysen ermöglichen einen genauen Einblick in die unterschiedlichen Strukturmerkmale der betreffenden Sprachen sowie in sprachübergreifende Textmerkmale, und die qualitativen Untersuchungen zeigen Ähnlichkeiten und Abweichungen bei bestimmten Verfahren, die sich morphosyntaktisch iederschlagen und besonders am Satzanfang relevant sind. Insgesamt erlauben die Beiträge Hypothesen zu topologisch und informationsstrukturell markierten Satzanfängen und zu Präferenzen in den jeweiligen Sprachen, aber auch zu möglichen Konstanten und Gemeinsamkeiten, was – auf differenziertere Korpora erweitert – für die Bereiche Sprache und Kognition sowie computergestützte Übersetzung ein großer Gewinn sein dürfte.

Research into dictionary use / Wörterbuchbenutzungsforschung. 5. Arbeitsbericht des wissenschaftlichen Netzwerks „Internetlexikografie“ (2015)

Lexikographische Prozesse bei Internetwörterbüchern (2016)

Während lexikographische Prozesse, die zur Publikation gedruckter Wörterbücher führen, bereits seit einigen Jahrzehnten im Fokus der Wörterbuchforschung stehen und die dafür unterschiedenen Phasen der Vorbereitung, der Datenbeschaffung, der Datenaufbereitung, der Datenauswertung und der Satz- und Druckvorbereitung mittlerweile als etabliert betrachtet werden dürfen, steht die Diskussion und Beschreibung lexikographischer Prozesse von Internetwörterbüchern noch in den Anfängen. Zwar besteht kein Zweifel daran, dass sich lexikographische Prozesse bei der Publikation von Internetwörterbüchern anders gestalten als bei Printwörterbüchern, doch die Fragen, inwiefern sie dies tun, welchen Einfluss die neuen Möglichkeiten der Datengewinnung aus elektronischen Textkorpora auf die Prozesse haben, wie Bearbeitungsteilwortschätze auszuwählen sind, wie verschiedene Fassungen zu versionieren und zu archivieren sind und wie sich schließlich die Änderungen der lexikographischen Prozesse auf die Nutzer auswirken, ob und wie die Nutzer in diese Prozesse einbezogen werden können, sind noch nicht ausführlich beantwortet. Diese und andere Fragen waren daher Gegenstand des vierten Arbeitstreffens des wissenschaftlichen Netzwerks “Internetlexikografie”, das am 22. und 23. November 2012 an der Universität Trier stattfand und vom Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften/Trier Center for Digital Humanities organisiert wurde. Die Auseinandersetzung mit dem lexikographischen Prozess wurde fortgesetzt in drei Arbeitsgruppen, die sich mit Auswahlkriterien, Umsetzung und Problemen von Bearbeitungsteilwortschätzen, mit Archivierung und Versionierung und mit dem korpusbasierten Vorgehen bei der Erweiterung bestehender lexikographischer Ressourcen beschäftigten. Der vorliegende Band beschäftigt sich mit den in den Diskussionsrunden und Arbeitsgruppen gefundenen Ergebnissen und den dort identifizierten weiterführenden Fragen.

Die Brüder Grimm. Pioniere deutscher Sprachkultur des 21. Jahrhunderts (2013)

Die bekanntesten Märchenerzähler der Deutschen - und doch reicht die Wirkung der weltberühmten Brüder viel weiter: Tatsächlich zählen Jacob und Wilhelm Grimm zu den produktivsten Sprachforschern ihres Jahrhunderts. Sie kamen der Entstehung der germanischen Sprachen auf die Spur, und sie schufen mit dem »Deutschen Wörterbuch« das umfangreichste Nachschlagewerk zur deutschen Sprache überhaupt. Wissenschaft verstanden sie dabei als Dienst an der Gesellschaft: In all ihren Arbeiten war immer auch der Gedanke an Aufklärung, Sprachkultur und Volksbildung lebendig. Die Brüder Grimm - Pioniere deutscher Sprachkultur des 21. Jahrhunderts gibt einen aufschlussreichen Überblick über das Wirken der Grimms, vermittelt Einblicke in zwei außergewöhnliche Forscherleben und zeigt, wie ihre Ideen und Konzepte bis heute aktuell geblieben sind.

Non-canonical control in a cross-linguistic perspective (2021)

Control, typically defined as a specific referential dependency between the null-subject of a non-finite embedded clause and a co-dependent of the matrix predicate, has been subject to extensive research in the last 50 years. While there is a broad consensus that a distinction between Obligatory Control (OC), Non-Obligatory Control (NOC) and No Control (NC) is useful and necessary to cover the range of relevant empirical phenomena, there is still less agreement regarding their proper analyses. In light of this ongoing discussion, the articles collected in this volume provide a cross-linguistic perspective on central questions in the study of control, with a focus on non-canonical control phenomena. This includes cases which show NOC or NC in complement clauses or OC in adjunct clauses, cases in which the controlled subject is not in an infinitival clause, or in which there is no unique controller in OC (i.e. partial control, split control, or other types of controllers). Based on empirical generalizations from a wide range of languages, this volume provides insights into cross-linguistic variation in the interplay of different components of control such as the properties of the constituent hosting the controlled subject, the syntactic and lexical properties of the matrix predicate as well as restrictions on the controller, thereby furthering our empirical and theoretical understanding of control in grammar.

CLARIN. The infrastructure for language resources (2022)

CLARIN, the "Common Language Resources and Technology Infrastructure", has established itself as a major player in the field of research infrastructures for the humanities. This volume provides a comprehensive overview of the organization, its members, its goals and its functioning, as well as of the tools and resources hosted by the infrastructure. The many contributors representing various fields, from computer science to law to psychology, analyse a wide range of topics, such as the technology behind the CLARIN infrastructure, the use of CLARIN resources in diverse research projects, the achievements of selected national CLARIN consortia, and the challenges that CLARIN has faced and will face in the future. The book will be published in 2022, 10 years after the establishment of CLARIN as a European Research Infrastructure Consortium by the European Commission (Decision 2012/136/EU).

Relationships in organized helping. Analyzing interaction in psychotherapy, medical encounters, coaching and in social media (2022)

This edited volume offers up-to-date research on the interactive building and managing of relationships in organized helping. Its contributions address this core of helping in psychotherapy, coaching, doctor-patient interaction, and digital helping interaction and document and analyze essential communicative practices of relationship management. A summarizing contribution identifies common dimensions of relationship management across the different helping contexts and thereby provides a framework for understanding and researching how interactive practices and helping relationships are interconnected. The volume brings together researchers and practitioners and merges academic approaches to studying relationships with practical knowledge about verbal helping in these settings. The book is intended for scholars in the field of organized helping as well as for students and researchers of communication and discourse / conversation analysis in professional and organized contexts. It is also addressed to practitioners interested in learning more about the micro- and meso-management of their working relationships.

Proceedings of the LREC 2022 Workshop on Challenges in the Management of Large Corpora (CMLC-10 2022). Marseille, 20 June 2022 (2022)

Contents: 1. Vasile Pais, Maria Mitrofan, Verginica Barbu Mititelu, Elena Irimia, Roxana Micu and Carol Luca Gasan: Challenges in Creating a Representative Corpus of Romanian Micro-Blogging Text. Pp. 1-7 2. Modest von Korff: Exhaustive Indexing of PubMed Records with Medical Subject Headings. Pp. 8-15 3. Luca Brigada Villa: UDeasy: a Tool for Querying Treebanks in CoNLL-U Format. Pp. 16-19 4. Nils Diewald: Matrix and Double-Array Representations for Efficient Finite State Tokenization. Pp. 20-26 5. Peter Fankhauser and Marc Kupietz: Count-Based and Predictive Language Models for Exploring DeReKo. Pp. 27-31 6. Hanno Biber: “The word expired when that world awoke.” New Challenges for Research with Large Text Corpora and Corpus-Based Discourse Studies in Totalitarian Times. Pp. 32-35

Sprache in der Coronakrise. Dynamischer Wandel in Lexikon und Kommunikation (2021)

Selten hat ein globales Ereignis nicht nur den Alltag sehr vieler Menschen weltweit schlagartig verändert und in einem längeren Zeitraum zu nachhaltigen Änderungen der Lebensumstände geführt, sondern auch direkte Spuren im Wortschatz und der Art und Weise des Kommunizierens hinterlassen, wie dies durch die Coronakrise der Fall war. Die Beiträge in diesem Band zeichnen diese Reflexionen nach und machen die Veränderungen auf Basis unterschiedlichen Materials (z.B. Pressetexte, Social-Media-Quellen, Gespräche) und zu einem breiten Themenspektrum (Arbeit, Schule, Wirtschaft usw.) nachvollziehbar. Ein deutlicher Fokus liegt dabei auf dem lexikalischen Wandel und zahlreichen Neologismen, die rund um die Coronapandemie aufgekommen sind.

Lexicography of coronavirus-related neologisms (2022)

This volume brings together contributions by international experts reflecting on Covid19-related neologisms and their lexicographic processing and representation. The papers analyze new words, new meanings of existing words, and new multiword units, where they come from, how they are transmitted (or differ) across languages, and how their use and meaning are reflected in dictionaries of all sorts. Recent trends in as many as ten languages are considered, including general and specialized language, monolingual as well as bilingual and printed as well as online dictionaries.

Im Nationalsozialismus. Praktiken – Kommunikation – Diskurse. Teil 2 (2022)

Dieses aus zwei Teilbänden bestehende Werk folgt der Leitidee einer sprachlichen Sozialgeschichte des Nationalsozialismus. Berücksichtigt werden jeweils ebenso die sprachlich-kommunikativen Praktiken des NS-Apparats und der NS-Affinen wie der Ausgeschlossenen und Widerstandsmitglieder vor dem Hintergrund relevanter Diskurse. Der Schwerpunkt in diesem zweiten Teilband liegt auf der Darstellung der Nutzung einiger zentraler Kommunikationsformen/Textsorten (Tagebuch, Brief, Postkarte, Denk- und Flugschrift, Rede) und der Frage danach, wie Texttraditionen modifiziert werden. Hier werden Diskursverdichtungen (›Arbeit‹, ›Blut‹, ›Freiheit‹ u.a.m) aufbereitet, die das Denken, Fühlen, Sollen und Wollen der NS-Zeit ideologisch bestimmten.

Im Nationalsozialismus. Praktiken – Kommunikation – Diskurse. Teil 1 (2022)

Dieses aus zwei Teilbänden bestehende Werk folgt der Leitidee einer sprachlichen Sozialgeschichte des Nationalsozialismus. Berücksichtigt werden jeweils ebenso die sprachlich-kommunikativen Praktiken des NS-Apparats und der NS-Affinen wie der Ausgeschlossenen und Widerstandsmitglieder vor dem Hintergrund relevanter Diskurse. Der Schwerpunkt in diesem ersten Teilband liegt auf der Beschreibung der Praktiken, die kennzeichnend sind für das kommunikative Verhalten im Nationalsozialismus, insbesondere die Praktik der Inklusion/Exklusion zur Herstellung von Gemeinschaft, ebenso wie situationsspezifische Formen des Agierens (wie z.B. sich beschweren) und Interagierens (wie z.B. im Zuge des Prozesses gegen die Widerstandskämpfer des 20. Juli).

Handbuch europäische Sprachkritik online (HESO). Band 3: Sprachpurismus und Sprachkritik (2018)

In dem vorliegenden Handbuchband wird Sprachpurismus als eine Kritik am Sprachgebrauch und als eine Kritik an verschiedenen Strukturen und Elementen einer Sprache verstanden. Es wird sprachvergleichend aufgezeigt, in welchen Sprachkonstellationen Sprachpurismus in der Vergangenheit sowie heute von Bedeutung ist und inwiefern die einzelnen Sprachkulturen von sprachpuristischen Aktionen betroffen waren bzw. sind. Außerdem wird auf wichtige Akteure und auf spezifische diskursive Zusammenhänge der einzelnen Sprachräume eingegangen.

Diskurs - kontrastiv. Diskurslinguistik als Methode zur Erfassung transnationaler und sprachübergreifender Diskursrealitäten (2018)

Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-9) 2021. Limerick, 12 July 2021 (Online-Event) (2021)

Contents: 1. Julien Abadji, Pedro Javier Ortiz Suárez, Laurent Romary and Benoît Sagot: "Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus", S.1-9. 2. Markus Gärtner, Felicitas Kleinkopf, Melanie Andresen and Sibylle Hermann: "Corpus Reusability and Copyright - Challenges and Opportunities", S.10-19. 3. Nils Diewald, Eliza Margaretha and Marc Kupietz: "Lessons learned in Quality Management for Online Research Software Tools in Linguistics", S.20-26.

Proceedings of GermEval 2018, 14th Conference on Natural Language Processing (KONVENS 2018), Vienna, Austria – September 21, 2018 (2018)

Offensive language in social media is a problem currently widely discussed. Researchers in language technology have started to work on solutions to support the classification of offensive posts. We present the pilot edition of the GermEval Shared Task on the Identification of Offensive Language. This shared task deals with the classification of German tweets from Twitter. GermEval 2018 is the fourth workshop in a series of shared tasks on German processing.

Proceedings of the 12th Web as Corpus Workshop (ACL SIGWAC). Language Resources and Evaluation Conference (LREC 2020), Marseille, 11–16 May 2020 (2020)

The 12th Web as Corpus workshop (WAC-XII) looks at the past, present, and future of web corpora given the fact that large web corpora are nowadays provided mostly by a few major initiatives and companies, and the diversity of the early years appears to have faded slightly. Also, we acknowledge the fact that alternative sources of data (such as data from Twitter and similar platforms) have emerged, some of them only available to large companies and their affiliates, such as linguistic data from social media and other forms of the deep web. At the same time, gathering interesting and relevant web data (web crawling) is becoming an ever more intricate task as the nature of the data offered on the web changes (for example the death of forums in favour of more closed platforms).

Proceedings of the Workshop on Challenges in the Management of Large Corpora and Big Data and Natural Language Processing (CMLC-5+BigNLP) 2017 including the papers from the Web-as-Corpus (WAC-XI) guest section. Birmingham, 24 July 2017 (2017)

Contents: 1. Andreas Dittrich: Intra-connecting a small exemplary literary corpus with semantic web technologies for exploratory literary studies, S. 1 2. John Kirk, Anna Čermáková: From ICE to ICC: The new International Comparable Corpus, S. 7 3. Dawn Knight, Tess Fitzpatrick, Steve Morris, Jeremy Evas, Paul Rayson, Irena Spasic, Mark Stonelake, Enlli Môn Thomas, Steven Neale, Jennifer Needs, Scott Piao, Mair Rees, Gareth Watkins, Laurence Anthony, Thomas Michael Cobb, Margaret Deuchar, Kevin Donnelly, Michael McCarthy, Kevin Scannell: Creating CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes – The National Corpus of Contemporary Welsh), S. 13 4. Marc Kupietz, Andreas Witt, Piotr Bański, Dan Tufiş, Dan Cristea, Tamás Váradi: EuReCo - Joining Forces for a European Reference Corpus as a sustainable base for cross-linguistic research, S. 15 5. Harald Lüngen, Marc Kupietz: CMC Corpora in DeReKo, S. 20 6. David McClure, Mark Algee-Hewitt, Douris Steele, Erik Fredner, Hannah Walser: Organizing corpora at the Stanford Literary Lab, S. 25 7. Radoslav Rábara, Pavel Rychlý ,Ondřej Herman: Accelerating corpus search using multiple cores, S. 30 8. John Vidler, Stephen Wattam: Keeping Properties with the Data: CL-MetaHeaders – An Open Specification, S. 35 9. Vladimir Benko: Are Web Corpora Inferior? The Case of Czech and Slovak, S. 43 10. Edyta Jurkiewicz-Rohrbacher, Zrinka Kolaković, Björn Hansen: Web Corpora – the best possible solution for tracking phenomena in underresourced languages: clitics in Bosnian, Croatian and Serbian, S. 49 11. Vít Suchomel: Removing Spam from Web Corpora Through Supervised Learning Using FastText, S. 56

Korpuslinguistik (2018)

Der Band nimmt eine Bestandsaufnahme zu Grundlagen, Methodik, Werkzeugen und Anwendungsfeldern der Korpuslinguistik mit Fokus auf die germanistische Sprachwissenschaft vor. Die Beiträge stellen den aktuellen Forschungsstand sowohl im Bereich schriftsprachlicher wie auch mündlicher Korpora dar und beschreiben innovative Herangehensweisen, aktuelle Herausforderungen und Desiderata zur Arbeit mit Korpora in der Sprachwissenschaft.

Laut, Buchstabe, Wort und Satz. Verzeichnis grundlegender grammatischer Fachausdrücke (2020)

Das vorliegende "Verzeichnis grundlegender grammatischer Fachausdrücke" beruht auf einem Konsens, den das "Gremium für Schulgrammatische Terminologie" unter Berücksichtigung fachwissenschaftlicher, fachdidaktischer und unterrichtspraktischer Gesichtspunkte hergestellt hat. Ziel dieses Verzeichnisses ist es, Anhaltspunkte zu geben für die Konzeption von Lehrplänen und Schulbüchern für das Fach Deutsch. Das Verzeichnis bietet eine Grundlage zur Vereinheitlichung der Termini sowie des mit einem Terminus verbundenen Begriffsverständnisses.

Special Issue: Social interaction and the theatre rehearsal (2023)

Wortbildung und Konstruktionsgrammatik (2023)

Special issue on challenges in computational linguistics, empiric research & multidisciplinary potential of German song lyrics (2023)

Encyclopedia of terminology for conversation analysis and interactional linguistics. Elektronische Ressource (2023)

The Encyclopedia of Terminology for Conversation Analysis and Interactional Linguistics is an online resource for students and scholars of CA/IL, publicly available on the EMCA Wiki page. Encyclopedias and glossaries are widespread across various fields and methods, and serve as immensely valuable resources. Given the extent to which the EMCA/IL community has expanded over the years—both terminologically as well as geographically—we hope that this encyclopedia of terminology will be well received by students and practitioners of CA and IL across the globe.

Linguistik und Medizin. Sprachwissenschaftliche Zugänge und interdisziplinäre Perspektiven (2021)

Das Buch präsentiert die ersten Arbeitsergebnisse des wissenschaftlichen Netzwerks >Linguistik und Medizin< Patho- und Salutodiskurse im Spannungsfeld von objektivierter Diagnose, interaktiver Vermittlung und medialer Konstitution, gegründet 2017 und finanziert von der Deutschen Forschungsgemeinschaft. Aus unterschiedlichen linguistischen, medizinischen, historischen und soziologischen Perspektiven werden Prozesse der Wissenskonstitution, -aushandlung und des -transfers in Bezug auf Gesundheit und (psychische wie somatische) Krankheiten thematisiert. Mit Daten und Methoden der Gesprächs-, Korpus- und Diskurslinguistik, der Medizin und der Soziologie werden aktuelle und gesellschaftsrelevante Fragestellungen in der Arzt-Patienten-Kommunikation, den ö̈ffentlichen massenmedialen Diskursen und in der Fachkommunikation in einem interdisziplinären Dialog bearbeitet. Im Fokus stehen einzelne Krankheitsbilder und deren semiotische Konstruktion wie Schizophrenie, HIV/AIDS, Alzheimer, Depression; mannigfaltige interaktive Praktiken z.B. der Empathiebekundung, der Aufklärung, der Emotionalisierung in Arzt-Patienten-Gesprächen; Prozesse der gemeinsamen Wissensaushandlung in Online-Foren; fachliche Konstruktionen von Vorstellungen zu Normalität und Abweichung.

Free variation in grammar. Empirical and theoretical approaches (2023)

Recent years have seen a growing interest in grammatical variation, a core explanandum of grammatical theory. The present volume explores questions that are fundamental to this line of research: First, the question of whether variation can always and completely be explained by intra- or extra-linguistic predictors, or whether there is a certain amount of unpredictable – or ‘free’ – grammatical variation. Second, the question of what implications the (in-)existence of free variation would hold for our theoretical models and the empirical study of grammar. The volume provides the first dedicated book-length treatment of this long-standing topic. Following an introductory chapter by the editors, it contains ten case studies on potentially free variation in morphology and syntax drawn from Germanic, Romance, Uralic and Mayan.

Variability in language predictions: Assessing the influence of speaker, text and experimental method (2023)

Prediction is a central mechanism in the human language processing architecture. The psycholinguistic and neurolinguistic literature has seen a lively debate about what form prediction may take and what status it has for language processing in the human mind and brain. While predictions are a ubiquitous finding, the implications of these results for models of language processing differ. For instance, eyetracking data suggest that predictions may rely on sublexical orthographic information in natural reading, while electrophysiological data provide mixed evidence for form-based predictions during reading. Other research has revealed that humans rapidly adapt to text specifics and that their predictive capacity varies, broadly speaking, in accordance with inter- and intra-individual language proficiency, which cuts across the speaker groups (e.g. L1 vs. L2 speakers, skilled vs. untrained readers) traditionally used for experimental contrasts. There is therefore evidence that the kind and strength of linguistic predictions depend on (at least) three sources of variability in language processing: speaker, text genre and experimental method. The aim of this Research Topic is to develop a better understanding of prediction in light of the three sources of variability in language processing, by providing an overview of state-of-the art research on predictive language processing and by bringing together research from various disciplines. First, intra-and inter-individual differences and their influence on predictive processes remain underrepresented in experimental research on predictive processing. How do language users differ in their predictive abilities and strategies, and how are these differences shaped by e.g. biological, social and cultural factors? Second, while language users experience great stylistic diversity in their daily language exposure and use, the majority of language processing research still focuses on a very constrained register of well-controlled sentences composed in the standard language. How are predictions shaped by extra- and meta-linguistic context, such as register/genre or accent/speaker identity, and how may this influence the processing of experimental items in another language or text variety? Third, the Research Topic invites contributions that make use of a multi-method approach, such as combined behavioral and electrophysiological measures or experimental methods combined with measures extracted from corpus data. What opportunities and challenges do we face when integrating multiple approaches to examine linguistic, experimental and individual differences in human predictive capacity? We welcome contributions from all areas of empirical psycho- and neurolinguistics, but contributions must explicitly address variability and variation in language and language processing. Relevant topics include individual differences and the impact of genre, modality, register and language variety. Contributions that go beyond single word and single sentence paradigms are especially desirable. Experimental, corpus-based, meta-analytic and review papers, as well as theoretical/opinion pieces are welcome; however, papers of the latter type should support their arguments with substantial empirical evidence from the literature. Particularly desirable are contributions which combine topics and/or methods, such as the impact of an individual's native dialect on processing of constructions that show variability in the standard language (e.g. choice of auxiliary, agreement of mass nouns, etc.) or experimental methods combined with measures extracted from corpus data such as information-theoretic surprisal.

Politisches Positionieren. Sprachliche und soziale Praktiken (2023)

Politisches Positionieren ist eine elementare sprachliche und soziale Praxis. Wo und wie wir uns und andere in der Gesellschaft verorten, ist eine alltäglich verhandelte Frage. Positionierungen werden dabei sowohl explizit thematisiert und kontrovers diskutiert als auch beiläufig durch sprachliche Praktiken hervorgebracht. Im Zentrum von Positionierungen stehen Aushandlungen sozialer Identität. Doch nicht nur persönliche Identitäten werden durch Positionierungen konstituiert, stabilisiert oder umgedeutet, auch die Gesellschaft ist durch die sprachlichen Positionierungspraktiken ihrer Mitglieder unmittelbar oder mittelbar betroffen. Die Beiträge des Bandes betrachten diese Schnittstelle zwischen Interaktion und Diskurs aus unterschiedlichen disziplinären Perspektiven und erörtern, wie Positionierungen vollzogen werden, ob bzw. inwiefern sie politisch sind und in welchen wechselseitigen Zusammenhängen sie zu gesellschaftlichen, sozialen und politischen Arrangements und Ordnungen stehen.

Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-7) 2019. Cardiff, 22 July 2019 (2019)

Contents: 1. Johannes Graën, Tannon Kew, Anastassia Shaitarova and Martin Volk, "Modelling Large Parallel Corpora", S. 1-8 2. Pedro Javier Ortiz Suárez, Benoît Sagot and Laurent Romary, "Asynchronous Pipelines for Processing Huge Corpora on Medium to Low Resource Infrastructures", S. 9-16 3. Vladimír Benko, "Deduplication in Large Web Corpora", S. 17-22 4. Mark Davies, "The best of both worlds: Multi-billion word “dynamic” corpora", S. 23-28 5. Adrien Barbaresi, "On the need for domain-focused web corpora", S. 29-32 6. Marc Kupietz, Eliza Margaretha, Nils Diewald, Harald Lüngen and Peter Fankhauser, "What's New in EuReCo? Interoperability, Comparable Corpora, Licensing", S. 33-39

10. International Contrastive Linguistics Conference (ICLC). July 18-21, 2023, Mannheim, Germany. Book of abstracts (2023)

This conference booklet provides information about 10th International Contrastive Linguistics Conference (ICLC-10) that took place in Mannheim, Germany, from 18 to 21 July 2023. It contains – a description of the conference aims, – details on the conference venue, – information on committees, – the conference program, – the abstracts of the keynotes, oral and poster presentations, and – an author index.

Kommunikative Praktiken im Nationalsozialismus (2023)

Die nationalsozialistische Gesellschaft war geprägt von vielgestaltigen kommunikativen Praktiken des sozialen und auch gewaltvollen Ein- und Ausschlusses. Gleichzeitig bildeten sich durch Widerstandshandlungen vielfältige Gegendiskurse heraus. Der Sammelband nimmt konkrete Beispiele kommunikativer Praktiken während des Nationalsozialismus in den Blick und fragt speziell danach, inwiefern diese themen-, textsorten- und akteursspezifisch gebunden waren.

Proceedings of the 10th International Conference on CMC and Social Media Corpora for the Humanities (CMC-Corpora 2023), 14–15 September 2023, University of Mannheim, Germany (2023)

Following the successes of the ninth conference in 2022 held in the wonderful Santiago de Compostela, Spain, we are pleased to present the proceedings of the 10th edition of International Conference on CMC and Social Media Corpora for the Humanities (CMC-2023). The focal point of the conference is to investigate the collection, annotation, processing, and analysis of corpora of computer-mediated communication (CMC) and social media. Our goal is to serve as the meeting place for a wide variety of language-oriented investigations into CMC and social media from the fields of linguistics, philology, communication sciences, media studies, and social sciences, as well as corpus and computational linguistics, language technology, textual technology, and machine learning. This year’s event is the largest so far with 45 accepted submissions: 32 papers and 13 poster presentations, each of which were reviewed by members of our ever-growing scientific committee. The contributions were presented in five sessions of two or three streams, and a single poster session. The talks in these proceedings cover a wide range of topics, including the corpora construction, digital identities, digital knowledge-building, digitally-mediated interaction, features of digitally-mediated communication, and multimodality in digital spaces. As part of the conference, we were delighted to include two invited talks: an international keynote speech by Unn Røyneland from the University of Oslo, Norway, on the practices and perceptions of researching dialect writing in social media, and a national keynote speech by Tatjana Scheffler from the Ruhr-University of Bochum on analysing individual linguistic variability in social media and constructing corpora from this data. Additionally, participants could take part in a workshop on processing audio data for corpus linguistic analysis. This volume contains abstracts of the invited talks, short papers of oral presentations, and abstracts of posters presented at the conference.

Dictionaries and Society. Book of Abstracts of the XX EURALEX International Congress, 12-16 July 2022, Mannheim, Germany (2022)

Open Access

Refine

Author

Year of publication

Document Type

Language

Has Fulltext

Is part of the Bibliography

Keywords

Publicationstate

Reviewstate

Publisher

92 search hits