Refine
Year of publication
Document Type
- Book (90) (remove)
Language
- German (60)
- English (25)
- Multiple languages (5)
Is part of the Bibliography
- yes (90) (remove)
Keywords
- Korpus <Linguistik> (23)
- Deutsch (21)
- Grammatik (10)
- Linguistik (8)
- Wörterbuch (8)
- Kommunikation (7)
- Konversationsanalyse (7)
- Soziolinguistik (7)
- Sprachgebrauch (7)
- Interaktion (6)
Publicationstate
- Veröffentlichungsversion (90) (remove)
Reviewstate
Publisher
- de Gruyter (12)
- Institut für Deutsche Sprache (10)
- IDS-Verlag (9)
- Heidelberg University Publishing (7)
- Winter (5)
- Verlag für Gesprächsforschung (4)
- Benjamins (3)
- Leibniz-Institut für Deutsche Sprache (3)
- Narr Francke Attempto (3)
- V&R unipress (3)
Die Lexikologie befindet sich in einer Phase des Umbruchs. Die Diskussion der Abgrenzung von Grammatik und Lexikon, die verstärkte Berücksichtigung von Varianzphänomenen, die Beobachtung quantitativer Verteilungen lexikalischer Phänomene in großen Textkorpora und die Entwicklung internetlexikographischer Formate verändern unser traditionelles Bild vom Lexikon in erheblichem Maße. Der vorliegende Band orientiert sich an lexikalischen Phänomenen, deren Untersuchung diese Entwicklung prägt, und wirft Schlaglichter auf die gegenwärtige lexikologische Theorie und Praxis.
Lexikalische Wiederholungen nehmen in der Lehre von den rhetorischen Stilfiguren viel Raum ein; in der Linguistik des schriftsprachlichen Deutsch spielen sie dagegen kaum ein Rolle. Die Arbeit überprüft, inwieweit sich die Funktionsweise zweier Figuren der meist unmittelbaren Ausdruckswiederholung, der Geminatio und der Anadiplose, auf der Basis von Standardannahmen zur Syntax, Semantik und Pragmatik des Deutschen erklären lässt.
Zugrunde liegt der Arbeit eine Sammlung von über 700 Instanzen der Geminatio und Anadiplose aus deutschsprachigen Gedichten des 17. bis 21. Jahrhunderts. Es wird daran gezeigt, wie die Geminatio unter Ausnutzung von satztopologischen und NP-internen Positionierungen und darauf aufbauenden bedeutungskompositionellen und implikaturenbasierten Prozessen der Bedeutungkonstitution zum ikonischen Ausdruck der Gradierung von Eigenschaften dient. Die Anadiplose wiederum entpuppt sich als Mittel zur Hervorhebung von Themen und Propositionen, die pragmatisch und informationsstrukturell auf ihrer Einbindung in Herausstellungskonstruktionen und Satzverknüpfungen gründet.
Damit liefern die beiden rhetorischen Figuren kaum Argumente für die Abweichungstheorie literarischer Sprache, derzufolge die Sprachverwendung in literarischen und insbesondere lyrischen Texten oft nicht den Regeln und dem Usus des nicht-literarischen Deutsch folgt. Die Funktionsweise der Geminatio und der Anadiplose ist gut in das syntaktische, semantische und pragmatische System des Deutschen eingebunden. Insbesondere die Geminatio zeigt dabei in Gedichten auch deutliche Parallelen zu entsprechenden Phänomenen im gesprochenen Deutsch.
Visualisierungen spielen in den Wissenschaften eine wichtige Rolle im Forschungsprozess. Sie dienen der Illustration von gewonnener Erkenntnis, aber auch als eigenständiges Mittel der Erkenntnisgewinnung. Auch in der Linguistik sind solche Visualisierungen bedeutend. Beispielsweise in Form von Karten, Baumgraphen und Begriffsnetzen. Bei korpuslinguistischen Methoden sind explorative Visualisierungen oft ein wichtiges Mittel, um die Daten überblickbar und interpretierbar zu machen. Das Buch reflektiert die theoretischen Grundlagen wissenschaftlicher Visualisierungen in der Linguistik, zeigt Praxisbeispiele und stellt auch Visualisierungswerkzeuge vor.
Verschmelzung von Präposition und Artikel. Eine kontrastive Analyse zum Deutschen und Italienischen
(2018)
Präpositionen und Artikelformen gehen in vielen europäischen Sprachen klitische Verbindungen ein, die spezielle Ausdrucksklassen wie die deutschen Verschmelzungsformen (z. B. ans, vom, zur) und italienischen ‚preposizioni articolate‘ (z. B. alla, delle, nel) konstituieren. Dieses Buch widmet sich dem Sprachvergleich dieser Ausdrucksklassen im Deutschen und Italienischen, die ausgehend von ähnlichen Voraussetzungen divergente diachrone Entwicklungen repräsentieren. Gezeigt wird dies anhand intra- und interlingualer Analysen zu Phonologie, Morphologie, Syntax und funktionalen Aspekten im Rede- und Textzusammenhang, die sowohl diachrone als auch synchrone Aspekte berücksichtigen und unmittelbar korpusempirisch abgesichert werden. Zentrale Erkenntnisse liefern außerdem sprachspezifische Fallstudien in großen Korpora, die auf methodisch innovativen, quantitativ und qualitativ ausgerichteten Distributionsanalysen struktureller und orthographischer Varianten von Präposition-Definitartikel-Verbindungen basieren.
Der Sammelband zur typologisch und kontrastiv vergleichenden grammatischen Erforschung und Beschreibung des Satzanfangs des Deutschen und vier seiner Kontrastsprachen ist ein Ergebnis eines Forschungsnetzwerks, bestehend aus dem Institut für Deutsche Sprache (Mannheim) und Forschergruppen verschiedener europäischer Universitäten. Unter Berücksichtigung insbesondere morphosyntaktischer und informationsstruktureller Aspekte werden die satztopologischen Unterschiede der typologisch recht heterogenen Sprachen bzw. Sprachfamilien unter verschiedenen Gesichtspunkten beleuchtet. Die Untersuchungen werden korpusbasiert durchgeführt, wobei sich die Hälfte der Beiträge auf aufbereitete POS-getaggte Wikipedia-Korpora stützt. Die quantitativ ausgerichteten Korpusanalysen ermöglichen einen genauen Einblick in die unterschiedlichen Strukturmerkmale der betreffenden Sprachen sowie in sprachübergreifende Textmerkmale, und die qualitativen Untersuchungen zeigen Ähnlichkeiten und Abweichungen bei bestimmten Verfahren, die sich morphosyntaktisch iederschlagen und besonders am Satzanfang relevant sind. Insgesamt erlauben die Beiträge Hypothesen zu topologisch und informationsstrukturell markierten Satzanfängen und zu Präferenzen in den jeweiligen Sprachen, aber auch zu möglichen Konstanten und Gemeinsamkeiten, was – auf differenziertere Korpora erweitert – für die Bereiche Sprache und Kognition sowie computergestützte Übersetzung ein großer Gewinn sein dürfte.
Die Beschreibung und Analyse sprachlicher Variation gehört zu den Feldern, die in der germanistischen Sprachwissenschaft in jüngerer Zeit stark an Aufmerksamkeit gewonnen haben. Dieser Band zeigt in einer Zusammenschau verschiedener Ansätze von der Einstellungs- bis zur Sprachkontaktforschung, wie sich Variation entlang verschiedener Normorientierungen von Sprechern sowie als Ergebnis von Identitätskonstruktionen begreifen lässt.
Prediction is a central mechanism in the human language processing architecture. The psycholinguistic and neurolinguistic literature has seen a lively debate about what form prediction may take and what status it has for language processing in the human mind and brain. While predictions are a ubiquitous finding, the implications of these results for models of language processing differ. For instance, eyetracking data suggest that predictions may rely on sublexical orthographic information in natural reading, while electrophysiological data provide mixed evidence for form-based predictions during reading. Other research has revealed that humans rapidly adapt to text specifics and that their predictive capacity varies, broadly speaking, in accordance with inter- and intra-individual language proficiency, which cuts across the speaker groups (e.g. L1 vs. L2 speakers, skilled vs. untrained readers) traditionally used for experimental contrasts. There is therefore evidence that the kind and strength of linguistic predictions depend on (at least) three sources of variability in language processing: speaker, text genre and experimental method.
The aim of this Research Topic is to develop a better understanding of prediction in light of the three sources of variability in language processing, by providing an overview of state-of-the art research on predictive language processing and by bringing together research from various disciplines.
First, intra-and inter-individual differences and their influence on predictive processes remain underrepresented in experimental research on predictive processing. How do language users differ in their predictive abilities and strategies, and how are these differences shaped by e.g. biological, social and cultural factors?
Second, while language users experience great stylistic diversity in their daily language exposure and use, the majority of language processing research still focuses on a very constrained register of well-controlled sentences composed in the standard language. How are predictions shaped by extra- and meta-linguistic context, such as register/genre or accent/speaker identity, and how may this influence the processing of experimental items in another language or text variety?
Third, the Research Topic invites contributions that make use of a multi-method approach, such as combined behavioral and electrophysiological measures or experimental methods combined with measures extracted from corpus data. What opportunities and challenges do we face when integrating multiple approaches to examine linguistic, experimental and individual differences in human predictive capacity?
We welcome contributions from all areas of empirical psycho- and neurolinguistics, but contributions must explicitly address variability and variation in language and language processing. Relevant topics include individual differences and the impact of genre, modality, register and language variety. Contributions that go beyond single word and single sentence paradigms are especially desirable. Experimental, corpus-based, meta-analytic and review papers, as well as theoretical/opinion pieces are welcome; however, papers of the latter type should support their arguments with substantial empirical evidence from the literature. Particularly desirable are contributions which combine topics and/or methods, such as the impact of an individual's native dialect on processing of constructions that show variability in the standard language (e.g. choice of auxiliary, agreement of mass nouns, etc.) or experimental methods combined with measures extracted from corpus data such as information-theoretic surprisal.
Valenz im Fokus. Grammatische und lexikografische Studien. Festschrift für Jacqueline Kubczak
(2015)
Die Festschrift Valenz im Fokus: Grammatische und lexikografische Studien enthält zum einen die Beiträge des internationalen Kolloquiums „Valenz im Fokus“, das am 12. Juli 2013 im Institut für Deutsche Sprache in Mannheim zu Ehren von Jacqueline Kubczak veranstaltet wurde, zum anderen weitere Beiträge von Kollegen aus der ganzen Welt, die zum einen als elektronische Publikation während des Kolloquiums präsentiert wurden, zum anderen speziell für die Festschrift hinzukamen.
Vages Sprechen in psychotherapeutischen Diagnosegesprächen. Eine gesprächsanalytische
Untersuchung
(2018)
Der Zusammenhang von Vagheit und Sprache ist bereits vielfach behandelt worden, allerdings überwiegend aus philosophischer oder semantischer Perspektive. Demgegenüber verfolgen wir in dieser Arbeit einen gesprächsanalytischen Ansatz, um Phänomene sprachlicher Vagheit zu untersuchen. Wir fokussieren uns dabei speziell auf Vagheit in psychotherapeutischen Diagnosegesprächen.
Vagheit, wie sie in alltäglicher Kommunikation erfahren wird, lässt sich beschreiben als semantische Unterspezifizierung, die durch den Gebrauch unklarer Bezüge oder zu allgemeiner Ausdrücke entsteht. Unser Verständnis von Vagheit unterscheidet sich damit fundamental von der philosophischen und semantischen Kategorie „Vagheit“. Es handelt sich unserem Verständnis nach um eine interaktive Kategorie, die nur durch das Auftreten interaktiver Verwerfungen sichtbar wird.
Vages Sprechen kann den Patienten dazu dienen, sensible Themen zu vermeiden, aber mehr noch dazu, ein neues Thema zu setzen oder den thematischen Schwerpunkt des laufenden Gespräches zu verschieben. Therapeuten reagieren auf vages Sprechen, indem sie unmittelbar oder mittelbar auf die unterspezifizierte Äußerung eingehen oder indem sie die Patienten mit Hilfe von Spezifikationsangeboten unterstützen, insbesondere im Bereich sensibler Thematiken. Formal und/oder funktional ähnliche sprachliche Phänomene sind Teilresponsivität und Hochstufung durch Rückstufung.
Vages Sprechen hat auch Auswirkungen auf die Allianz zwischen Patienten und Therapeuten: Therapeuten können die Hinweise der Patienten nutzen, um das Diagnosegespräch im Hinblick auf die von den Patienten gesetzten Schwerpunkte zu organisieren.
In Studien zu pädiatrischer Interaktion wird immer wieder die niedrige Redebeteiligung der jungen Patient/innen, deren Leiden in den ärztlichen Gesprächen verhandelt werden, herausgestellt. In einigen triadisch-pädiatrischen Erstkonsultationen, die sich in mehreren Punkten signifikant von dyadischen Erstgesprächen unterscheiden, ist allerdings die Beteiligung der Patient/innen deutlich höher. Eine Kombination aus quantitativer und konversationsanalytischer Untersuchung von Erstkonsultationen in der pädiatrischen Praxis zeigt, dass der Aufforderung zur Beschwerdenschilderung dabei eine entscheidende Bedeutung zukommt, weswegen der Formulierung besondere Aufmerksamkeit geschenkt werden sollte. Doch die herausfordernde Situation birgt nicht nur Stolpersteine, sondern kann auch von allen Interaktionspartner/innen als strategisches Mittel eingesetzt werden. Eine interaktive Relevanz haben überdies elterliche Initiativen. An mehreren Beispielen wird gezeigt, welche erheblichen Konsequenzen eine Nicht-Bearbeitung oder eine nicht ausreichende Bearbeitung für die jeweilige Interaktion hat.
Die Studie untersucht therapeutische Strategien für den Umgang mit und das Management von Patientenwiderstand, der auf Lösungsorientierte Fragen in der Psychotherapie folgt. Patienten reagieren auf Lösungsorientierte Fragen regelmäßig dispräferiert. Die Therapeuten wiederum sollen therapeutisch relevantes Material elizitieren.
Mit Hilfe linguistisch-gesprächsanalytischer Methoden wird untersucht, wie Therapeuten im Anschluss an lösungsorientierte Anfragen mit dispräferierten Antworten umgehen. Das Widerstandsmanagement der Therapeuten umfasst dabei sowohl expansions- und reparaturinitiierende Reaktionen als auch Themenwechsel.
Untersucht werden 15 psychodiagnostische Erstgespräche nach der erweiterten Version der Operationalisierten Psychodynamischen Diagnostik (OPD-2), einem standardisierten und manualisierten diagnostischen Inventar, das die psychodynamischen Kräfte hinter den Erkrankungen der Patienten erfassen soll.
Sprachliche Zweifelsfälle kommen auf allen linguistischen Ebenen vor. Ihre Einordnung erfolgt zumeist nach Systemebene, nach Entstehungsursache oder nach lexematischer Struktur. Sprachlicher Zweifel kann auch nach intra- und interlingualen Aspekten unterschieden werden. Stehen zwei oder mehrere lexikalische Varianten zur Verfügung, kann es zu Unsicherheiten bezüglich des angemessenen Gebrauchs kommen. Nicht nur Muttersprachler*innen sind mit Schwierigkeiten konfrontiert, Zweifelsfälle stellen auch ein Problem bei der Fremdsprachenproduktion dar.
Dieser Band beschränkt sich auf lexikalisch-semantische, flexivische und wortbildungsbedingte Zweifelsfälle und führt interessierte Leser*innen in Fachliteratur und Nachschlagewerke ein. Er streift Fragen der Sprachdidaktik, der Fehler- und Variationslinguistik, denn die Auseinandersetzung mit typischen Zweifelsfällen zeigt auch das Spannungsfeld zwischen allgemeinem Usus und kodifizierter Norm, zwischen Gegenwart und Wandel, zwischen Dynamik, sprachlichem Reichtum und erlernter Bildungstradition.
Kann man den Sprachgebrauch in einer Gruppe verändern? Und wenn ja, wie? In Politik und Wirtschaft sind schlüssige Antworten auf diese Fragen von großem Interesse. Karolina Suchowolec findet sie, indem sie den aktuellen Forschungsstand zu Sprachplanung, Plansprachen, Kontrollierten Sprachen und Terminologiearbeit analysiert, die Erkenntnisse auf ihre mögliche Verallgemeinerung hin prüft und daraus Sprachlenkung als einen übergreifenden linguistischen Forschungsgegenstand ableitet. Dessen praktische Umsetzung hat sie empirisch untersucht. Im Ergebnis formuliert sie eine Übersicht zu den Herausforderungen der Sprachlenkung sowie zu in der Literatur postulierten Lösungsansätzen – eine solide Grundlage für die weitere theoretische Forschung sowie Hilfestellung für die praktische Sprachlenkung.
Selten hat ein globales Ereignis nicht nur den Alltag sehr vieler Menschen weltweit schlagartig verändert und in einem längeren Zeitraum zu nachhaltigen Änderungen der Lebensumstände geführt, sondern auch direkte Spuren im Wortschatz und der Art und Weise des Kommunizierens hinterlassen, wie dies durch die Coronakrise der Fall war. Die Beiträge in diesem Band zeichnen diese Reflexionen nach und machen die Veränderungen auf Basis unterschiedlichen Materials (z.B. Pressetexte, Social-Media-Quellen, Gespräche) und zu einem breiten Themenspektrum (Arbeit, Schule, Wirtschaft usw.) nachvollziehbar. Ein deutlicher Fokus liegt dabei auf dem lexikalischen Wandel und zahlreichen Neologismen, die rund um die Coronapandemie aufgekommen sind.
Wo steht die germanistische Sprachwissenschaft aktuell? Der Band orientiert über den Stand der Forschung zur kommunikativen Verwendung von Sprache, ihrer Rolle in der Interaktion und ihrem Verhältnis zur Kultur. Die Beiträge stellen theoretische Grundlagen und wissenschaftsgeschichtliche Entwicklungen ihrer jeweiligen Forschungsgegenstände dar, illustrieren sie anhand von empirischen Ergebnissen und formulieren Desiderata für die Zukunft der Sprachwissenschaft.
This edited volume offers up-to-date research on the interactive building and managing of relationships in organized helping. Its contributions address this core of helping in psychotherapy, coaching, doctor-patient interaction, and digital helping interaction and document and analyze essential communicative practices of relationship management. A summarizing contribution identifies common dimensions of relationship management across the different helping contexts and thereby provides a framework for understanding and researching how interactive practices and helping relationships are interconnected. The volume brings together researchers and practitioners and merges academic approaches to studying relationships with practical knowledge about verbal helping in these settings. The book is intended for scholars in the field of organized helping as well as for students and researchers of communication and discourse / conversation analysis in professional and organized contexts. It is also addressed to practitioners interested in learning more about the micro- and meso-management of their working relationships.
In diesem Buch werden auf einer großen empirischen Basis die regionalen Sprechweisen von verschiedenen Bevölkerungsgruppen in einem kleinen Gebiet im alemannischen Sprachraum untersucht. Als Datengrundlage dienen aktuelle, spontansprachliche und fragebuchbasierte Daten, die einander gegenübergestellt und diachron mit den Ergebnissen des Südwestdeutschen Sprachatlas (SSA) aus den 1970er Jahren verglichen werden. Es werden vorwiegend datenaggregierende Verfahren angewendet, um die regionale und soziale Gebundenheit der vorgefundenen Variation zu erfassen. Mit Hilfe von Dialektabstandsmessungen werden ausgewählte, überwiegend phonologische Merkmale im Hinblick auf Dialektwandelprozesse untersucht. Außerdem wird gezeigt, dass mit dialektometrischen Verfahren explorative Aggregatanalysen möglich sind, die es erlauben, Sprachräume zu identifizieren und dialektologisch zu beschreiben.
In Deutschland leben 7,5 Millionen erwachsene Analphabeten. Daher ist der Bedarf an Materialien zum Erlernen der Schrift gestiegen. Der vorliegende Band ist begleitend für den Rechtschreibunterricht von (vor allem) Erwachsenen gedacht, die Deutsch auf einem (nahezu) muttersprachlichen Niveau beherrschen. Die systemische Beschreibung des Rechtschreibwortschatzes, insbesondere durch seine orthographische Annotation und die Kennzeichnung von Lernstellen, stützt sich größten teils auf die Darstellung der deutschen Orthographie im Rahmencurriculum Schreiben (kurz RCS) des Deutschen Volkshochschulverbandes. Außerdem lehnt sich der vorliegende Wortschatz an Themen an, die sich aus dem alltäglichen Leben ableiten. Lehrende finden in diesem Band gezielt reichlich Material zum Üben im Unterrichtskontext und können bei Bedarf auch neues Übungsmaterial erstellen; sie sollen aber auch zusätzlich vermitteln, dass sie selbst als Experten von Fall zu Fall in Wörterlisten nachschlagen müssen. Für den Lerner soll der Rechtschreibwortschatz dazu beitragen, die Eigeninitiative zu fördern und zu selbständigem praktischen Üben ermutigen.
Wenn Menschen heute auf der Straße protestieren, sind immer auch digitale Medien im Spiel. Ob zur Mobilisierung oder Koordination, zur Vor- oder Nachbereitung: Proteste sind durch die sprachlichen Interaktionen und medialen Praktiken der Teilnehmenden bestimmt. Mark Dang-Anh widmet sich der situativen Protestkommunikation in digitalen Medien mit einem Fokus auf Interaktionen im Mikrobloggingdienst Twitter. Anhand zweier Falluntersuchungen von Protesten gegen rechte Aufmärsche analysiert er die vielschichtigen Relationen zwischen Sprache, Medien und der sozialen Praxis des Protestierens.
Contents:
1. Andreas Dittrich: Intra-connecting a small exemplary literary corpus with semantic web technologies for exploratory literary studies, S. 1
2. John Kirk, Anna Čermáková: From ICE to ICC: The new International Comparable Corpus, S. 7
3. Dawn Knight, Tess Fitzpatrick, Steve Morris, Jeremy Evas, Paul Rayson, Irena Spasic, Mark Stonelake, Enlli Môn Thomas, Steven Neale, Jennifer Needs, Scott Piao, Mair Rees, Gareth Watkins, Laurence Anthony, Thomas Michael Cobb, Margaret Deuchar, Kevin Donnelly, Michael McCarthy, Kevin Scannell: Creating CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes – The National Corpus of Contemporary Welsh), S. 13
4. Marc Kupietz, Andreas Witt, Piotr Bański, Dan Tufiş, Dan Cristea, Tamás Váradi: EuReCo - Joining Forces for a European Reference Corpus as a sustainable base for cross-linguistic research, S. 15
5. Harald Lüngen, Marc Kupietz: CMC Corpora in DeReKo, S. 20
6. David McClure, Mark Algee-Hewitt, Douris Steele, Erik Fredner, Hannah Walser: Organizing corpora at the Stanford Literary Lab, S. 25
7. Radoslav Rábara, Pavel Rychlý ,Ondřej Herman: Accelerating corpus search using multiple cores, S. 30
8. John Vidler, Stephen Wattam: Keeping Properties with the Data: CL-MetaHeaders – An Open Specification, S. 35
9. Vladimir Benko: Are Web Corpora Inferior? The Case of Czech and Slovak, S. 43
10. Edyta Jurkiewicz-Rohrbacher, Zrinka Kolaković, Björn Hansen: Web Corpora – the best possible solution for tracking phenomena in underresourced languages: clitics in Bosnian, Croatian and Serbian, S. 49
11. Vít Suchomel: Removing Spam from Web Corpora Through Supervised Learning Using FastText, S. 56
Contents:
1. Julien Abadji, Pedro Javier Ortiz Suárez, Laurent Romary and Benoît Sagot: "Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus", S.1-9.
2. Markus Gärtner, Felicitas Kleinkopf, Melanie Andresen and Sibylle Hermann: "Corpus Reusability and Copyright - Challenges and Opportunities", S.10-19.
3. Nils Diewald, Eliza Margaretha and Marc Kupietz: "Lessons learned in Quality Management for Online Research Software Tools in Linguistics", S.20-26.
Contents:
1. Johannes Graën, Tannon Kew, Anastassia Shaitarova and Martin Volk, "Modelling Large Parallel Corpora", S. 1-8
2. Pedro Javier Ortiz Suárez, Benoît Sagot and Laurent Romary, "Asynchronous Pipelines for Processing Huge Corpora on Medium to Low Resource Infrastructures", S. 9-16
3. Vladimír Benko, "Deduplication in Large Web Corpora", S. 17-22
4. Mark Davies, "The best of both worlds: Multi-billion word “dynamic” corpora", S. 23-28
5. Adrien Barbaresi, "On the need for domain-focused web corpora", S. 29-32
6. Marc Kupietz, Eliza Margaretha, Nils Diewald, Harald Lüngen and Peter Fankhauser, "What's New in EuReCo? Interoperability, Comparable Corpora, Licensing", S. 33-39
Contents:
1. Vasile Pais, Maria Mitrofan, Verginica Barbu Mititelu, Elena Irimia, Roxana Micu and Carol Luca Gasan: Challenges in Creating a Representative Corpus of Romanian Micro-Blogging Text. Pp. 1-7
2. Modest von Korff: Exhaustive Indexing of PubMed Records with Medical Subject Headings. Pp. 8-15
3. Luca Brigada Villa: UDeasy: a Tool for Querying Treebanks in CoNLL-U Format. Pp. 16-19
4. Nils Diewald: Matrix and Double-Array Representations for Efficient Finite State Tokenization. Pp. 20-26
5. Peter Fankhauser and Marc Kupietz: Count-Based and Predictive Language Models for Exploring DeReKo. Pp. 27-31
6. Hanno Biber: “The word expired when that world awoke.” New Challenges for Research with Large Text Corpora and Corpus-Based Discourse Studies in Totalitarian Times. Pp. 32-35
In order to satisfy the information needs of a wide range of researchers across a number of disciplines, large textual datasets require careful design, collection, cleaning, encoding, annotation, storage, retrieval, and curation. This daunting set of tasks has coalesced into a number of key themes and questions that are of interest to the contributing research communities: (a) what sampling techniques can we apply? (b) what quality issues should we be aware of? (c) what infrastructures and frameworks are being developed for the efficient storage, annotation, analysis and retrieval of large datasets? (d) what affordances do visualisation techniques offer for the exploratory analysis approaches of corpora? (e) what legal paths can be followed in dealing with IPR and data protection issues governing both the data sources and the query results? (f) how to guarantee that corpus data remain available and usable in a sustainable way?
How can we measure the impact – such as awareness for economic, ecological, and political matters – of information, such as scientific publications, user-generated content, and reports from the public administration, based on text data? This workshop brings together research from different theoretical paradigms and methodologies for the extraction of impact-relevant indicators from natural language text data and related meta-data. The papers in this workshop represent different types of expertise in different methods for analyzing text data; spanning the whole spectrum of qualitative, quantitative, and mixed methods techniques, as well as domain expertise in the field of impact measurement. The program was built to create an interdisciplinary half-day workshop where we discuss possibilities, limitations, and synergistic effects of different approaches.
Contents:
1. Christoph Kuras, Thomas Eckart, Uwe Quasthoff and Dirk Goldhahn: Automation, management and improvement of text corpus production, S. 1
2. Thomas Krause, Ulf Leser, Anke Lüdeling and Stephan Druskat: Designing a re-usable and embeddable corpus search library, S. 6
3. Radoslav Rábara, Pavel Rychlý and Ondřej Herman: Distributed corpus search, S. 10
4. Adrien Barbaresi and Antonio Ruiz Tinoco: Using elasticsearch for linguistic analysis of tweets in time and space, S. 14
5. Marc Kupietz, Nils Diewald and Peter Fankhauser: How to Get the Computation Near the Data: Improving data accessibility to, and reusability of analysis functions in corpus query platforms, S. 20
6. Roman Schneider: Example-based querying for specialist corpora, S. 26
7. Paul Rayson: Increasing interoperability for embedding corpus annotation pipelines in Wmatrix and other corpus retrieval tools, S. 33
The 12th Web as Corpus workshop (WAC-XII) looks at the past, present, and future of web corpora given the fact that large web corpora are nowadays provided mostly by a few major initiatives and companies, and the diversity of the early years appears to have faded slightly. Also, we acknowledge the fact that alternative sources of data (such as data from Twitter and similar platforms) have emerged, some of them only available to large companies and their affiliates, such as linguistic data from social media and other forms of the deep web. At the same time, gathering interesting and relevant web data (web crawling) is becoming an ever more intricate task as the nature of the data offered on the web changes (for example the death of forums in favour of more closed platforms).
Following the successes of the ninth conference in 2022 held in the wonderful Santiago de Compostela, Spain, we are pleased to present the proceedings of the 10th edition of International Conference on CMC and Social Media Corpora for the Humanities (CMC-2023). The focal point of
the conference is to investigate the collection, annotation, processing, and analysis of corpora of computer-mediated communication (CMC) and social media.
Our goal is to serve as the meeting place for a wide variety of language-oriented investigations into CMC and social media from the fields of linguistics, philology, communication sciences, media
studies, and social sciences, as well as corpus and computational linguistics, language technology, textual technology, and machine learning.
This year’s event is the largest so far with 45 accepted submissions: 32 papers and 13 poster presentations, each of which were reviewed by members of our ever-growing scientific committee. The contributions were presented in five sessions of two or three streams, and a single poster session. The talks in these proceedings cover a wide range of topics, including the corpora construction, digital identities, digital knowledge-building, digitally-mediated interaction, features
of digitally-mediated communication, and multimodality in digital spaces.
As part of the conference, we were delighted to include two invited talks: an international keynote speech by Unn Røyneland from the University of Oslo, Norway, on the practices and perceptions of
researching dialect writing in social media, and a national keynote speech by Tatjana Scheffler from the Ruhr-University of Bochum on analysing individual linguistic variability in social media and
constructing corpora from this data. Additionally, participants could take part in a workshop on processing audio data for corpus linguistic analysis. This volume contains abstracts of the invited talks, short papers of oral presentations, and abstracts of posters presented at the conference.
Offensive language in social media is a problem currently widely discussed. Researchers in language technology have started to work on solutions to support the classification of offensive posts. We present the pilot edition of the GermEval Shared Task on the Identification of Offensive Language. This shared task deals with the classification of German tweets from Twitter. GermEval 2018 is the fourth workshop in a series of shared tasks on German processing.
Der Band leistet eine theoretisch begründete und empirisch validierte Entwicklung einer automatisierten Wortartenannotation (Part-of-Speech-Tagging) für Transkripte spontansprachlicher Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), das über die Datenbank für Gesprochenes Deutsch der Forschungsgemeinschaft öffentlich zugänglich ist. Dabei setzt er zwei Schwerpunkte: erstens die theoretische Aufarbeitung von Unterschieden von Transkripten gesprochener Sprache zu schriftsprachlichen Daten in Hinblick auf die Entwicklung eines Tagsets für das gesprochene Deutsch; zweitens die Darstellung der empirischen Arbeitsschritte zur Erstellung des automatisierten Part-of-Speech-Taggings, d. h. die Implementierung und Evaluierung für die Annotation des FOLK-Korpus. Der Band ist eine kritische Reflexion der Wortartentheorien im Spannungsfeld zwischen Theorie und datengeleiteter Arbeit. Er gibt Einblicke über die Korpusaufbereitung von Transkripten gesprochener Sprache und stellt diese in Bezug zu Theorien über die Eigenheiten gesprochener Sprache.
Politisches Positionieren ist eine elementare sprachliche und soziale Praxis. Wo und wie wir uns und andere in der Gesellschaft verorten, ist eine alltäglich verhandelte Frage. Positionierungen werden dabei sowohl explizit thematisiert und kontrovers diskutiert als auch beiläufig durch sprachliche Praktiken hervorgebracht. Im Zentrum von Positionierungen stehen Aushandlungen sozialer Identität. Doch nicht nur persönliche Identitäten werden durch Positionierungen konstituiert, stabilisiert oder umgedeutet, auch die Gesellschaft ist durch die sprachlichen Positionierungspraktiken ihrer Mitglieder unmittelbar oder mittelbar betroffen.
Die Beiträge des Bandes betrachten diese Schnittstelle zwischen Interaktion und Diskurs aus unterschiedlichen disziplinären Perspektiven und erörtern, wie Positionierungen vollzogen werden, ob bzw. inwiefern sie politisch sind und in welchen wechselseitigen Zusammenhängen sie zu gesellschaftlichen, sozialen und politischen Arrangements und Ordnungen stehen.
Control, typically defined as a specific referential dependency between the null-subject of a non-finite embedded clause and a co-dependent of the matrix predicate, has been subject to extensive research in the last 50 years. While there is a broad consensus that a distinction between Obligatory Control (OC), Non-Obligatory Control (NOC) and No Control (NC) is useful and necessary to cover the range of relevant empirical phenomena, there is still less agreement regarding their proper analyses. In light of this ongoing discussion, the articles collected in this volume provide a cross-linguistic perspective on central questions in the study of control, with a focus on non-canonical control phenomena. This includes cases which show NOC or NC in complement clauses or OC in adjunct clauses, cases in which the controlled subject is not in an infinitival clause, or in which there is no unique controller in OC (i.e. partial control, split control, or other types of controllers). Based on empirical generalizations from a wide range of languages, this volume provides insights into cross-linguistic variation in the interplay of different components of control such as the properties of the constituent hosting the controlled subject, the syntactic and lexical properties of the matrix predicate as well as restrictions on the controller, thereby furthering our empirical and theoretical understanding of control in grammar.
Diese Monografie setzt sich neu mit Laiengedanken zur deutschen Sprache auseinander. Mit einem kleinen, aber aussagekräftigen Korpus von rund 480 schriftlichen Äußerungen muttersprachlicher und nichtmuttersprachlicher Laien zwischen 1992 und 2023 fokussiert sie sich durch viele Detailanalysen erstens auf Themen, die Laien bewegen, zweitens auf Argumente, die Laien zur Bekräftigung ihrer Ansichten anführen, und drittens auf Ausdruckstopoi, mit denen Laien argumentieren.
Die Monografie ist Ideengeber vor allem für linguistische, soziolinguistische, psychologische und gesellschaftspolitische Projekte zum Laiendiskurs im öffentlichen Raum, speziell für Projekte zu brisanten, aktuell heftig diskutierten Themen wie Antirassismus und Gendern, für Projekte zu Anglizismen, für Projekte zu Sprachwandel, Sprachverfall, Sprachpflege und Sprachpurismus, für Projekte zu Jugendsprache und Generation sowie für Projekte zur Sprache als Herrschaftsinstrument.
The authors are pleased to present to the readers of the Zeitschrift für Sprachwissenschaft a Special Issue in honor of Rosemarie Tracy.
Contents:
0. Frontmatter
1. Petra Schulz, Ira Gawlitzek, Angelika Wöllstein: Introduction, S. 1
2. Natascha Müller: Different sources of delay and acceleration in early child bilingualism, S. 7
3. Hubert Haider, Christina Schörghofer-Essl, Karin Seethaler: Quantifying kids prefer intersecting sets - a pilot study, S. 31
4. Petra Schulz, Rabea Schwarze: How strong is the ban on non-finite verbs in V2? Evidence from early second language learners of German with and without SLI, S. 51
5. Monika Rothweiler, Manuela Schönenberger, Franziska Sterner: Subject-verb agreement in German in bilingual children with and without SLI, S. 79
6. Holger Hopp: The processing of English which-questions in adult L2 learners: Effects of L1 transfer and proficiency, S. 107
7. Oksana Laleko, Maria Polinsky: Silence is difficult: On missing elements in bilingual grammars, S. 135
8. Artemis Alexiadou: Building verbs in language mixing varieties, S. 165
Bis heute und weltweit genießt der „Mechanismus der menschlichen Sprache“ des Wolfgang von Kempelen unter Kennern einen beinahe legendären Ruf. In Methodik und Argumentation zählte dieses Buch seinerzeit zur wissenschaftlichen Avantgarde der erst im Entstehen begriffenen Phonetik. Heute jedoch ist seine Rezeption mit erheblichen Hürden verbunden: Insbesondere seine altertümliche Sprache und die Frakturschrift behindern eine intensive Auseinandersetzung. Zudem fehlte bislang eine englische Übersetzung.
Bis heute und weltweit genießt der „Mechanismus der menschlichen Sprache“ des Wolfgang von Kempelen unter Kennern einen beinahe legendären Ruf. In Methodik und Argumentation zählte dieses Buch seinerzeit zur wissenschaftlichen Avantgarde der erst im Entstehen begriffenen Phonetik. Heute jedoch ist seine Rezeption mit erheblichen Hürden verbunden: Insbesondere seine altertümliche Sprache und die Frakturschrift behindern eine intensive Auseinandersetzung. Zudem Fehlte bislang eine englische Übersetzung.
Manual für die Kodierung von Fragetypen und Fragesequenztypen im Coaching. Version 1.0 (Mai 2023)
(2023)
Das vorliegende Manual dient der Beschreibung und Bewertung einer coachingspezifischen Typologie von Fragen und, darauf aufbauend, der durch diese Fragen kontextualisierten Fragesequenzen. Mittels eines interdisziplinären psychologischen und linguistisch-gesprächsanalytischen Ansatzes wird ein Rating-Instrument zur qualitativen und quantitativen Erfassung von Fragen und Fragesequenzen im Coachingprozess entwickelt. Ziel ist es, weniger gelingende von besser gelingenden Sequenzen zu unterscheiden. Dabei wird davon ausgegangen, dass gelingende Sequenzen zum Gesamterfolg des Gesprächs beitragen.
Das Gelingen der Fragesequenzen wird mit Hilfe der Responsivität von Coach und Coachee bewertet. Responsivität bezieht sich auf die sprachlichen Handlungen beider Gesprächsteilnehmer*innen (Graf & Dionne 2021) und wird in diesem Manual sowohl auf der Ebene einzelner Sequenzpositionen als auch der Gesamtsequenz verstanden. Die Responsivität der Gesprächsteilnehmer*innen sowie das Gelingen der Fragesequenzen wird in Bezug auf die Organisationsstruktur des Coachinggesprächs betrachtet.
Gegenstand des Manuals sind dyadische Coachinggespräche zwischen Coaches und Coachees aus dem Bereich des berufsbezogenen Coachings. Fragen der Coaches dienen als Ausgangspunkt (target action) (Peräkylä 2019) für die Bildung einer Fragesequenz.
This manual serves to describe and evaluate a coaching-specific typology of questions and, building on this, of questioning sequences. Based on an interdisciplinary, psychological and linguistic/conversation analytical approach, a rating instrument has been developed in order to qualitatively and quantitatively capture questions and questioning sequences in the coaching process. The aim is to distinguish between more and less successful sequences. It is assumed that successful sequences contribute to the overall success of the coaching conversation.The success of the questioning sequences is evaluated by examining the responsiveness of coach and coachee. Responsiveness refers to the verbal actions of both participants in the conversation (Graf & Dionne 2021) and is understood in this manual both at the level of individual sequence positions as well as the entire questioning sequence. The responsiveness of the participants in the conversation and the success of the questioning sequences are considered in relation to the organizational structure of the coaching conversation. The manual is based on dyadic coaching conversations between coaches and coachees from the area of business/work-related coaching. Coaches' questions serve as a starting point (target action) (Peräkylä 2019) for a questioning sequence.
Dieser Band versammelt neun Beiträge mit dem Ziel, Sprach- und Literaturwissenschaft aufeinander zu beziehen: Literatur grammatisch zu betrachten und Grammatik für Literatur (neu) zu denken. Jeder Beitrag nimmt mindestens einen grammatischen und einen literarischen Gegenstand zum Ausgangspunkt. Dabei ist die Bandbreite groß; sie reicht von Bodo Kirchhoffs Roman ‚Dämmer und Aufruhr‘ über die Kurzgeschichte ‚Das Brot‘ von Wolfgang Borchert bis hin zu Marion Poschmanns Gedichtzyklus ‚Kindergarten Lichtenberg‘ und deckt unterschiedlichste sprachliche Bereiche wie Tempus, semantische Rollen, Interpunktionszeichen oder Metaphern ab. Ist es in der Schule geradezu erwünscht, Grammatik und Literatur integrativ zu unterrichten, verfolgen sie als universitäre Disziplinen oft ganz unterschiedliche Fragestellungen an verschiedenen Sprachwerken. Vor diesem Hintergrund ist dieser Band ein interdisziplinärer Versuch, Anregungen und neue Perspektiven für schulische wie universitäre Bildungskontexte zu geben.
Das Buch präsentiert die ersten Arbeitsergebnisse des wissenschaftlichen Netzwerks >Linguistik und Medizin< Patho- und Salutodiskurse im Spannungsfeld von objektivierter Diagnose, interaktiver Vermittlung und medialer Konstitution, gegründet 2017 und finanziert von der Deutschen Forschungsgemeinschaft. Aus unterschiedlichen linguistischen, medizinischen, historischen und soziologischen Perspektiven werden Prozesse der Wissenskonstitution, -aushandlung und des -transfers in Bezug auf Gesundheit und (psychische wie somatische) Krankheiten thematisiert. Mit Daten und Methoden der Gesprächs-, Korpus- und Diskurslinguistik, der Medizin und der Soziologie werden aktuelle und gesellschaftsrelevante Fragestellungen in der Arzt-Patienten-Kommunikation, den ö̈ffentlichen massenmedialen Diskursen und in der Fachkommunikation in einem interdisziplinären Dialog bearbeitet. Im Fokus stehen einzelne Krankheitsbilder und deren semiotische Konstruktion wie Schizophrenie, HIV/AIDS, Alzheimer, Depression; mannigfaltige interaktive Praktiken z.B. der Empathiebekundung, der Aufklärung, der Emotionalisierung in Arzt-Patienten-Gesprächen; Prozesse der gemeinsamen Wissensaushandlung in Online-Foren; fachliche Konstruktionen von Vorstellungen zu Normalität und Abweichung.
Während lexikographische Prozesse, die zur Publikation gedruckter Wörterbücher führen, bereits seit einigen Jahrzehnten im Fokus der Wörterbuchforschung stehen und die dafür unterschiedenen Phasen der Vorbereitung, der Datenbeschaffung, der Datenaufbereitung, der Datenauswertung und der Satz- und Druckvorbereitung mittlerweile als etabliert betrachtet werden dürfen, steht die Diskussion und Beschreibung lexikographischer Prozesse von Internetwörterbüchern noch in den Anfängen. Zwar besteht kein Zweifel daran, dass sich lexikographische Prozesse bei der Publikation von Internetwörterbüchern anders gestalten als bei Printwörterbüchern, doch die Fragen, inwiefern sie dies tun, welchen Einfluss die neuen Möglichkeiten der Datengewinnung aus elektronischen Textkorpora auf die Prozesse haben, wie Bearbeitungsteilwortschätze auszuwählen sind, wie verschiedene Fassungen zu versionieren und zu archivieren sind und wie sich schließlich die Änderungen der lexikographischen Prozesse auf die Nutzer auswirken, ob und wie die Nutzer in diese Prozesse einbezogen werden können, sind noch nicht ausführlich beantwortet.
Diese und andere Fragen waren daher Gegenstand des vierten Arbeitstreffens des wissenschaftlichen Netzwerks “Internetlexikografie”, das am 22. und 23. November 2012 an der Universität Trier stattfand und vom Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften/Trier Center for Digital Humanities organisiert wurde. Die Auseinandersetzung mit dem lexikographischen Prozess wurde fortgesetzt in drei Arbeitsgruppen, die sich mit Auswahlkriterien, Umsetzung und Problemen von Bearbeitungsteilwortschätzen, mit Archivierung und Versionierung und mit dem korpusbasierten Vorgehen bei der Erweiterung bestehender lexikographischer Ressourcen beschäftigten. Der vorliegende Band beschäftigt sich mit den in den Diskussionsrunden und Arbeitsgruppen gefundenen Ergebnissen und den dort identifizierten weiterführenden Fragen.
This volume brings together contributions by international experts reflecting on Covid19-related neologisms and their lexicographic processing and representation. The papers analyze new words, new meanings of existing words, and new multiword units, where they come from, how they are transmitted (or differ) across languages, and how their use and meaning are reflected in dictionaries of all sorts. Recent trends in as many as ten languages are considered, including general and specialized language, monolingual as well as bilingual and printed as well as online dictionaries.