Refine
Year of publication
- 2020 (357) (remove)
Document Type
- Part of a Book (139)
- Article (124)
- Conference Proceeding (29)
- Book (17)
- Other (15)
- Part of Periodical (15)
- Review (12)
- Doctoral Thesis (2)
- Working Paper (2)
- Master's Thesis (1)
Language
- German (252)
- English (101)
- French (2)
- Multiple languages (2)
Keywords
- Deutsch (95)
- Korpus <Linguistik> (64)
- COVID-19 (44)
- Sprachgebrauch (41)
- Neologismus (30)
- Forschungsdaten (25)
- Gesprochene Sprache (24)
- Grammatik (23)
- Mundart (23)
- Wortschatz (21)
Publicationstate
- Veröffentlichungsversion (169)
- Zweitveröffentlichung (137)
- Postprint (19)
- Ahead of Print (2)
Reviewstate
Publisher
- Leibniz-Institut für Deutsche Sprache (IDS) (77)
- Narr Francke Attempto (44)
- de Gruyter (43)
- European Language Resources Association (19)
- Erich Schmidt (10)
- CLARIN (6)
- Gesellschaft für deutsche Sprache e.V. (6)
- Heidelberg University Publishing (6)
- Spektrum der Wissenschaft Verlagsgesellschaft (5)
- Association for Computational Linguistics (4)
♀ ☺ = ♂ ☺? Oder: Das Gelächter der Geschlechter 2.0: Emojigebrauch in der WhatsApp-Kommunikation
(2020)
Praktiken des 'doing', 'undoing' und 'indexing' von Gender finden sich auch in der computervermittelten Kommunikation, und es ist zu erwarten, dass sie sich dort ganz besonders im Gebrauch von Emojis niederschlagen. Zu erwarten ist dies, weil Emojis ein wichtiges Mittel zur Hervorbringung von Nähe, Emotionalität und Gruppenzugehörigkeit sind, und Gender ist ein Parameter, der bei diesen Aspekten eine Rolle spielt. In dem vorliegenden Beitrag soll auf der Basis der Mobile Communication Database 2 (MoCoDa2), einer Datenbank mit WhatsApp-Interaktionen, aus quantitativer und qualitativer Perspektive gefragt werden, welche Gemeinsamkeiten und Unterschiede sich im Emojigebrauch von Männern und Frauen finden lassen.
Das „Lautdenkmal reichsdeutscher Mundarten zur Zeit Adolf Hitlers“ ist eine Sammlung von 300 Dialektaufnahmen aus Deutschland sowie weiteren 100 Aufnahmen aus Österreich, die, initiiert vom Reichsbund deutscher Beamter, in den Jahren 1936 bis 1938 erhoben wurden. In der aktuellen Forschung ist noch nicht geklärt, ob die Sprecher in den Aufnahmen frei sprechen durften oder eher auf Basis eines vorbereiteten bzw. von den Initiatoren vorgegebenen Skripts agierten. Ziel des vorliegenden Beitrages ist es dementsprechend, die sprachlichen und inhaltlichen Besonderheiten in zwei Aufnahmen aus Bayern und Schleswig-Holstein herauszuarbeiten und damit die Frage nach einer thematischen Steuerung zu beantworten.
Seit 30 Jahren besteht die Mauer als physische Grenze zwischen den ehemaligen beiden deutschen Staaten nicht mehr. Aus linguistischer Perspektive kann von einer „sprachlichen Vereinigung“ ausgegangen werden, jedoch scheint sich die Mauer mental und sprachlich als diskursive MauerindenKöpfen festgesetzt zu haben. Mittels der draw-a-map-Methode und der Priming-Methode der kognitiven Psychologie wird im vorliegenden Beitrag untersucht, ob sich eine solche Mauer auch in den Köpfen jünge-rer Personen finden lässt, die sozialisiert wurden, als die beiden deutschen Staaten nicht mehr existierten. Die Ergebnisse zeigen deutlich, dass sich Unterschiede unter den Priming-Bedingungen bzgl. der Sprechproben, der Herkunft der Proband/-innen und den Variablen Verortung, Benennung und Assoziation finden lassen
In der vorliegenden Studie steht die itzgründische Dialektlandschaft innerhalb der ehemaligen Grenzgebiete in Thüringen und Bayern im Fokus. Auf Basis des „integrierenden Ansatzes“ werden Real-Time-Daten und Apparent-Time-Daten miteinander kombiniert und die Frage geklärt, ob an der ehemaligen deutsch-deutschen Grenze eine neue Dialektgrenze entstanden ist. In diesem Zusammenhang wird sowohl die Wahrnehmung als auch die Kompetenz der Grenzbewohner untersucht. So ist es möglich, die objektive, dialektgeografische Struktur (mittels Variablenanalyse) und die subjektive, wahrnehmungsdialektologische Struktur (mittels Hörerurteilstests) darzustellen.
Dieser Beitrag beschäftigt sich mit dem Einsatz von dialektalen Merkmalen in Werbespots für den deutschen und österreichischen Markt sowie mit seinen Funktionen am Beispiel von Iglo (Lebensmittelbranche, Tiefkühlkost). Im Zentrum stehen dabei folgende Fragen: Welche dialektalen Merkmale welcher sprachlichen Beschreibungsebenen (Phonetik/Phonologie, Morphologie, Lexik) werden in welchen Textteilen der Spots verwendet? Wird dabei auch multimodal und multisensorisch auf die betreffende Region Bezug genommen? Die Analysen zeigen auch, inwiefern sich der Gebrauch dieser Merkmale in den deutschen und österreichischen Spots unterscheidet, und ob der Dialektgebrauch in den Werbespots (Auswahl der Merkmale, Kontexte/Gesprächssituationen) mit den Ergebnissen von Studien zum Gebrauch und zur Wahrnehmung von Dialekten im Allgemeinen übereinstimmt.
Die sprachliche Situation im Kanton Graubünden, wo eine Vielzahl von italienischen, romanischen und deutschen Varietäten in lang andauerndem Kontakt stehen, ist bisher nur wenig beschrieben, eine wahrnehmungslinguistische Untersuchung steht noch ganz aus. Ausgehend von der Annahme, dass Salienz abhängig vom eigenen sprachlichen System und vom Sprecherwissen ist, wurde ein Experiment konzipiert, bei dem Hörer aus Graubünden und Zürich Aufnahmen aus drei Bündner Orten, in denen Rätoromanisch und Deutsch in unterschiedlichen Kontaktverhältnissen stehen, hören und kommentieren sollten. Dabei konnte gezeigt werden, dass Bündner aufgrund ihres Sprecherwissens über die Variation in Graubünden andere Merkmale wahrgenommen und die Aufnahmen anders charakterisiert haben als Zürcher.
The article focuses on the lexeme Ahnung. A lexicographic analysis shows the range of Information offered by Ahnung in selected dictionaries, aespecially monolingual DaF dictionaries, and displays how the Spectrum of meaning is represented in them. Corpus-based analyses from two samples from FOLK and DeReKo investigate exemplary form characteristics and, with regard to the written-language data, the occurrence in text types. Ahnung shows a slightly higher combinatorial potential in written-linguistic data than in spoken-linguistic data. A clear tendency to the connection keine Ahnung is however to be recognized in both data sets.
Der Text etabliert eine neue analytische Hinsicht auf soziolinguistische Fragestellungen unter dem Titel soziale Präsenz, ausgehend von bestehenden theoretischen Annäherungen an das Verhältnis von Sprechen und Sozialität. Ziel des Ansatzes ist eine umfassende Analyse menschlichen (Sprach)Handelns in der Lebenswelt, die unterschiedliche Formen von symbolischer und praktischer Selbstbehauptung und darauf bezogener Formen gesellschaftlicher Anerkennung in ihrer jeweiligen Bedeutung für die praktische Aushandlung sozialer Regime der Sichtbarkeit in den Blick nimmt. Die theoretischen Setzungen werden in der Folge am Beispiel regionaltypischer Ausprägungen des Deutschen in Österreich empirisch überprüft. Die Analyse von Social-Media-Diskussionen aus der App „Jodel“ zeigt dabei, dass typisch österreichische Formen konstitutiver Bestandteil der digitalen Schriftlichkeit junger Österreicher/-innen sind, die diese Ressource gezielt einsetzen, um regionale Gruppenzugehörigkeit zu markieren. In ähnlicher Weise belegen die Einstellungen junger Österreicher/-innen die soziale Anerkennung typisch österreichischer Sprechweisen (besonders des Regiolekts) als bevorzugtes Mittel der informellen und Nähekommunikation mit identitätsstiftender Funktion. Die Analyse öffentlicher Schriftlichkeit in Wien mit Hilfe von Daten aus dem Projekt „Lingscape“ zuletzt verdeutlicht, dass typisch österreichische Formen in der städtischen Sprachlandschaft verankert sind, dabei aber vor allem der Herstellung soziokultureller Nähe in institutioneller und ökonomischer Kommunikation dienen.
„Die vo hinge füüre“ – Sprachspott in der Nordwestschweiz am Beispiel der Velarisierung von mhd. nd
(2020)
Der vorliegende Aufsatz untersucht interdialektalen Sprachspott exemplarisch anhand des lautlichen Phänomens der Velarisierung von mhd. nd zu [ŋ]. Es wird einerseits mithilfe einer qualitativen Auswertung von metasprachlichen Laienkommentaren gezeigt, wie Sprachspott von Betroffenen wahrgenommen wird, und andererseits anhand von quantitativen Auswertungen der tatsächliche Sprachgebrauch des verspotteten Merkmals dargestellt. Daraus geht hervor, dass insbesondere junge Pendler/-innen den Sprachspott als negativ empfinden – und es sind denn auch vor allem die jungen Pendler/-innen, die die niedrigsten Velarisierungswerte in der Abfrage verzeichnen. Die Ergebnisse der Untersuchung liefern Evidenz dafür, dass nicht etwa das alleinige Vorkommnis von Sprachspott das Sprachverhalten beeinflusst, sondern dass die individuelle Einstellung der Betroffenen zum erlebten Spott ausschlaggebend ist für das jeweilige Sprachverhalten.
Bisherige Studien zur gegenwärtigen Sprachsituation im ehemaligen innerdeutschen Grenzgebiet haben vor allem den Basisdialekt im bayrisch-thüringischen Grenzgebiet fokussiert. Die Regionalsprache, die laienlinguistische Wahrnehmung sowie die nördlich gelegenen Grenzgebiete wurden eher stiefmütterlich behandelt. In diesem Beitrag steht eine Untersuchung im Mittelpunkt der Betrachtung, die im Rahmen meines laufenden Promotionsprojekts durchgeführt wurde und sich dem genannten Desiderat annimmt. Der Fokus des Beitrags richtet sich auf ausgewählte Ergebnisse der Draw-a-Map-Task, die aufzeigen, wie die dort lebenden Personen den ehemaligen deutsch-deutschen Grenzraum strukturieren und wahrnehmen (bspw. welche Dialekträume werden im Grenzgebiet unterschieden und welchen Konzepten unterliegen sie). Hierbei steht insbesondere die Veränderlichkeit des Konzepts der „Mauer in den Köpfen“ im Vordergrund.
Mit der Tagung zu Bauernkomödien des 17. Jahrhunderts verfolgten Markus Denkler (Münster) und Michael Elmentaler (Kiel) ein ungewöhnliches Konzept, das einen besonders intensiven wissenschaftlichen Austausch ermöglichte: Gemeinsame Textgrundlage für alle Beitragenden stellten zwölf hoch- und niederdeutsche Bauernkomödien aus dem 17. Jahrhundert (ca. 1593–1701) dar. Dabei handelt es sich um Dramen mit bäuerlichen Figuren, die eine komödiantische Ausrichtung haben und in Prosaform verfasst sind. Alle Vortragenden erhielten im Vorfeld Zugriff auf die Sammlung und entwickelten daraus in der Folge Fragestellungen für ihre Vorträge. Inhaltlich ergaben sich drei Blöcke. Zwei literaturwissenschaftliche Beiträge ordneten die Textsorte literatur- und kulturhistorisch ein. Daran schlossen sich ein umfangreicher Block zur historischen Dialogforschung und Pragmatik und ein etwas kürzerer zu historischer Varietätenlinguistik und Grammatik an.
Even though the use of several languages has become more common in modern societies, it is important to find a common language in order to communicate economically (by the way, also with regard to economic success). So, of course, it is an advantage and a basic request in our national societies to be able to communicate by means of the national language(s). But looking a bit closer at the communicative demands of today one sees that there is a growing need to react to internal variation, and that a modern linguistic identity not only covers that fact, but also the fact, that English – in different forms – is part of a linguistic spectrum fitting a modern European communicative life. In the last years a communicative pattern is developing within an elite group of young academically educated people that is based on the use of English only, more or less ignoring the connection to the national linguistic surroundings, somehow kind of an alternative monolingualism. But looking at the communicative needs in our complex societies losing the ability to cope with different linguistic options in different communicative situations and to integrate this possibility into your linguistic identity is a rather restricted option – also in economic terms. And this even holds not taking into account the linguistic effect of modern migration.
Für den öffentlichen Sprachgebrauch im Internet ist Facebook, das mit 15 Jahren zur älteren Generation von Social-Media-Sites zählt, nach wie vor hochrelevant. Im deutschsprachigen Raum ist es die am meisten genutzte Social-Media-Plattform (Newman et al. 2019). Zu den Diensten gehören unter anderem Facebook-Seiten (Pages), die von Unternehmen, Parteien, Medien und anderen Institutionen oder Individuen betrieben werden und als öffentliche Angebote prinzipiell auch von nicht bei Facebook angemeldeten Personen eingesehen werden können. Solche öffentlichen Facebook-Seiten sind als sites of engagement zwischen gesellschaftlichen Institutionen und Individuen reichhaltige Quellen für die linguistische Forschung.
Im Vergleich zu anderen Plattformen bietet Facebook aber nur einen eingeschränkten Zugriff auf diese öffentlichen Sprach- und Interaktionsdaten (Freelon 2018). Während beispielsweise für Twitter viele Tools zur Datensammlung existieren und auch die Plattform selbst eine ausgebaute Suchmaske bietet, erschweren die limitierten Suchmöglichkeiten der Facebook-Plattform und das fehlende Angebot von einfach nutzbarer Software linguistische Projekte in Forschung und Lehre. Gleichzeitig stellen sich neben den praktischen Fragen an vielen Stellen auch forschungsethische Fragen im Umgang mit Onlinedaten.
In der deutschsprachigen Gender-Mainstreaming-Debatte treten sprachpolitische Positionen in Konflikt mit grammatischen Regularitäten und orthografischen Normen – nicht selten ohne wesentliche Annäherung. Der Beitrag beleuchtet die Debatte aus der Perspektive des Rats für deutsche Rechtschreibung und argumentiert anhand paradigmatischer Textbeispiele aus dem aktuellen Schreibgebrauch für eine textsorten- und zielgruppenspezifische Realisierung geschlechtergerechter Schreibung. Ausgehend vom breiten Spektrum entsprechender Strategien in bisherigen Leitfäden, Richtlinien und Empfehlungen werden Möglichkeiten einer orthografisch korrekten und sprachlich angemessenen Umsetzung aufgezeigt – in einem multiperspektivischen Ausgleichsversuch beider Diskurspole: Gendergerechte Texte sollen sachlich korrekt, verständlich, lesbar und vorlesbar sein, Rechtssicherheit und Eindeutigkeit gewährleisten sowie die Konzentration auf wesentliche Sachverhalte und Kerninformationen sicherstellen. Abschließend wird diskutiert, welche Rolle der Rat vor dem Hintergrund seines Auftrags der Bewahrung der Einheitlichkeit der Orthografie im gesamten deutschen Sprachraum in der Debatte einnehmen könnte und sollte.
Zwischen den Jahren oder eine Zeit zwischen den Zeiten. Sprachliche Betrachtungen zur "Normalität"
(2020)
Die Sozialen Medien haben sich zunehmend zu einem Raum öffentlicher Meinungsbildung entwickelt. Die öffentliche Diskussion um Hass-Kommentare im Internet macht deutlich, dass Soziale Medien über die epistemische Dimension rationaler Diskurse hinaus emotionalisierte, strategische und identitätsorientierte Diskurse begünstigen, die das deliberative Paradigma öffentlicher Meinungsbildung und die Prinzipien politischer Rationalität und logischen Argumentierens in Frage stellen. Der Beitrag untersucht am Beispiel der drei Plattformen Facebook, Twitter und Youtube den Zusammenhang von Plattformlogik und Interaktionsstrukturen mit einem Schwerpunkt auf den Diskurspraktiken des Emotionalisierens. Es wird auch die Frage geklärt, inwiefern die vorhandenen Ansätze der Konversations- und Dialoganalyse auf Interaktionen in Sozialen Medien anwendbar sind.
Dieser Beitrag untersucht auf der Basis von Dialekt-Standard-Übersetzungen und einem Matched-Guise-Experiment bei 108 Personen, die im mittelbairischen Raum wohnhaft sind und Deutsch als Erst- oder Zweitsprache verwenden, den Zusammenhang zwischen Dialektkompetenz und Dialektbewertungen. Die Ergebnisse weisen darauf hin, dass Variationskompetenz auch im Zweitspracherwerb erreicht wird und dass die Bewertung von Dialekt stark von der individuellen Dialektkompetenz und weniger von einer kategorisch angelegten Sprachgruppenzugehörigkeit (Deutsch als Erst- vs. Zweitsprache) beeinflusst wird.
Despite the importance of the agent role for language grammar and processing, its definition and features are still controversially discussed in the literature on semantic roles. Moreover, diagnostic tests to dissociate agentive from non-agentive roles are typically applied with qualitative introspection data. We investigated whether quantitative acceptability ratings obtained with a well-established agentivity test, the DO-cleft, provide evidence for the feature-based prototype account of (Dowty, David R. 1991. Thematic protoroles and argument selction. Language 67(3). 547-619) postulating that agentivity increases with the number of agentive features that a role subsumes. We used four different intransitive verb classes in German and collected acceptability judgements from non-expert native speakers of German. Our results show that sentence acceptability increases linearly with the number of agentive features and, hence, agentivity. Moreover, our findings confirm that sentience belongs to the group of proto-agent features. In summary, this suggests that a multidimensional account including a specific mechanism for role prototypicality (feature accumulation) successfully captures gradient acceptability clines. Quantitative acceptability estimates are a meaningful addition to linguistic theorizing.
Der Beitrag bespricht in Abgrenzung zum vorherrschenden onomasiologischen Paradigma der Terminologielehre die Vor- und Nachteile einer semasiologischen Terminologiearbeit und -modelierung. Hierbei wird davon ausgegeangen, dass terminologische Einheiten diskursiv konstituiert werden und dass aus einer relationalen Beschreibung semasiologisch verstandener terminologischer Einheiten eine begriffsorientierte Beschreibung emergent hervorgeht. Zu diesem Zweck empfiehlt der Beitrag ein Prinzip der Zeichenorientierung, mit dem zudem die theoretische Beschreibung von terminologiestrukturierenden Beziehungstypen vereinheitlicht werden kann.
Die Wörterbücher zur Sprach- und Kommunikationswissenschaft sind eine Fachwörterbuchreihe, die für 25 Bände geplant ist und in der aktuell ca. 12.000 Artikel online stehen. WSK-1 wird in zwei Teilbänden (Formenlehre, Syntax) von Stefan J. Schierholz und Pál Uzonyi herausgegeben. Es handelt sich um ein alphabetisches und teilbilingualisiertes terminologisches Fachwörterbuch, das als Adressaten in erster Linie Studierende sieht und bei der Textrezeption und fachbezogenen Informationen behilflich sein soll. Von insgesamt ca. geplanten 4500 Artikeln sind über 4000 Artikel bereits online erschienen.
Im Folgenden werden die konzeptuelle Ordnung der Termini, die unterschiedlichen Artikeltypen (Synopse-, Einzel-, Verweisartikel), die Verweisstrukturen (uni-, bidirektional; Synonyme, Antonyme, inhaltlich-thematische Verweisungen, Mehrworttermini), die Abbildung der kognitiven Strukturen des Fachwissens, die Lernkomponenet des Bandes sowie der Artikelaufbau vorgestellt.
Vitaminhaltig ist gut, vitaminreich noch besser. Eine arbeitsfreie Zeit mag entspannen, eine arbeitslose kaum. Wirken solche Aussagen sinnvoll oder doch eher sinnarm?
Die Wortbildungsproduktivität von komplexen possessiven und privativen Adjektiven erscheint praktisch grenzenlos – in der Theorie werden ihr dagegen sehr wohl Grenzen gesetzt, jedoch ohne Berücksichtigung gebrauchsbasierter, empirischer Analysen. Diesem Desiderat widmet sich dieser Band, in welchem anhand konkreter Sprachdaten Forschungslücken und Widersprüche aufgedeckt und offene Fragestellungen beantwortet werden. Zudem zeigen sich neue Bedeutungsaspekte, die den Wortbildungsprodukten bislang nicht zugeschrieben wurden. In Gänze erbringen die Analysen den nötigen Beweis, dass die korpuslinguistischen Untersuchungen bisherige morphologische Beschreibungen sowohl erweitern als auch korrigieren können und sich darüber hinaus zum Entwickeln neuer Modelle mit neuen Kategorien eignen. Die eigens für diese Zwecke korpusgestützt generierte Stichwortliste findet sich samt Anzahl an Belegtreffern im Anhang wieder.
Der Artikel hinterfragt die Annahme, dass Wortarten sich gemäß ihrer Definition dazu eignen, als (schul-)grammatische Kategorien zu fungieren: Betrachtet man die tatsächlich in Sprachen (hier: dem Deutschen) vorliegende lexikalische Elemente, so stellt man fest, dass systematische Zwischen- und Zweifelsfälle der Kategorisierung binäre Kategorisierungen (wie Substantiv – kein Substantiv, Verb – kein Verb, etc.) oft empirisch nicht zulassen. Alternative (graduellere/mehrdimensionale) Kategorisierungen, die den empirischen Fakten Rechnung tragen, eignen sich umgekehrt aber nicht für die ihnen zugedachten binären Vorhersagen (Großschreibung – keine Großschreibung, Subjektkongruenz – keine Subjektkongruenz, etc.). Eine Lösung dieses Dilemmas scheint momentan nicht leicht verfügbar.
Der vorliegende Beitrag stellt Konzeptualisierungen von Sprachlagen des individuellen Spektrums linguistischer ungeschulter Personen dar und vergleicht dabei erstmalig attitudinale Daten aus Wien und ruralen Regionen Österreichs. Im Fokus der Pilotstudie stehen dabei insbesondere Konzepte zu ‚Dialekt‘, ‚Hochdeutsch‘ sowie ‚Wienerisch‘, die sich in einem mehrstufigen Analyseverfahren als äußerst heterogen erweisen. Ihre Heterogenität speist sich aus einem komplexen Zusammenspiel soziodemografischer, regionaler, situativer sowie dynamischer Parameter, die kontrastiv diskutiert werden und auf distinkte Sprachlagenkonzepte hindeuten.
Terminologiearbeit im wirtschaftlichen Kontext geht von zwei Arbeitsphasen aus: einer umfassenden deskriptiven Phase, in der die Begriffsstruktur und der aktuelle Terminologiegebrauch erfasst, aber noch nicht bewertet werden, sowie einer präskriptiven Phase, in der der eigentliche Standardisierungseingriff erfolgt. In der Praxis wird die deskriptive Phase oft reduziert und der Schwerpunkt unmittelbar auf die Präskription gelegt. In unserem Beitrag diskutieren wir das Potenzial, das eine ausführliche deskriptive Terminologiearbeit zur Verbesserung der Wissenskommunikation im Rahmen des Wissensmanagements birgt. Am Beispiel eines wissenschaftlichen Projektes im Bereich Grammatik des Deutschen zeigen wir, wie diese eng an der Theorie orientierte Ausgestaltung der Deskription in der Praxis aussieht, welche Herausforderungen sie mit sich bringt und wie ihre Ergebnisse das Wissensmanagement unterstützen können.
N-grams are of utmost importance for modern linguistics and language theory. The legal status of n-grams, however, raises many practical questions. Traditionally, text snippets are considered copyrightable if they meet the originality criterion, but no clear indicators as to the minimum length of original snippets exist; moreover, the solutions adopted in some EU Member States (the paper cites German and French law as examples) are considerably different. Furthermore, recent developments in EU law (the CJEU's Pelham decision and the new right of newspaper publishers) also provide interesting arguments in this debate. The proposed paper presents the existing approaches to the legal protection of n-grams and tries to formulate some clear guidelines as to the length of n-grams that can be freely used and shared.
Having the necessary skills for staying in contact with friends and relatives through digital devices is crucial in today’s world. As the current COVID-19 pandemic shows, this holds especially true for the elderly. Being quarantined and restricted from physically meeting people, various communication technologies are more important than ever for staying social and informed on current events. In nursing homes, staff members are now finding new ways for staying in touch with family members by assisting residents in making video calls with mobile devices.
But what if elderly people cannot rely on personal assistance for accessing these alternative means of communication? This raises the general question of how older people can and do learn to use such technologies. Although the internet is full of guides and instructional videos on how to use smartphones or tablets, they are a cold comfort to someone who may not even know what an internet browser is.
Especially for digital newcomers, the tried and true method of face-to-face instruction is invaluable. While many older people turn to their children or grandchildren for help in all things digital, courses specifically tailored for elderly users are also increasingly popular.
More and more governmental initiatives and associations indeed acknowledge the already existing interest of elderly citizens in digital tools and their growing need to receive customized training (e.g. “SeniorSurf” and “Kansalaisen digitaidot” in Finland or “Silver Tipps” in Germany). For a researcher of social interaction, these courses can also provide a valuable window for discovering what it looks and sounds like to learn to use essential but sometimes alien technologies.
Wenn hinten besser ist als vorne. Laienlinguistisches Wissen unter diskursanalytischer Perspektive
(2020)
Wahrnehmungsdialektologische Studien haben den wichtigen Nachweis erbracht, dass sich Laien bei der mentalen Strukturierung ihrer sprachlichen Umgebung an sozial relevanten, z. B. an politischen, Räumen orientieren. Methodisch ermittelt wurde dieser Nachweis über Draw-a-map-Aufgaben, die Laien zur kartografischen Visualisierung ihrer sprachräumlichen Vorstellungen bewegen. Vorliegender Artikel wählt einen methodisch anderen Weg: Laienlinguistische Strukturierungen werden nämlich nicht ausgehend von handgezeichneten Karten, sondern von Gesprächen über diese Karten untersucht. Dabei zeigt sich, dass es mentale Strukturierungen gibt, die jenseits von kartografisch abbildbaren Räumen liegen: Ein flexibel einsetzbares Hinten und Vorne im Sprachraum etwa oder ein Oben und Unten, die beide mit gewichtigen gesellschaftlichen Wertungen versehen und deshalb für Laien im Alltag relevant sind.
Aus diesem Grunde haben wir uns empirisch der Frage genähert, wie oder ob bestimmte Gruppen heute überhaupt noch Wörterbücher nutzen und ob sie sie bewusst von anderen sprachbezogenen Daten im Web unterscheiden. Es sollten empirische Daten gesammelt werden, um zu erfahren, wie DaF-Lernende tatsächlich arbeiten (und nicht was sie dazu retrospektiv sagen), vor allem um eine bessere empirische Basis für den Unterricht zur Verfügung zu haben. Zentrale Fragen dabei waren:
• Wie nutzen DaF-Lernende heutzutage lexikografische Ressourcen?
• Welche Suchstrategien wenden sie an?
• Differenzieren sie zwischen den unterschiedlichen Ressourcen?
• Welche Strategien erweisen sich als besonders erfolgreich?
Das Theonym Gott für den christlichen Gott weist im Frühneuhochdeutschen eine Reihe ungewöhnlicher grammatischer Eigenschaften auf, die in diesem Beitrag korpusbasiert untersucht werden. Zum einen hat es sich von seiner appellativischen Herkunft emanzipiert, wie beispielsweise am fehlenden Artikel deutlich wird, zum anderen nutzt es aber das für einen Namen ungewöhnliche es-Flexiv im Genitiv (Pauls, Gottes) und tritt, wie unbelebte Appellative, als Genitivattribut dominant nachgestellt auf (Haus __ Gottes). In der Schreibung bildet sich die Doppelmajuskel <GOtt> heraus, die es bis ins 18. Jh. visuell von der übrigen Lexik abhebt. Damit weist das Theonym im Frühneuhochdeutschen eine Sondergrammatik auf, in abgeschwächter Form besteht sie bis heute fort. Der Beitrag argumentiert dafür, dass es sich um ein Resultat besonderer kommunikativer Relevanz handelt.
Vorwort
(2020)
Dieser Beitrag beschreibt, welche Schritte nötig sind, um die Daten des Archivs der Grafen v. Platen (AGP) für Forschungsdateninfrastrukturen (FDI) zugänglich zu machen: die Daten konvertieren, die Metadaten extrahieren, Daten und Metadaten indizieren sowie die Datenmodelle für Daten und Metadaten so ergänzen, dass sie die Bestände des Archivs sinnvoll erfassen. Zugleich wird begründet, weshalb man überhaupt solchen Aufwand treiben sollte: nämlich, damit die Daten einem größeren Publikum zur Verfügung stehen und überdies mit Werkzeugen bearbeitet werden können, die in den Infrastrukturen zur Verfügung stehen, und damit eine weitere Verlinkung und Kombination mit externen Ressourcen erfolgen kann, sodass ein deutlicher Mehrwert entstehen kann.
Von Nichtstun und Erholung (an Weihnachten und zu anderen Zeiten) (aus der Rubrik Neuer Wortschatz)
(2020)
Von Gummistiefelmomenten
(2020)
Vernetzung des Linguistik-Portals mit Linguistic Linked Open Data: Die Rolle des BLL-Thesaurus
(2020)
Das Linguistik-Portal ist ein internetbasiertes Rechercheinstrument für die allgemeine und vergleichende Sprachwissenschaft, das einen einheitlichen Zugang zu fachspezifischen Informationen bietet. Eine innovative Komponente des Portals stellt die Vernetzung mit Linguistic Linked Open Data (LLOD) dar: Dadurch wird eine Brücke zwischen linguistischen Repositorien innerhalb der LLOD-Cloud und bibliografischen Daten geschlagen und eine Verbindung zu weiteren Sprachressourcen ermöglicht. Die Anbindung an die Cloud erfolgt, indem der Schlagwort-Thesaurus der Bibliography of Linguistic Literature (BLL) für LOD aufbereitet und mit relevanten Ontologien verlinkt wird.Der BLL-Thesaurus wird seit über 40 Jahren als integraler Bestandteil der gleichnamigen Bibliografie entwickelt. Darüber hinaus liefert er die Grundlage für die thematische Klassifikation und die normierten Schlagwörter des Linguistik-Portals. Das neue Anwendungsszenario stellt jedoch spezifische technische und konzeptuelle Anforderungen, die nur durch eine formale und inhaltliche Aufarbeitung erfüllt werden können.
Die zentrale Aufgabenstellung des Verbundprojektes TextTransfer (Pilot) war eine Machbarkeitsprüfung für die Entwicklung eines Text-Mining-Verfahrens, mit dem Forschungsergebnisse automatisiert auf Hinweise zu Transfer- und Impactpotenzialen untersucht werden können. Das vom Projektkoordinator IDS verantwortete Teilprojekt konzentrierte sich dabei auf die Entwicklung der methodischen Grundlagen, während der Projektpartner TIB vornehmlich für die Bereitstellung eines geeigneten Datensatzes verantwortlich war. Solchen automatisierten Verfahren liegen zumeist textbasierte Daten als physisches Manifest wissenschaftlicher Erkenntnisse zugrunde, die im Falle von TextTransfer (Pilot) als empirische Grundlage herangezogen wurden. Das im Verbund zur Anwendung gebrachte maschinelle Lernverfahren stützte sich ausschließlich auf deutschsprachige Projektendberichte öffentlich geförderter Forschung. Diese Textgattung eignet sich insbesondere hinsichtlich ihrer öffentlichen Verfügbarkeit bei zuständigen Gedächtnisorganisationen und aufgrund ihrer im Vergleich zu anderen Formaten wissenschaftlicher Publikation relativen strukturellen wie sprachlichen Homogenität. TextTransfer (Pilot) ging daher grundsätzlich von der Annahme struktureller bzw. sprachlicher Ähnlichkeit in Berichtstexten aus, bei denen der Nachweis tatsächlich erfolgten Transfers zu erbringen war. Im Folgenden wird in diesen Fällen von Texten bzw. textgebundenen Forschungsergebnissen mit Transfer- und Impactpotenzial gesprochen werden. Es wurde ferner postuliert, dass sich diese Indizien von sprachlichen Eigenschaften in Texten zu Projekten ohne nachzuweisenden bzw. ggf. auch niemals erfolgtem, aber potenziell möglichem Transfer oder Impact unterscheiden lassen. Mit einer Verifizierung dieser Annahmen war es möglich, Transfer- oder Impactwahrscheinlichkeiten in großen Mengen von Berichtsdaten ohne eingehende Lektüre zu prognostizieren.
Der vorliegende Beitrag betrachtet den Erwerb von Sprache im Kontext innerer Mehrsprachigkeit aus der Perspektive des Inputs, den Kinder durch Modellsprecher/-innen erhalten. Diese Art des Inputs, der u. a. durch Spracheinstellungen hervorgerufen wird und sich im tatsächlichen Varietätengebrauch manifestiert, ist im deutschsprachigen Raum bisher noch wenig untersucht worden. Die Ergebnisse einer empirischen Untersuchung von Spracheinstellungen und Varietätengebrauch in der an Kinder gerichteten Sprache in Österreich werden vorgestellt. Die Studie soll einen Beitrag zum besseren Verständnis von kindgerichteter Sprache im Kontext von innerer Mehrsprachigkeit leisten.
In our paper, we present a case study on the quality of concept relations in the manually developed terminological resource of grammis, an information system on German grammar. We assess a SKOS representation of the resource using the tool qSKOS, create a typology of the issues identified by the tool, and conduct a qualitative analysis of selected cases. We identify and discuss aspects that can motivate quality issues and uncover that ill-formed relations are frequently indicative of deeper issues in the data model. Finally, we outline how these findings can inform improvements in our resource’s data model, discussing implications for the machine readability of terminological data.
As a part of the ZuMult-project, we are currently modelling a backend architecture that should provide query access to corpora from the Archive of Spoken German (AGD) at the Leibniz-Institute for the German Language (IDS). We are exploring how to reuse existing search engine frameworks providing full text indices and allowing to query corpora by one of the corpus query languages (QLs) established and actively used in the corpus research community. For this purpose, we tested MTAS - an open source Lucene-based search engine for querying on text with multilevel annotations. We applied MTAS on three oral corpora stored in the TEI-based ISO standard for transcriptions of spoken language (ISO 24624:2016). These corpora differ from the corpus data that MTAS was developed for, because they include interactions with two and more speakers and are enriched, inter alia, with timeline-based annotations. In this contribution, we report our test results and address issues that arise when search frameworks originally developed for querying written corpora are being transferred into the field of spoken language.
The newest generation of speech technology caused a huge increase of audio-visual data nowadays being enhanced with orthographic transcripts such as in automatic subtitling in online platforms. Research data centers and archives contain a range of new and historical data, which are currently only partially transcribed and therefore only partially accessible for systematic querying. Automatic Speech Recognition (ASR) is one option of making that data accessible. This paper tests the usability of a state-of-the-art ASR-System on a historical (from the 1960s), but regionally balanced corpus of spoken German, and a relatively new corpus (from 2012) recorded in a narrow area. We observed a regional bias of the ASR-System with higher recognition scores for the north of Germany vs. lower scores for the south. A detailed analysis of the narrow region data revealed – despite relatively high ASR-confidence – some specific word errors due to a lack of regional adaptation. These findings need to be considered in decisions on further data processing and the curation of corpora, e.g. correcting transcripts or transcribing from scratch. Such geography-dependent analyses can also have the potential for ASR-development to make targeted data selection for training/adaptation and to increase the sensitivity towards varieties of pluricentric languages.
The newest generation of speech technology caused a huge increase of audio-visual data nowadays being enhanced with orthographic transcripts such as in automatic subtitling in online platforms. Research data centers and archives contain a range of new and historical data, which are currently only partially transcribed and therefore only partially accessible for systematic querying. Automatic Speech Recognition (ASR) is one option of making that data accessible. This paper tests the usability of a state-of-the-art ASR-System on a historical (from the 1960s), but regionally balanced corpus of spoken German, and a relatively new corpus (from 2012) recorded in a narrow area. We observed a regional bias of the ASR-System with higher recognition scores for the north of Germany vs. lower scores for the south. A detailed analysis of the narrow region data revealed – despite relatively high ASR-confidence – some specific word errors due to a lack of regional adaptation. These findings need to be considered in decisions on further data processing and the curation of corpora, e.g. correcting transcripts or transcribing from scratch. Such geography-dependent analyses can also have the potential for ASR-development to make targeted data selection for training/adaptation and to increase the sensitivity towards varieties of pluricentric languages.
In this article, we describe a user support solution for the digital humanities. As a case study, we show the development of the CLARIN-D Helpdesk from 2013 into the current support solution that has been extended for several other CLARIN-related software and projects and the DARIAH-ERIC. Furthermore, we describe a way towards a common support platform for CLARIAH-DE, which is currently in the final phase. We hope to further expand the help desk in the following years in order to act as a hub for user support and a central knowledge resource for the digital humanities not only in the German, but also in the European area and perhaps at some point worldwide.
This article deals with narratives of traumatic experiences of parental violence in childhood, told by adult narrators in the context of clinical adult attachment interviews. The study rests on a corpus of interviews with 20 patients suffering from fibromyalgia, who were interviewed in the context of psychodynamic psychotherapy. Nine of the patients reported repeated experiences of parental violence. The article focuses on extracts from two interviews, which provide for a maximal contrast concerning the practices of telling experiences of violence and which are ‘clear cases’ of the practices that are characteristic of the whole corpus. The main differences between the different ways of telling concern:
• With respect to the ascription of guilt and responsibility, parental violence is portrayed as legitimate pedagogic action versus as being evil-minded and guilty without rational justification.
• With respect to the process of the telling, we find narrative trajectories over which an initial vague gloss is increasingly unpacked by reports of highly violent actions versus narratives in which violence is overtly stated and morally ascribed from its very first mention.
Türkisch in Deutschland
(2020)
This article explores a sequence organizational phenomenon that results from the use of a loosely specifiable turn format (viz., That’s + wh-clause) for launching (next) sequences while at the same time connecting back to a prior turn. Using this practice creates a sequential juncture, i.e., a pivot-like nexus between one sequence and a next. In third position, such junctures serve to accomplish seamless sequential transitions from one sequence into a next by presenting the latter as locally occasioned. The practice may, however, also be deployed in second position to launch actions that have not been made relevant or provided for by the preceding action and exhibit response relevance themselves. The sequential junctures then become retro-sequential in character: They transform the projected trajectory of the sequence in progress and create interlocking sequential structures. These findings highlight that sequence is practice, while pointing to understudied interconnections between tying and sequentiality. Data are in English.
Twenty-two historical encyclopedias encoded in TEI: a new resource for the Digital Humanities
(2020)
This paper accompanies the corpus publication of EncycNet, a novel XML/TEI annotated corpus of 22 historical German encyclopedias from the early 18th to early 20th century. We describe the creation and annotation of the corpus, including the rationale for its development, suggested methodology for TEI annotation, possible use cases and future work. While many well-developed annotation standards for lexical resources exist, none can adequately model the encyclopedias at hand, and we therefore suggest how the TEI Lex-0 standard may be modified with additional guidelines for the annotation of historical encyclopedias. As the digitization and annotation of historical encyclopedias are settling on TEI as the de facto standard, our methodology may inform similar projects.
The paper presents a discussion on the main linguistic phenomena of user-generated texts found in web and social media, and proposes a set of annotation guidelines for their treatment within the Universal Dependencies (UD) framework. Given on the one hand the increasing number of treebanks featuring user-generated content, and its somewhat inconsistent treatment in these resources on the other, the aim of this paper is twofold: (1) to provide a short, though comprehensive, overview of such treebanks - based on available literature - along with their main features and a comparative analysis of their annotation criteria, and (2) to propose a set of tentative UD-based annotation guidelines, to promote consistent treatment of the particular phenomena found in these types of texts. The main goal of this paper is to provide a common framework for those teams interested in developing similar resources in UD, thus enabling cross-linguistic consistency, which is a principle that has always been in the spirit of UD.
In Theaterproben entwickeln Beteiligte gemeinsam eine Inszenierung, die zur Aufführung gebracht wird. Ein wesentliches Mittel dazu ist das Vorspielen von Teilen des Stücks und das anschließende Besprechen. Dies geschieht üblicherweise in Rollenteilung: Die Schauspielenden führen Teile des Stücks vor, während die Regie zuschaut und gegebenenfalls interveniert, woran sich Besprechungen anschließen können. Dieser Teil von Theaterproben, in dem abwechselnd vorgespielt und besprochen wird, haben wir Spielprobe genannt (siehe Einleitung zu diesem Themenheft). Eine wesentliche interaktionsorganisatorische Aufgabe von Spielproben besteht für die Beteiligten darin, Schauspielaktivitäten und Besprechungsaktivitäten miteinander zu verzahnen. Dies geschieht durch Transitionspraktiken, die das Spiel entweder unterbrechen oder wieder eröffnen. Der vorliegende Beitrag untersucht Transitionspraktiken in Spielproben als ein konstitutives Moment ihrer interaktiven Organisation. Fokussiert werden Praktiken, die das Spiel unterbrechen, so genannte Interventionen. Nach einer detaillierten Fallanalyse, die eine prototypische Transition vom Spiel ins Besprechen und zurück ins Spiel veranschaulicht (Kap. 4.1/4.2), widmet sich der Rest des Beitrags der Analyse einer Kollektion von Interventionen. Es zeigt sich, dass Interventionen normativen Orientierungen unterliegen und verwendete Praktiken hinsichtlich verschiedener Dimensionen (etwa Ursache/Grund der Intervention) systematisch variieren.
The coronavirus pandemic may be the largest crisis the world has had to face since World War II. It does not come as a surprise that it is also having an impact on language as our primary communication tool. In this short paper, we present three inter-connected resources that are designed to capture and illustrate these effects on a subset of the German language: An RSS corpus of German-language newsfeeds (with freely available untruncated frequency lists), a continuously updated HTML page tracking the diversity of the vocabulary in the RSS corpus and a Shiny web application that enables other researchers and the broader public to explore the corpus in terms of basic frequencies.
This paper describes the development of a systematic approach to the creation, management and curation of linguistic resources, particularly spoken language corpora. It also presents first steps towards a framework for continuous quality control to be used within external research projects by non-technical users, and discuss various domain and discipline specific problems and individual solutions. The creation of spoken language corpora is not only a time-consuming and costly process, but the created resources often represent intangible cultural heritage, containing recordings of, for example, extinct languages or historical events. Since high quality resources are needed to enable re-use in as many future contexts as possible, researchers need to be provided with the necessary means for quality control. We believe that this includes methods and tools adapted to Humanities researchers as non-technical users, and that these methods and tools need to be developed to support existing tasks and goals of research projects.
Towards Comprehensive Definitions of Data Quality for Audiovisual Annotated Language Resources
(2020)
Though digital infrastructures such as CLARIN have been successfully established and now provide large collections of digital resources, the lack of widely accepted standards for data quality and documentation still makes re-use of research data a difficult endeavour, especially for more complex resource types. The article gives a detailed overview over relevant characteristics of audiovisual annotated language resources and reviews possible approaches to data quality in terms of their suitability for the current context. Conclusively, various strategies are suggested in order to arrive at comprehensive and adequate definitions of data quality for this particular resource type.
We present recognizers for four very different types of speech, thought and writing representation (STWR) for German texts. The implementation is based on deep learning with two different customized contextual embeddings, namely FLAIR embeddings and BERT embeddings. This paper gives an evaluation of our recognizers with a particular focus on the differences in performance we observed between those two embeddings. FLAIR performed best for direct STWR (F1=0.85), BERT for indirect (F1=0.76) and free indirect (F1=0.59) STWR. For reported STWR, the comparison was inconclusive, but BERT gave the best average results and best individual model (F1=0.60). Our best recognizers, our customized language embeddings and most of our test and training data are freely available and can be found via www.redewiedergabe.de or at github.com/redewiedergabe.
This paper presents the corpus-based lexicographical prototype that was developed within the framework of the project Lexik des gesprochenen Deutsch (=LeGeDe) as a thirdparty funded project. Research results regarding the information offered in dictionaries have shown that there is a necessity for information on spoken lexis and its interactional functions. The resulting LeGeDe-prototype is based on these needs and desiderata and is thus an innovative example for the adequate representation of spoken language in online dictionaries. It is available online since September 2019 (https://www.owid.de/legede/). In the following sections, after first focusing on the presentation of the project’s goals, the data basis, the intended end user, and the applied methods, we will illustrate the microstructure of the prototype and the information provided in a dictionary entry based on the lemma eben. Finally, we will summarize innovative aspects that are important for the implementation of such a resource.
The lexicography of German
(2020)
This chapter discusses the main dictionaries of the German language as it is spoken and written in Germany, and also German as it is spoken and written in Austria, Switzerland, the eastern fringes of Belgium, and South Tyrol. It also briefly describes Pennsylvania German. Corpora and other language resources used in German dictionary-making are also presented. Finally, there is a discussion of some current issues in German lexicography, as well as future prospects.
For a long time, the lecture dominated performatively presented scientific communication. Given academic traditions, it is possible to make a connection between the lecture and classical rhetoric, a highly differentiated instrument of analysis. The tradition of the lecture has been perpetuated in the presentation of research results, first in the use of transparencies and subsequently through computer-based projections. Yet the use of media technology has also allowed new practices to emerge, including mediation practices hitherto neglected in the theory of rhetoric.
In this article, we examine the current situation of data dissemination and provision for CMC corpora. By that we aim to give a guiding grid for future projects that will improve the transparency and replicability of research results as well as the reusability of the created resources. Based on the FAIR guiding principles for research data management, we evaluate the 20 European CMC corpora listed in the CLARIN CMC Resource family, individuate successful strategies among the existing corpora and establish best practices for future projects. We give an overview of existing approaches to data referencing, dissemination and provision in European CMC corpora, and discuss the methods, formats and strategies used. Furthermore, we discuss the need for community standards and offer recommendations for best practices when creating a new CMC corpus.
This article makes an empirical and a methodological contribution to the comparative study of action. The empirical contribution is a comparative study of three distinct types of action regularly accomplished with the turn format du meinst x (“you mean/think x”) in German: candidate understandings, formulations of the other’s mind, and requests for a judgment. These empirical materials are the basis for a methodological exploration of different levels of researcher abstraction in the comparative study of action. Two levels are examined: the (coarser) level of conditionally relevant responses (what a response speaker must do to align with the action of the prior turn) and the (finer) level of “full alignment” (what a response speaker can do to align with the action of a prior turn). Both levels of abstraction provide empirically viable and analytically interesting descriptive concepts for the comparative study of action. Data are in German.
This article makes an empirical and a methodological contribution to the comparative study of action. The empirical contribution is a comparative study of three distinct types of action regularly accomplished with the turn format du meinst x (“you mean/think x”) in German: candidate understandings, formulations of the other’s mind, and requests for a judgment. These empirical materials are the basis for a methodological exploration of different levels of researcher abstraction in the comparative study of action. Two levels are examined: the (coarser) level of conditionally relevant responses (what a response speaker must do to align with the action of the prior turn) and the (finer) level of “full alignment” (what a response speaker can do to align with the action of a prior turn). Both levels of abstraction provide empirically viable and analytically interesting descriptive concepts for the comparative study of action. Data are in German.
The CMDI Explorer
(2020)
We present the CMDI Explorer, a tool that empowers users to easily explore the contents of complex CMDI records and to process selected parts of them with little effort. The tool allows users, for instance, to analyse virtual collections represented by CMDI records, and to send collection items to other CLARIN services such as the Switchboard for subsequent processing. The CMDI Explorer hence adds functionality that many users felt was lacking from the CLARIN tool space.
Wie wirkt sich das Schreiben kürzerer Texte in interaktionsorienterter Online-Kommunikation langfristig auf das Schreiben und die Qualität monologischer Texte aus? Auf diese Frage geht der Beitrag ein und präsentiert dazu empirische Daten aus einer Korpus-Vergleichsstudie, in der die Verwendung ausgewählter Konnektoren in einem Facebook-Korpus quantitativ und qualitativ analysiert und mit der Verwendung in dialogischen Texten von Wikipedia-Diskussionsseiten einerseits und in monologischen Texten wie Zeitungskommentaren und Schulertexten anderseits verglichen wurde. Die Analysen fokussieren darauf, wie Konnektoren in Online-Texten eingesetzt werden, ob sich spezifische Online-Verwendungen etablieren und ob „Spuren“ typischer Online-Verwendungen auch in normgebundener Umgebung nachweisbar sind.
Der Beitrag beschreibt einen Ansatz zur Qualitätsbewertung multimodaler Hypertexte und internetbasierter Interaktion. Das Modell fußt auf Ansätzen zur Bewertung von Textqualität in linear organisierten Schrifttexten, insbesondere dem Zürcher Textqualitätenraster, das bereits im prädigitalen Zeitalter für eine große empirische Untersuchung zum Schreibgebrauch in Aufsatztexten genutzt wurde. Der Beitrag beschreibt und begründet, welche Erweiterungen für multimodale Hypertexte und internetbasierte Interaktion erforderlich sind. Vertiefend wird dabei das Konzept der Kohärenz behandelt, das für lineare Texte und für Hypertexte gleichermaßen relevant ist. An Beispielen wird gezeigt, wie Hyperlinks als digitale Kohärenzbildungshilfen bei der Hypertextproduktion und beim interaktionsorientierten Schreiben eingesetzt werden. Die Kohärenzanalyse wird erweitert um zwei neue Aspekte: 1) die interaktionale Kohärenz zwischen Beiträgen verschiedener Personen in der digitalen Interaktion (z. B. beim Chatten oder in Online-Diskussionen) und 2) die multimodale Kohärenz zwischen Text-, Bild-, Audio- und Videoelementen.
Die Textqualität von Social-Media-Texten unterscheidet sich deutlich von der Textqualität traditioneller monologischer Texte, weshalb neue Textqualitätskategorien für Social-Media-Texte benötigt werden. Der Beitrag beschreibt zunächst, wie in einer Studie zwölf Schreibratgeber für Social-Media-Texte auf Belegstellen des Zürcher Textanalyserasters durchsucht wurden und wie darüber hinaus mittels qualitativer Inhaltsanalyse neue Textqualitätskategorien von Social-Media-Texten in den Ratgebern bestimmt und geordnet wurden. In einem zweiten Schritt werden die Ergebnisse dieser Studie aufgeführt, die Belegstellen des Zürcher Rasters und die aus der Studie gewonnenen und geordneten Kategorien einzeln erläutert. Mit den acht neuen Textqualitätskategorien für Social-Media-Texte wurde das Mannheimer Analyseraster angefertigt, das zur Analyse von Social-Media-Texten angewendet werden kann und den letzten Abschnitt des Beitrags bildet.
Text und Sprache digital
(2020)
T-Shirt Lexicography
(2020)
This article presents a study of graphic inscriptions on garments such as T-shirts, inscriptions that resemble entries in general monolingual dictionaries of German. Referred to here as "T-shirt lexicography," the collected material is analyzed in terms of its form, content, and function, focusing on lexicographical aspects. T-shirt lexicography is an example of vernacular lexicography inasmuch as different lexicographical traditions are assumed (correctly as well as erroneously) by the (unknown) authors, but also adapted to their specific needs.
Studying Lexical Dynamics and Language Change via Generalized Entropies: The Problem of Sample Size
(2020)
Recently, it was demonstrated that generalized entropies of order α offer novel and important opportunities to quantify the similarity of symbol sequences where α is a free parameter. Varying this parameter makes it possible to magnify differences between different texts at specific scales of the corresponding word frequency spectrum. For the analysis of the statistical properties of natural languages, this is especially interesting, because textual data are characterized by Zipf’s law, i.e., there are very few word types that occur very often (e.g., function words expressing grammatical relationships) and many word types with a very low frequency (e.g., content words carrying most of the meaning of a sentence). Here, this approach is systematically and empirically studied by analyzing the lexical dynamics of the German weekly news magazine Der Spiegel (consisting of approximately 365,000 articles and 237,000,000 words that were published between 1947 and 2017). We show that, analogous to most other measures in quantitative linguistics, similarity measures based on generalized entropies depend heavily on the sample size (i.e., text length). We argue that this makes it difficult to quantify lexical dynamics and language change and show that standard sampling approaches do not solve this problem. We discuss the consequences of the results for the statistical analysis of languages.
Studenten, StudentInnen, Studierende? Aktuelle Verwendungspräferenzen bei Personenbezeichnungen
(2020)
Im Beitrag werden Meinungen und Einstellungen zur geschlechtergerechten Sprache dargestellt. Dazu werden verschiedene Möglichkeiten für die Bezeichnung von Personen, die studieren, in den Blick genommen. Diese werden zunächst beschrieben und ihre Frequenzen im Deutschen Referenzkorpus ausgewertet. Anschließend werden explizit die Meinungen und Einstellungen behandelt. Dafür werden die Daten der Deutschland-Erhebung 2008 und der Deutschland-Erhebung 2017 ausgewertet. In der aktuellen Erhebung wurden laienlinguistische Verwendungspräferenzen von Personenbezeichnungen erhoben; präferiert wird von den meisten Befragten die Partizipialform (den Studierenden). Die Verwendungspräferenzen hangen vor allem mit dem Alter der Befragten und ihrer politischen Orientierung zusammen. Insgesamt zeigt sich jedoch, dass das Thema der geschlechtergerechten Sprache für die meisten Befragten nur eine untergeordnete Rolle spielt.
Usually, weak inflection of an attributive or nominalized adjective occurs if the adjective is preceded by an inflected determiner: mit diesem technischen Aufwand (‘at great technical expense’). Otherwise, the inflection of the adjective is strong: mit technischem Aufwand. Following this rule of thumb, we would expect strong inflection of an adjective following another adjective whenever the determiner is missing: mit hohem technischem Aufwand. But many German speakers opt for a weak dative singular ending -en following the strong ending -em on the first adjective: mit hohem technischen Aufwand. This chapter shows which explanatory variables play a role in this variation within standard German.