Refine
Year of publication
- 2020 (139) (remove)
Document Type
- Part of a Book (139) (remove)
Language
- German (113)
- English (25)
- Multiple languages (1)
Has Fulltext
- yes (139)
Keywords
- Deutsch (47)
- Korpus <Linguistik> (25)
- Mundart (19)
- Sprachgebrauch (15)
- Dialektologie (14)
- Grammatik (13)
- Social Media (12)
- Sprachvariante (10)
- Forschungsdaten (9)
- Soziolinguistik (9)
Publicationstate
- Zweitveröffentlichung (98)
- Veröffentlichungsversion (23)
- Postprint (9)
Reviewstate
- (Verlags)-Lektorat (111)
- Peer-Review (16)
Publisher
- Narr Francke Attempto (40)
- de Gruyter (36)
- European Language Resources Association (6)
- Heidelberg University Publishing (5)
- Universitätsverlag Rhein-Ruhr (4)
- Association for Computational Linguistics (2)
- Benjamins (2)
- Buske (2)
- Dudenverlag (2)
- Hempen (2)
Wie wirkt sich das Schreiben kürzerer Texte in interaktionsorienterter Online-Kommunikation langfristig auf das Schreiben und die Qualität monologischer Texte aus? Auf diese Frage geht der Beitrag ein und präsentiert dazu empirische Daten aus einer Korpus-Vergleichsstudie, in der die Verwendung ausgewählter Konnektoren in einem Facebook-Korpus quantitativ und qualitativ analysiert und mit der Verwendung in dialogischen Texten von Wikipedia-Diskussionsseiten einerseits und in monologischen Texten wie Zeitungskommentaren und Schulertexten anderseits verglichen wurde. Die Analysen fokussieren darauf, wie Konnektoren in Online-Texten eingesetzt werden, ob sich spezifische Online-Verwendungen etablieren und ob „Spuren“ typischer Online-Verwendungen auch in normgebundener Umgebung nachweisbar sind.
Die sprachliche Situation im Kanton Graubünden, wo eine Vielzahl von italienischen, romanischen und deutschen Varietäten in lang andauerndem Kontakt stehen, ist bisher nur wenig beschrieben, eine wahrnehmungslinguistische Untersuchung steht noch ganz aus. Ausgehend von der Annahme, dass Salienz abhängig vom eigenen sprachlichen System und vom Sprecherwissen ist, wurde ein Experiment konzipiert, bei dem Hörer aus Graubünden und Zürich Aufnahmen aus drei Bündner Orten, in denen Rätoromanisch und Deutsch in unterschiedlichen Kontaktverhältnissen stehen, hören und kommentieren sollten. Dabei konnte gezeigt werden, dass Bündner aufgrund ihres Sprecherwissens über die Variation in Graubünden andere Merkmale wahrgenommen und die Aufnahmen anders charakterisiert haben als Zürcher.
In diesem Beitrag werden neue, repräsentative Daten zur arealen Variation in Deutschland vorgestellt, die das Leibniz-Institut für Deutsche Sprache im Rahmen der Innovationsstichprobe des Sozio-ökonomischen Panels (SOEP) des Deutschen Instituts für Wirtschaftsforschung (DIW) in der Befragungsrunde 2017/2018 erhoben hat. Zum einen wurde die Dialektkompetenz abgefragt; überindividuell zeigt sich hier das bekannte Nord-Süd-Gefälle, beim individuellen Grad der Kompetenz der Dialektsprecher gibt es aber regional nur geringe Unterschiede. Zum anderen wurden die Bewertungen von Dialekten erhoben; hier werden Norddeutsch und Bayerisch besonders positiv, Sächsisch hingegen besonders negativ bewertet, wobei regionale Muster eine Rolle spielen. Auffällig ist ferner die bundesweit sehr einheitlich positive Bewertung des Hochdeutschen.
Die Sprache in Sozialen Medien zeigt auf allen Ebenen eine hohe Variabilität und wurde daher als eine Mischung verschiedener Register (Tagliamonte/Denis 2008) analysiert, die sowohl informelle als auch formelle Formen umfassen. Im Gegensatz zu herkömmlichen schriftlichen Medien, wie z.B. Zeitungstexten, sind Soziale Medien wie Chat, Twitter, Forumsdiskussionen, Facebook oder Blogs für diverse Autor/innen zugänglich, sind spontaner, und unterliegen weniger den sprachlichen Standards. Ein Teil der in diesen Kommunikationskanälen gefundenen Variabilität wird häufig auf Fehler zurückgeführt, es gibt jedoch viele Phänomene, die eigenen Regeln folgen. In Bezug auf das Kontinuum von konzeptueller/medialer Mündlichkeit/Schriftlichkeit (Koch/Oesterreicher 1985) befinden sich die meisten Social-Media-Beitrage in der Mitte des konzeptuellen Oralitätskontinuums, obwohl deren genaue Position bisher weitgehend unbestimmt ist. Soweit Nicht-Standard-Merkmale untersucht wurden, wurde meist die Orthographie, Morphologie, das Lexikon und die Syntax (z.B. Abkürzungen, Emoticons, Ellipsis) berücksichtigt.
Im Gegensatz dazu wählen wir einen pragmatischen, diskursorientierten Standpunkt: Welche Diskursstrategien wählen Sprecher/innen in Sozialen Medien und wie unterscheiden sich diese von bisher untersuchten Medienformen?
Der Beitrag diskutiert Interpunktion als ein Teilsystem des Deutschen, an dem das Verhältnis zwischen Sprachwandel und dem gesamtgesellschaftlichen Wandelprozess der Digitalisierung besonders gut ablesbar ist. Der Gebrauch von Interpunktionszeichen im interaktionsorientierten digitalen Schreiben ist gekennzeichnet durch eine distributive Umstrukturierung des Interpunktionsinventars sowie durch Prozesse der Pragmatikalisierung, Syntaktisierung und Ikonizität, die verschiedene Satzzeichen betreffen. In der privaten und öffentlichen metasprachlichen Reflexion zeigen sich eine nicht-binäre Wahrnehmung digitaler Interpunktion und eine Registrierung einzelner Interpunktionspraktiken mit sozialen Gruppen. Die Verlagerung interpersonaler Kommunikation auf digitale Schriftlichkeit führt insgesamt zu einer Ausfächerung des interaktionalen Umgangs mit Interpunktion und zur Herausbildung domänenspezifischer Interpunktionsstile.
Der Beitrag bespricht in Abgrenzung zum vorherrschenden onomasiologischen Paradigma der Terminologielehre die Vor- und Nachteile einer semasiologischen Terminologiearbeit und -modelierung. Hierbei wird davon ausgegeangen, dass terminologische Einheiten diskursiv konstituiert werden und dass aus einer relationalen Beschreibung semasiologisch verstandener terminologischer Einheiten eine begriffsorientierte Beschreibung emergent hervorgeht. Zu diesem Zweck empfiehlt der Beitrag ein Prinzip der Zeichenorientierung, mit dem zudem die theoretische Beschreibung von terminologiestrukturierenden Beziehungstypen vereinheitlicht werden kann.
Die Kernaufgabe der Projektgruppe des DWDS besteht darin, den in den Korpora enthaltenen Wortschatz lexikografisch und korpusbasiert zu beschreiben. In der modernen Lexikografie werden die Aussagen zu den sprachlichen Aspekten und Eigenschaften der beschriebenen Wörter und zu Besonderheiten ihrer Verwendung auf Korpusevidenz gestutzt. Empirisch können riesige Textsammlungen Hypothesen genauer oder ausführlicher belegen. Dabei wird deutlich, wie vielfältig Sprache im Gebrauch tatsachlich realisiert wird. Zu diesem Zweck bieten wir auf der DWDS-Plattform neben den zeitlich und nach Textsorten ausgewogenen Kernkorpora und den Zeitungskorpora eine Reihe von Spezialkorpora an, die hinsichtlich ihres Gegenstandes oder ihrer sprachlichen Charakteristika von den erstgenannten Korpora abweichen. Die Webkorpora bilden einen wesentlichen Bestandteil dieser Spezialkorpora.
Der Beitrag behandelt die Frage, wie sich das spezifisch Neue internetbasierter Kommunikation unter linguistischer Perspektive fassen und in Traditionen des sprachlichen Handelns einordnen lässt. Es wird gezeigt, dass sich die internetbasierte Kommunikation weder als Interaktion noch als Textkommunikation hinreichend beschreiben lasst, zugleich aber Merkmale mit beiden Formen teilt. Mit dem Konzept der Textformen-basierten Interaktion wird ein Vorschlag formuliert, wie dieses Dilemma aufgelöst werden kann: Das Innovationspotenzial internetbasierter Kommunikationstechnologien liegt gerade darin, dass diese durch Indienstnahme von Textformen die Möglichkeiten von Interaktion erweitern. Das hat einerseits Konsequenzen fur die linguistische Analyse und lässt sich andererseits fruchtbar machen fur die Entwicklung von Standards fur die Repräsentation von Korpora.
Die MoCoDa 2 (https://db.mocoda2.de) ist eine webbasierte Infrastruktur für die Erhebung, Aufbereitung, Bereitstellung und Abfrage von Sprachdaten aus privater Messenger-Kommunikation (WhatsApp und ähnliche Anwendungen). Zentrale Komponenten bilden (1) eine Datenbank, die für die Verwaltung von WhatsApp-Sequenzen eingerichtet ist, die von Nutzer/innen gespendet und für linguistische Recherche- und Analysezwecke aufbereitet wurden, (2) ein Web-Frontend, das die Datenspender/innen dabei unterstützt, gespendete Sequenzen um analyserelevante Metadaten anzureichern und zu pseudonymisieren, und (3) ein Web-Frontend, über das die Daten für Zwecke in Forschung und Lehre abgefragt werden können. Der Aufbau der MoCoDa-2-Infrastruktur wurde im Rahmen des Programms „Infrastrukturelle Forderung für die Geistes- und Gesellschaftswissenschaften“ vom Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen gefordert. Ziel des Projekts ist es, ein aufbereitetes Korpus zur Sprache und Interaktion in der deutschsprachigen Messenger-Kommunikation bereitzustellen, das speziell auch für qualitative Untersuchungen eine wertvolle Grundlage bildet.
Einleitung
(2020)
affiziertes Objekt
(2020)
Effiziertes Objekt
(2020)
This chapter focuses on the formation of adverbs from a corpuslinguistic perspective, providing an overview of adverb formation patterns in German that includes frequencies and hints to productivity as well as combining quantitative methods and theoretically founded hypotheses to address questions that concern possible grammaticalization paths in domains that are formally marked by prepositional elements or inflectional morphology (in particular, superlative or superlative-derived forms). Within our collection of adverb types from the project corpus, special attention is paid to adverbs built from primary prepositions. The data suggest that generally, such adverb formation involves the saturation of the internal argument slot of the relation-denoting preposition. In morphologically regular formations with the preposition in final position, pronominal forms like da ‘there’, hier ‘here’, wo ‘where’ as well as hin ‘hither’ and her ‘thither’ serve to derive adverbs. On the other hand, morphologically irregular formations with the preposition – in particular: zu ‘to’ or vor ‘before, in front of’ – in initial posi-tion show traits of syntactic origin such as (remnants of) inflectional morphology. The pertaining adverb type dominantly saturates the internal argument slot by means of universal quantification that is part and parcel as well of the derivation of superlatives and demonstrably fuels the productivity of the pertaining formation pattern.
Corpus REDEWIEDERGABE
(2020)
This article presents the corpus REDEWIEDERGABE, a German-language historical corpus with detailed annotations for speech, thought and writing representation (ST&WR). With approximately 490,000 tokens, it is the largest resource of its kind. It can be used to answer literary and linguistic research questions and serve as training material for machine learning. This paper describes the composition of the corpus and the annotation structure, discusses some methodological decisions and gives basic statistics about the forms of ST&WR found in this corpus.
Die Sozialen Medien haben sich zunehmend zu einem Raum öffentlicher Meinungsbildung entwickelt. Die öffentliche Diskussion um Hass-Kommentare im Internet macht deutlich, dass Soziale Medien über die epistemische Dimension rationaler Diskurse hinaus emotionalisierte, strategische und identitätsorientierte Diskurse begünstigen, die das deliberative Paradigma öffentlicher Meinungsbildung und die Prinzipien politischer Rationalität und logischen Argumentierens in Frage stellen. Der Beitrag untersucht am Beispiel der drei Plattformen Facebook, Twitter und Youtube den Zusammenhang von Plattformlogik und Interaktionsstrukturen mit einem Schwerpunkt auf den Diskurspraktiken des Emotionalisierens. Es wird auch die Frage geklärt, inwiefern die vorhandenen Ansätze der Konversations- und Dialoganalyse auf Interaktionen in Sozialen Medien anwendbar sind.
Dialekt und Regiolekt in der politischen Kommunikation: Code-Switching, -Mixing und -Shifting
(2020)
Politische Kommunikation erfolgt in Bayern im Kontinuum zwischen Standardsprache, Regiolekt und Basisdialekt. Dieser Wechsel zwischen den Sprechlagen in der bayerischen Kommunalpolitik ist Gegenstand dieses Beitrags. Das zugrundeliegende Korpus besteht aus Aufzeichnungen von Stadtratssitzungen in zwei Kleinstädten im mittelbairischen Dialektgebiet Niederbayerns. Dieser Beitrag will die im Untersuchungsmaterial festgestellten Wechselphänomene des Code-Switching, -Mixing und -Shifting anhand der sprecherinternen (interindividuellen) Schwankungen des Abstands zur Standardsprache sowohl phonetisch, als auch unter Berücksichtigung der innersprachlichen Ebenen Lexik, Morphologie und Syntax sowie unter dem Aspekt der Sprecherstrategien untersuchen.
Türkisch in Deutschland
(2020)
Interaktionale Semantik
(2020)
Der Beitrag stellt zunächst die drei grundlegenden methodischen Verfahren der Konversationsanalyse und der mittlerweile deren Vorgehen folgenden diskursiven Psychologie dar: die Transkription, die detaillierte Sequenzanalyse am Einzelfall und die (komparative) Analyse von Datenkollektionen. Nach einer Übersicht über grundlegende Befunde zur Organisation von Interaktionen wird auf drei psychologische Untersuchungsbereiche eingegangen: Die Konstitution von Identität in Gesprächen, die Rolle von Kognitionen in der sozialen Interaktion und die Erforschung von Psychotherapiegesprächen.
Vernetzung des Linguistik-Portals mit Linguistic Linked Open Data: Die Rolle des BLL-Thesaurus
(2020)
Das Linguistik-Portal ist ein internetbasiertes Rechercheinstrument für die allgemeine und vergleichende Sprachwissenschaft, das einen einheitlichen Zugang zu fachspezifischen Informationen bietet. Eine innovative Komponente des Portals stellt die Vernetzung mit Linguistic Linked Open Data (LLOD) dar: Dadurch wird eine Brücke zwischen linguistischen Repositorien innerhalb der LLOD-Cloud und bibliografischen Daten geschlagen und eine Verbindung zu weiteren Sprachressourcen ermöglicht. Die Anbindung an die Cloud erfolgt, indem der Schlagwort-Thesaurus der Bibliography of Linguistic Literature (BLL) für LOD aufbereitet und mit relevanten Ontologien verlinkt wird.Der BLL-Thesaurus wird seit über 40 Jahren als integraler Bestandteil der gleichnamigen Bibliografie entwickelt. Darüber hinaus liefert er die Grundlage für die thematische Klassifikation und die normierten Schlagwörter des Linguistik-Portals. Das neue Anwendungsszenario stellt jedoch spezifische technische und konzeptuelle Anforderungen, die nur durch eine formale und inhaltliche Aufarbeitung erfüllt werden können.
Die Terminologielehre(speziell die Terminologielehre nach Eugen Wüster)liefert eine Basis und Methoden für terminologische Anwendungen in der Praxis. Viele Unternehmen und Institutionen richten ihr Terminologiemanagement danach aus. Nach einer kurzen Vorstellung der entsprechenden Ziele und Prozesse werden wichtige Typen von Begriffssystemen dargestellt, und es wird aufgezeigt, welche positiven Effekte das Erarbeiten von Begriffssystemen auf die Qualität der Terminologiearbeit hat. Als nächster inhaltlicher Schwerpunkt werden Möglichkeiten und Besonderheiten der Terminologieverwaltung unter besonderer Berücksichtigung der Eintragsmodellierung in terminologischen Datenbanken erörtert. Den Abschluss der Betrachtungen bildet die Zusammenführung der zwei Bereiche: Welche Optionen stehen für die Repräsentation von Begriffssystemen in Terminologieverwaltungssystemen zur Verfügung bzw. können dort umgesetzt werden?
In dem Beitrag werden Kommunikationsstörungen in Sportvideointerviews im Ukrainischen und Deutschen im Zeitraum von 2000-2018 untersucht. Für die Typologie der Kommunikationsstörungen werden der Faktor ihres Auftretens und die strukturelle Ebene ihrer Entwicklung betrachtet. Dabei zeigt sich, dass je nach Typ und Besonderheiten der Kommunikationsstörungen Sportvideointerviews mehr Gemeinsames als Unterschiedliches in beiden Sprachen aufweisen. Sowohl kommunikative als auch rein sprachliche Störungen treten bei den Interviewern und Interviewten im Ukrainischen und bei den Interviewten als Nichtmuttersprachler im Deutschen auf.
Kommunikative Misserfolge im Deutschen für ukrainische Deutschlerner aus interkultureller Sicht
(2020)
Begriffe, die meist als nulläquivalente Lexik (Lakunen) für ukrainische Deutschlerner gelten und somit Schwierigkeiten bereiten sowie im Allgemeinen zu Misserfolgen zwischen Kommunizierenden führen können, stehen im Mittelpunkt der folgenden Ausführungen. Um sie zu vermeiden, werden einige Themen und Aufgaben zur Erweiterung der sozial-kommunikativen und interkulturellen Kompetenzen vorgeschlagen.
Russisch
(2020)
This article examines the language contact situation as well as the language attitudes of the Caucasian Germans, descendants of German-born inhabitants of the Russian Empire and the Soviet Union who emigrated in 1816/17 to areas of Transcaucasia. After deportations and migrations, the group of Caucasian Germans now consists of those who have since emigrated to Germany and those who still live in the South Caucasus. It’s the first time that sociolinguistic methods have been used to record data from the generation who experienced living in the South Caucasus and in Germany as well as from two succeeding generations. Initial results will be presented below with a focus on the language contact constellations of German varieties as well as on consequences of language contact and language repression, which both affect language attitudes.
Einleitend stellt der Beitrag unter Bezugnahme auf die Jahrestagungen des Leibniz-Instituts für Deutsche Sprache von 2019 und 1999 die Bezeichnungen Soziale Medien und neue Medien gegenüber. Dann steht die schriftbasierte Whats-App-Kommunikation im Fokus, es werden aber auch Beispiele aus anderen Kommunikationsformen angeführt (z.B. Zeitungsartikel auf Facebook, Texte aus der Unternehmenskommunikation). Gezeigt werden soll, wie sich die Verwendung von Emojis in diesen Texten gestaltet. Im Anschluss daran geht es um die Frage, welchen Stellenwert das Schreiben in Sozialen Medien in der Schule hat und welchen Stellenwert es künftig haben wird. Diese Frage leitet über zu dem im Titel unter Perspektiven angedeuteten Blick in die Zukunft: Hier wird zum einen diskutiert, ob die Popularität von Emojis noch zunehmen wird, zum anderen wird gefragt, ob das digitale Schreiben in Zukunft möglicherweise von anderen Praktiken abgelöst wird.
Even though the use of several languages has become more common in modern societies, it is important to find a common language in order to communicate economically (by the way, also with regard to economic success). So, of course, it is an advantage and a basic request in our national societies to be able to communicate by means of the national language(s). But looking a bit closer at the communicative demands of today one sees that there is a growing need to react to internal variation, and that a modern linguistic identity not only covers that fact, but also the fact, that English – in different forms – is part of a linguistic spectrum fitting a modern European communicative life. In the last years a communicative pattern is developing within an elite group of young academically educated people that is based on the use of English only, more or less ignoring the connection to the national linguistic surroundings, somehow kind of an alternative monolingualism. But looking at the communicative needs in our complex societies losing the ability to cope with different linguistic options in different communicative situations and to integrate this possibility into your linguistic identity is a rather restricted option – also in economic terms. And this even holds not taking into account the linguistic effect of modern migration.
Dieser Beitrag untersucht auf der Basis von Dialekt-Standard-Übersetzungen und einem Matched-Guise-Experiment bei 108 Personen, die im mittelbairischen Raum wohnhaft sind und Deutsch als Erst- oder Zweitsprache verwenden, den Zusammenhang zwischen Dialektkompetenz und Dialektbewertungen. Die Ergebnisse weisen darauf hin, dass Variationskompetenz auch im Zweitspracherwerb erreicht wird und dass die Bewertung von Dialekt stark von der individuellen Dialektkompetenz und weniger von einer kategorisch angelegten Sprachgruppenzugehörigkeit (Deutsch als Erst- vs. Zweitsprache) beeinflusst wird.
The present paper outlines the projected second part of the Corpus Query Lingua Franca (CQLF) family of standards: CQLF Ontology, which is currently in the process of standardization at the International Standards Organization (ISO), in its Technical Committee 37, Subcommittee 4 (TC37SC4) and its national mirrors. The first part of the family, ISO 24623-1 (henceforth CQLF Metamodel), was successfully adopted as an international standard at the beginning of 2018. The present paper reflects the state of the CQLF Ontology at the moment of submission for the Committee Draft ballot. We provide a brief overview of the CQLF Metamodel, present the assumptions and aims of the CQLF Ontology, its basic structure, and its potential extended applications. The full ontology is expected to emerge from a community process, starting from an initial version created by the authors of the present paper.
Gegenstand dieses Beitrags ist die Entwicklung des graphentheoretischen Analysetools Laniakea, das zur Visualisierung von Phänomenen und Veränderungen in terminologischen Netzwerken entwickelt wurde. Wir führen theoretische Grundlagen, Designentscheidungen und technische Details der Implementierung des Tools aus. Darüber hinaus wird auch eine Beschreibung von Erfahrungen im Fokus des Beitrages stehen, die bei der Anwendung von Laniakea bei der Überarbeitung der terminologischen Ressourcen des Grammatischen Informationssystems grammis, gesammelt wurden.
„Die vo hinge füüre“ – Sprachspott in der Nordwestschweiz am Beispiel der Velarisierung von mhd. nd
(2020)
Der vorliegende Aufsatz untersucht interdialektalen Sprachspott exemplarisch anhand des lautlichen Phänomens der Velarisierung von mhd. nd zu [ŋ]. Es wird einerseits mithilfe einer qualitativen Auswertung von metasprachlichen Laienkommentaren gezeigt, wie Sprachspott von Betroffenen wahrgenommen wird, und andererseits anhand von quantitativen Auswertungen der tatsächliche Sprachgebrauch des verspotteten Merkmals dargestellt. Daraus geht hervor, dass insbesondere junge Pendler/-innen den Sprachspott als negativ empfinden – und es sind denn auch vor allem die jungen Pendler/-innen, die die niedrigsten Velarisierungswerte in der Abfrage verzeichnen. Die Ergebnisse der Untersuchung liefern Evidenz dafür, dass nicht etwa das alleinige Vorkommnis von Sprachspott das Sprachverhalten beeinflusst, sondern dass die individuelle Einstellung der Betroffenen zum erlebten Spott ausschlaggebend ist für das jeweilige Sprachverhalten.
Dieser Beitrag beschreibt, welche Schritte nötig sind, um die Daten des Archivs der Grafen v. Platen (AGP) für Forschungsdateninfrastrukturen (FDI) zugänglich zu machen: die Daten konvertieren, die Metadaten extrahieren, Daten und Metadaten indizieren sowie die Datenmodelle für Daten und Metadaten so ergänzen, dass sie die Bestände des Archivs sinnvoll erfassen. Zugleich wird begründet, weshalb man überhaupt solchen Aufwand treiben sollte: nämlich, damit die Daten einem größeren Publikum zur Verfügung stehen und überdies mit Werkzeugen bearbeitet werden können, die in den Infrastrukturen zur Verfügung stehen, und damit eine weitere Verlinkung und Kombination mit externen Ressourcen erfolgen kann, sodass ein deutlicher Mehrwert entstehen kann.
We present web services which implement a workflow for transcripts of spoken language following the TEI guidelines, in particular ISO 24624:2016 “Language resource management – Transcription of spoken language”. The web services are available at our website and will be available via the CLARIN infrastructure, including the Virtual Language Observatory and WebLicht.
♀ ☺ = ♂ ☺? Oder: Das Gelächter der Geschlechter 2.0: Emojigebrauch in der WhatsApp-Kommunikation
(2020)
Praktiken des 'doing', 'undoing' und 'indexing' von Gender finden sich auch in der computervermittelten Kommunikation, und es ist zu erwarten, dass sie sich dort ganz besonders im Gebrauch von Emojis niederschlagen. Zu erwarten ist dies, weil Emojis ein wichtiges Mittel zur Hervorbringung von Nähe, Emotionalität und Gruppenzugehörigkeit sind, und Gender ist ein Parameter, der bei diesen Aspekten eine Rolle spielt. In dem vorliegenden Beitrag soll auf der Basis der Mobile Communication Database 2 (MoCoDa2), einer Datenbank mit WhatsApp-Interaktionen, aus quantitativer und qualitativer Perspektive gefragt werden, welche Gemeinsamkeiten und Unterschiede sich im Emojigebrauch von Männern und Frauen finden lassen.
In this article, we examine the current situation of data dissemination and provision for CMC corpora. By that we aim to give a guiding grid for future projects that will improve the transparency and replicability of research results as well as the reusability of the created resources. Based on the FAIR guiding principles for research data management, we evaluate the 20 European CMC corpora listed in the CLARIN CMC Resource family, individuate successful strategies among the existing corpora and establish best practices for future projects. We give an overview of existing approaches to data referencing, dissemination and provision in European CMC corpora, and discuss the methods, formats and strategies used. Furthermore, we discuss the need for community standards and offer recommendations for best practices when creating a new CMC corpus.
Südtirol ist eine mehrsprachige italienische Provinz, in der die Verwendung unterschiedlicher Sprachen, besonders Deutsch und Italienisch, sowie der lokalen deutschen Dialekte in der mündlichen Kommunikation in formalen wie informalen Sprechsituationen einen hohen gesellschaftlichen Stellenwert hat. Mit der Frage, welche Sprachen bzw. Varietäten in der schriftlichen Alltagskommunikation verwendet werden und welche soziolinguistischen Faktoren dabei eine Rolle spielen, hat sich das Projekt DiDi befasst, in dem die Sprach- und Varietätenverwendung in Facebook-Texten näher untersucht wurden. Dabei stellte sich unter anderem heraus, dass das Schreiben im Dialekt besonders unter Jugendlichen weit verbreitet ist (Glaznieks/Frey 2018). Mithilfe des aus diesem Projekt entstandenen und für wissenschaftliche Nutzung frei zugänglichen Facebook-Korpus kann die Sprach- und Varietätenverwendung Südtiroler Facebooknutzer/innen in der internetbasierten Kommunikation aus unterschiedlichen linguistischen Perspektiven untersucht werden.
Blogg Dir deinen Urlaub nach Tunesien! Zur Erläuterung des Musters [VImp PROPReflexivDat NPAkk]
(2020)
In diesem Beitrag soll das Muster [VImp PROPReflexivDat NPAkk] semantisch und syntaktisch erläutert werden. Dieses Muster, das semantisch mit Verben des Erwerbens wie anschaffen korreliert, wird auch im Zusammenhang mit Kommunikationsverben wie bloggen und facebooken sowie mit dem Kontaktverb rubbeln belegt. Mithilfe des Konzeptes der Koerzion bzw. der semantischen Anpassung soll das Kovorkommen des erwänhten Musters mit diesen Verben beschrieben und erklärt werden. Als empirische Quelle dient das Korpus für das Deutsche 2012 und 2014 aus den Corpora from the Web. Die vorliegende Untersuchung ist im Rahmen meiner Dissertationsarbeit zum Thema Argumentstruktur und Bedeutung medialer Kommunikationsverben des Deutschen und des Spanischen im Sprachvergleich durchgeführt worden.
The newest generation of speech technology caused a huge increase of audio-visual data nowadays being enhanced with orthographic transcripts such as in automatic subtitling in online platforms. Research data centers and archives contain a range of new and historical data, which are currently only partially transcribed and therefore only partially accessible for systematic querying. Automatic Speech Recognition (ASR) is one option of making that data accessible. This paper tests the usability of a state-of-the-art ASR-System on a historical (from the 1960s), but regionally balanced corpus of spoken German, and a relatively new corpus (from 2012) recorded in a narrow area. We observed a regional bias of the ASR-System with higher recognition scores for the north of Germany vs. lower scores for the south. A detailed analysis of the narrow region data revealed – despite relatively high ASR-confidence – some specific word errors due to a lack of regional adaptation. These findings need to be considered in decisions on further data processing and the curation of corpora, e.g. correcting transcripts or transcribing from scratch. Such geography-dependent analyses can also have the potential for ASR-development to make targeted data selection for training/adaptation and to increase the sensitivity towards varieties of pluricentric languages.
The theme of the AFinLA 2020 Yearbook Methodological turns in applied language studies is discussed in this introductory article from three interrelated perspectives, variously addressed in the three plenary presentations at the AFinLA Autumn Symposium 2019 as well as in the thirteen contributions to the yearbook. In the first set of articles presented, the authors examine the role and impact of technological development on the study of multimodal digital and non-digital contexts and discourses and ensuing new methods. The second set of studies in the yearbook revisits issues of language proficiency, critically discussing relevant concepts and approaches. The third set of articles explores participation and participatory research approaches, reflecting on the roles of the researcher and the researched community.
Esipuhe/Preface
(2020)
Texte aus Sozialen Medien finden in linguistischen Diskursanalysen bisher noch wenig Berücksichtigung. Viele Diskursanalysen konzentrieren sich auf Zeitungstexte als Untersuchungsgegenstände. Dieser Beitrag unterbreitet einen Vorschlag zur Überwindung dieses Newspaper Bias, um das Programm und das Methodeninventar der Diskurslinguistik am Beispiel der Wikipedia hin zu digitalen Diskursanalysen zu erweitern. Neben den besonderen Eigenschaften digitaler Diskurse wird die Bedeutung digitaler Objekte (v.a. Links) in den Diskursfragmenten der Wikipedia thematisiert. Zuletzt wird ein Analysemodell präsentiert, das einen umfassenden Rahmen für die Untersuchung von digitalen Diskursen bietet.
Twenty-two historical encyclopedias encoded in TEI: a new resource for the Digital Humanities
(2020)
This paper accompanies the corpus publication of EncycNet, a novel XML/TEI annotated corpus of 22 historical German encyclopedias from the early 18th to early 20th century. We describe the creation and annotation of the corpus, including the rationale for its development, suggested methodology for TEI annotation, possible use cases and future work. While many well-developed annotation standards for lexical resources exist, none can adequately model the encyclopedias at hand, and we therefore suggest how the TEI Lex-0 standard may be modified with additional guidelines for the annotation of historical encyclopedias. As the digitization and annotation of historical encyclopedias are settling on TEI as the de facto standard, our methodology may inform similar projects.
Jesus in der Alltagssprache
(2020)
Innerhalb der Wahrnehmungsdialektologie werden Begriffe oft vortheoretisch benutzt. Ziel dieses Beitrages ist, ein an den Bedürfnissen der Disziplin orientierten Begriff dialektologischen Wissens zu entwerfen, der auf den Wissenserwerb wie auf die Repräsentation gleichermaßen eingeht. Dafür wird zunächst eine Bestandsaufnahme bisheriger Konzeptionen vorgenommen, von der ausgehend im Anschluss an Erkenntnisse der kognitiven Linguistik ein neuer Wissensbegriff entworfen wird. Das Zentrum ist dabei das sogenannte Epistemikon, das die einzelnen Wissensbestände (Episteme) in sich vereint und organisiert.
Das „Lautdenkmal reichsdeutscher Mundarten zur Zeit Adolf Hitlers“ ist eine Sammlung von 300 Dialektaufnahmen aus Deutschland sowie weiteren 100 Aufnahmen aus Österreich, die, initiiert vom Reichsbund deutscher Beamter, in den Jahren 1936 bis 1938 erhoben wurden. In der aktuellen Forschung ist noch nicht geklärt, ob die Sprecher in den Aufnahmen frei sprechen durften oder eher auf Basis eines vorbereiteten bzw. von den Initiatoren vorgegebenen Skripts agierten. Ziel des vorliegenden Beitrages ist es dementsprechend, die sprachlichen und inhaltlichen Besonderheiten in zwei Aufnahmen aus Bayern und Schleswig-Holstein herauszuarbeiten und damit die Frage nach einer thematischen Steuerung zu beantworten.
Vorwort
(2020)