Refine
Year of publication
- 2020 (139) (remove)
Document Type
- Part of a Book (139) (remove)
Language
- German (113)
- English (25)
- Multiple languages (1)
Has Fulltext
- yes (139)
Keywords
- Deutsch (47)
- Korpus <Linguistik> (25)
- Mundart (19)
- Sprachgebrauch (15)
- Dialektologie (14)
- Grammatik (13)
- Social Media (12)
- Sprachvariante (10)
- Forschungsdaten (9)
- Soziolinguistik (9)
Publicationstate
- Zweitveröffentlichung (98)
- Veröffentlichungsversion (23)
- Postprint (9)
Reviewstate
- (Verlags)-Lektorat (111)
- Peer-Review (16)
Publisher
- Narr Francke Attempto (40)
- de Gruyter (36)
- European Language Resources Association (6)
- Heidelberg University Publishing (5)
- Universitätsverlag Rhein-Ruhr (4)
- Association for Computational Linguistics (2)
- Benjamins (2)
- Buske (2)
- Dudenverlag (2)
- Hempen (2)
Seit dem Präsidentschaftswahlkampf in den USA sorgen „Fake News“ für eine lebhafte wissenschaftliche Debatte. Bisherige Definitionen sind allerdings weder einheitlich noch widerspruchsfrei und werden zudem nicht nachvollziehbar entwickelt, sondern meist einfach gesetzt. Unser Beitrag will dieses Theoriedefizit mittels einer Begriffsexplikation unter Rückgriff auf Literatur zu Desinformation, Lüge und (öffentliche) Kommunikation abstellen. Dabei ersetzen wir den Begriff „Fake News“ durch „aktuelle Desinformation“ und erörtern systematisch, welche Bedingungen notwendig sind, um von diesem Phänomen sprechen zu können. Wir definieren aktuelle Desinformation als Kommunikation wissentlich und empirisch falscher Informationen zu neuen und relevanten Sachverhalten mit dem Anspruch auf Wahrheit.
affiziertes Objekt
(2020)
In diesem Beitrag werden neue, repräsentative Daten zur arealen Variation in Deutschland vorgestellt, die das Leibniz-Institut für Deutsche Sprache im Rahmen der Innovationsstichprobe des Sozio-ökonomischen Panels (SOEP) des Deutschen Instituts für Wirtschaftsforschung (DIW) in der Befragungsrunde 2017/2018 erhoben hat. Zum einen wurde die Dialektkompetenz abgefragt; überindividuell zeigt sich hier das bekannte Nord-Süd-Gefälle, beim individuellen Grad der Kompetenz der Dialektsprecher gibt es aber regional nur geringe Unterschiede. Zum anderen wurden die Bewertungen von Dialekten erhoben; hier werden Norddeutsch und Bayerisch besonders positiv, Sächsisch hingegen besonders negativ bewertet, wobei regionale Muster eine Rolle spielen. Auffällig ist ferner die bundesweit sehr einheitlich positive Bewertung des Hochdeutschen.
This chapter focuses on the formation of adverbs from a corpuslinguistic perspective, providing an overview of adverb formation patterns in German that includes frequencies and hints to productivity as well as combining quantitative methods and theoretically founded hypotheses to address questions that concern possible grammaticalization paths in domains that are formally marked by prepositional elements or inflectional morphology (in particular, superlative or superlative-derived forms). Within our collection of adverb types from the project corpus, special attention is paid to adverbs built from primary prepositions. The data suggest that generally, such adverb formation involves the saturation of the internal argument slot of the relation-denoting preposition. In morphologically regular formations with the preposition in final position, pronominal forms like da ‘there’, hier ‘here’, wo ‘where’ as well as hin ‘hither’ and her ‘thither’ serve to derive adverbs. On the other hand, morphologically irregular formations with the preposition – in particular: zu ‘to’ or vor ‘before, in front of’ – in initial posi-tion show traits of syntactic origin such as (remnants of) inflectional morphology. The pertaining adverb type dominantly saturates the internal argument slot by means of universal quantification that is part and parcel as well of the derivation of superlatives and demonstrably fuels the productivity of the pertaining formation pattern.
Die Terminologielehre(speziell die Terminologielehre nach Eugen Wüster)liefert eine Basis und Methoden für terminologische Anwendungen in der Praxis. Viele Unternehmen und Institutionen richten ihr Terminologiemanagement danach aus. Nach einer kurzen Vorstellung der entsprechenden Ziele und Prozesse werden wichtige Typen von Begriffssystemen dargestellt, und es wird aufgezeigt, welche positiven Effekte das Erarbeiten von Begriffssystemen auf die Qualität der Terminologiearbeit hat. Als nächster inhaltlicher Schwerpunkt werden Möglichkeiten und Besonderheiten der Terminologieverwaltung unter besonderer Berücksichtigung der Eintragsmodellierung in terminologischen Datenbanken erörtert. Den Abschluss der Betrachtungen bildet die Zusammenführung der zwei Bereiche: Welche Optionen stehen für die Repräsentation von Begriffssystemen in Terminologieverwaltungssystemen zur Verfügung bzw. können dort umgesetzt werden?
Der Beitrag zeigt die Dialekte auf, die im Rahmen eines Online-Fragebogens von österreichischen Gewährspersonen als besonders „beliebt“, „unbeliebt“ sowie als „markant/auffällig“ bewertet wurden ebenso wie die hierfür herangezogenen Begründungen. In einem zweiten Schritt wird mithilfe eines Hörerurteilstests belegt, dass die als „auffällig“ empfundenen Dialekte durchaus erkannt und zu einem Großteil korrekt dem richtigen Bundesland zugeordnet werden. Dies sind vor allem das Vorarlbergerische und Tirolerische neben dem Kärntnerischen, Wienerischen und Steirischen.
Im vorliegenden Beitrag werden erstmals Daten zweier aktueller Projekte zu Einstellungen von Deutschschweizer/-innen zu Hochdeutsch und Dialekt verglichen. Dabei wird beleuchtet, welche Unterschiede und Gemeinsamkeiten sich in den Daten der Samples – einem bezüglich Bildung und Beruf heterogenen und einem bezüglich dieser Faktoren homogenen – feststellen lassen. Es zeigt sich eine vielschichtige Konzeptualisierung des Hochdeutschen in beiden Studien, die mit der Annahme unterschiedlicher mentaler Hochdeutsch-Modelle (Norm, Plurizentrizität, Schriftlichkeit, Mündlichkeit mit zwei Untermodellen) erklärt werden kann.
Blogg Dir deinen Urlaub nach Tunesien! Zur Erläuterung des Musters [VImp PROPReflexivDat NPAkk]
(2020)
In diesem Beitrag soll das Muster [VImp PROPReflexivDat NPAkk] semantisch und syntaktisch erläutert werden. Dieses Muster, das semantisch mit Verben des Erwerbens wie anschaffen korreliert, wird auch im Zusammenhang mit Kommunikationsverben wie bloggen und facebooken sowie mit dem Kontaktverb rubbeln belegt. Mithilfe des Konzeptes der Koerzion bzw. der semantischen Anpassung soll das Kovorkommen des erwänhten Musters mit diesen Verben beschrieben und erklärt werden. Als empirische Quelle dient das Korpus für das Deutsche 2012 und 2014 aus den Corpora from the Web. Die vorliegende Untersuchung ist im Rahmen meiner Dissertationsarbeit zum Thema Argumentstruktur und Bedeutung medialer Kommunikationsverben des Deutschen und des Spanischen im Sprachvergleich durchgeführt worden.
Im Projekt fussballlinguistik.de baue ich Korpora mit schriftlichen und mündlichen Texten aus dem Bereich der Fußballberichterstattung auf und mache sie über das webbasierte Tool CQPweb (Hardie 2012) der Fachöffentlichkeit zuganglich (Meier 2017). Die Korpora (www.fussballlinguistik.de/korpora) enthalten vornehmlich internetbasierte Texte wie etwa Liveticker, Spielberichte und Taktikanalysen, aber auch transkribierte Radioreportagen im Umfang von 44,8 Mio. Tokens (Stand Marz 2019) in den Sprachen Deutsch, Englisch, Niederländisch und Russisch in vollständig annotierter Form. Ein Teil der Daten ist zudem in das Deutsche Referenzkorpus (DeReKo 2018–II) eingegangen. Die seit gut 50 Jahren etablierte sprachwissenschaftliche Forschung zur Sprache des Fußballs hat dadurch eine in ihrer Themenspezifik einzigartige empirische Ressource erhalten.
We present web services which implement a workflow for transcripts of spoken language following the TEI guidelines, in particular ISO 24624:2016 “Language resource management – Transcription of spoken language”. The web services are available at our website and will be available via the CLARIN infrastructure, including the Virtual Language Observatory and WebLicht.
The present paper outlines the projected second part of the Corpus Query Lingua Franca (CQLF) family of standards: CQLF Ontology, which is currently in the process of standardization at the International Standards Organization (ISO), in its Technical Committee 37, Subcommittee 4 (TC37SC4) and its national mirrors. The first part of the family, ISO 24623-1 (henceforth CQLF Metamodel), was successfully adopted as an international standard at the beginning of 2018. The present paper reflects the state of the CQLF Ontology at the moment of submission for the Committee Draft ballot. We provide a brief overview of the CQLF Metamodel, present the assumptions and aims of the CQLF Ontology, its basic structure, and its potential extended applications. The full ontology is expected to emerge from a community process, starting from an initial version created by the authors of the present paper.
Corpus REDEWIEDERGABE
(2020)
This article presents the corpus REDEWIEDERGABE, a German-language historical corpus with detailed annotations for speech, thought and writing representation (ST&WR). With approximately 490,000 tokens, it is the largest resource of its kind. It can be used to answer literary and linguistic research questions and serve as training material for machine learning. This paper describes the composition of the corpus and the annotation structure, discusses some methodological decisions and gives basic statistics about the forms of ST&WR found in this corpus.
Südtirol ist eine mehrsprachige italienische Provinz, in der die Verwendung unterschiedlicher Sprachen, besonders Deutsch und Italienisch, sowie der lokalen deutschen Dialekte in der mündlichen Kommunikation in formalen wie informalen Sprechsituationen einen hohen gesellschaftlichen Stellenwert hat. Mit der Frage, welche Sprachen bzw. Varietäten in der schriftlichen Alltagskommunikation verwendet werden und welche soziolinguistischen Faktoren dabei eine Rolle spielen, hat sich das Projekt DiDi befasst, in dem die Sprach- und Varietätenverwendung in Facebook-Texten näher untersucht wurden. Dabei stellte sich unter anderem heraus, dass das Schreiben im Dialekt besonders unter Jugendlichen weit verbreitet ist (Glaznieks/Frey 2018). Mithilfe des aus diesem Projekt entstandenen und für wissenschaftliche Nutzung frei zugänglichen Facebook-Korpus kann die Sprach- und Varietätenverwendung Südtiroler Facebooknutzer/innen in der internetbasierten Kommunikation aus unterschiedlichen linguistischen Perspektiven untersucht werden.
In internetgestützten Medien ist eine Reihe von medienspezifischen Kommunikationspraktiken entstanden - vom Flaming und Trolling aus der Frühzeit des Internet bis zum für die Sozialen Medien charakteristischen Shitstorm. In diesem Beitrag befasse ich mich anhand einer Fallstudie eines von mir als „personalisiert“ bezeichneten Shitstorms gegen die Sprachwissenschaftlerin Luise Pusch mit der Frage, inwiefern diese Form des Shitstorms mit den medialen Eigenschaften sozialer Netze - speziell, des Netzwerks Twitter - zusammenhängt und welche gesellschaftlichen Rahmenbedingungen er benötigt.
Der Weihnachtsbrief
(2020)
Dialekt und Regiolekt in der politischen Kommunikation: Code-Switching, -Mixing und -Shifting
(2020)
Politische Kommunikation erfolgt in Bayern im Kontinuum zwischen Standardsprache, Regiolekt und Basisdialekt. Dieser Wechsel zwischen den Sprechlagen in der bayerischen Kommunalpolitik ist Gegenstand dieses Beitrags. Das zugrundeliegende Korpus besteht aus Aufzeichnungen von Stadtratssitzungen in zwei Kleinstädten im mittelbairischen Dialektgebiet Niederbayerns. Dieser Beitrag will die im Untersuchungsmaterial festgestellten Wechselphänomene des Code-Switching, -Mixing und -Shifting anhand der sprecherinternen (interindividuellen) Schwankungen des Abstands zur Standardsprache sowohl phonetisch, als auch unter Berücksichtigung der innersprachlichen Ebenen Lexik, Morphologie und Syntax sowie unter dem Aspekt der Sprecherstrategien untersuchen.
Die Thematisierung von Dialekt im Unterricht ist einem größeren Wandel unterworfen. Als neue Komponente trat der dialektale Spracherwerb hinzu, für den insbesondere im niederdeutschen Sprachraum Strukturen und Materialien geschaffen wurden und fortgesetzt ergänzt werden. Bedeutsam ist die Abgrenzung dialekt- und regionalsprachdidaktischer Zielsetzungen. Regionalsprachliche Reflexion und gesteuerter Dialekterwerb betreffen unterschiedliche Lernziele, die in einen neuen Einklang einer parallelen Existenz im Unterrichtsgeschehen zu bringen sind.
Innerhalb der Wahrnehmungsdialektologie werden Begriffe oft vortheoretisch benutzt. Ziel dieses Beitrages ist, ein an den Bedürfnissen der Disziplin orientierten Begriff dialektologischen Wissens zu entwerfen, der auf den Wissenserwerb wie auf die Repräsentation gleichermaßen eingeht. Dafür wird zunächst eine Bestandsaufnahme bisheriger Konzeptionen vorgenommen, von der ausgehend im Anschluss an Erkenntnisse der kognitiven Linguistik ein neuer Wissensbegriff entworfen wird. Das Zentrum ist dabei das sogenannte Epistemikon, das die einzelnen Wissensbestände (Episteme) in sich vereint und organisiert.
Sprachliche Zeichen im öffentlichen Raum (Linguistic Landscape - LL) tragen neben ihrer primären Bedeutung und Funktion wie Auskunft und Werbung auch sekundäre Informationen zur Sprachenhierarchie, zur Repräsentation von Minderheitensprachen, zur sprachlichen Toleranz gegenüber der Mehrsprachigkeit in diesem Raum, etc. Diese Vielschichtigkeit macht die sprachlichen Zeichen im öffentlichen Raum zu wertvollen Lernobjekten, an denen die im Berufsleben so bedeutende diskursive Lesefähigkeit der Studierenden trainiert werden kann. Der Beitrag öffnet Perspektiven auf die Möglichkeiten der Verknüpfung der LL-Analyse mit den Inhalten der traditionellen germanistischen Curricula wie auch benachbarter Fachbereiche und verweist auf bisherige Studien in diesem Bereich.
Grammatische Termini sind in ihrer Existenz nicht immer stabil. neue wissenschaftliche Erkenntnisse, erweiterte Perspektiven und Paradigmenwechsel führen zu einem Wandelin der Terminologie. Während die Termini in Linguistischen Grammatiken dem aktuellen Status Quo der sprachwissenschaftlichen Grammatikschreibung weitgehend entsprechen, hinkt die sprachpraktische Anwendung in der Didaktik deutsch als Fremdsprache oft hinterher. Dies wird mithilfe einer Auswahl grammatischer Themen (Konnektoren, Verbvalenz, Wortbildung des Verbs und dem Bereich der Kollokationen/usuellen Wortverbindungen) und der im DAF-Bereich häufig verwendeten Pädagogisch-didaktischen Grammatiken, Handbüchern und Fachlexika sowie Lehrwerken aufgezeigt.
Die MoCoDa 2 (https://db.mocoda2.de) ist eine webbasierte Infrastruktur für die Erhebung, Aufbereitung, Bereitstellung und Abfrage von Sprachdaten aus privater Messenger-Kommunikation (WhatsApp und ähnliche Anwendungen). Zentrale Komponenten bilden (1) eine Datenbank, die für die Verwaltung von WhatsApp-Sequenzen eingerichtet ist, die von Nutzer/innen gespendet und für linguistische Recherche- und Analysezwecke aufbereitet wurden, (2) ein Web-Frontend, das die Datenspender/innen dabei unterstützt, gespendete Sequenzen um analyserelevante Metadaten anzureichern und zu pseudonymisieren, und (3) ein Web-Frontend, über das die Daten für Zwecke in Forschung und Lehre abgefragt werden können. Der Aufbau der MoCoDa-2-Infrastruktur wurde im Rahmen des Programms „Infrastrukturelle Forderung für die Geistes- und Gesellschaftswissenschaften“ vom Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen gefordert. Ziel des Projekts ist es, ein aufbereitetes Korpus zur Sprache und Interaktion in der deutschsprachigen Messenger-Kommunikation bereitzustellen, das speziell auch für qualitative Untersuchungen eine wertvolle Grundlage bildet.
Die Kernaufgabe der Projektgruppe des DWDS besteht darin, den in den Korpora enthaltenen Wortschatz lexikografisch und korpusbasiert zu beschreiben. In der modernen Lexikografie werden die Aussagen zu den sprachlichen Aspekten und Eigenschaften der beschriebenen Wörter und zu Besonderheiten ihrer Verwendung auf Korpusevidenz gestutzt. Empirisch können riesige Textsammlungen Hypothesen genauer oder ausführlicher belegen. Dabei wird deutlich, wie vielfältig Sprache im Gebrauch tatsachlich realisiert wird. Zu diesem Zweck bieten wir auf der DWDS-Plattform neben den zeitlich und nach Textsorten ausgewogenen Kernkorpora und den Zeitungskorpora eine Reihe von Spezialkorpora an, die hinsichtlich ihres Gegenstandes oder ihrer sprachlichen Charakteristika von den erstgenannten Korpora abweichen. Die Webkorpora bilden einen wesentlichen Bestandteil dieser Spezialkorpora.
Texte aus Sozialen Medien finden in linguistischen Diskursanalysen bisher noch wenig Berücksichtigung. Viele Diskursanalysen konzentrieren sich auf Zeitungstexte als Untersuchungsgegenstände. Dieser Beitrag unterbreitet einen Vorschlag zur Überwindung dieses Newspaper Bias, um das Programm und das Methodeninventar der Diskurslinguistik am Beispiel der Wikipedia hin zu digitalen Diskursanalysen zu erweitern. Neben den besonderen Eigenschaften digitaler Diskurse wird die Bedeutung digitaler Objekte (v.a. Links) in den Diskursfragmenten der Wikipedia thematisiert. Zuletzt wird ein Analysemodell präsentiert, das einen umfassenden Rahmen für die Untersuchung von digitalen Diskursen bietet.
Der Beitrag diskutiert Interpunktion als ein Teilsystem des Deutschen, an dem das Verhältnis zwischen Sprachwandel und dem gesamtgesellschaftlichen Wandelprozess der Digitalisierung besonders gut ablesbar ist. Der Gebrauch von Interpunktionszeichen im interaktionsorientierten digitalen Schreiben ist gekennzeichnet durch eine distributive Umstrukturierung des Interpunktionsinventars sowie durch Prozesse der Pragmatikalisierung, Syntaktisierung und Ikonizität, die verschiedene Satzzeichen betreffen. In der privaten und öffentlichen metasprachlichen Reflexion zeigen sich eine nicht-binäre Wahrnehmung digitaler Interpunktion und eine Registrierung einzelner Interpunktionspraktiken mit sozialen Gruppen. Die Verlagerung interpersonaler Kommunikation auf digitale Schriftlichkeit führt insgesamt zu einer Ausfächerung des interaktionalen Umgangs mit Interpunktion und zur Herausbildung domänenspezifischer Interpunktionsstile.
Die Sprache in Sozialen Medien zeigt auf allen Ebenen eine hohe Variabilität und wurde daher als eine Mischung verschiedener Register (Tagliamonte/Denis 2008) analysiert, die sowohl informelle als auch formelle Formen umfassen. Im Gegensatz zu herkömmlichen schriftlichen Medien, wie z.B. Zeitungstexten, sind Soziale Medien wie Chat, Twitter, Forumsdiskussionen, Facebook oder Blogs für diverse Autor/innen zugänglich, sind spontaner, und unterliegen weniger den sprachlichen Standards. Ein Teil der in diesen Kommunikationskanälen gefundenen Variabilität wird häufig auf Fehler zurückgeführt, es gibt jedoch viele Phänomene, die eigenen Regeln folgen. In Bezug auf das Kontinuum von konzeptueller/medialer Mündlichkeit/Schriftlichkeit (Koch/Oesterreicher 1985) befinden sich die meisten Social-Media-Beitrage in der Mitte des konzeptuellen Oralitätskontinuums, obwohl deren genaue Position bisher weitgehend unbestimmt ist. Soweit Nicht-Standard-Merkmale untersucht wurden, wurde meist die Orthographie, Morphologie, das Lexikon und die Syntax (z.B. Abkürzungen, Emoticons, Ellipsis) berücksichtigt.
Im Gegensatz dazu wählen wir einen pragmatischen, diskursorientierten Standpunkt: Welche Diskursstrategien wählen Sprecher/innen in Sozialen Medien und wie unterscheiden sich diese von bisher untersuchten Medienformen?
Entity framing is the selection of aspects of an entity to promote a particular viewpoint towards that entity. We investigate entity framing of political figures through the use of names and titles in German online discourse, enhancing current research in entity framing through titling and naming that concentrates on English only. We collect tweets that mention prominent German politicians and annotate them for stance. We find that the formality of naming in these tweets correlates positively with their stance. This confirms sociolinguistic observations that naming and titling can have a status-indicating function and suggests that this function is dominant in German tweets mentioning political figures. We also find that this status-indicating function is much weaker in tweets from users that are politically left-leaning than in tweets by right leaning users. This is in line with observations from moral psychology that left-leaning and right-leaning users assign different importance to maintaining social hierarchies.
In informal interaction, speakers rarely thank a person who has complied with a request. Examining data from British English, German, Italian, Polish, and Telugu, we ask when speakers do thank after compliance. The results show that thanking treats the other’s assistance as going beyond what could be taken for granted in the circumstances. Coupled with the rareness of thanking after requests, this suggests that cooperation is to a great extent governed by expectations of helpfulness, which can be long-standing, or built over the course of a particular interaction. The higher frequency of thanking in some languages (such as English or Italian) suggests that cultures differ in the importance they place on recognizing the other’s agency in doing as requested.
Effiziertes Objekt
(2020)
Einleitung
(2020)
A corpus-based academic grammar of German is an enormous undertaking, especially if it aims at using state-of-the-art methodology while ensuring that its study results are verifiable. The Bausteine-series, which is being developed at the Leibniz Institute for the German Language (IDS), presents individual “building blocks” for such a grammar. In addition to the peer-reviewed texts, the series publishes the results of statistical analyses and, for selected topics, the underlying data sets.
Einleitung
(2020)
Esipuhe/Preface
(2020)
Globalisierungsdiskurs
(2020)
This chapter begins with a sketch of the specifics of our approach, an overview of the contents of the chapters on word formation and some methodological notes. It then discusses the general characteristics of word formations and of their overall inventory, comparing word formations to primary words. Furthermore, the chapter explores the relative frequencies of word formations in different vocabulary areas and traces the word formation profiles of individual parts of speech. Finally, it compiles the characteristic word formation rules for different parts of speech.
Der Beitrag untersucht vorhandene Lösungen und neue Möglichkeiten des Korpusausbaus aus Social Media- und internetbasierter Kommunikation (IBK) für das Deutsche Referenzkorpus (DEREKO). DEREKO ist eine Sammlung gegenwartssprachlicher Schriftkorpora am IDS, die der sprachwissenschaftlichen Öffentlichkeit über die Korpusschnittstellen COSMAS II und KorAP angeboten wird. Anhand von Definitionen und Beispielen gehen wir zunächst auf die Extensionen und Überlappungen der Konzepte Social Media, Internetbasierte Kommunikation und Computer-mediated Communication ein. Wir betrachten die rechtlichen Voraussetzungen für einen Korpusausbau aus Sozialen Medien, die sich aus dem kürzlich in relevanten Punkten reformierten deutschen Urheberrecht, aus Persönlichkeitsrechten wie der europäischen Datenschutz-Grundverordnung ergeben und stellen Konsequenzen sowie mögliche und tatsächliche Umsetzungen dar. Der Aufbau von Social Media-Korpora in großen Textmengen unterliegt außerdem korpustechnologischen Herausforderungen, die für traditionelle Schriftkorpora als gelöst galten oder gar nicht erst bestanden. Wir berichten, wie Fragen der Datenaufbereitung, des Korpus-Encoding, der Anonymisierung oder der linguistischen Annotation von Social Media Korpora für DEREKO angegangen wurden und welche Herausforderungen noch bestehen. Wir betrachten die Korpuslandschaft verfügbarer deutschsprachiger IBK- und Social Media-Korpora und geben einen Überblick über den Bestand an IBK- und Social Media-Korpora und ihre Charakteristika (Chat-, Wiki Talk- und Forenkorpora) in DEREKO sowie von laufenden Projekten in diesem Bereich. Anhand korpuslinguistischer Mikro- und Makro-Analysen von Wikipedia-Diskussionen im Vergleich mit dem Gesamtbestand von DEREKO zeigen wir charakterisierende sprachliche Eigenschaften von Wikipedia-Diskussionen auf und bewerten ihren Status als Repräsentant von IBK-Korpora.
Der folgende Beitrag verfolgt das Ziel, einen Impuls für die Problematik des Übertrags der linguistischen Fachterminologie in die fachdidaktische Anwendung zu geben. Die daten stammen aus einem Seminar des Praxissemesters in NRW, wo Studierende Unterrichtseinheiten zum Thema Informationsstruktur erstellt haben.
In der Schule tätig greifen Studierende bei der Unterrichtsplanung auf Lehrbücher, Zeitschriften und Online-Vorlagen (Arbeitsblätter und Hilfestellungen für Lehrkräfte) zurück, damit sie möglichst schnell adäquates Material für den eigenen Unterricht vorliegen haben. Die Herausforderung beginnt beim Übertragen der fachwissenschaftlichen
Erkenntnisse in die Recherche mit der nicht immer eindeutigen Terminologie. Im Beitrag wird darauf eingegangen, welche Termini zur Informationsstruktur überhaupt zum Ziel führen und auf welche Alternativen man ausweichen muss, um passende Ergebnisse zu haben.
Interaktionale Semantik
(2020)
Interaktive Emergenz und Stabilisierung. Zur Entstehung kollektiver Kreativität in Theaterproben
(2020)
Ein multilinguales linguistisches Begriffssystem wird in Form einer Datenbank implementiert, die dem Benutzer den semasiologischen und onomasiologischen Zugriff erlaubt, ihn also zu einem gegebenen Terminus den Begriff und seine Definition und zu einem gegebenen Begriff die Termini in den beteiligten Sprachen finden lässt. Die Mehrfachzuordnung von Begriffen zu Termini ist dabei auf interlingualer Ebene nicht wesentlich verschieden von der Situation in einer monolingualen Ontologie. Für die Normierung einer interlingualen Ontologie werden Grundsätze zur Bildung von Begriffen und von Termini vorgeschlagen. Zwischen den Begriffen bestehen eine Menge von vordefinierten konzeptuellen Relationen, die sie in systematische Beziehungen zueinander setzen und es sowohl dem Verwalter ermöglichen, das System konsistent zu halten, als auch dem Benutzer, im Begriffssystem zu navigieren.
Der Beitrag behandelt die Frage, wie sich das spezifisch Neue internetbasierter Kommunikation unter linguistischer Perspektive fassen und in Traditionen des sprachlichen Handelns einordnen lässt. Es wird gezeigt, dass sich die internetbasierte Kommunikation weder als Interaktion noch als Textkommunikation hinreichend beschreiben lasst, zugleich aber Merkmale mit beiden Formen teilt. Mit dem Konzept der Textformen-basierten Interaktion wird ein Vorschlag formuliert, wie dieses Dilemma aufgelöst werden kann: Das Innovationspotenzial internetbasierter Kommunikationstechnologien liegt gerade darin, dass diese durch Indienstnahme von Textformen die Möglichkeiten von Interaktion erweitern. Das hat einerseits Konsequenzen fur die linguistische Analyse und lässt sich andererseits fruchtbar machen fur die Entwicklung von Standards fur die Repräsentation von Korpora.
I’ve got a construction looks funny – representing and recovering non-standard constructions in UD
(2020)
The UD framework defines guidelines for a crosslingual syntactic analysis in the framework of dependency grammar, with the aim of providing a consistent treatment across languages that not only supports multilingual NLP applications but also facilitates typological studies. Until now, the UD framework has mostly focussed on bilexical grammatical relations. In the paper, we propose to add a constructional perspective and discuss several examples of spoken-language constructions that occur in multiple languages and challenge the current use of basic and enhanced UD relations. The examples include cases where the surface relations are deceptive, and syntactic amalgams that either involve unconnected subtrees or structures with multiply-headed dependents. We argue that a unified treatment of constructions across languages will increase the consistency of the UD annotations and thus the quality of the treebanks for linguistic analysis.
Jesus in der Alltagssprache
(2020)
In dem Beitrag werden Kommunikationsstörungen in Sportvideointerviews im Ukrainischen und Deutschen im Zeitraum von 2000-2018 untersucht. Für die Typologie der Kommunikationsstörungen werden der Faktor ihres Auftretens und die strukturelle Ebene ihrer Entwicklung betrachtet. Dabei zeigt sich, dass je nach Typ und Besonderheiten der Kommunikationsstörungen Sportvideointerviews mehr Gemeinsames als Unterschiedliches in beiden Sprachen aufweisen. Sowohl kommunikative als auch rein sprachliche Störungen treten bei den Interviewern und Interviewten im Ukrainischen und bei den Interviewten als Nichtmuttersprachler im Deutschen auf.
Kommunikative Misserfolge im Deutschen für ukrainische Deutschlerner aus interkultureller Sicht
(2020)
Begriffe, die meist als nulläquivalente Lexik (Lakunen) für ukrainische Deutschlerner gelten und somit Schwierigkeiten bereiten sowie im Allgemeinen zu Misserfolgen zwischen Kommunizierenden führen können, stehen im Mittelpunkt der folgenden Ausführungen. Um sie zu vermeiden, werden einige Themen und Aufgaben zur Erweiterung der sozial-kommunikativen und interkulturellen Kompetenzen vorgeschlagen.
Der Beitrag stellt zunächst die drei grundlegenden methodischen Verfahren der Konversationsanalyse und der mittlerweile deren Vorgehen folgenden diskursiven Psychologie dar: die Transkription, die detaillierte Sequenzanalyse am Einzelfall und die (komparative) Analyse von Datenkollektionen. Nach einer Übersicht über grundlegende Befunde zur Organisation von Interaktionen wird auf drei psychologische Untersuchungsbereiche eingegangen: Die Konstitution von Identität in Gesprächen, die Rolle von Kognitionen in der sozialen Interaktion und die Erforschung von Psychotherapiegesprächen.
Am Leibniz-Institut für Deutsche Sprache (IDS) wurde im Programmbereich „Lexikografie und Sprachdokumentation“ ein neuartiges Wörterbuch entwickelt, das leicht verwechselbare Ausdrücke in ihrem aktuellen öffentlichen Sprachgebrauch deskriptiv beschreibt. Im Jahr 2018 erschien das elektronische Nachschlagewerk „Paronyme – Dynamisch im Kontrast“, das sich durch folgende drei Aspekte auszeichnet:
1) Erstens liegen mehrstufige kontrastive Beschreibungsebenen und flexible Darstellungsformen vor;
2) zweitens sind die Bedeutungserläuterungen kognitiv-konzeptuell angelegt, um einer langen Forderung nach einer stärker kognitiv ausgerichteten Lexikografie Rechnung zu tragen;
3) drittens werden Datengrundlagen und Analysemethoden genutzt, mit denen umfassend Paronyme ermittelt und diese anschließend erstmals empirisch ausgewertet werden konnten.
Der Mythos „Künstliche Intelligenz“ wird besonders von der sogenannten „transhumanistischen“ Community im Silicon Valley propagiert, deren Vertreter wie der Physiker Ray Kurzweil davon ausgehen, dass wir in spätestens 30 Jahren mit KIs kommunizieren könnten, wie mit einem Menschen (Kurzweil 2005). Saudi Arabien hat 2017 bereits dem anthropomorphen Roboter mit Sprachinterface Sophia die Staatsbürgerschaft zugesprochen (Arab News 2017). Künstliche Intelligenzen wie Apples Assistenzsystem Siri oder Amazons Alexa halten derzeit Einzug in unseren Alltag. Chatbots und Social-Bots wie der Twitter-Bot Tay nehmen Einfluss auf öffentliche Diskurse und interaktives Spielzeug mit Dialogfunktion führt bereits unsere Jüngsten an die Interaktion mit dem artifiziellen Gegenüber heran. Hier entsteht eine völlig neue Form der Dialogizität, die wir aus linguistischer Perspektive noch kaum verstehen. Unabhängige Studien zur Mensch-Maschine-Interaktion stellen also ein großes Desiderat dar.
This article examines the language contact situation as well as the language attitudes of the Caucasian Germans, descendants of German-born inhabitants of the Russian Empire and the Soviet Union who emigrated in 1816/17 to areas of Transcaucasia. After deportations and migrations, the group of Caucasian Germans now consists of those who have since emigrated to Germany and those who still live in the South Caucasus. It’s the first time that sociolinguistic methods have been used to record data from the generation who experienced living in the South Caucasus and in Germany as well as from two succeeding generations. Initial results will be presented below with a focus on the language contact constellations of German varieties as well as on consequences of language contact and language repression, which both affect language attitudes.
Gegenstand dieses Beitrags ist die Entwicklung des graphentheoretischen Analysetools Laniakea, das zur Visualisierung von Phänomenen und Veränderungen in terminologischen Netzwerken entwickelt wurde. Wir führen theoretische Grundlagen, Designentscheidungen und technische Details der Implementierung des Tools aus. Darüber hinaus wird auch eine Beschreibung von Erfahrungen im Fokus des Beitrages stehen, die bei der Anwendung von Laniakea bei der Überarbeitung der terminologischen Ressourcen des Grammatischen Informationssystems grammis, gesammelt wurden.
Lexikonprojektion und Konstruktion: Experimentelle Studien zu Argumentalternationen im Deutschen
(2020)
Debates on lexicalist vs. constructionist modelling of argument alternations are typically based on data from single constructions, each including different types of verbs. Evidence from constructions with an identical set of verb types that systematically differ in their meaning is lacking, even though such evidence is imperative for specifically investigating the dependence of argument alternations on the interaction between construction and lexical meanings. We present two acceptability studies where verb lexeme meanings and constructions - specifically active voice, impersonal passive and the construction with man 'one' in German - vary systematically. Prima facie our results support a constructionist explanation, because each construction exhibits a unique acceptability cline. However, across constructions, an adequate explanation has to consider verb-based lexical meanings. The most plausible explanation is that the semantic features licensed by the construction are matched with the semantic features provided by the verb lexeme.
Providing online repositories for language resources is one of the main activities of CLARIN centres. The legal framework regarding liability of Service Providers for content uploaded by their users has recently been modified by the new Directive on Copyright in the Digital Single Market. A new category of Service Providers, Online Content-Sharing Service Providers (OCSSPs), was added. It is subject to a complex and strict framework, including the requirement to obtain licenses from rightholders for the hosted content. This paper provides the background and effect of these changes to law and aims to initiate a debate on how CLARIN repositories should navigate this new legal landscape.
Ziel des vorliegenden Beitrages ist es, LingTermNet, ein Online-Repositorium für linguistische Fachtermini, vorzustellen. Methodologisch und hinsichtlich seiner lexikografischen Umsetzung basiert LingTermNet auf framesemantischen Prinzipien, die auch dem Berkeleyer FrameNet-Projekt zugrunde liegen. Dargestellt werden zunächst leitende theoretische Annahmen; im Zentrum steht sodann die Präsentation von Aufbau und Struktur der Ressource. Im Unterschied zu ‘traditionellen’ Wörterbüchern entstehen Einträge in LingTermNet auf der Grundlage von framesemantischen Annotationen, deren Auswertung auf zwei Ebenen lexikografisch aufgearbeitet werden: Die framesemantische Ebene dokumentiert Frames und ihre Beziehungen untereinander, die lemmaspezifische Ebene basiert auf framesemantischen Untersuchungserkenntnissen, wobei die Einträge hier klassischen Wörterbuchdefinitionen ähneln.
In der Diskussion um Methodologie und Methoden finden unterschiedliche
wissenschaftliche Arbeitsbereiche und Forschungsaktivitäten stets einen gemeinsamen Nenner. Ulrike Froschauer hat sich lange Jahre ausführlich und intensiv mit den Fragestellungen der Organisationssoziologie beschäftigt. Die vorliegenden Buchveröffentlichungen wie beispielsweise „Organisationen in Bewegung. Beiträge zur interpretativen Organisationsanalyse“ (2012) oder „Organisationen im Wechselspiel von Dynamik und Stabilität“ (2015) geben einen guten Zugang zu ihrem wissenschaftlichen Wirken. Das Arbeitsfeld unserer Forschungsgruppe ist ein anderes, nämlich das der Medienwissenschaft, speziell der Medienrezeptionsforschung. In den 1980er Jahren haben wir hierzu das integrationswissenschaftliche Modell der „Strukturanalytischen Rezeptionsforschung“ entwickelt und dieses über die Jahre hinweg an unterschiedlichen Forschungsorten in zahlreichen Einzelstudien weiter ausgearbeitet. Verbunden hat uns, die Wiener Organisationssoziologin Ulrike Froschauer und die Baseler Mediensoziolog_innen, das anhaltende Interesse an method(-olog-)ischen Fragen.
The theme of the AFinLA 2020 Yearbook Methodological turns in applied language studies is discussed in this introductory article from three interrelated perspectives, variously addressed in the three plenary presentations at the AFinLA Autumn Symposium 2019 as well as in the thirteen contributions to the yearbook. In the first set of articles presented, the authors examine the role and impact of technological development on the study of multimodal digital and non-digital contexts and discourses and ensuing new methods. The second set of studies in the yearbook revisits issues of language proficiency, critically discussing relevant concepts and approaches. The third set of articles explores participation and participatory research approaches, reflecting on the roles of the researcher and the researched community.
This paper discusses a theoretical and empirical approach to language fixedness that we have developed at the Institut für Deutsche Sprache (IDS) (‘Institute for German Language’) in Mannheim in the project Usuelle Worterbindungen(UWV) over the last decade. The analysis described is based on the Deutsches Referenzkorpus (‘German Reference Corpus’; DeReKo) which is located at the IDS. The corpus analysis tool used for accessing the corpus data is COSMAS II (CII) and – for statistical analysis – the IDS collocation analysis tool (Belica, 1995; CA). For detecting lexical patterns and describing their semantic and pragmatic nature we use the tool lexpan (or ‘Lexical Pattern Analyzer’) that was developed in our project. We discuss a new corpus-driven pattern dictionary that is relevant not only to the field of phraseology, but also to usage-based linguistics and lexicography as a whole.
In diesem Beitrag werden exemplarisch verschiedene potenzielle Gebrauchsmuster mit dem deutschen Lemma wissen gesammelt und ihre in der Fachliteratur vorgelegten interaktionslinguistisch-funktionalen Beschreibungen für einen Strukturierungsversuch genutzt. Im Zentrum steht ein multifunktionaler handlungsorientierter Ansatz zur Beschreibung von Interaktion im Gespräch. Der Beitrag greift dabei Überlegungen auf, die im Rahmen des Forschungsprojekts Lexik des gesprochenen Deutsch (= LeGeDe) zur Erstellung einer korpusbasierten lexikogra- fischen Ressource lexikalischer Besonderheiten des gesprochenen Deutsch in der Interaktion thematisiert wurden.
Schlüsselwörter: Muster, Lexik des gesprochenen Deutsch, Interaktion, Internetlexikografie
Objekte der Begeisterung
(2020)
We present a construction-based approach to German prepositional object (I’O) constructions occurring with the verb begeistern ,to thrill'. Traditionally, the preposition in such structures is analysed as a meaningless object marker that is lexically selected by the governing verb and not subject to variation. Drawing on a corpus study in the German reference corpus DeReKo, we show that our target verb occurs with four different PO prepositions (für ,lor‘,« ׳? ,at', von ,front' and über ,over‘) that can be analysed as markers o f schematic argument structure constructions in the Construction Grammar sense. We show that each construction comes with its own meaning and semantically coherent predicate restrictions. We argue that purely valency-based (lexical) approaches to argument structure fail to capture these generalisations. On the other hand, purely schema-based (constructionist) approaches to argument structure face the complcmentary problem o f accommodating item-specific restrictions and exceptions to the generalisations they embody. We suggest that the necessary synthesis can be formulated within an account that recognises both generalised constructions and item-specific valency properties.
Viele neue Orte des akademischen Lesens und Schreibens sind Anfang der 2000er im Mitmachnetz „Web 2.0“ entstanden, die heute als „Soziale Medien“ Forschung und Lehre sowohl hinsichtlich Produktion und Rezeption als auch als Gegenstand massiv beeinflussen. Zu diesen Formen zählt u.a. auch die Wissenschaftsvermittlung auf (Micro-)Blogs, an der (beinahe typisch) die nicht immer reibungslosen Annäherungen einer Fachkultur an digitale Formen der Textproduktion im Beitrag nachgezeichnet werden. Angesichts der ambivalenten Bewertung dieser neuen Formen der Fachkommunikation wird dafür votiert, (Micro-)Blogs als Arbeitsplattformen zur Kollaboration und nur als solche zu begreifen.
Privacy by Design (also referred to as Data Protection by Design) is an approach in which solutions and mechanisms addressing privacy and data protection are embedded through the entire project lifecycle, from the early design stage, rather than just added as an additional layer to the final product. Formulated in the 1990 by the Privacy Commissionner of Ontario, the principle of Privacy by Design has been discussed by institutions and policymakers on both sides of the Atlantic, and mentioned already in the 1995 EU Data Protection Directive (95/46/EC). More recently, Privacy by Design was introduced as one of the requirements of the General Data Protection Regulation (GDPR), obliging data controllers to define and adopt, already at the conception phase, appropriate measures and safeguards to implement data protection principles and protect the rights of the data subject. Failing to meet this obligation may result in a hefty fine, as it was the case in the Uniontrad decision by the French Data Protection Authority (CNIL). The ambition of the proposed paper is to analyse the practical meaning of Privacy by Design in the context of Language Resources, and propose measures and safeguards that can be implemented by the community to ensure respect of this principle.
Der Beitrag beschäftigt sich mit kommunikativen Praktiken in audiovisuellen Webformaten am Beispiel von sogenannten „Let’s Plays“, in denen ein Videospiel im Internet für Zuschauende gespielt und kommentiert wird. An live ausgestrahlten Let’s Plays zeigen wir, wie Zuschauende mit Produzierenden während der Ausstrahlung interagieren und so integraler Bestandteil des entstehenden Produkts werden. Live ausgestrahlte Let’s Plays machen eine Trennung zwischen Produktion, Produkt und Rezeption, wie wir sie von traditionellen Medien kennen, obsolet. Wir sprechen daher von sogenannten Medienketten. Sie zeichnen sich dadurch aus, dass die drei genannten Elemente, aufgrund der gegebenen medialen Affordanzen ineinander übergehen, sich dynamisch beeinflussen oder gegenseitig hervorbringen.
Prosodische Morphologie
(2020)
Die Korpusanalyseplattform KorAP wird als Nachfolgesystem zu COSMAS II am Leibniz-Institut für Deutsche Sprache (IDS) entwickelt und erlaubt einen umfassenden Zugriff auf einen Teil von DeReKo (Kupietz et al. 2010). Trotz einiger noch fehlender Funktionalitäten ist KorAP bereits produktiv einsetzbar. Im Folgenden wollen wir am Beispiel der Untersuchung von Social-Media-Korpora einige neue Möglichkeiten und Besonderheiten vorstellen.
This chapter describes the resources that speakers of Polish use when recruiting assistance and collaboration from others in everyday social interaction. The chapter draws on data from video recordings of informal conversation in Polish, and reports language-specific findings generated within a large-scale comparative project involving eight languages from five continents (see other chapters of this volume). The resources for recruitment described in this chapter include linguistic structures from across the levels of grammatical organization, as well as gestural and other visible and contextual resources of relevance to the interpretation of action in interaction. The presentation of categories of recruitment, and elements of recruitment sequences, follows the coding scheme used in the comparative project (see Chapter 2 of the volume). This chapter extends our knowledge of the structure and usage of Polish with detailed attention to the properties of sequential structure in conversational interaction. The chapter is a contribution to an emerging field of pragmatic typology.
The present chapter investigates the relative order of attributive adjectives in German. Based on corpus data, our results corroborate previous findings that semantics is the most important factor in accounting for adjective order. Going beyond previous studies, we also consider coordinated structures (such as mit [[großem, verwildertem] Garten] ‘with (a) large, overgrown garden’), where both adjectives are of equal rank. While adjective order in embedded structures (mit [ schwierigem [ familiärem Hintergrund ]] ‘with (a) difficult domestic background’) can be predicted rather accurately on semantic grounds, we show that predictions can also be made for coordinated structures, albeit with lower accuracy. Using regression analysis, we examine how semantic factors interact with a number of other explanatory variables.
This contribution deals with right-dislocated complement clauses with the subordinating conjunction dass (‘that’) in German talk-in-interaction. The bi-clausal construction we analyze is as follows: The first clause, in which one argument is realized by the demonstrative pronoun das (‘this/that’), is syntactically and semantically complete; the reference of the pronoun is (re-)specified by adding a dass-complement clause after a point of possible completion (e.g., aber das hab ich nich MITbekommen. (0.32) dass es da so YOUtubevideos gab. (‘But I wasn’t aware of that. That there were videos about that on YouTube.’). The first clause always performs a backward-oriented action (e.g., an assessment) and the second clause (re-)specifies the propositional reference of the demonstrative, allowing for a (strategic) perspective shift. Based on a collection of 93 cases from everyday conversations and institutional interactions, we found that the construction is used close to the turn-beginning for referring to and (re-)specifying (parts of) another speaker’s prior turn; turn-internal uses tie together parts of a speaker’s multi-unit turn. The construction thus facilitates an incremental constitution of meaning and reference.
Making corpora accessible and usable for linguistic research is a huge challenge in view of (too) big data, legal issues and a rapidly evolving methodology. This does not only affect the design of user-friendly graphical interfaces to corpus analysis tools, but also the availability of programming interfaces supporting access to the functionality of these tools from various analysis and development environments. RKorAPClient is a new research tool in the form of an R package that interacts with the Web API of the corpus analysis platform KorAP, which provides access to large annotated corpora, including the German reference corpus DeReKo with 45 billion tokens. In addition to optionally authenticated KorAP API access, RKorAPClient provides further processing and visualization features to simplify common corpus analysis tasks. This paper introduces the basic functionality of RKorAPClient and exemplifies various analysis tasks based on DeReKo, that are bundled within the R package and can serve as a basic framework for advanced analysis and visualization approaches.
Russisch
(2020)
Einleitend stellt der Beitrag unter Bezugnahme auf die Jahrestagungen des Leibniz-Instituts für Deutsche Sprache von 2019 und 1999 die Bezeichnungen Soziale Medien und neue Medien gegenüber. Dann steht die schriftbasierte Whats-App-Kommunikation im Fokus, es werden aber auch Beispiele aus anderen Kommunikationsformen angeführt (z.B. Zeitungsartikel auf Facebook, Texte aus der Unternehmenskommunikation). Gezeigt werden soll, wie sich die Verwendung von Emojis in diesen Texten gestaltet. Im Anschluss daran geht es um die Frage, welchen Stellenwert das Schreiben in Sozialen Medien in der Schule hat und welchen Stellenwert es künftig haben wird. Diese Frage leitet über zu dem im Titel unter Perspektiven angedeuteten Blick in die Zukunft: Hier wird zum einen diskutiert, ob die Popularität von Emojis noch zunehmen wird, zum anderen wird gefragt, ob das digitale Schreiben in Zukunft möglicherweise von anderen Praktiken abgelöst wird.
Silbenkurzwort
(2020)
Zum (Fremdsprachen-)Lernen mit Sozialen Medien existieren verschiedene Hypothesen, von denen ein paar eine große Stoßkraft entwickelt haben, obwohl sie sich empirisch nicht belegen lassen. In diesem Artikel werden einige von ihnen dekonstruiert, gleichzeitig wird aber auch gezeigt, warum und mit welchen Zielen ein Einsatz Sozialer Medien im Deutsch-als-Fremdsprache-Unterricht sinnvoll ist. Möglichkeiten des Einsatzes werden beispielhaft für die Förderbereiche des kooperativen Schreibens sowie für eine Verbindung von informellem und formalem Lernen thematisiert. Dabei wird ein besonderer Schwerpunkt auf die Betrachtung sozialer Netzwerke gelegt. Abschließend wird auf Herausforderungen eingegangen, die sich im Zusammenhang mit dem Einsatz Sozialer Medien im Deutsch-als-Fremdsprache-Unterricht stellen.
Was macht eigentlich die Netzwerkforschung im Zusammenhang mit Beziehungen und deren Struktur in der digitalen Welt? Wie hängt Struktur und die Herausbildung von Kultur und Sprache zusammen? Obwohl Kultur noch mehr als Sprache umfasst, sind die Aushandlung von Kultur und die Anwendung von Kulturelementen kaum ohne Sprache vorstellbar. Sprache ist also integrativer Teil von Kultur - ohne Sprache keine Kultur. Die Herausbildung von Sprachkulturen ist wesentlicher Teil dieser Entwicklungen. Wenn wir nun auf den Zusammenhang von Netzwerken und Kultur schauen, so können wir feststellen, dass hier kaum eine Kausalität behauptet werden kann, sondern beides ist miteinander tief verwoben. Zunächst werden einige wichtige Aspekte der Netzwerkforschung exemplarisch angesprochen und mit eigener Forschung illustriert. Danach gehe ich auf einen Shitstorm ein, an dem ich einige Aspekte aus dem Anfangsteil noch einmal aufnehme.
Als die Olympischen Sommerspiele 1968 im Oktober 1963 nach Mexico City vergeben wurden, machten sorgenvolle Befürchtungen aufgrund der Höhe des Austragungsorts und die dadurch auftretenden Belastungen der Athlet*innenkörper in den Medien die Runde. Sehr schnell gingen fast alle teilnehmenden Sportverbände zur höhenphysiologischen Vorbereitung unter Einbeziehung sportmedizinischer Expertise über. Auf der Basis von Archivbeständen des Deutschen Olympischen Sportbundes sowie zeitgenössischen sportmedizinischen Beiträgen beleuchtet der Aufsatz die Rolle der Sportmedizin in der Vorbereitungsphase auf die Olympischen Sommerspiele 1968. Im Zentrum steht die Frage, auf welche Weise der Leistungskörper der Athlet*innen ins biopolitische, sportmedizinische Blickfeld rückte, welche Tests und Untersuchungen mit ihm durchgeführt wurden und welche Bedeutung dies für das Zusammenspiel von Leistungssport und Sportmedizin hatte.
In dem einleitenden Beitrag wird in groben Zügen 1. ein Überblick über die digitale Entwicklung und die Entwicklung der Internetlinguistik gegeben und 2. auf Probleme und Desiderata hinsichtlich theoretischer und empirisch-methodischer Aspekte in der Forschung eingegangen, wobei 3. perspektivisch auf Vernetzung und Netzwerkanalysen fokussiert wird. Dies wird schlaglichtartig reflektiert vor dem Hintergrund der Entwicklung eines maschinenbasierten Digitalkapitalismus.
Sprachentwicklungstest zum Kasus bei bilingualen Vorschulkindern: Sprachstand Deutsch (KT-DEU)
(2020)
Sprachentwicklungstest zum Kasus bei den bilingualen Vorschulkindern: Sprachstand Russisch (KT-RUS)
(2020)
Usually, weak inflection of an attributive or nominalized adjective occurs if the adjective is preceded by an inflected determiner: mit diesem technischen Aufwand (‘at great technical expense’). Otherwise, the inflection of the adjective is strong: mit technischem Aufwand. Following this rule of thumb, we would expect strong inflection of an adjective following another adjective whenever the determiner is missing: mit hohem technischem Aufwand. But many German speakers opt for a weak dative singular ending -en following the strong ending -em on the first adjective: mit hohem technischen Aufwand. This chapter shows which explanatory variables play a role in this variation within standard German.
Studying Lexical Dynamics and Language Change via Generalized Entropies: The Problem of Sample Size
(2020)
Recently, it was demonstrated that generalized entropies of order α offer novel and important opportunities to quantify the similarity of symbol sequences where α is a free parameter. Varying this parameter makes it possible to magnify differences between different texts at specific scales of the corresponding word frequency spectrum. For the analysis of the statistical properties of natural languages, this is especially interesting, because textual data are characterized by Zipf’s law, i.e., there are very few word types that occur very often (e.g., function words expressing grammatical relationships) and many word types with a very low frequency (e.g., content words carrying most of the meaning of a sentence). Here, this approach is systematically and empirically studied by analyzing the lexical dynamics of the German weekly news magazine Der Spiegel (consisting of approximately 365,000 articles and 237,000,000 words that were published between 1947 and 2017). We show that, analogous to most other measures in quantitative linguistics, similarity measures based on generalized entropies depend heavily on the sample size (i.e., text length). We argue that this makes it difficult to quantify lexical dynamics and language change and show that standard sampling approaches do not solve this problem. We discuss the consequences of the results for the statistical analysis of languages.
Wie wirkt sich das Schreiben kürzerer Texte in interaktionsorienterter Online-Kommunikation langfristig auf das Schreiben und die Qualität monologischer Texte aus? Auf diese Frage geht der Beitrag ein und präsentiert dazu empirische Daten aus einer Korpus-Vergleichsstudie, in der die Verwendung ausgewählter Konnektoren in einem Facebook-Korpus quantitativ und qualitativ analysiert und mit der Verwendung in dialogischen Texten von Wikipedia-Diskussionsseiten einerseits und in monologischen Texten wie Zeitungskommentaren und Schulertexten anderseits verglichen wurde. Die Analysen fokussieren darauf, wie Konnektoren in Online-Texten eingesetzt werden, ob sich spezifische Online-Verwendungen etablieren und ob „Spuren“ typischer Online-Verwendungen auch in normgebundener Umgebung nachweisbar sind.
In this article, we examine the current situation of data dissemination and provision for CMC corpora. By that we aim to give a guiding grid for future projects that will improve the transparency and replicability of research results as well as the reusability of the created resources. Based on the FAIR guiding principles for research data management, we evaluate the 20 European CMC corpora listed in the CLARIN CMC Resource family, individuate successful strategies among the existing corpora and establish best practices for future projects. We give an overview of existing approaches to data referencing, dissemination and provision in European CMC corpora, and discuss the methods, formats and strategies used. Furthermore, we discuss the need for community standards and offer recommendations for best practices when creating a new CMC corpus.