Refine
Year of publication
- 2022 (223) (remove)
Document Type
- Part of a Book (104)
- Article (56)
- Book (20)
- Conference Proceeding (19)
- Other (12)
- Review (7)
- Doctoral Thesis (2)
- Preprint (2)
- Part of Periodical (1)
Language
- German (141)
- English (79)
- French (2)
- Multiple languages (1)
Is part of the Bibliography
- yes (223) (remove)
Keywords
- Deutsch (87)
- Korpus <Linguistik> (56)
- Kommunikation (25)
- Nationalsozialismus (23)
- Interaktion (22)
- Konversationsanalyse (19)
- Sprachgebrauch (19)
- Gesprochene Sprache (18)
- Wörterbuch (18)
- Sprachdaten (16)
Publicationstate
- Veröffentlichungsversion (140)
- Zweitveröffentlichung (70)
- Postprint (33)
- Ahead of Print (1)
Reviewstate
Publisher
- de Gruyter (42)
- IDS-Verlag (20)
- V&R unipress (19)
- Leibniz-Institut für Deutsche Sprache (IDS) (16)
- Wilhelm Fink (15)
- European Language Resources Association (ELRA) (9)
- Leibniz-Institut für Deutsche Sprache (8)
- Peter Lang (8)
- Cambridge University Press (5)
- Benjamins (4)
Sometimes in interaction, a speaker articulates an overt interpretation of prior talk. Such moments have been studied as involving the repair of a problem with the other’s talk or as formulating an understanding of the matter at hand. Stepping back from the established notions of formulations and repair, we examine the variety of actions speakers do with the practice of offering an interpretation, and the order within this domain. Results show half a dozen usage types of interpretations in mundane interaction. These form a largely continuous territory of action, with recognizably distinct usage types as well as cases falling between these (proto)typical uses. We locate order in the domain of interpretations using the method of semantic maps and show that, contrary to earlier assumptions in the literature, interpretations that formulate an understanding of the matter at hand are actually quite pervasive in ordinary talk. These findings contribute to research on action formation and advance our understanding of understanding in interaction. Data are video- and audio-recordings of mundane social interaction in the German language from a variety of settings.
We examine moments in social interaction in which a person formulates what another thinks or believes. Such formulations of belief constitute a practice with specifiable contexts and consequences. Belief formulations treat aspects of the other person's prior conduct as accountable on the basis that it provided a new angle on a topic, or otherwise made a surprising contribution within an ongoing course of actions. The practice of belief formulations subjectivizes the content that the other articulated and thereby topicalizes it, mobilizing commitment to that position, an account, or further elaboration. We describe how the practice can be put to work in different activity contexts: sometimes it is designed to undermine the other's position as a subjective 'mere belief', at other times it serves to mobilize further topic talk. Throughout, belief formulations show themselves to be a method by which we get to know ourselves and each other as mental agents.
Wir stellen eine empirische Studie vor, die der Frage nachgeht, ob und in welchem Ausmaß Wörterbücher und andere lexikographische Ressourcen die Ergebnisse von Textüberarbeitungen verbessern. Studierende wurden in unserer Studie gebeten, zwei Texte zu optimieren und waren dabei zufällig in drei unterschiedliche Versuchsbedingungen eingeteilt: 1. ein Ausgangstext ohne Hinweise auf potenzielle Fehler im Text, 2. ein Ausgangstext, bei dem problematische Stellen im Text hervorgehoben waren und 3. ein Ausgangstext mit hervorgehobenen Problemstellen zusammen mit lexikographischen Ressourcen, die zur Lösung der spezifischen Probleme verwendet werden konnten. Wir fanden heraus, dass die Teilnehmer*innen der dritten Gruppe die meisten Probleme korrigierten und die wenigsten semantischen Verzerrungen während der Überarbeitung einführten. Außerdem waren sie am effizientesten (gemessen in verbesserten Textabschnitten pro Zeit). Wir berichten in dieser Fallstudie ausführlich vom Versuchsaufbau, der methodischen Durchführung der Studie und eventuellen Limitationen unserer Ergebnisse.
Dictionaries have been part and parcel of literate societies for many centuries. They assist in communication, particularly across different languages, to aid in understanding, creating, and translating texts. Communication problems arise whenever a native speaker of one language comes into contact with a speaker of another language. At the same time, English has established itself as a lingua franca of international communication. This marked tendency gives lexicography of English a particular significance, as English dictionaries are used intensively and extensively by huge numbers of people worldwide.
Based on the privative derivational suffix -los, we test statements found in the literature on word formation using a – at least in this field – novel empirical basis: a list of affective-emotional ratings of base nouns and associated -los derivations. In addition to a frequency analysis based on the German Reference Corpus, we show that, in general, emotional polarity (so-called valence, positive vs. negative emotions) is reversed by suffixation with -los. This change is stronger for more polarized base nouns. The perceived intensity of emotion (so-called arousal) is generally lower for -los derivations than for base nouns. Finally, to capture the results theoretically, we propose a prototypical -los construction in the framework of Construction Morphology.
Wenn alle Forschungsfragen gestellt, alle Hypothesen formuliert, alle Korpora kompiliert und alle Daten von Proband*innen gesammelt wurden, befinden Sie sich auf einer der letzten Etappen Ihrer linguistischen Studie: der Analyse der Daten. In diesem Kapitel werden Sie einige Werkzeuge kennenlernen, die Sie dabei unterstützen können. Hier nehmen wir an, dass Sie in irgendeiner Form eine quantitative statistische Auswertung vornehmen möchten, denn für qualitative Analysen sind die Werkzeuge, die wir Ihnen vorstellen werden, weniger bis gar nicht geeignet.
The Leibniz-Institute for the German Language (IDS) was established in Mannheim in 1964. Since then, it has been at the forefront of innovation in German linguistics as a hub for digital language data. This chapter presents various lessons learnt from over five decades of work by the IDS, ranging from the importance of sustainability, through its strong technical base and FAIR principles, to the IDS’ role in national and international cooperation projects and its expertise on legal and ethical issues related to language resources and language technology.
We address the task of distinguishing implicitly abusive sentences on identity groups (“Muslims contaminate our planet”) from other group-related negative polar sentences (“Muslims despise terrorism”). Implicitly abusive language are utterances not conveyed by abusive words (e.g. “bimbo” or “scum”). So far, the detection of such utterances could not be properly addressed since existing datasets displaying a high degree of implicit abuse are fairly biased. Following the recently-proposed strategy to solve implicit abuse by separately addressing its different subtypes, we present a new focused and less biased dataset that consists of the subtype of atomic negative sentences about identity groups. For that task, we model components that each address one facet of such implicit abuse, i.e. depiction as perpetrators, aspectual classification and non-conformist views. The approach generalizes across different identity groups and languages.
Um eine bessere Erreichbarkeit und Zugänglichkeit zu bestehenden sowie neuen Angeboten von Lehr- und Schulungsmaterialien im Bereich der Digital Humanities zu ermöglichen, sollten diese in einem zentralen Verzeichnis zur Verfügung gestellt werden. Im Rahmen des CLARIAH-DE Projekts wurde – zunächst für die Umsetzung eines Projektmeilensteins – eine Lösung gesucht, die eine übergreifende Suche in frei zugänglichen und nachnutzbaren Lehr- und Schulungsmaterialien zu Forschungsmethoden, Verfahren sowie Werkzeugen im Bereich der Digital Humanities in unterschiedlichen Plattformen und Repositorien bietet.
Das Lehnwortportal Deutsch (LWPD) ist ein Online-Informationssystem zu Entlehnungen von Wörtern aus dem Deutschen in andere Sprachen. Es beruht auf einer wachsenden Zahl von lexikographischen Ressourcen zu verschiedenen Sprachen und bietet eine einfache ressourcenübergreifende Suchfunktion an. Das Poster präsentiert eine derzeit in Entwicklung befindliche onomasiologische Suchfunktion für das LWPD.
Die Untersuchung von Positionierungsaktivitäten zur diskursiven Herstellung sozialer Identität blickt auf eine lange Tradition zurück und wird innerhalb der Sprachwissenschaft hauptsächlich in der gesprächsanalytischen Erzählforschung angewendet. Im Rahmen eines sozialkonstruktivistischen Ansatzes geht die Positionierungstheorie von einer dynamischen Konstitution von Identität aus.
Bisher fehlte es noch an einer systematischen Betrachtung von interaktiven Positionierungsaktivitäten, die sich mit der Realisierung und Aushandlung von Positionierungen in Alltagsgesprächen befasst. Hier setzt diese Arbeit an: Im Rahmen eines interaktionslinguistischen Ansatzes werden Positionierungspraktiken systematisch in vorwiegend nicht-narrativen Kontexten betrachtet. Auf der Grundlage empirischer Analysen liefert die Untersuchung neue Einblicke in die interaktive Konstitution von Identität, ihre sequenziellen Regelhaftigkeiten, Erwartungsstrukturen sowie in das Verhältnis von Selbst- und Fremdpositionierung.
Kontrastive Korpuslinguistik versteht sich als eine Bezeichnung für sprachvergleichende Studien, deren Ergebnisse mit Analysen sprachlicher Daten erreicht und empirisch fundiert sind. Die Bezeichnung contrastive corpus linguistics für eine neue, sich entwickelnde Disziplin wurde 1996 von Karin Aijmer und Bengt Altenberg (Schmied 2009: 1142) eingeführt. Der Einsatz der sprachlichen Korpora bei der Beschreibung kontrastiver Studien bedeutet in den 1990er-Jahren für die kontrastive Linguistik eine Wiederbelebung, nachdem die weit gesteckten Ziele und Hoffnungen in den 50er- und 60er-Jahren, die mit der Fremdsprachendidaktik zusammenhingen, vor etwa 50 Jahren aufgegeben wurden.
Since the beginning of the Covid-19 pandemic, about 2000 new lexical units have entered the German lexicon. These concern a multitude of coinings and word formations (Kuschelkontakt, rumaerosolen, pandemüde) as well as lexical borrowings mainly from English (Lockdown, Hotspot, Superspreader). In a special way, these neologisms function as keywords and lexical indicators sketching the development of the multifaceted corona discourse in Germany. They can be detected systematically by corpus-linguistic investigations of reports and debates in contemporary public communication. Keyword analyses not only exhibit new vocabulary, they also reveal discursive foci, patterns of argumentation and topicalisations within the diverse narratives of the discourse. With the help of quickly established and dominant neologisms, this paper will outline typical contexts and thematic references, but it will also identify speakers' attitudes and evaluations.
The public as linguistic authority: Why users turn to internet forums to differentiate between words
(2022)
This paper addresses the question of why we face unsatisfactory German dictionary entries when looking up and comparing two similar lexical terms that are loan words, new words, (near) synonyms, or confusables. It explains how users are aware of existing reference works but still search or post on language forums, often after consulting a dictionary and experiencing a range of dictionary based problems. Firstly, these dictionary based difficulties will be scrutinised in more detail with respect to content, function, presentation, and the language of definitions. Entries documenting loan words and commonly confused pairs from different lexical reference resources serve as examples to show the short comings. Secondly, I will explain why learning about your target group involves studying discussion forums. Forums are a valuable source for detailed user studies, enabling the examination of different communicative needs, concrete linguistic questions, speakers’ intuitions, and people’s reactions to posts and comments. Thirdly, with the help of two examples I will describe how the study of chats and forums had a major impact on the development of a recently compiled German dictionary of confusables. Finally, that same problem solving approach is applied to the idea of a future dictionary of neologisms and their synonyms.
The public as linguistic authority: Why users turn to internet forums to differentiate between words
(2022)
This paper addresses the question of why we face unsatisfactory German dictionary entries when looking up and comparing two similar lexical terms that are loan words, new words, (near)-synonyms, or confusables. It explains how users are aware of existing reference works but still search or post on language forums, often after consulting a dictionary and experiencing a range of dictionary-based problems. Firstly, these dictionary-based difficulties will be scrutinised in more detail with respect to content, function, presentation, and the language of definitions. Entries documenting loan words and commonly confused pairs from different lexical reference resources serve as examples to show the shortcomings. Secondly, I will explain why learning about your target group involves studying discussion forums. Forums are a valuable source for detailed user studies, enabling the examination of different communicative needs, concrete linguistic questions, speakers’ intuitions, and people’s reactions to posts and comments. Thirdly, with the help of two examples I will describe how the study of chats and forums had a major impact on the development of a recently compiled German dictionary of confusables. Finally, that same problem-solving approach is applied to the idea of a future dictionary of neologisms and their synonyms.
This paper investigates the long-term diachronic development of the perfect and preterite tenses in German and provides a novel analysis by supplementing Reichenbach’s (1947) classical theory of tense by the notion of underspecification. Based on a newly compiled parallel corpus spanning the entire documented history of German, we show that the development in question is cyclic: It starts out with only one tense form (preterite) compatible with both current relevance and narrative past readings in (early) Old High German and, via three intermediate stages, arrives at only one tense form again (perfect) compatible with the same readings in modern Upper German dialects. We propose that in order to capture all attested stages we must allow tenses to be unspecified for R (reference time), with R merely being inferred pragmatically. We then propose that the transitions between the different stages can be explained by the interplay between semantics and pragmatics.
Bauchschmerzen bei Kindern sind häufig, aber glücklicherweise meist ohne schwerwiegende Ursache. Sogar starke oder wiederkehrende Bauchschmerzen haben oftmals keinen organischen Ursprung. Dennoch erfolgt bei Kindern mit häufigen Bauchschmerzen in der Regel eine umfangreiche und für alle Beteiligten belastende diagnostische Abklärung – teilweise sogar ohne seriösen, hilfreichen Befund. Idealerweise sollte bereits im Gespräch mit einem fachkundigen Arzt deutlich werden, ob die Schmerzen somatischen oder psychosomatischen Ursprungs sind, um überflüssige und teure Untersuchungsmaßnahmen einzusparen. An dieser Stelle kommt die Gesprächsforschung zum Einsatz: Für die Unterscheidung von organischen und psychisch bedingten Anfallsereignissen konnte gezeigt werden, dass die entscheidenden Hinweise zur Diagnose nicht nur in den geschilderten Fakten liegen, sondern auch in der Art, wie die Betroffenen selbst über ihr Problem reden und mit dem Arzt interagieren. Diese Hinweise lassen sich zielgenau durch gesprächslinguistische Analysen erfassen (vgl. Opp/Frank-Job/Knerich 2015). Für epileptische vs. dissoziative Anfälle konnte dies bereits belegt und in klinischen Studien validiert werden (vgl. Schwabe/Howell/Reuber 2007). In Anknüpfung an das genannte Projekt wird in dieser Dissertation überprüft, ob und inwieweit die Befunde aus der Anfallsforschung auch auf eine andere Erkrankung und Patientinnengruppe übertragen werden können. Für diesen Zweck werden dyadische Interaktionen junger Patientinnen mit Medizinerinnen während einer spezifischen Form und Phase der Anamnese analysiert: Der analytische Kern der Arbeit thematisiert die Interaktion der Beteiligten beim zeichnerischen Umsetzen von Bauchschmerzen. Dabei zeigt sich die interaktiv hervorgebrachte Positionierung der Patientinnen zur Malaufgabe als zentral und entsprechend diagnostisch relevant: Während Patientinnen, deren Schmerzen organischen Ursprungs sind, dazu tendieren, die Malaufgabe mit redundanten Informationen pflichtgemäß zu erfüllen, neigen Patientinnen, die an funktionellen Beschwerden leiden, hingegen dazu, die Malaufgabe als Chance zur Aktualisierung der Beschwerdenschilderung zu sehen. Diese Erkenntnisse lassen sich in Form einer Diagnosetabelle zusammenfassen und konstituieren damit die Basis für einen gesprächsanalytischen Anwendungsbezug, der die medizinische Forschung und Ausbildung um ein innovatives Diagnostikverfahren bereichern kann.
Der nationalsozialistische Interaktions- und Kommunikationsraum war mithin bevölkert von kommunikativ konstruierten Sozialfiguren. Hierbei gab es sowohl positiv Konnotierte (z. B. Volksgenosse, Nationalsozialist, Parteigenosse, SA-Mann, Alter Kämpfer) als auch negativ Konnotierte (z. B. Asozialer, Judenfreund, Schwarzer, Roter, Freimaurer). Diese stereotypisierten Sozialfiguren, an die wiederum vielfältige positive wie negative Attribuierungen geknüpft waren, stellten gleichsam Diskurspositionen dar, die anderen zugewiesen wurden oder eingenommen werden konnten – sofern den individuellen Voraussetzungen nach möglich – und die mit unterschiedlichen Graden der In- bzw. Exklusion einhergingen. Die folgenden Ausführungen konzentrieren sich auf zwei dieser Figuren, die spezifischer als Grenzfiguren begriffen werden können: Meckerer und Märzgefallene. Es wird untersucht, wie diese beiden Grenzfiguren sprachlich konstruiert, in welchen Kontexten und Kommunikationssituationen sie angeeignet und verwendet wurden. In beiden Fällen wird der Fokus dabei über den wörtlichen Ausdruck hinaus auf zeitgenössisch ähnliche oder eng verwandte Bezeichnungen ausgeweitet.
Sich beschweren – Kommunikation von Unzufriedenheit in Eingaben an Staats- und Parteiinstanzen
(2022)
Sich in eigener Sache zu beschweren oder einen ausgemachten Missstand anzusprechen, war neben dem Bitten und dem Huldigen die in Eingaben an Behörden und Politiker während des Nationalsozialismus am häufigsten anzutreffende Kommunikationspraktik. Die folgende, ihrem vorläufigen Charakter nach explorative, Analyse nimmt diese in den Blick und konzentriert sich dabei auf häufig anzutreffende Sprachhandlungsmuster, die für die Kommunikationspraktik des Sich-Beschwerens in Beschwerdeschreiben an offizielle Stellen konstitutiv waren. Untersuchungsgrundlage ist ein Korpus von ca. 500 Beschwerdeschreiben, die im Stadtarchiv Mannheim, dem Generallandesarchiv Karlsruhe, dem Landeshauptarchiv Koblenz sowie den »Akten der Partei-Kanzlei« (Microfiche-Edition) erhoben wurden.
Führer
(2022)
Die folgende Analyse trägt der Zentralität des Führerkonzepts während des Nationalsozialismus Rechnung und skizziert – orientiert an der leitenden Akteurseinteilung in zentrale Repräsentanten des NS-Apparats, verschiedene Akteursgruppen der integrierten Gesellschaft und der Ausgeschlossenen sowie Akteure des Widerstands – ein differenziertes Bild des zeitgenössischen Sprachgebrauchs und der unterschiedlichen Verwendungsweisen des Führerkonzepts. Führer wird als nationalsozialistisches Leitkonzept konturiert, das eng mit weiteren Leitkonzepten wie Volk, Nation und Reich verknüpft war. Es besaß einerseits hohe integrative und affektive Kraft, diente andererseits – auf Seiten der Ausgeschlossenen, Dissidenten und des Widerstands – als Einsatzpunkt von Distanzierung und Kritik.
Träume - oder genauer: die berichteten und niedergeschriebenen Traumepisoden von Menschen, die während des Nationalsozialismus gelebt haben - lassen sich als Bestandteil von Kommunikation verstehen. Sie geben darüber hinaus oftmals Einblicke in die Art und Weise, wie von Kommunikation geträumt wurde. Traumerzählungen handeln also einerseits oft von Kommunikation, sie sind andererseits aber auch selbst als Kommunikation eingebunden in spezifische Kommunikationssituationen. Mit diesen Merkmalen sind sie ein lohnender Untersuchungsgegenstand für eine Kommunikationsgeschichte des Nationalsozialismus, die sich für kommunikative Praktiken der Hervorbringung, Aktualisierung und Infragestellung der nationalsozialistischen Gesellschaft interessiert. In welchen Situationen und Textsorten Menschen ihre Träume schilderten und welche Bedeutung sie ihnen verliehen, wie sie sich selbst zu ihren Träumen verhielten, lässt Interpretationen darüber zu, wie zur Zeit des Nationalsozialismus lebende Menschen etwas gemeinhin als zutiefst intim und persönlich Betrachtetes - ihre Träume - in den politischen Kommunikationsraum des Nationalsozialismus einbrachten.
Das Vokabular von Songtexten im gesellschaftlichen Kontext – ein diachron-empirischer Beitrag
(2022)
Der Beitrag untersucht den Stellenwert gesellschaftlich relevanter Thematiken in deutschsprachigen Songtexten der zurückliegenden fünf Jahrzehnte. Dabei zeigt sich, dass neben individuellen Befindlichkeiten auch politische, sozialkritische oder umweltbezogene Themen signifikant angesprochen werden. Wir kontrastieren Songtexte mit anderen Testsorten und wenden dabei quantitative Methoden auf umfangreiche, breit stratifizierte Datensamples an, um die Phänomenbeschreibungen präzisierbar, generalisierbar und reproduzierbar zu machen. Das longitudinale Korpusdesign bietet Potenzial für diachrone Vergleiche. Im Sinne eines erweiterten „Mixed Methods“-Ansatzes exploriert die Studie zudem ausgewählte Aspekte qualitativ und bettet sie in den zeitlichen Kontext ein.
Vorgestellt wird das Korpus deutschsprachiger Songtexte als innovative Sprachdatenquelle für interdisziplinäre Untersuchungsszenarien und speziell für den Einsatz im Fremd- und Zweitsprachenunterricht. Die Ressource dokumentiert Eigenschaften konzeptioneller Schriftlichkeit und konzeptioneller Mündlichkeit und erlaubt empirisch begründete Analysen sprachlicher Phänomene bzw. Tendenzen in den Texten moderner Popmusik. Vorgestellt werden Design, Annotationen und Anwendungsbeispiele des in thematische und autorenspezifische Archive stratifizierten Korpus.
Man findet im Burnout-Diskurs einerseits zahlreiche Passagen in fachinternen/-externen Texten, in denen ein „Noch-nicht-(genug)-Wissen“ oder „unsicheres Wissen“ (Janich 2018: 557) und eine zu wenig trennscharfe, ungenaue Verwendung des Begriffs und das Fehlen einer validen, allgemeingültigen, eindeutigen Definition des Phänomens konstatiert werden. Dieser offensichtlichen Kritik steht allerdings der konvergente Leseeindruck entgegen, der sich in Bezug auf die begriffliche Fassung bzw. Definition von ›Burnout‹ einstellt, wenn man Texte von 1975-2018 zu diesem Phänomen sichtet. Von diesen Beobachtungen ausgehend, analysiert die hier vorgestellte Dissertation: 1.) wie ein psychosomatisches Phänomen, das spezifikationsbedürftig erscheint, in Fach-, Medien- und Vermittlungstexten vor dem Hintergrund fachkultureller, sozialer und diskursiver Bedingungen definiert wird, 2.) wie bestimmte definitorische Merkmale und Definitionsformen sich trotz Kritik über die Zeit im Diskurs durchsetzen und 3.) in welcher Weise sich medizinische/psychologische und fachexterne Ansprüche an die Tätigkeit des Definierens und sprachliche Mittel und diskursive Praktiken des Definierens unterscheiden oder ähneln und sich in Typen diskursiver Praxis des Definierens verdichten lassen.
Wie können Kinder und Jugendliche ihren mehrsprachigen Alltag im Mannheimer Vielfaltsquartier Neckarstadt-West erforschen – gemeinsam mit Forschenden des Leibniz-Instituts für Deutsche Sprache und seinen Kooperationspartnern, dem Campus Neckarstadt-West, der Alten Feuerwache Mannheim gGmbH und dem Verein Neckarstadt Kids e.V.?
Wir wollen die Potenziale von Citizen Science in einem sprachbezogenen Projekt ausloten:
- für die Etablierung vertrauensvoller Zusammenarbeit zwischen den jungen Citizen Scientists und der sprachwissenschaftlichen Forschung,
- für hochwertige Bildungsangebote im Sinne der UN-Nachhaltigkeitsziele und
- für neue Impulse im Bereich der Sprachkontakt- und Mehrsprachigkeitsforschung.
In diesem Beitrag skizzieren wir die Ziele, Fragen und Methoden unseres Projekts und geben Einblicke in die bisher durchgeführten und im Jahr 2023 geplanten Aktionen.
Korpora gesprochener Sprache
(2022)
Korpora gesprochener Sprache bestehen aus Audio- oder Videoaufnahmen sprachlicher Produktionen, die über eine Transkription einer linguistischen Analyse zugänglich gemacht werden. Sie kommen zur Untersuchung unterschiedlichster sprachwissenschaftlicher Fragestellungen unter anderem in der Gesprächsforschung, der Dialektologie und der Phonetik zum Einsatz. Dieser Beitrag diskutiert die wichtigsten Eigenschaften von Korpora gesprochener Sprache und stellt einige Vertreter der verschiedenen Kategorien vor.
Transkriptionswerkzeuge sind spezialisierte Softwaretools für die Transkription und Annotation von Audio- oder Videoaufzeichnungen gesprochener Sprache. Dieses Kapitel erklärt einleitend, worin der zusätzliche Nutzen solcher Werkzeuge gegenüber einfacher Textverarbeitungssoftware liegt, und gibt dann einen Überblick über grundlegende Prinzipien und einige weitverbreitete Tools dieser Art. Am Beispiel der Editoren FOLKER und OrthoNormal wird schließlich der praktische Einsatz zweier Werkzeuge in den Arbeitsabläufen eines Korpusprojekts illustriert.
Daten und Metadaten
(2022)
In diesem Kapitel werden Metadaten als Daten definiert, die der Dokumentation und/oder Beschreibung empirischer Sprachdaten dienen. Einleitend werden die verschiedenen Funktionen von Metadaten im Forschungsprozess und ihre Bedeutung für die Konzepte der Ausgewogenheit und Repräsentativität diskutiert. Anhand des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) werden dann Metadaten eines konkreten Korpus vorgestellt, und es wird gezeigt, wie diese bei Korpusanalysen zum Einsatz kommen.
This article presents a discussion on the main linguistic phenomena which cause difficulties in the analysis of user-generated texts found on the web and in social media, and proposes a set of annotation guidelines for their treatment within the Universal Dependencies (UD) framework of syntactic analysis. Given on the one hand the increasing number of treebanks featuring user-generated content, and its somewhat inconsistent treatment in these resources on the other, the aim of this article is twofold: (1) to provide a condensed, though comprehensive, overview of such treebanks—based on available literature—along with their main features and a comparative analysis of their annotation criteria, and (2) to propose a set of tentative UD-based annotation guidelines, to promote consistent treatment of the particular phenomena found in these types of texts. The overarching goal of this article is to provide a common framework for researchers interested in developing similar resources in UD, thus promoting cross-linguistic consistency, which is a principle that has always been central to the spirit of UD.
Within a rapidly digitalising society, it is important to understand how the learning and teaching of digital skills play out in situ, particularly amongst older adults who acquire these skills later in life. This paper focuses on participants engaged in the process of learning digital skills in adult education courses. Using video recordings from adult education centres in Finland and Germany, we explore how students mobilise their teachers’ assistance when encountering problems with their smartphones, laptops or tablets. Prior research on social interaction has shown that assistance can be recruited through a variety of verbal and embodied formats. In this specific educational setting, participants can use complaints about their digital skills or mobile devices to obtain assistance. Utilising multimodal conversation analysis, we describe two basic sequence types involving students’ complaints, discuss their cross-linguistic characteristics, and reflect on their connection to this educational setting and digital devices.
The question of whether a letter is a grapheme or not is a perennial issue in writing research. The answer depends on which criteria are used to differentiate between letters and graphemes and, ultimately,how the unit ‘grapheme’ is defined. This problem is particularly relevant to complex graphemes, i.e. sequences of letters that behave like a single grapheme in certain respects. Typical for German is the ‹ch›. This paper argues for a scalar concept of graphemes, which compares the grapheme status of each of the units under investigation. For this purpose, new criteria for the identification of complex graphemes are used, which originate from handwriting analysis. There, it is shown that complex graphemes are connected with each other disproportionately often and also have deviating letter forms disproportionately often.
In contrast to printed letters, handwritten texts show a larger amount of variation regarding letter shape and letter contact. This variation though might not be totally random but could follow a certain grammatical or structural function. By analysing a corpus of 10.117 graphs written by four writers, this paper explores which structures and which functions correlate. More precisely, it will be shown that the shape of certain letters might indicate syllabic, morphologic od prosodic structures. In addition, it will be shown that handwritten texts present the words’ structure better than printed texts could do. Overall, this paper points out how handwritten scripts show the graphematic principles known from printing even better than printed texts do.
Das Archiv für Gesprochenes Deutsch und das Forschungs- und Lehrkorpus für Gesprochenes Deutsch
(2022)
Der Beitrag stellt das Archiv für Gesprochenes Deutsch (AGD) und das
Forschungs- und Lehrkorpus für Gesprochenes Deutsch (FOLK) als Ressourcen für die sprachwissenschaftliche Forschung vor. Besonderes Augenmerk liegt dabei auf deren Potenzial für die sprachwissenschaftliche Forschung zu Sprachgebrauch in Gesellschaft und Politik.
This paper presents a compositional annotation scheme to capture the clusivity properties of personal pronouns in context, that is their ability to construct and manage in-groups and out-groups by including/excluding the audience and/or non-speech act participants in reference to groups that also include the speaker. We apply and test our schema on pronoun instances in speeches taken from the German parliament. The speeches cover a time period from 2017-2021 and comprise manual annotations for 3,126 sentences. We achieve high inter-annotator agreement for our new schema, with a Cohen’s κ in the range of 89.7-93.2 and a percentage agreement of > 96%. Our exploratory analysis of in/exclusive pronoun use in the parliamentary setting provides some face validity for our new schema. Finally, we present baseline experiments for automatically predicting clusivity in political debates, with promising results for many referential constellations, yielding an overall 84.9% micro F1 for all pronouns.