Refine
Year of publication
Document Type
- Part of a Book (148)
- Article (98)
- Conference Proceeding (53)
- Book (29)
- Working Paper (17)
- Review (9)
- Other (2)
- Preprint (2)
- Doctoral Thesis (1)
- Master's Thesis (1)
Keywords
- Gesprochene Sprache (361) (remove)
Publicationstate
- Veröffentlichungsversion (176)
- Zweitveröffentlichung (67)
- Postprint (16)
- Erstveröffentlichung (2)
Reviewstate
Publisher
Im vorliegenden Beitrag wird anhand von Fallstudien der Frage nachgegangen, welche Dialektkompetenz speziell diejenigen russlanddeutschen Aussiedler der Einwanderungsgeneration mitbringen, die zwar in deutschen Sprachinseln geboren und aufgewachsen sind, einen Großteil des erwachsenen Lebens jedoch in russischsprachiger Umgebung verbracht haben.
Ziel des vorliegenden Beitrags ist es, auszuloten, wie Sprechen und Handeln, das wir aus dem Alltag kennen, einzuschätzen ist, wenn es im Fernsehen und vor allem im so genannten Reality-TV erscheint. Einen guten Einstieg, diese Problemstellung zu illustrieren, bieten Pannen, wie man sie etwa aus Nachrichtensendungen wie der Tagesschau kennt.
ZuRecht steht für Zugang zur Recherche in Transkripten. Es handelt sich um eine prototypische Implementierung einer webbasierten grafischen Benutzeroberfläche, welche Zugriff auf Transkripte gesprochener Sprache aus dem Archiv für Gesprochenes Deutsch (AGD) des Leibniz-Instituts für Deutsche Sprache (IDS) bietet. Der Zugriff erfolgt über die neue, im Projekt „ZuMult“ entwickelte Schnittstelle zur Suche in mündlichen Korpora. ZuRecht dient einerseits der Demonstration der Möglichkeiten der neuen Schnittstelle, indem es komplexe Suchanfragen mit der speziell für die Korpusrecherche entwickelten Anfragesprache CQP auf Transkriptionen gesprochener Sprache erlaubt. Andererseits kommt ZuRecht als Erweiterung der Datenbank für Gesprochenes Deutsch (DGD) zum Einsatz und eröffnet den DGD-Nutzer:innen viele neue Forschungsmöglichkeiten, insbesondere auf den Gebieten der Gesprächsanalyse und der DaF/DaZ-bezogenen Forschung. Im Beitrag werden die Funktionalitäten von ZuRecht ausführlich vorgestellt und ihre Einsatzmöglichkeiten in den genannten Disziplinen exemplarisch vorgeführt.
Metadaten zu Gesprächen und den beteiligten Sprecher/-innen enthalten Informationen, die für die Beschreibung, Erschließung und Analyse von Korpora wichtig sind. Bisher werden sie jedoch in der Konversationsanalyse und der Interaktionalen Linguistik so gut wie nicht genutzt. Dieser Beitrag zeigt exemplarisch, wie Metadaten des Gesprächskorpus „Forschungs- und Lehrkorpus Gesprochenes Deutsch“ (FOLK) im Rahmen einer interaktionslinguistischen Untersuchung verwendet werden können, um Regularitäten der Verwendung einer untersuchten Gesprächspraktik zu identifizieren und ihren Zusammenhang mit den Eigenschaften von Aktivitäten und Sprecherrollen zu klären. In allgemeinerer Perspektive diskutiert der Beitrag, wie und an welchen Stellen einer interaktionslinguistischen Untersuchung Metadaten von Nutzen sein können und wie ihr Stellenwert im Rahmen dieser Methodologie kritisch reflektiert werden muss.
Nach Eve Sweetser (1990) kann eine Äußerung auf drei kognitiven Ebenen - Sachverhaltsebene, epistemische Ebene und Sprechaktebene - gedeutet werden. In diesem Beitrag werden auf der Basis eines Korpus gesprochensprachlicher Daten' sowohl syntaktische als auch prosodische Besonderheiten kausaler und konditionaler konnektorhaltiger Relationen untersucht, die auf unterschiedlichen Ebenen gedeutet werden können. Ein besonderes Interesse gilt dabei der Frage, ob die Sweetser’sehen Ebenen im Deutschen sprachlich markiert sind. Es wird gezeigt, dass syntaktische und prosodische Signale mit den Ebenen sehr stark korrelieren, die Ebenen im kausalen Bereich aber anders markiert sind als im konditionalen Bereich. Aufgrund dieses Befundes wird gegen die Annahme Sweetsers argumentiert, dass Kausalität als Basisbedeutung für Konditionalität angesehen werden könne.
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), zugänglich über die Datenbank für Gesprochenes Deutsch (DGD), strebt den Status eines Referenzkorpus für den aktuellen mündlichen Sprachgebrauch im deutschen Sprachraum an. Es enthält einen wachsenden Bestand von Audio- und Videoaufnahmen authentischer Gespräche aus verschiedenen Bereichen des gesellschaftlichen Lebens. Die Dokumentation und Repräsentation von Interaktions- und Sprecherinformationen sind bereits seit den Anfängen des Korpusaufbaus integrale Bestandteile von FOLK. Allerdings lag bislang kein ausgearbeitetes, empirisch erprobtes und vollständig in die Korpusinfrastruktur integrierbares Stratifikationskonzept vor. Mit dem vorliegenden Artikel wird ein solches Konzept vorgeschlagen. Es knüpft an frühere Konzeptionen an und wurde anhand der vorhandenen Daten überprüft, korrigiert und erweitert. Dieser Prozess verlief parallel zur Überarbeitung des XML-Schemas zur Metadatendokumentation, um die konkrete Implementierung vorzubereiten. Im Anschluss an eine Skizzierung genereller Aspekte des Korpusdesigns werden die stratifikationsleitenden und ergänzenden Parameter vorgestellt und erläutert. Abschließend werden Ansätze und Strategien zum Korpusausbau diskutiert.
Der vorliegende Beitrag beschäftigt sich mit Imperativen, die nicht oder nicht nur für Handlungsaufforderungen, sondern auch für gesprächsorganisatorische Zwecke eingesetzt werden. Einschlägige Vertreter wie guck mal, hör mal, komm oder geh wurden in der Literatur meist als Interjektionen, aber auch als Diskursmarker klassifiziert. Anhand einer explorativen Korpusrecherche wird zunächst ein Überblick über die Häufigkeit und einige distributionelle Eigenschaften gesprächsorganisatorischer Imperative im gesprochenen Deutsch gegeben. Anschließend wird ein bisher nicht empirisch untersuchter Vertreter, warte (mal), anhand einer Kollektion von 190 Belegen im Hinblick auf seine Semantik und Funktion untersucht. In turninitialer und syntaktisch vorangestellter Position wird warte (mal) zur Markierung von Unterbrechungen der Progressivität und von Aktivitätswechseln verwendet, z.B. um Verstehensprobleme zu klären oder Argumente in eine Diskussion einzubringen. Tritt es satzmedial auf, markiert es Selbstreparaturen und Häsi-tationen. Es wird argumentiert, dass die Distribution und Funktionen es nicht rechtfertigen, warte (mal) als Diskursmarker zu bezeichnen.
Nach Auffassung der Interaktionalen Linguistik sind Äußerungen 'situiert', das heißt ihre Form ist an ihren Kontext sowie an die Art der mit ihnen ausgeführten Handlung( en) angepasst. Dieser Beitrag überprüft diese These am Beispiel des Einflusses unterschiedlicher Beteiligungsrollen auf die Realisierung konzessiver Konstruktionen in amerikanisch-englischen Rundfunkinterviews unter Zuhilfenahme qualitativer und quantitativer Methoden. Nach einer Beschreibung der Besonderheiten des Genres werden die Auswirkungen der situationalen Identitäten der Interaktantinnen auf die Realisierung der Diskursrelation in Radiointerviews untersucht. Die Ergebnisse beruhen auf der Analyse zweier je zweistündiger Korpora von Rundfunk- und Privatkonversationsdaten. Die konzessiven Konstruktionen wurden auf der Basis dreier Handlungen - BEHAUPTEN, EINRÄUMEN und ENTGEGENHALTEN -
identifiziert. Zum einen zeigten sich dabei (zum Teil erwartbare) Unterschiede in der Länge der Konstruktionselemente, ihrer lexikalischen und prosodischen Gestaltung sowie ihrer argumentativen Aufladung. Zum anderen ergaben sich aber auch Befunde, die bisherige Annahmen ergänzen oder ihnen sogar entgegenstehen, etwa wenn Sprecherinnen mit Hilfe konzessiver Konstruktionen ihre institutionell geregelten Diskursrechte erweitern bzw. -pflichten umgehen.
Das Beispiel ist seit der Antike ein zentraler Gegenstand der abendländischen Diskussion. In dieser ersten umfassenden Monographie zur Linguistik des Beispiels wird deshalb eine interdisziplinäre Perspektive entfaltet, in der Ansätze aus Rhetorik, Philosophie, Pädagogik und Psychologie sowie linguistischen Ansätze zur Beispielforschung behandelt werden. Die sprachwissenschaftliche Beschäftigung mit Beispielen blieb bisher jedoch ein Randphänomen, obwohl Praktiken der Beispielverwendung in der Alltagskommunikation allgegenwärtig sind.
Orientiert an ›grounded theory‹, linguistischer Hermeneutik und Handlungssemantik wird hier ein Beispielbegriff erarbeitet, demzufolge das Beispielverwenden eine komplexe Form sprachlichen Handelns und eine fundamentale menschliche Denkbewegung darstellt, die darin besteht, einen Konnex zwischen Besonderem und Allgemeinem zu konstituieren. Hierauf basierend werden Beispiele anhand eines umfangreichen Korpus von Gesprächsdaten analysiert und kommunikative Muster, sprachliche Realisierungsformen sowie Funktionen des Beispielverwendens in der Interaktion herausgearbeitet.
Im vorliegenden Artikel wird ein Überblick über das von der DFG geförderte Projekt Zugänge zu multimodalen Korpora gesprochener Sprache – Vernetzung und zielgruppenspezifische Ausdifferenzierung (ZuMult) gegeben. Dabei wird zunächst auf die Sprachdaten und auf die technische Basis der Applikationen eingegangen, die dem Projekt zugrunde liegen. Im Anschluss werden die weiteren Beiträge in diesem Themenheft von KorDaF kurz vorgestellt. Übergeordnetes Thema von ZuMult ist die Verbesserung der Zugänglichkeit von digitalen mündlichen Sprachdaten für verschiedene Anwendungen und Zielgruppen, wobei der Fokus dieses Themenhefts auf Applikationen und Anwender:innen aus der Fremdsprachendidaktik und der DaF-/DaZ-Forschung und -Lehre liegt. Die einzelnen Beiträge beleuchten zentrale methodische und/oder technische Aspekte dieses Themas und beschreiben die Architektur und verschiedene prototypische Anwendungen, die das Projekt entwickelt hat.
Transkriptionswerkzeuge sind spezialisierte Softwaretools für die Transkription und Annotation von Audio- oder Videoaufzeichnungen gesprochener Sprache. Dieses Kapitel erklärt einleitend, worin der zusätzliche Nutzen solcher Werkzeuge gegenüber einfacher Textverarbeitungssoftware liegt, und gibt dann einen Überblick über grundlegende Prinzipien und einige weitverbreitete Tools dieser Art. Am Beispiel der Editoren FOLKER und OrthoNormal wird schließlich der praktische Einsatz zweier Werkzeuge in den Arbeitsabläufen eines Korpusprojekts illustriert.
Die vorliegende empirisch basierte Studie zu Verwendungsweisen von ‘wenn' in gesprochenem Deutsch versteht sich als kleiner Beitrag zur Konnektorensemantik. Anhand eines Korpus gesprochener Sprache werden im ersten Schritt die Bedeutungsvarianten von wenn auf der Basis der Oppositionspaare ‘faktisch' vs. ‘nicht-faktisch’ und ‘generisch' vs. ‘spezifisch' typologisiert und im Hinblick auf ihre syntaktischen Spezifika untersucht. Im zweiten Schritt wird gezeigt, wie die so ermittelten Typen von wenn-Relationen mit den in Sweetser (1990) ausgefiihrten Verknüpfungsdomänen (Sachverhaltsebene, epistemische Ebene, Sprechaktebene), die durch pragmatische Ambiguität gekennzeichnet sind, korrelieren.
Weniger ist mehr! Die IDS-Goethe-Studie in den Integrationskursen und Vorschläge für die Praxis
(2021)
Was sind die Grundeinheiten gesprochener Sprache? Ein altes Problem und ein neuer Lösungsvorschlag
(2003)
This article revives the question of what the fundamental units of spoken language are. In chapter 2 some answers of current and previous theory are listed. In chapter 3 I argue that turns are the basic units of conversation, although the question of the constituents of a single turn arises. In chapter 4 a turn is broken down into atomistic units: the functional units. A functional unit is the smallest constituent of interaction to which a recipient can ascribe function for the communicative process. Functional units are distinguished into three types: contigently independent, projective and associated. A tentative account of different subtypes is suggested.
Die 7. Auflage der Duden-Grammatik ist u.a. erweitert um ein Kapitel "Gesprochene Sprache" im Umfang von 80 Druckseiten. Der Beitrag behandelt eine Reihe von konzeptionellen Fragen, die sich beim Verfassen dieses Kapitels ergaben, und stellt seinen Aufbau und Inhalt vor. Nach einer Skizzierung der Rahmenbedingungen (Abschnitt 2.) wird der Gegenstandsbereich einer Grammatik gesprochener Sprache diskutiert (Abschnitte 3. bis 5.). Abschnitt 6. behandelt einige Konsequenzen, die sich aus der Andersartigkeit des Gegenstands 'Gesprochene Sprache' für die Grammatikschreibung ergeben. Ein weiteres Problem stellt die Frage dar, ob bzw. inwieweit die schriftsprachlich geprägten Kategorien der traditionellen Grammatik geeignet sind, Phänomene der gesprochenen Sprache zu beschreiben und inwieweit gegenstandsangemessene Kategorien entwickelt werden müssen. Abschnitt 7. exemplifiziert diese Frage am Beispiel der sog. Apokoinukonstruktionen. Ein methodisches Problem stellt die Ermittlung von Besonderheiten der gesprochenen Sprache durch den Vergleich mit der geschriebenen dar (Abschnitt 8.). Abschnitt 9. skizziert Inhalte und Gliederung des Kapitels "Gesprochene Sprache". Abschließend werden konzeptionelle Probleme der Duden-Grammatik angesprochen (Abschnitt 10.).
Dieser Beitrag soll auf einen Verknüpfungsbereich von Grammatik und Pragmatik, speziell Gesprächsanalyse hinweisen, der sich in der Forschung der letzten fünfzehn Jahre als sehr fruchtbar erwiesen hat, zumindest für die Pragmatik und eine kommunikativ-funktional orientierte Grammatikkonzeption (vgl. dazu auch Zifonun et al. 1997). Äußerungsstrukturelle, insbesondere grammatische Gesichtspunkte spielen für die Verfahren des gesprächsanalytischen Spurenlesens im Umgang mit Dokumenten der Kommunikationswirklichkeit eine große Rolle, und die Systematisierung der dabei anfallenden Befunde macht Fortschritte. Für die folgenden Überlegungen beziehe ich mich auf die Verteilung von Redebeiträgen, das zentrale Arbeitsfeld der klassischen Konversationsanalyse. Dabei spielt die Frage der Vollständigkeit von Redebeiträgen bzw. Äußerungsstrukturen eine wichtige Rolle. Und hier gibt es eine fruchtbare Verknüpfungsstelle zwischen Gesprächsanalyse und Grammatik.
Vorschlag zu einer Typik der Kommunikationssituationen in der gesprochenen deutschen Standardsprache
(1975)
Unter dem Schlagwort ‚Kiezdeutsch‘ wurde in den letzten zehn Jahren intensiv über die Herkunft des deutschen Multiethnolekts diskutiert, der von Jugendlichen mit und ohne Migrationshintergrund genutzt wird. Handelt es sich bei den typischen Merkmalen um altersgebundene Stilisierungen? Oder avanciert die Jugendsprache zu einem neuen Dialekt des Deutschen? Einig war man sich bisher nur darin, dass der Multiethnolekt keine Fortsetzung der Lernermerkmale der Gastarbeitergeneration darstellt.
Ein Vergleich von sieben Merkmalen in über 50 Studien der letzten 50 Jahre lässt diese Prämisse fraglich erscheinen. Der vorliegende Band liefert eine Erklärung der Variation in der Morphosyntax, die mit den Schritten der Koinéisierung im Einklang steht und den kollektiven Sprachwechsel ins Deutsche berücksichtigt: Über mehrere Generationen und Lebensabschnitte erfolgt eine Weitergabe, Abnahme und Funktionalisierung der Merkmale, wobei ethnische Grenzen zunehmend verschwimmen.
Die 21. Arbeitstagung zur Gesprächsforschung mit dem Rahmenthema „Vergleichende Gesprächsforschung“ fand vom 21.–23. März 2018 am Institut für Deutsche Sprache in Mannheim statt. Das Ziel der Tagung war es, Forscherinnen und Forscher zusammenzubringen, die authentische Interaktionsdaten aus vergleichender Perspektive untersuchen. Das Rahmenthema der Tagung ergab sich aus dem steigenden Interesse an vergleichenden Fragestellungen innerhalb konversations- und gesprächsanalytischer Untersuchungen. Die Tagung nahm gezielt Vorgehensweisen und Methoden bei der Durchführung vergleichender Untersuchungen in den Blick. Die Vorträge, Projektpräsentationen und Datensitzungen erörterten 1. das Vergleichen als analytische Grundoperation der Konversations- und Gesprächsanalyse, 2. Vergleiche alternativer Ressourcen und Praktiken für spezifische Handlungen und Aktivitäten in der Interaktion sowie 3. methodologische Herausforderungen einer vergleichenden Gesprächsforschung.
Dieser Beitrag analysiert, wie sich Verbosität als Widerstandsphänomen sprachlich-interaktional manifestiert. Widerstand gilt in der psychodynamischen Therapie als Schutzfunktion der Patienten vor Veränderung, die den Fortschritt der Therapie hemmt, ist aus therapeutischer Sicht jedoch ein wertvoller Indikator für dahinterliegende, bedeutungsvolle Erfahrungen der Patienten. Gegenstand der Analyse sind drei Fallbeispiele aufgezeichneter ambulanter, psychodynamischer Therapiesitzungen. Die folgenden Merkmale von Verbosität sind Ergebnisse der Untersuchung: a) eine Themenverschiebung zu Beginn der jeweiligen Erzählung; b) Erzählgegenstand sind dritte, nicht anwesende Personen und/oder alltägliche Begebenheiten; c) Emotionen werden wenig oder gar nicht thematisiert; d) die Erzählungen weisen einen hohen Detailliertheitsgrad auf. Therapeuten behandeln die Erzählungen nur implizit als verbos durch eine zunächst abwartende Haltung, wenig bis keine Nachfragen sowie die Thematisierung von Emotionen und der Bedeutung des Gesagten für die Patienten selbst. Außerdem lenken sie das Gespräch auf die Patienten bzw. auf das vorherige Gesprächsthema oder übertragen die erzählte Geschichte auf die aktuelle Gesprächssituation.
Der Band untersucht die Verwendung der Bewegungsverben kommen und gehen sowie der mentalen Verben wissen und denken im gesprochenen Deutsch. Anhand einer Kombination explorativer, mit der Schriftlichkeit vergleichender Korpusuntersuchungen und interaktionslinguistischer Analysen werden spezifisch mündliche Argumentrealisierungsmuster identifiziert und deren funktionale Motivationen beschrieben. Es zeigt sich, dass viele verbgebundene Konstruktionen diskursorganisatorische Funktionen erfüllen oder mündlichkeitsspezifische Bedeutungen haben und dass dabei reduzierte Formen besonders häufig sind.
As a part of the ZuMult-project, we are currently modelling a backend architecture that should provide query access to corpora from the Archive of Spoken German (AGD) at the Leibniz-Institute for the German Language (IDS). We are exploring how to reuse existing search engine frameworks providing full text indices and allowing to query corpora by one of the corpus query languages (QLs) established and actively used in the corpus research community. For this purpose, we tested MTAS - an open source Lucene-based search engine for querying on text with multilevel annotations. We applied MTAS on three oral corpora stored in the TEI-based ISO standard for transcriptions of spoken language (ISO 24624:2016). These corpora differ from the corpus data that MTAS was developed for, because they include interactions with two and more speakers and are enriched, inter alia, with timeline-based annotations. In this contribution, we report our test results and address issues that arise when search frameworks originally developed for querying written corpora are being transferred into the field of spoken language.
The newest generation of speech technology caused a huge increase of audio-visual data nowadays being enhanced with orthographic transcripts such as in automatic subtitling in online platforms. Research data centers and archives contain a range of new and historical data, which are currently only partially transcribed and therefore only partially accessible for systematic querying. Automatic Speech Recognition (ASR) is one option of making that data accessible. This paper tests the usability of a state-of-the-art ASR-System on a historical (from the 1960s), but regionally balanced corpus of spoken German, and a relatively new corpus (from 2012) recorded in a narrow area. We observed a regional bias of the ASR-System with higher recognition scores for the north of Germany vs. lower scores for the south. A detailed analysis of the narrow region data revealed – despite relatively high ASR-confidence – some specific word errors due to a lack of regional adaptation. These findings need to be considered in decisions on further data processing and the curation of corpora, e.g. correcting transcripts or transcribing from scratch. Such geography-dependent analyses can also have the potential for ASR-development to make targeted data selection for training/adaptation and to increase the sensitivity towards varieties of pluricentric languages.
The newest generation of speech technology caused a huge increase of audio-visual data nowadays being enhanced with orthographic transcripts such as in automatic subtitling in online platforms. Research data centers and archives contain a range of new and historical data, which are currently only partially transcribed and therefore only partially accessible for systematic querying. Automatic Speech Recognition (ASR) is one option of making that data accessible. This paper tests the usability of a state-of-the-art ASR-System on a historical (from the 1960s), but regionally balanced corpus of spoken German, and a relatively new corpus (from 2012) recorded in a narrow area. We observed a regional bias of the ASR-System with higher recognition scores for the north of Germany vs. lower scores for the south. A detailed analysis of the narrow region data revealed – despite relatively high ASR-confidence – some specific word errors due to a lack of regional adaptation. These findings need to be considered in decisions on further data processing and the curation of corpora, e.g. correcting transcripts or transcribing from scratch. Such geography-dependent analyses can also have the potential for ASR-development to make targeted data selection for training/adaptation and to increase the sensitivity towards varieties of pluricentric languages.
This contribution presents the background, design and results of a study of users of three oral corpus platforms in Germany. Roughly 5.000 registered users of the Database for Spoken German (DGD), the GeWiss corpus and the corpora of the Hamburg Centre for Language Corpora (HZSK) were asked to participate in a user survey. This quantitative approach was complemented by qualitative interviews with selected users. We briefly introduce the corpus resources involved in the study in section 2. Section 3 describes the methods employed in the user studies. Section 4 summarizes results of the studies focusing on selected key topics. Section 5 attempts a generalization of these results to larger contexts.
In this paper, we describe a data processing pipeline used for annotated spoken corpora of Uralic languages created in the INEL (Indigenous Northern Eurasian Languages) project. With this processing pipeline we convert the data into a loss-less standard format (ISO/TEI) for long-term preservation while simultaneously enabling a powerful search in this version of the data. For each corpus, the input we are working with is a set of files in EXMARaLDA XML format, which contain transcriptions, multimedia alignment, morpheme segmentation and other kinds of annotation. The first step of processing is the conversion of the data into a certain subset of TEI following the ISO standard ’Transcription of spoken language’ with the help of an XSL transformation. The primary purpose of this step is to obtain a representation of our data in a standard format, which will ensure its long-term accessibility. The second step is the conversion of the ISO/TEI files to a JSON format used by the “Tsakorpus” search platform. This step allows us to make the corpora available through a web-based search interface. As an addition, the existence of such a converter allows other spoken corpora with ISO/TEI annotation to be made accessible online in the future.
Transkriptionsaufwand
(2015)
Während die Erhebung von Gesprächsdaten zwar zeitaufwändig, aber doch noch relativ zügig zu bewältigen ist, handelt es sich bei der Transkription um eine langwierige Aufgabe, die oft unterschätzt wird. Damit Studierende, Promovierende sowie WissenschaftlerInnen, die Exposés, Arbeitspläne usw. aufstellen oder Zuschüsse für Projekte beantragen müssen, zukünftig über fundiertere Werte verfügen und damit realistischere Aussagen über den benötigten Aufwand (zeitliche wie personelle Ressourcen) treffen können, stellt der Beitrag die Ergebnisse einer Erhebung des Transkriptionsaufwandes im FOLK-Projekt vor.
While written corpora can be exploited without any linguistic annotations, speech corpora need at least a basic transcription to be of any use for linguistic research. The basic annotation of speech data usually consists of time-aligned orthographic transcriptions. To answer phonetic or phonological research questions, phonetic transcriptions are needed as well. However, manual annotation is very time-consuming and requires considerable skill and near-native competence. Therefore it can take years of speech corpus compilation and annotation before any analyses can be carried out. In this paper, approaches that address the transcription bottleneck of speech corpus exploitation are presented and discussed, including crowdsourcing the orthographic transcription, automatic phonetic alignment, and query-driven annotation. Currently, query-driven annotation and automatic phonetic alignment are being combined and applied in two speech research projects at the Institut für Deutsche Sprache (IDS), whereas crowdsourcing the orthographic transcription still awaits implementation.
This paper describes EXMARaLDA, an XML-based framework for the construction, dissemination and analysis of corpora of spoken language transcriptions. Departing from a prototypical example of a “partitur” (musical score) transcription, the EXMARaLDA “single timeline, multiple tiers” data model and format is presented alongside with the EXMARaLDA Partitur-Editor, a tool for inputting and visualizing such data. This is followed by a discussion of the interaction of EXMARaLDA with other frameworks and tools that work with similar data models. Finally, this paper presents an extension of the “single timeline, multiple tiers” data model and describes its application within the EXMARaLDA system.
This paper describes the development of a systematic approach to the creation, management and curation of linguistic resources, particularly spoken language corpora. It also presents first steps towards a framework for continuous quality control to be used within external research projects by non-technical users, and discuss various domain and discipline specific problems and individual solutions. The creation of spoken language corpora is not only a time-consuming and costly process, but the created resources often represent intangible cultural heritage, containing recordings of, for example, extinct languages or historical events. Since high quality resources are needed to enable re-use in as many future contexts as possible, researchers need to be provided with the necessary means for quality control. We believe that this includes methods and tools adapted to Humanities researchers as non-technical users, and that these methods and tools need to be developed to support existing tasks and goals of research projects.
The aim of this paper is to highlight the actual need for corpora that have been annotated based on acoustic information. The acoustic information should be coded in features or properties and is needed to inform further processing systems, i.e. to present a basis for a speech recognition system using linguistic information. Feature annotation of existing corpora in combination with segmental annotation can provide a powerful training material for speech recognition systems, but will as well challenge the further processing of features to segments and syllables. We present here the theoretical preliminaries for our multilingual feature extraction system, that we are currently working on.
Researchers interested in the sounds of speech or the physical gestures of Speakers make use of audio and video recordings in their work. Annotating these recordings presents a different set of requirements to the annotation of text. Special purpose tools have been developed to display video and audio Signals and to allow the creation of time-aligned annotations. This chapter reviews the most widely used of these tools for both manual and automatic generation of annotations on multimodal data.
This paper describes EXMARaLDA, a system for computer transcription of spoken discourse developed and used by the SFB "Mehrsprachigkeit" at the university of Hamburg. EXMARaLDA consists of several DTDs for XML coding of transcription data and some input and output tools for these formats. Apart from being a transcription system in its own right, EXMARaLDA also plays the role of a mediator between older existing data formats at the SFB and between these formats and a planned database of multilingual spoken discourse.
This paper describes the TEI-based ISO standard 24624:2016 ‘Transcription of spoken language’ and other formats used within CLARIN for spoken language resources. It assesses the current state of support for the standard and the interoperability between these formats and with rele- vant tools and services. The main idea behind the paper is that a digital infrastructure providing language resources and services to researchers should also allow the combined use of resources and/or services from different contexts. This requires syntactic and semantic interoperability. We propose a solution based on the ISO/TEI format and describe the necessary steps for this format to work as an exchange format with basic semantic interoperability for spoken language resources across the CLARIN infrastructure and beyond.
"FOLK is the ""Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK)"" (eng.: research and teaching corpus of spoken German). The project has set itself the aim of building a corpus of German conversations which a) covers a broad range of interaction types in private, institutional and public settings, b) is sufficiently large and diverse and of sufficient quality to support different qualitative and quantitative research approaches, c) is transcribed, annotated and made accessible according to current technological standards, and d) is available to the scientific community on a sound legal basis and without unnecessary restrictions of usage. This paper gives an overview of the corpus design, the strategies for acquisition of a diverse range of interaction data, and the corpus construction workflow from recording via transcription an annotation to dissemination."
The Partitur Format at BAS
(1997)
Most spoken language resources are produced and disseminated together with symbolic information relating to the speech signal. These are for instance orthographic transcript labeling and segmentation on the phonologic phoneti prosodic phrasal level. Most of the known formats for these symbolic data are defined in a ‘closed form’ that is not fexible enough to allow simple and platform independent processing and easy extensions.
At the Bavarian Archive for Speech Signals (BAS) a new format has been developed and used over the last few years that shows some significant advantages over other existing formats. This paper describes the basic principles behind this format discusses briefly the advantages and gives detailed definitions of the description levels used so far.
This contribution investigates the use of the Czech particle jako (“like”/“as”) in naturally occurring conversations. Inspired by interactional research on unfinished or suspended utterances and on turn-final conjunctions and particles, the analysis aims to trace the possible development of jako from conjunction to a tag-like particle that can be exploited for mobilizing affiliative responses. Traditionally, jako has been described as conjunction used for comparing two elements or for providing a specification of a first element [“X (is) like Y”]. In spoken Czech, however, jako can be flexibly positioned within a speaking turn and does not seem to operate as a coordinating or hypotactic conjunction. As a result, prior studies have described jako as a polyfunctional particle. This article will try to shed light on the meaning of jako in spoken discourse by focusing on its apparent fuzzy or “filler” uses, i.e., when it is found in a mid-turn position in multi-unit turns and in the immediate vicinity of hesitations, pauses, and turn suspensions. Based on examples from mundane, video-recorded conversations and on a sequential and multimodal approach to social interaction, the analyses will first show that jako frequently frames discursive objects that co-participants should respond to. By using jako before a pause and concurrently adopting specific embodied displays, participants can more explicitly seek to mobilize responsive action. Moreover, as jako tends to cluster in multi-unit turns involving the formulation of subjective experience or stance, it can be shown to be specifically designed for mobilizing affiliative responses. Finally, it will be argued that the potential of jako to open up interactive turn spaces can be linked to the fundamental comparative semantics of the original conjunction.
This paper presents the concept of the "participant perspective" as an approach to the study of spoken language. It discusses three aspects of this concept and shows that they can offer helpful tools in spoken language research. Employing the participant perspective provides us with an alternative to many of the approaches currently in use in the study of spoken language in that it favours small-scale, qualitative research that aims to uncover categories relevant for the participants. Its results can usefully complement large-scale studies of phenomena on all linguistic dimensions of talk.
This paper presents the corpus-based lexicographical prototype that was developed within the framework of the project Lexik des gesprochenen Deutsch (=LeGeDe) as a thirdparty funded project. Research results regarding the information offered in dictionaries have shown that there is a necessity for information on spoken lexis and its interactional functions. The resulting LeGeDe-prototype is based on these needs and desiderata and is thus an innovative example for the adequate representation of spoken language in online dictionaries. It is available online since September 2019 (https://www.owid.de/legede/). In the following sections, after first focusing on the presentation of the project’s goals, the data basis, the intended end user, and the applied methods, we will illustrate the microstructure of the prototype and the information provided in a dictionary entry based on the lemma eben. Finally, we will summarize innovative aspects that are important for the implementation of such a resource.
The lexicography of German
(2020)
This chapter discusses the main dictionaries of the German language as it is spoken and written in Germany, and also German as it is spoken and written in Austria, Switzerland, the eastern fringes of Belgium, and South Tyrol. It also briefly describes Pennsylvania German. Corpora and other language resources used in German dictionary-making are also presented. Finally, there is a discussion of some current issues in German lexicography, as well as future prospects.
This paper presents the first release of the KiezDeutsch Korpus (KiDKo), a new language resource with multiparty spoken dialogues of Kiezdeutsch, a newly emerging language variety spoken by adolescents from multi-ethnic urban areas in Germany. The first release of the corpus includes the transcriptions of the data as well as a normalisation layer and part-of-speech annotations. In the paper, we describe the main features of the new resource and then focus on automatic POS tagging of informal spoken language. Our tagger achieves an accuracy of nearly 97% on KiDKo. While we did not succeed in further improving the tagger using ensemble tagging, we present our approach to using the tagger ensembles for identifying error patterns in the automatically tagged data.
The current paper presents a corpus containing 35 dialogues of spontaneously spoken southern German, including half an hour of articulography for 13 of the speakers. Speakers were seated in separate recording chambers, mimicking a telephone call, and recorded on individual audio channels. The corpus provides manually corrected word boundaries and automatically aligned segment boundaries. Annotations are provided in the Praat format. In addition to audio recordings, speakers filled out a detailed questionnaire, assessing among others their audio-visual consumption habits.
This paper reports on the efforts of twelve national teams in building the International Comparable Corpus (ICC; https://korpus.cz/icc) that will contain highly comparable datasets of spoken, written and electronic registers. The languages currently covered are Czech, Finnish, French, German, Irish, Italian, Norwegian, Polish, Slovak, Swedish and, more recently, Chinese, as well as English, which is considered to be the pivot language. The goal of the project is to provide much-needed data for contrastive corpus-based linguistics. The ICC corpus is committed to the idea of re-using existing multilingual resources as much as possible and the design is modelled, with various adjustments, on the International Corpus of English (ICE). As such, ICC will contain approximately the same balance of forty percent of written language and 60 percent of spoken language distributed across 27 different text types and contexts. A number of issues encountered by the project teams are discussed, ranging from copyright and data sustainability to technical advances in data distribution.
The IFCASL corpus is a French-German bilingual phonetic learner corpus designed, recorded and annotated in a project on individualized feedback in computer-assisted spoken language learning. The motivation for setting up this corpus was that there is no phonetically annotated and segmented corpus for this language pair of comparable of size and coverage. In contrast to most learner corpora, the IFCASL corpus incorporate data for a language pair in both directions, i.e. in our case French learners of German, and German learners of French. In addition, the corpus is complemented by two sub-corpora of native speech by the same speakers. The corpus provides spoken data by about 100 speakers with comparable productions, annotated and segmented on the word and the phone level, with more than 50% manually corrected data. The paper reports on inter-annotator agreement and the optimization of the acoustic models for forced speech-text alignment in exercises for computer-assisted pronunciation training. Example studies based on the corpus data with a phonetic focus include topics such as the realization of /h/ and glottal stop, final devoicing of obstruents, vowel quantity and quality, pitch range, and tempo.
Textsorten und Soziolekte : Funktion und Reziprozität in gesprochener und geschriebener Sprache
(1973)
This article discusses questions concerning the creation, annotation and sharing of spoken language corpora. We use the Hamburg Map Task Corpus (HAMATAC), a small corpus in which advanced learners of German were recorded solving a map task, as an example to illustrate our main points. We first give an overview of the corpus creation and annotation process including recording, metadata documentation, transcription and semi-automatic annotation of the data. We then discuss the manual annotation of disfluencies as an example case in which many of the typical and challenging problems for data reuse – in particular the reliability of interpretative annotations – are revealed.
Nach einer Definition der Begriffe ‚multimodale Verständigung‘ und ‚gesprochene Sprache‘ werden im vorliegenden Beitrag Prozessualität, Interaktivität und Multimodalität als zentrale Besonderheiten multimodaler Verständigung beschrieben und in ihren möglichen Auswirkungen auf die Syntax gesprochener Sprache charakterisiert. Als aktuelle Konzepte zur syntaktischen Beschreibung gesprochener Sprache stelle ich dann die on line-Syntax, die Konstruktionsgrammatik und die multimodale
Grammatik vor. Als Probleme der syntaktischen Beschreibung gesprochener Sprache diskutiere ich die Beschreibungskategorien sowie die Varianz gesprochener Sprache, die eine eindeutige kategoriale Erfassung erschwert. Als Gegenstand syntaktischer Beschreibung werden die funktionalen Einheiten und der Gesprächsbeitrag eingeführt (Abschnitt 2). Sodann stelle ich Ausschließlichkeit, quantitative Differenz und funktionale Differenz als zu unterscheidende Formen von Besonderheiten vor. Es schließen sich Darstellungen zur Syntax im Formulierungsprozess, zu spezifischen syntaktischen Strukturen und Konstruktionen und zur Syntax ‚elliptischer‘ Gesprächsbeiträge an (Abschnitt 3). Zum Abschluss werden zusammenfassend allgemeine Tendenzen der Syntax gesprochener Sprache benannt (Abschnitt 4).
Mit den Methoden der Interaktionalen Linguistik und der Konversationsanalyse untersucht die vorliegende Arbeit syntaktische Ko-Konstruktionen im gesprochenen Deutsch, wobei der Fokus auf Vervollständigungen eines zweiten Sprechers vor einem möglichen syntaktischen Abschlusspunkt liegt. Auf der Basis von 199 Ko-Konstruktionen aus informellen Interviews und Tischgesprächen leistet die Arbeit eine erste umfassende Analyse der gemeinsamen Konstruktion einer syntaktischen Gestalt durch zwei Sprecher im Deutschen.
Die Struktur der Ko-Konstruktionen wird in einem ersten Schritt über die Basisoperationen der Online-Syntax, Projektion und Retraktion, beschrieben. Im Fokus steht hier die Frage, an welchen Projektionen sich der zweite Sprecher orientiert, wobei sowohl syntaktische und prosodische als auch semanto-pragmatische Aspekte in die Analyse miteinbezogen werden. In einem zweiten Schritt wird die zeitliche und sequenzielle Organisation der Ko-Konstruktionen detailliert herausgearbeitet. Ein Schwerpunkt liegt hier auf einer genauen Darstellung und Analyse der verschiedenen Handlungsoptionen des ersten Sprechers nach der ko-konstruierten Vervollständigung.
In this presentation I show first results from an ongoing study about syntactic complexity of sanctioning turns in spoken language. This study is part of a larger project on sanctioning of misconduct in social interaction in different European languages (English, German, Italian and Polish). For the study I use video recordings of different everyday settings (family breakfasts, board game interactions and car rides) with three or four participants. These data come from the Parallel European Corpus of Informal Interaction (Kornfeld/Küttner/Zinken 2023; Küttner et al. submitted). I focus on sanctioning turns with more than one turn-constructional unit (see among others for TCUs: Sacks/Schegloff/Jefferson 1974; Clayman 2013). The study asks how often TCUs are linked to each other in the different languages, for what function, and how language diversity enters into this. Note that complex sanctioning turns do not always come as complex sentences.
Die Guidelines sind eine Erweiterung des STTS (Schiller et al. 1999) für die Annotation von Transkripten gesprochener Sprache. Dieses Tagset basiert auf der Annotation des FOLK-Korpus des IDS Mannheim (Schmidt 2014) und es wurde gegenüber dem STTS erweitert in Hinblick auf typisch gesprochensprachliche Phänomene bzw. Eigenheiten der Transkription derselben. Es entstand im Rahmen des Dissertationsprojekts „POS für(s) FOLK – Entwicklung eines automatisierten Part-of-Speech-Tagging von spontansprachlichen Daten“ (Westpfahl 2017 (i.V.)).
Lexikalische Diskurspartikeln wie ‚gut‘, ‚schön‘, ‚genau‘, ‚richtig‘, ‚klar‘ etc. mit Äquivalenten in anderen Wortklassen (z.B. als Adjektive) und einem inhärenten semantischen Gehalt sind ein häufiges Phänomen in der gesprochenen Sprache. In ihrem vielfältigen, feinnuancierten Gebrauch tragen sie maßgeblich zur Organisation von Gesprächen bei. Der Fokus dieser empirischen interaktionslinguistischen Untersuchung liegt auf der detaillierten Beschreibung des Formen- und Funktionsspektrums sowie der Verwendungspraktiken von ‚gut‘ und ‚schön‘. Dabei werden funktionale, sequenzielle, prosodische und kombinatorische Regelhaftigkeiten aufgezeigt sowie das Verhältnis zwischen ‚gut/schön‘ und ihren Pendants als Adjektiven diskutiert. Die Verwendungsmerkmale und -bereiche der Diskurspartikeln werden zudem mit prädikativen Formen mit ‚gut/schön‘ verglichen, um die Spezifika und Leistungsfähigkeit von lexikalischen Diskurspartikeln aufzuzeigen und die Formate im Hinblick auf Pragmatikalisierung zu diskutieren.
Die Beiträge des Bandes konzentrieren sich auf die Fragen: Was umfasst der Begriff 'Standardsprache', wie hat sich die deutsche Standardsprache seit dem 19. Jh. entwickelt, wie ist ihr gegenwärtiger Zustand sprachwissenschaftlich angemessen zu beschreiben und welche längerfristigen Entwicklungstendenzen lassen sich erkennen? Die Antworten reflektieren auch Notwendigkeit und Grenzen von Normativität.
Sprache und Gehirn
(2008)
Sprachverstehen ist ein hochkomplexer Prozess bei dem eine Reihe von Subprozessen aufgerufen und zeitlich koordiniert werden müssen. Linguistische Theorien und psycholinguistische Modelle postulieren unterschiedliche Prozessdomänen für die Verarbeitung von gesprochener Sprache: Semantik, Syntax und Phonologie und innerhalb dieser, die Prosodie. Neurophysiologische Studien, die auf den zeitlichen Verlauf dieser Prozesse im Gehirn fokussieren, zeigen, dass syntaktische Information früh und unabhängig von semantischer Information verarbeitet wird. Bildgebende Verfahren belegen, dass diese verschiedenen Prozessdomänen von unterschiedlichen neuronalen Netzwerken in der linken Hirnhälfte unterstützt werden. Für die syntaktische Verarbeitung können dabei zwei Subnetzwerke differenziert werden. Ein Netzwerk, bestehend aus dem frontalen Operculum und dem anterioren Anteil des oberen Temporalgyrus, zeichnet verantwortlich für die Verarbeitung der lokalen Phrasenstruktur. Ein zweites Netzwerk, bestehend aus dem Broca-Areal und dem hinteren Anteil des oberen Temporalgyrus, ist verantwortlich für die Verarbeitung hierarchischer Strukturen. Die rechte Hirnhälfte ist vornehmlich für die Verarbeitung prosodischer Information auf Satzebene zuständig. Die schnelle Kommunikation zwischen beiden Hirnhälften ist Voraussetzung für eine enge Koppelung von syntaktischer und prosodischer Verarbeitung auf dem Weg zum Sprachverstehen. Diese wird durch eine Hirnstruktur gesichert, die die beiden Hemisphären miteinander verbindet. Als Beleg hierfür gilt der Befund, dass Patienten mit Schädigung dieser Hirnstruktur keine normale Interaktion zwischen grammatischer und prosodischer Information zeigen.
Der Beitrag plädiert für eine Untersuchung der gesprochenen Sprache als integralem Bestandteil multimodaler Interaktionspraktiken. Das leibliche Handeln bildet die Infrastruktur für die Verwendung von Sprache, es schafft Bedingungen, Möglichkeiten und Motivationen für die Verwendung spezifischer sprachlicher Strukturen; umgekehrt wird es seinerseits durch sprachliches Handeln organisiert. Zunächst werden in dem Beitrag grundlegende Eigenschaften multimodaler Interaktion dargestellt: die Vielfalt der leiblichen Handlungsressourcen und ihre Koordination, Sequenzialität und Simultaneität von Aktivitäten, multimodale Beteiligung an der Interaktion, der Stellenwert von Raum, Objekten, Multiaktivität und Bewegung. Ebenso wird kurz auf die methodischen Grundlagen der Untersuchung eingegangen: Videoaufnahme und multimodale Transkription. An drei sprachlichen Phänomenbereichen wird dann exemplarisch gezeigt, wie sprachliche Praktiken durch ihr Zusammenspiel mit anderen leiblichen Ressourcen der Kommunikation geprägt sind. Im Einzelnen geht es um die Disambiguierung sprachlicher Praktiken durch ihre Koordination mit anderen Ressourcen, die Erweiterung sprachlicher Strukturen, die aufgrund von Rezipientenreaktionen simultan zur Turn-Produktion stattfindet, und die Verwendungen minimaler Referenzformen, die sich auf die multimodale Ko-Orientierung der Beteiligten stützt.
Gerade wenn es um die Gewinnung und eine erste Bewertung von Forschungsdaten geht, ist derzeit oft vom Übergang zu citizen science die Rede. Nachdem dieses Konzept zunächst in den Lebenswissenschaften eine größere Rolle gespielt hat, findet es sich neuerdings auch in Teilen der Sprachwissenschaft. Viele einschlägige Initiativen schließen an die Tätigkeiten an, bei denen sich auch traditionell schon die professionalisierte Wissenschaft der Hilfe der ‚Laien‘ bediente, sie können allerdings jetzt die in ungeahntem Ausmaß gewachsenen Möglichkeiten elektronischer Kommunikation und elektronischen Daten-Managements nutzen. Das digitale Interagieren erweitert die Möglichkeiten der als beteiligte „Laien“ gesehenen Personen aber doch so sehr, dass sich auch qualitativ ein neues Verhältnis zwischen den am Forschungsprozess Beteiligten entwickelt. In diesem Beitrag wird diskutiert, welche Folgen diese Veränderung für die wissenschaftliche Praxis, aber auch für das Verständnis des Konzepts „Wissenschaft“ hat.
Die Arbeit ist ein Versuch, Erscheinungen in der gesprochenen Sprache mit linguistischen, soziologischen und psychologischen Methoden, Modellen und Theorien zu analysieren. Die empirischen Methoden stehen dabei gleichberechtigt neben den theoretischen Überlegungen; in wechselseitiger Abstimmung aufeinander bestimmen Theorie und Empirie den Gang der Untersuchung. Die verschiedenen hypothetischen und theoretischen Überlegungen können in dieser Arbeit von der Empirie allerdings immer nur ein stückweit "eingeholt" werden; es bleibt also noch viel zu tun, um alle theoretischen Ansätze, die hier entwickelt werden, einer empirischen Überprüfung zu unterziehen. Dies gilt vor allem deshalb, da gesprochene Sprache von Schulkindern untersucht wird, der theoretische Rahmen aber auch für das Sprachverhalten von Jugendlichen und Erwachsenen gelten soll.
Die linguistisch-gesprächsanalytischen bzw. soziologisch-ethnographischen Beiträge dieses Sammelbandes beschreiben den Zusammenhang zwischen dem kommunikativen Stil von sozialen Welten und sozialen Prozessen der Integration bzw. der Ab- und Ausgrenzung. Stil wird dabei verstanden als Ausdruck sozialer und kultureller Identität; Stilformen sind Mittel zum Ausdruck von sozialer Präsenz auf wichtigen Schauplätzen der politischen bzw. kulturell-politischen Auseinandersetzung.
Die Beiträge des Bandes präsentieren – neben einigen einführenden und theoretischen Beiträgen – Stilanalysen aus sehr unterschiedlichen Bereichen der Gesellschaft. Dabei fokussieren sie einzelne stilkonstitutive Aspekte, wie die für bestimmte soziale Gruppen spezifischen Regeln des Sprechens oder charakteristischen Formen und Verfahren der Selbst- und Fremdtypisierung bzw. Kategorisierung. Die Beiträger(innen) sind Werner Kallmeyer in langjähriger Zusammenarbeit verbunden.
Die Programmbereiche „Korpuslinguistik“ und „Mündliche Korpora“ haben am IDS die Aufgabe, Grundlagen für die empirische Erforschung der deutschen Sprache zu legen. Unter anderem sammeln und erstellen sie schriftliche und mündliche Korpora, bereiten sie für eine wissenschaftliche Nutzung auf und stellen sie über Web-Oberflächen (COSMAS, DGD2 demnächst KorAP) zur Verfügung. Unser Beitrag gibt zunächst einen Überblick über Entstehungsgeschichte und aktuellen Stand dieser Arbeiten. Mit einem Blick in die Zukunft widmen wir uns auch der Frage, ob und in welcher Weise das Schlagwort ,Big Data‘ für diese Arten linguistischer Ressourcen relevant ist. In Bezug auf die schriftlichen Korpora wird dabei insbesondere über die diesjährige DEREKo-Erweiterung um über 17 Milliarden Wörter und die damit verbundenen Arbeiten berichtet. In diesem Zusammenhang werden u.a. DeReKos Design, die zugrundeliegende Akquisitionsstrategie und Überlegungen zu Dispersion und Stratifizierbarkeit diskutiert. Die spezifischen Herausforderungen, die sich beim Aufbau eines großen Gesprächskorpus stellen, werden am Beispiel des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) diskutiert. Dabei steht außer Frage, dass angesichts des Aufwandes, den Feldzugang sowie Erschließung der im Feld gewonnenen Audio- und Videodaten bedeuten, vergleichbare Datenmengen und Wachstumsraten wie bei Textkorpora nicht zu erreichen sind. Für den Aufbau umfangreicher mündlicher Korpora ist daher die Entwicklung eines eigenen Methodeninstrumentariums notwendig.
Schriftlich-Mündlich
(1990)
Satz und Wort im heutigen Deutsch : Probleme und Ergebnisse neuerer Forschung : Jahrbuch 1965/1966
(1967)
Since Lerner coined the notion of delayed completion in 1989, this recurrent social practice of continuing one’s speaking turn while disregarding an intermediate co-participant’s utterance has not been investigated with regard to embodied displays and actions. A sequential approach to videotaped mundane conversations in German will explain the occurrence and use of delayed completions. First, especially in multi-party and multi-activity settings, delayed completions can result from reduced monitoring and coordinating activities. Second, recipients can use intra-turn response slots for more extended responsive actions than the current speaker initially projected, leading to delayed completion sequences. Finally, delayed completions are used for blocking possibly misaligned co-participant actions. The investigation of visible action illustrates that delayed completions are a basic practice for retrospectively managing co-participant response slots.