P2: Mündliche Korpora
Refine
Document Type
- Article (22)
- Part of a Book (22)
- Conference Proceeding (20)
- Part of Periodical (3)
- Book (1)
- Doctoral Thesis (1)
- Preprint (1)
Language
- English (36)
- German (33)
- Multiple languages (1)
Has Fulltext
- yes (70)
Keywords
- Korpus <Linguistik> (43)
- Gesprochene Sprache (26)
- Deutsch (22)
- Konversationsanalyse (13)
- Forschungsdaten (12)
- Annotation (10)
- Datenmanagement (9)
- Interaktion (9)
- Mündliche Kommunikation (7)
- Transkription (7)
Publicationstate
- Veröffentlichungsversion (36)
- Zweitveröffentlichung (32)
- Postprint (9)
Reviewstate
Publisher
- European Language Resources Association (8)
- Linköping University Electronic Press (5)
- Association for Computational Linguistics (4)
- de Gruyter (4)
- CLARIN (3)
- Leibniz-Institut für Deutsche Sprache (IDS) (3)
- Narr (3)
- Narr Francke Attempto (3)
- Universitäts- und Landesbibliothek Darmstadt (3)
- Verlag für Gesprächsforschung (3)
Der Umgang mit längeren, komplexeren Redebeiträgen hat als Gegenstand der Mündlichkeitsdidaktik in Sprachvermittlung sowie Sprachbildung viel Aufmerksamkeit erfahren. Empirische Untersuchungen dazu, in welchen Sprachverwendungskontexten lange Redebeiträge in natürlichen Gesprächssituationen häufig vorkommen und damit die Fähigkeit, sie verstehen und produzieren zu können, eine Anforderung für Lernende bildet, stehen jedoch noch aus. Der Beitrag stellt eine explorative Studie auf der Basis des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) vor, die zeigt, wie durch korpuslinguistische Analysen anhand von Interaktionskorpora eine Beschreibung der Gebrauchsspezifika langer Redebeiträge für ein weites Spektrum an Gesprächskontexten gewonnen und damit eine Grundlage für die zielgruppenspezifische Vermittlung diskursiver Fähigkeiten im DaF/DaZ-Unterricht bereitgestellt werden kann.
We present a collection of (currently) about 5.500 commands directed to voice-controlled virtual assistants (VAs) by sixteen initial users of a VA system in their homes. The collection comprises recordings captured by the VA itself and with a conditional voice recorder (CVR) selectively capturing recordings including the VA-directed commands plus some surrounding context. Next to a description of the collection, we present initial findings on the patterns of use of the VA systems during the first weeks after installation, including usage timing, the development of usage frequency, distributions of sentence structures across commands, and (the development of) command success rates. We discuss the advantages and disadvantages of the applied collection-specific recording approach and describe potential research questions that can be investigated in the future, based on the collection, as well as the merit of combining quantitative corpus linguistic approaches with qualitative in-depth analyses of single cases.
Wissenschaftskommunikation gehört auch in den Sprachwissenschaften inzwischen zu den regelmäßigen Aufgaben neben Forschung und Lehre. Die Aktivitäten reichen von "kleineren Formaten" wie TikTok-Videos zu linguistischen Themen bis zum Aufbau des "Forum Deutsche Sprache" durch das IDS Mannheim als eine Art "Museum für Sprachwissenschaft". Im Rahmen des Uni.Stadt.Fests 2019, einer ganztägigen Veranstaltung anlässlich des 50jährigen Jubiläums der Universität Bielefeld, haben wir – Gesprächsforschende der Universität – die Gesprächsanalyse an einem Stand als Forschungsmethode erlebbar gemacht: in einem sogenannten "Plauderlabor". Die Idee zu diesem Projekt basiert auf dem "Conversational Rollercoaster" von Albert et al. (2018), einem partizipatorischen Format zur Demonstration der konversationsanalytischen Methode, entwickelt für eine Wissenschaftsmesse in London 2016. Zur Vorbereitung des Plauderlabors organisierte sich in Bielefeld eine interdisziplinäre Gruppe mit den Lehrstuhlinhaberinnen Ruth Ayaß (Methoden der empirischen Sozialforschung mit dem Schwerpunkt qualitative Methoden, Fakultät für Soziologie), Barbara Job (Sprache und Kommunikation, Fakultät für Linguistik und Literaturwissenschaft) und Friederike Kern (Germanistik/Frühe sprachliche Bildung und frühes Lernen, Fakultät für Linguistik und Literaturwissenschaft) sowie ca. 30 wissenschaftlichen Mitarbeiter*innen, Doktorand*innen und studentischen Hilfskräften, teils aus dem Zentrum für Lehren und Lernen (ZLL) und der Bielefeld School of Education (BiSEd). Unsere Erfahrungen mit dem Plauderlabor wollen wir im Folgenden teilen.
Dieser Beitrag stellt den Aufbau eines multimodalen Korpus zur Erforschung des Deutschen als Minderheitssprache in Argentinien vor (DiA). In dem sich im Aufbau befindlichen DiA-Korpus werden die heutige wie auch die historische Situation mit multimodalen (mündlichen, schriftlichen und visuellen) Datensätzen repräsentiert, die mit entsprechenden methodischen Zugängen erfasst wurden und werden. Dazu gehören fragebogengeleitete Interviews (mündliches Medium), Briefe und elizitierte Schriftzeugnisse (geschriebenes Medium) sowie Linguistic-Landscape-Bilddaten (visuelles Medium). In diesem Beitrag wird zunächst ein Überblick über die Forschungssituation zum Deutschen als Minderheitensprache in Argentinien gegeben. Kern des Beitrags ist dann die Vorstellung der Korpusstruktur und des Vorgehens beim Korpusaufbau sowie die Darstellung von Auswertungspotentialen des Datenfundus auf systemischer, soziolinguistischer, sprachideologischer und kontaktlinguistischer Ebene. Eine Methodenreflexion rundet den Beitrag ab.
For many reasons, Mennonite Low German is a language whose documentation and investigation is of great importance for linguistics. To date, most research projects that deal with this language and/ or its speakers have had a relatively narrow focus, with many of the data cited being of limited relevance beyond the projects for which they were collected. In order to create a resource for a broad range of researchers, especially those working on Mennonite Low German, the dataset presented here has been transformed into a structured and searchable corpus that is accessible online. The translations of 46 English, Spanish, or Portuguese stimulus sentences into Mennonite Low German by 321 consultants form the core of the MEND-corpus (Mennonite Low German in North and South America) in the Archive for Spoken German. In addition to describing the origin of this corpus and discussing possibilities and limitations for further research, we discuss the technical structure and search possibilities of the Database for Spoken German. Among other things, this database allows for a structured search of metadata, a context-sensitive token search, and the generation of virtual corpora that can be shared with others. Moreover, thanks to its text-sound alignment, one can easily switch from a particular text section of the corpus to the corresponding audio section. Aside from the desire to equip the reader with the technical knowledge necessary to use this corpus, a further goal of this paper is to demonstrate that the corpus still offers many possibilities for future research.
This paper examines multi-unit turns that allow speakers to retrospectively close the prior sequence while prospectively launching a new sequence, which Schegloff (1986) referred to as interlocking organization. Using English telephone conversations as data, we focus on how multi-unit turns are used for topic shifts, and show that interlocking organization operates in conjunction with other phonetic and lexical features, such as increased pitch and overt markers of disjunction (e.g., “listen”). In addition, speakers utilize an audible inbreath that is placed between the first and the second units as a central interactional resource to project further talk, thereby suppressing speaker transition and possibly highlighting the action delivered in the second unit as being distinctly new. We propose that interlocking multi-unit turns, when used to make topically disjunctive moves, promote progressivity by avoiding a possible lapse in turn transition
Einleitung
(2023)
Speech islands are historically and developmentally unique and will inevitably disappear within the next decades. We urgently need to preserve their remains and exploit what is left in order to make research on language-in-contact and historical as well as current comparative language research possible.
The Archive for Spoken German (AGD) at the Institute for German Language collects, fosters and archives data from completed research projects and makes them available to the wider research community.
Besides large variation corpora and corpora of conversational speech, the archive already contains a range of collections of data on German speech minorities. The latter will be outlined in this chapter. Some speech island data is already made available through the personal service of the AGD, or the database of spoken German (DGD), e.g. data on Australian German, Unserdeutsch, or German in North America. Some corpora are still being prepared for publication, but still important to document for potentially interested research projects. We therefore also explain the current problems and efforts related to the curation of speech island data, from the digitization of recordings and the collection of metadata, to the integration of transcriptions, annotations and other ways of accessing and sharing data.