P2: Mündliche Korpora
Refine
Document Type
- Article (22)
- Part of a Book (22)
- Conference Proceeding (20)
- Part of Periodical (3)
- Book (1)
- Doctoral Thesis (1)
- Preprint (1)
Language
- English (36)
- German (33)
- Multiple languages (1)
Has Fulltext
- yes (70)
Keywords
- Korpus <Linguistik> (43)
- Gesprochene Sprache (26)
- Deutsch (22)
- Konversationsanalyse (13)
- Forschungsdaten (12)
- Annotation (10)
- Datenmanagement (9)
- Interaktion (9)
- Mündliche Kommunikation (7)
- Transkription (7)
- spoken language (7)
- oral corpora (6)
- Audiovisuelles Material (5)
- Beleidigung (5)
- Computerlinguistik (5)
- Datenqualität (5)
- Forschungsmethode (5)
- Sprachdaten (5)
- Automatische Spracherkennung (4)
- Beschimpfung (4)
- Fremdsprache (4)
- German (4)
- Korpora in DaF/DaZ (4)
- Metadaten (4)
- Natürliche Sprache (4)
- Social Media (4)
- Sprachanalyse (4)
- Sprachgebrauch (4)
- Text Encoding Initiative (4)
- abusive language (4)
- Datenbank (3)
- Datenerhebung (3)
- Datensatz (3)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) (3)
- Fremdsprachenlernen (3)
- Gespräch (3)
- Multimodalität (3)
- Mündliche Korpora (3)
- corpora in GFL/GSL (3)
- Aufforderung (2)
- Automatische Sprachanalyse (2)
- Deutschland. Deutscher Bundestag (2)
- Digital Humanities (2)
- Fremdsprachenunterricht (2)
- Germanistik (2)
- Gesprächskorpora (2)
- Handlung (2)
- ISO/TEI (2)
- Instruktion (2)
- Intention (2)
- Kind (2)
- Kommunikationsanalyse (2)
- Leibniz-Institut für Deutsche Sprache (IDS) (2)
- Leibniz-Institut für Deutsche Sprache. Jahrestagung (58. : 2022 : Online) (2)
- Maschinelles Lernen (2)
- Name (2)
- Parlamentsdebatte (2)
- Personalpronomen (2)
- Phonetik (2)
- Soziolinguistik (2)
- Sprachkontakt (2)
- Sprachvariante (2)
- Strukturbaum (2)
- TEI (2)
- UGC (2)
- Universal Dependencies (2)
- Verstehen (2)
- Web (2)
- audiovisual data (2)
- data quality (2)
- gesprochene Sprache (2)
- ASR (1)
- Abfrage (1)
- Abfragesprache (1)
- Ad-hoc-Ausdrücke (1)
- Akademischer Grad (1)
- Altenbild (1)
- Alter (1)
- Ambiguität (1)
- Analyse (1)
- Anamnese (1)
- Angewandte Linguistik (1)
- Annotation guidelines (1)
- Annotation of causal language (1)
- Arbeit mit Transkripten (1)
- Archiv für Gesprochenes Deutsch (AGD) (1)
- Archiv für gesprochenes Deutsch (AGD) (1)
- Argentinien <Motiv> (1)
- Argumentation (1)
- Audioaufnahmen (1)
- Audioaufzeichnung (1)
- Augenblicksbildung (1)
- Ausgewogenheit (1)
- Austausch (1)
- Austrian Media Corpus (1)
- Bauchschmerz (1)
- BeDiaCo (1)
- Bedeutung (1)
- Benutzerfreundlichkeit (1)
- Beschuldigung (1)
- CLARIAH-DE (1)
- CLARIN (1)
- CLARIN-D (1)
- Chinesisches Deutschlerner-Korpus (1)
- Clarin (1)
- CoNNAR (1)
- Computerunterstützte Kommunikation (1)
- Crowdsourcing (1)
- DARIAH-DE (1)
- Data Augmentation (1)
- Datenanalyse (1)
- Datenaufbereitung (1)
- Datenbank für Gesprochenes Deutsch (DGD) (1)
- Datenbanksystem (1)
- Datenkomposition (1)
- Datenmodell (1)
- Datentyp (1)
- Debatte (1)
- Dependenzgrammatik (1)
- Deutsch als Fremdsprache (DaF) (1)
- Deutsch als Zweitsprache (DaZ) (1)
- Deutsch in Namibia (DNam) (1)
- Deutsches Referenzkorpus (DeReKo) (1)
- Diagnose (1)
- Dialektologie (1)
- Digitaler Sprachassistent (1)
- Digitalisierung (1)
- Diskursanalyse (1)
- Diskursive Fähigkeiten (1)
- Dokumentation (1)
- Drei-Ebenen-Architektur (1)
- Eigengruppe (1)
- Einfache Sprache (1)
- Einwanderer (1)
- Elektronisches Publizieren (1)
- Elektronisches Wörterbuch (1)
- Empirische Forschung (1)
- Empirische Sprachdaten (1)
- Ethik (1)
- Explikation (1)
- Externe Ebene (1)
- FAIR (1)
- FAIR data (1)
- FOLKER (1)
- FORGE2021 (1)
- Fairness (1)
- Formulierung (1)
- Forschung (1)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) (1)
- Forschungs- und Lehrkorpus für Gesprochenes Deutsch (FOLK) (1)
- Forschungsdateninfrastruktur (1)
- Forschungsdatenmanagement (1)
- Forschungsdatenzentrum (FDZ) (1)
- Framing-Effekt (1)
- Fremdgruppe (1)
- GeWiss-Korpus (1)
- Gebärdensprache (1)
- Geriatrie (1)
- Gesprochene Sprache in Interaktion (1)
- Gesprochenes Deutsch (1)
- Gesprächsanalyse (1)
- Graphische Benutzeroberfläche (1)
- Graphisches Symbol (1)
- Gütekriterien (1)
- Hamburger Zentrum für Sprachkorpora (1)
- Handlungsorientierung im Deutsch als Fremdsprache-Unterricht (1)
- Herder-Institut (Leipzig) (1)
- Hilfesystem (1)
- ISO-Norm (1)
- Identität (1)
- Infrastruktur (1)
- Interaktionsanalyse (1)
- Interaktionskorpora (1)
- Interaktionslinguistik (1)
- Interjektion (1)
- Interne Ebene (1)
- Interoperabilität (1)
- Intersubjektivität (1)
- Israel (1)
- Jesus Christus (1)
- Jugend (1)
- Kausalität (1)
- Klassifikation (1)
- Kommunikation (1)
- Kommunikativer Sinn (1)
- Konflikt (1)
- Konsortium (1)
- Kontrastive Linguistik (1)
- Kontrastive Syntax (1)
- Konzeptuelle Ebene (1)
- Korpora (1)
- Korpusanalsyse (1)
- Korpusbasierte Gesprächsforschung (1)
- Korpuslinguistik (1)
- Korpusrecherche (1)
- Kritik (1)
- LeiKo (1)
- Leibniz-Institut für Deutsche Sprache. Jahrestagung (58. : 2022 : Mannheim) (1)
- Leichte Sprache (1)
- Lernerkorpora (1)
- Lexical Semantics (1)
- Lexicon (1)
- Lexikalische Semantik (1)
- Lexikon (1)
- Linguistik (1)
- MTAS (1)
- Mediation (1)
- Mennonite Low German (1)
- Mennonitendeutsch (1)
- Methode (1)
- Minderheitensprache (1)
- Modalverb (1)
- Mundart (1)
- Mündlichkeitsdidaktik (1)
- Named Entity Recognition (1)
- Namibia (1)
- Nationale Forschungsdateninfrastruktur (NFDI) (1)
- Negation (1)
- Negativer Polaritätsausdruck (1)
- NottDeuYTSch (1)
- OTRS (1)
- Okkasionalismen (1)
- Online-Wörterbuch (1)
- Open Access (1)
- Open Journal Systems (1)
- Oral history (1)
- OrthoNormal (1)
- Pflegeheim (1)
- Phonetische Korpora (1)
- Plauderlabor (1)
- Plurizentrische Sprache (1)
- Polarity Shifter (1)
- Polarität (1)
- Politik (1)
- Politische Rede (1)
- Pragmatik (1)
- Pronomen (1)
- QUEST project (1)
- Redebeitrag (1)
- Referenzkorpora (1)
- Reparaturen (1)
- Rhetorik (1)
- Ripuarian (1)
- Russlanddeutsch (1)
- Russlanddeutsche Dialektdatenbank (RuDiDat) (1)
- Satzende (1)
- Schriftsprache (1)
- Semantik (1)
- Sentiment Analysis (1)
- Smiley (1)
- Software (1)
- Sozialwissenschaften (1)
- Spracherwerb (1)
- Sprachgeografie (1)
- Sprachgeographie (1)
- Sprachgeschichte (1)
- Sprachinsel (1)
- Sprachliche Minderheit (1)
- Sprachpolitik (1)
- Sprachtypologie (1)
- Sprachunterricht (1)
- Sprachwissenschaft (1)
- Sprachübersetzung (1)
- Stereotyp (1)
- Strategie (1)
- Suchanfragesprache (1)
- Supervised Classification (1)
- Swiss-AL (1)
- Telefonieren (1)
- Textanalyse (1)
- Textlinguistik (1)
- Textverarbeitungssoftware (1)
- Transkript (1)
- Transkriptionswerkzeuge (1)
- Treebanks (1)
- Twitter (1)
- Twitter <Softwareplattform> (1)
- Umgangssprache (1)
- User Generated Content (1)
- Variationskorpora (1)
- Vergleich <Rhetorik> (1)
- Verhaltenswissenschaften (1)
- Veröffentlichung (1)
- Videoaufnahmen (1)
- Videoaufzeichnung (1)
- VinKo (1)
- Visualisierung (1)
- Visualisierung von Transkripten (1)
- Web Services (1)
- Wirtschaftswissenschaften (1)
- Wissenschaftskommunikation (1)
- Wissensvermittlung (1)
- World Wide Web (1)
- Wörterbuch (1)
- Zeichnen (1)
- ZuMult (1)
- ZuMult data model (1)
- ZuMult-Datenmodell (1)
- Zweitsprache (1)
- abusive comparisons (1)
- abusive emojis (1)
- abusive remarks (1)
- abusive words (1)
- accusation (1)
- action ascription (1)
- action orientation in GFL teaching (1)
- acute hospital (1)
- ad-hoc-expressions (1)
- age stereotypes (1)
- ambiguous words (1)
- annotation guidelines (1)
- annotation tool (1)
- application (1)
- argumentation (1)
- audio-visual data (1)
- automatic transcription (1)
- causal tagger (1)
- clusivity (1)
- cognitive impairment (1)
- contextual framework (1)
- conversation analysis (1)
- conversation corpora (1)
- conversational analysis (1)
- corpora (1)
- corpora in DaF/DaZ (1)
- corpus access (1)
- corpus creation (1)
- corpus curation (1)
- corpus research (1)
- corpus search platform (1)
- corpus treatment and editing (1)
- corpus-based conversation research (1)
- curation (1)
- data (1)
- data curation (1)
- digital humanities (1)
- disjunction (1)
- distributional semantics (1)
- domain-specific solutions (1)
- elderspeak (1)
- first person plural pronouns (1)
- formulation (1)
- framing (1)
- fuck (1)
- functional status (1)
- functionalities of the Database for Spoken German (1)
- help desk (1)
- identity groups (1)
- implicit abuse (1)
- implicitly abusive comparisons (1)
- implicitly abusive language (1)
- inbreath (1)
- intention (1)
- intention ascription (1)
- interlocking organization (1)
- interoperability (1)
- intersubjectivity (1)
- language corpora (1)
- language variation (1)
- linguistic data (1)
- logical/conceptual level (1)
- methods of data elicitation (1)
- modal verb constructions (1)
- multi-unit turn (1)
- mündliche Interaktion (1)
- mündliche Korpora (1)
- naming (1)
- occasionalisms (1)
- oral history corpora (1)
- oral interaction (1)
- physical/internal level (1)
- pluricentric (1)
- political text analysis (1)
- pronouns (1)
- public mediation (1)
- quality evaluation (1)
- query (1)
- repairs (1)
- research data (1)
- research infrastructure (1)
- resources (1)
- rhetorical device (1)
- search query language (1)
- sentence boundary detection (1)
- sentiment (1)
- software (1)
- spoken German (1)
- spoken corpora (1)
- spoken language corpora (1)
- spoken language data (1)
- spoken language in interaction (1)
- spoken language transcripts (1)
- spoken vs. written (1)
- stance (1)
- strategy ascription (1)
- three-tier architecture (1)
- topic management (1)
- topic shift (1)
- transcription (1)
- treebanks (1)
- turn design (1)
- understanding (1)
- usability (1)
- user support (1)
- view/external level (1)
- visualisation of transcripts (1)
- web service (1)
- wir (1)
- word embeddings (1)
- working with transcripts (1)
- Älterer Mensch (1)
- Öffentlichkeit (1)
- Übersetzung (1)
Publicationstate
- Veröffentlichungsversion (36)
- Zweitveröffentlichung (32)
- Postprint (9)
Reviewstate
Publisher
- European Language Resources Association (8)
- Linköping University Electronic Press (5)
- Association for Computational Linguistics (4)
- de Gruyter (4)
- CLARIN (3)
- Leibniz-Institut für Deutsche Sprache (IDS) (3)
- Narr (3)
- Narr Francke Attempto (3)
- Universitäts- und Landesbibliothek Darmstadt (3)
- Verlag für Gesprächsforschung (3)
Einleitung
(2023)
Speech islands are historically and developmentally unique and will inevitably disappear within the next decades. We urgently need to preserve their remains and exploit what is left in order to make research on language-in-contact and historical as well as current comparative language research possible.
The Archive for Spoken German (AGD) at the Institute for German Language collects, fosters and archives data from completed research projects and makes them available to the wider research community.
Besides large variation corpora and corpora of conversational speech, the archive already contains a range of collections of data on German speech minorities. The latter will be outlined in this chapter. Some speech island data is already made available through the personal service of the AGD, or the database of spoken German (DGD), e.g. data on Australian German, Unserdeutsch, or German in North America. Some corpora are still being prepared for publication, but still important to document for potentially interested research projects. We therefore also explain the current problems and efforts related to the curation of speech island data, from the digitization of recordings and the collection of metadata, to the integration of transcriptions, annotations and other ways of accessing and sharing data.
Dieser Beitrag stellt den Aufbau eines multimodalen Korpus zur Erforschung des Deutschen als Minderheitssprache in Argentinien vor (DiA). In dem sich im Aufbau befindlichen DiA-Korpus werden die heutige wie auch die historische Situation mit multimodalen (mündlichen, schriftlichen und visuellen) Datensätzen repräsentiert, die mit entsprechenden methodischen Zugängen erfasst wurden und werden. Dazu gehören fragebogengeleitete Interviews (mündliches Medium), Briefe und elizitierte Schriftzeugnisse (geschriebenes Medium) sowie Linguistic-Landscape-Bilddaten (visuelles Medium). In diesem Beitrag wird zunächst ein Überblick über die Forschungssituation zum Deutschen als Minderheitensprache in Argentinien gegeben. Kern des Beitrags ist dann die Vorstellung der Korpusstruktur und des Vorgehens beim Korpusaufbau sowie die Darstellung von Auswertungspotentialen des Datenfundus auf systemischer, soziolinguistischer, sprachideologischer und kontaktlinguistischer Ebene. Eine Methodenreflexion rundet den Beitrag ab.
This paper examines multi-unit turns that allow speakers to retrospectively close the prior sequence while prospectively launching a new sequence, which Schegloff (1986) referred to as interlocking organization. Using English telephone conversations as data, we focus on how multi-unit turns are used for topic shifts, and show that interlocking organization operates in conjunction with other phonetic and lexical features, such as increased pitch and overt markers of disjunction (e.g., “listen”). In addition, speakers utilize an audible inbreath that is placed between the first and the second units as a central interactional resource to project further talk, thereby suppressing speaker transition and possibly highlighting the action delivered in the second unit as being distinctly new. We propose that interlocking multi-unit turns, when used to make topically disjunctive moves, promote progressivity by avoiding a possible lapse in turn transition
For many reasons, Mennonite Low German is a language whose documentation and investigation is of great importance for linguistics. To date, most research projects that deal with this language and/ or its speakers have had a relatively narrow focus, with many of the data cited being of limited relevance beyond the projects for which they were collected. In order to create a resource for a broad range of researchers, especially those working on Mennonite Low German, the dataset presented here has been transformed into a structured and searchable corpus that is accessible online. The translations of 46 English, Spanish, or Portuguese stimulus sentences into Mennonite Low German by 321 consultants form the core of the MEND-corpus (Mennonite Low German in North and South America) in the Archive for Spoken German. In addition to describing the origin of this corpus and discussing possibilities and limitations for further research, we discuss the technical structure and search possibilities of the Database for Spoken German. Among other things, this database allows for a structured search of metadata, a context-sensitive token search, and the generation of virtual corpora that can be shared with others. Moreover, thanks to its text-sound alignment, one can easily switch from a particular text section of the corpus to the corresponding audio section. Aside from the desire to equip the reader with the technical knowledge necessary to use this corpus, a further goal of this paper is to demonstrate that the corpus still offers many possibilities for future research.
We present a collection of (currently) about 5.500 commands directed to voice-controlled virtual assistants (VAs) by sixteen initial users of a VA system in their homes. The collection comprises recordings captured by the VA itself and with a conditional voice recorder (CVR) selectively capturing recordings including the VA-directed commands plus some surrounding context. Next to a description of the collection, we present initial findings on the patterns of use of the VA systems during the first weeks after installation, including usage timing, the development of usage frequency, distributions of sentence structures across commands, and (the development of) command success rates. We discuss the advantages and disadvantages of the applied collection-specific recording approach and describe potential research questions that can be investigated in the future, based on the collection, as well as the merit of combining quantitative corpus linguistic approaches with qualitative in-depth analyses of single cases.
Die Darstellung von und Arbeit mit Transkripten spielt in vielen forschungs- und anwendungsbezogenen Arbeiten mit Daten gesprochener Sprache eine wichtige Rolle. Der im ZuMult-Projekt entwickelte Prototyp ZuViel (Zugang zu Visualisierung von Transkripten) knüpft an etablierte Verfahren zur Transkriptdarstellung an und erweitert diese durch neue Möglichkeiten des interaktiven Arbeitens mit Transkripten im digitalen Medium. Der Beitrag führt in diese neuen Möglichkeiten ein und erklärt, wie sie in didaktischen DaF/DaZ-Kontexten aber auch hinsichtlich forschungsbezogener Perspektiven angewendet werden können
Im vorliegenden Artikel wird ein Überblick über das von der DFG geförderte Projekt Zugänge zu multimodalen Korpora gesprochener Sprache – Vernetzung und zielgruppenspezifische Ausdifferenzierung (ZuMult) gegeben. Dabei wird zunächst auf die Sprachdaten und auf die technische Basis der Applikationen eingegangen, die dem Projekt zugrunde liegen. Im Anschluss werden die weiteren Beiträge in diesem Themenheft von KorDaF kurz vorgestellt. Übergeordnetes Thema von ZuMult ist die Verbesserung der Zugänglichkeit von digitalen mündlichen Sprachdaten für verschiedene Anwendungen und Zielgruppen, wobei der Fokus dieses Themenhefts auf Applikationen und Anwender:innen aus der Fremdsprachendidaktik und der DaF-/DaZ-Forschung und -Lehre liegt. Die einzelnen Beiträge beleuchten zentrale methodische und/oder technische Aspekte dieses Themas und beschreiben die Architektur und verschiedene prototypische Anwendungen, die das Projekt entwickelt hat.