Refine
Year of publication
Document Type
- Part of a Book (41)
- Conference Proceeding (16)
- Article (10)
- Working Paper (5)
- Book (4)
- Other (2)
- Preprint (1)
Is part of the Bibliography
- yes (79) (remove)
Keywords
- Korpus <Linguistik> (55)
- Gesprochene Sprache (43)
- Deutsch (22)
- Transkription (11)
- Annotation (9)
- Forschungsdaten (7)
- Germanistik (7)
- Sprachdaten (7)
- oral corpora (6)
- Leibniz-Institut für Deutsche Sprache. Jahrestagung (58. : 2022 : Online) (5)
- Automatische Spracherkennung (4)
- Computerlinguistik (4)
- Forschungsmethode (4)
- Interaktion (4)
- Mündliche Kommunikation (4)
- Text Encoding Initiative (4)
- spoken German (4)
- spoken language (4)
- Datenbank (3)
- Datenerhebung (3)
- Datenmanagement (3)
- Kolonialismus (3)
- Kontrastive Linguistik (3)
- Metadaten (3)
- Multimodalität (3)
- Sprachanalyse (3)
- Sprachgeografie (3)
- Sprachkontakt (3)
- ASR (2)
- Archiv für Gesprochenes Deutsch (AGD) (2)
- Automatische Sprachanalyse (2)
- Datenaufbereitung (2)
- Datenbank für Gesprochenes Deutsch (DGD) (2)
- Datenschutz (2)
- Dialektologie (2)
- Gesprächskorpora (2)
- ISO/TEI (2)
- Institut für Deutsche Sprache <Mannheim> (2)
- Korpora in DaF/DaZ (2)
- Korpusaufbereitung (2)
- Korpuslinguistik (2)
- Langzeitarchivierung (2)
- Lehnwort (2)
- Linguistik (2)
- MTAS (2)
- Mundart (2)
- Part-of-Speech-Tagging = POS (2)
- Plurizentrische Sprache (2)
- Ripuarian (2)
- Software (2)
- Soziolinguistik (2)
- Sprachgebrauch (2)
- Sprachpolitik (2)
- Syntax (2)
- Textlinguistik (2)
- Transkript (2)
- Videoaufzeichnung (2)
- Web Services (2)
- Wiedervereinigung <Deutschland> (2)
- annotation (2)
- automatic transcription (2)
- corpora in GFL/GSL (2)
- corpus curation (2)
- corpus-based (2)
- gesprochene Sprache (2)
- online lexicography (2)
- pluricentric (2)
- spoken language corpora (2)
- spoken language data (2)
- Abfrage (1)
- Abfragesprache (1)
- Abweichung (1)
- Alemannisch (1)
- Altenbild (1)
- Alter (1)
- Analyse (1)
- Angewandte Gesprächsforschung (1)
- Anonymisierung (1)
- Arbeit mit Transkripten (1)
- Archiv für gesprochenes Deutsch (AGD) (1)
- Audioaufnahmen (1)
- Audioaufzeichnung (1)
- Augenzeuge (1)
- Ausgewogenheit (1)
- Austrian Media Corpus (1)
- BeDiaCo (1)
- Benutzerforschung (1)
- Biografisches Interview (1)
- CMC (1)
- Chinesisches Deutschlerner-Korpus (1)
- Clarin (1)
- CoNNAR (1)
- Computerunterstützte Kommunikation (1)
- Computerunterstützte Lexikografie (1)
- Computerunterstützte Lexikographie (1)
- DMC (1)
- Dateiformat (1)
- Datenanalyse (1)
- Datenbank für gesprochenes Deutsch = DGD (1)
- Datenkomposition (1)
- Datenmodell (1)
- Datensatz (1)
- Datenschutzrichtlinie (1)
- Datentyp (1)
- Deutsch in Namibia (DNam) (1)
- Deutsches Referenzkorpus (DeReKo) (1)
- Deutsches Spracharchiv (1)
- Deutschland (1)
- Dokumentation (1)
- Drei-Ebenen-Architektur (1)
- Dreiländereck (1)
- Einfache Sprache (1)
- Einleitung (1)
- Ellipse <Linguistik> (1)
- Empirische Forschung (1)
- Empirische Linguistik (1)
- Empirische Sprachdaten (1)
- Ethik (1)
- Ethischer Diskurs (1)
- Europa (1)
- Externe Ebene (1)
- FAIR data (1)
- FOLK (1)
- FOLKER (1)
- FORGE2021 (1)
- Fernsehen (1)
- Format (1)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) (1)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch = FOLK (1)
- Forschungs- und Lehrkorpus für Gesprochenes Deutsch (FOLK) (1)
- Forschungsdateninfrastruktur (1)
- Forschungsdatenzentrum (FDZ) (1)
- Forschungsstand (1)
- Fremdsprache (1)
- Fremdsprachenlernen (1)
- Fremdsprachenunterricht (1)
- GOLD standard (1)
- GeWiss-Korpus (1)
- Gebärdensprache (1)
- Gemeinschaftsdiskurs (1)
- Geriatrie (1)
- German (1)
- German colonialism (1)
- German spoken language (1)
- Gesprochenes Deutsch (1)
- Gesprächsanalyse (1)
- Gesprächsaufnahme (1)
- Gesprächsforschung (1)
- Grammatik (1)
- Hamburger Zentrum für Sprachkorpora (1)
- Herder-Institut (Leipzig) (1)
- Heuristik (1)
- Historische Sprachwissenschaft (1)
- ISO-Norm (1)
- Infrastruktur (1)
- Interaktionslinguistik (1)
- Internationalismus (1)
- Interne Ebene (1)
- Interoperabilität (1)
- Jugendsprache (1)
- Konsortium (1)
- Konversationsanalyse (1)
- Konzeptuelle Ebene (1)
- Korpora (1)
- Korpusanalsyse (1)
- Korpusdesign (1)
- Kriminalisierung (1)
- Kritische Diskursanalyse (1)
- Legitimierung (1)
- LeiKo (1)
- Leibniz-Institut für Deutsche Sprache (IDS) (1)
- Leichte Sprache (1)
- Lernerkorpora (1)
- Lexikografie (1)
- Maschinelles Lernen (1)
- Massenmedien (1)
- Mennonite Low German (1)
- Mennonitendeutsch (1)
- Methode (1)
- Mündliche Korpora (1)
- Mündlichkeit (1)
- Namibia (1)
- Nationale Forschungsdateninfrastruktur (NFDI) (1)
- Nationalismus (1)
- Natürliches sprachliches Handeln (1)
- Niederdeutsch (1)
- NottDeuYTSch (1)
- NottDeuYTSch corpus (1)
- Nutzungsrecht (1)
- OrthoNormal (1)
- Parallel European Corpus of Informal Interaction (PECII) (1)
- Parallelkorpus (1)
- Partikelverb (1)
- Pflegeheim (1)
- Phonetik (1)
- Phonetische Korpora (1)
- Phonologie (1)
- Poetik (1)
- Quelle (1)
- Quellenkritik (1)
- Recht (1)
- Rechtschreibung (1)
- Referenzkorpora (1)
- Revolution <1989> (1)
- Satzende (1)
- Schriftlichkeit (1)
- Schriftsprache (1)
- Segmentierung (1)
- Social Media (1)
- Sozialwissenschaften (1)
- Sprache (1)
- Spracheinstellung (1)
- Spracherwerb (1)
- Sprachgeographie (1)
- Sprachgeschichte (1)
- Sprachhandeln (1)
- Sprachliche Minderheit (1)
- Sprachvariante (1)
- Sprachwandel (1)
- Sprachwissenschaft (1)
- Sprachübersetzung (1)
- Sprecherwechsel (1)
- Standard (1)
- Standardisierung (1)
- Standardsprache (1)
- Stereotyp (1)
- Suchmaschine (1)
- Swiss-AL (1)
- TEI (1)
- Textverarbeitungssoftware (1)
- Token <Linguistik> (1)
- Transkriptionswerkzeuge (1)
- Variationskorpora (1)
- Vergleichende Interaktionsforschung (1)
- Vergleichende Sprachwissenschaft (1)
- Verhaltenswissenschaften (1)
- Videoaufnahmen (1)
- VinKo (1)
- Visualisierung (1)
- Visualisierung von Transkripten (1)
- Vorwort (1)
- Westsamoa (1)
- Wirtschaftswissenschaften (1)
- Wissenschaftsgeschichte (1)
- YouTube (1)
- ZuMult (1)
- ZuMult data model (1)
- ZuMult-Datenmodell (1)
- acute hospital (1)
- age stereotypes (1)
- annotation tool (1)
- anonymization (1)
- cognitive impairment (1)
- contextual framework (1)
- corpora (1)
- corpus linguistics (1)
- corpus access (1)
- corpus creation (1)
- corpus search engine (1)
- corpus search platform (1)
- corpus treatment and editing (1)
- curation (1)
- digital communication (1)
- elderspeak (1)
- format migration (1)
- functional status (1)
- functionalities of the Database for Spoken German (1)
- interoperability (1)
- language contact (1)
- language planning (1)
- language policy (1)
- language variation (1)
- legal issues (1)
- lexical borrowing (1)
- logical/conceptual level (1)
- long-term archival (1)
- metadata (1)
- methods of data elicitation (1)
- multi-turn conversations (1)
- multimodal (1)
- mündliche Korpora (1)
- oral corpus platform (1)
- physical/internal level (1)
- query (1)
- query language (1)
- research infrastructures (1)
- sentence boundary detection (1)
- speech (1)
- spoken language transcripts (1)
- survey (1)
- three-tier architecture (1)
- transcription (1)
- user survey (1)
- video (1)
- view/external level (1)
- visualisation of transcripts (1)
- web service (1)
- working with transcripts (1)
- youth language (1)
- Älterer Mensch (1)
- Übersetzung (1)
Publicationstate
- Veröffentlichungsversion (34)
- Zweitveröffentlichung (28)
- Postprint (8)
Reviewstate
- (Verlags)-Lektorat (32)
- Peer-Review (28)
- (Verlags-)lektorat (1)
- Peer-review (1)
- Verlags-Lektorat (1)
Publisher
Dieser Beitrag setzt sich mit Gesprächskorpora als einem besonderen Typus von Korpora gesprochener Sprache auseinander. Es werden zunächst wesentliche Eigenschaften solcher Korpora herausgearbeitet und einige der wichtigsten deutschsprachigen Gesprächskorpora vorgestellt. Der zweite Teil des Beitrags setzt sich dann mit dem Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) auseinander. FOLK hat sich zum Ziel gesetzt, ein wissenschaftsöffentliches Korpus von Interaktionsdaten aufzubauen, das methodisch und technisch dem aktuellen Forschungsstand entspricht. Die Herausforderungen, die sich beim Aufbau von FOLK in methodischer und korpustechnologischer Hinsicht stellen, werden in abschließenden Abschnitt diskutiert.
This article discusses questions concerning the creation, annotation and sharing of spoken language corpora. We use the Hamburg Map Task Corpus (HAMATAC), a small corpus in which advanced learners of German were recorded solving a map task, as an example to illustrate our main points. We first give an overview of the corpus creation and annotation process including recording, metadata documentation, transcription and semi-automatic annotation of the data. We then discuss the manual annotation of disfluencies as an example case in which many of the typical and challenging problems for data reuse – in particular the reliability of interpretative annotations – are revealed.
Einleitung
(2018)
Einleitung
(2023)
Einleitung
(2023)
Der Beitrag illustriert die Nutzung des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für interaktionslinguistische Fragestellungen anhand einer exemplarischen Studie. Zunächst werden die Stratifikation (Datenkomposition) des Korpus, das zugrundeliegende Datenmodell und dessen Annotationsebenen sowie Typen von Untersuchungsinteressen vorgestellt, für die das Korpus nutzbar ist. Im Hauptteil wird Schritt für Schritt anhand einer Studie zur Verwendung des Formats was heißt X in der sozialen Interaktion gezeigt, wie mit FOLK relevante Daten gefunden und analysiert werden können. Abschließend weisen wir auf einige Vorsichtsmaßnahmen bei der Benutzung des Korpus hin.
KonsortSWD ist das NFDI Konsortium für die Sozial-, Verhaltens-, Bildungs- und Wirtschaftswissenschaften. Für die äußerst vielfältigen Datentypen und Forschungsmethoden bauen die Beteiligten im Rahmen der NFDI eine bereits bestehende Forschungsdateninfrastruktur aus und ergänzen neue integrierende Dienste. Basis sind die heute 41 vom Rat für Sozial- und Wirtschaftsdaten akkreditierten Forschungsdatenzentren (FDZ). FDZ sind Spezialsammlungen zu jeweils spezifischen Forschungsdaten, z.B. aus der qualitativen Sozialforschung, und können so Forschende auf Basis einer ausführlichen Expertise zu diesen Daten beraten. Neben der Unterstützung der FDZ baut KonsortSWD auch neue Dienste in den Bereichen Datenproduktion, Datenzugang und Technische Lösungen auf.