Refine
Year of publication
Document Type
- Part of a Book (58)
- Conference Proceeding (36)
- Article (27)
- Contribution to a Periodical (9)
- Working Paper (9)
- Book (8)
- Other (3)
- Preprint (2)
- Part of Periodical (1)
Keywords
- Korpus <Linguistik> (97)
- Gesprochene Sprache (66)
- Deutsch (41)
- Transkription (32)
- Computerlinguistik (24)
- gesprochene Sprache (18)
- Annotation (15)
- Konversationsanalyse (12)
- Forschungsdaten (10)
- Sprachdaten (10)
- Datenbank (9)
- Standardisierung (8)
- Germanistik (7)
- Gesprächsanalyse (7)
- Computerunterstützte Lexikographie (6)
- Fußball (6)
- Metadaten (6)
- Multimodalität (6)
- Software (6)
- Sportsprache (6)
- Wörterbuch (6)
- oral corpora (6)
- Datenmanagement (5)
- Korpuslinguistik (5)
- Langzeitarchivierung (5)
- Leibniz-Institut für Deutsche Sprache. Jahrestagung (58. : 2022 : Online) (5)
- Linguistik (5)
- Mündliche Kommunikation (5)
- spoken language (5)
- Automatische Spracherkennung (4)
- Forschungsmethode (4)
- Gesprächsdatenbank (4)
- Interaktion (4)
- Mehrsprachigkeit (4)
- Sprachkontakt (4)
- Text Encoding Initiative (4)
- spoken German (4)
- Datenaufbereitung (3)
- Datenerhebung (3)
- Datenformat (3)
- Englisch (3)
- Fußballsprache (3)
- Gesprächskorpora (3)
- Gesprächskorpus (3)
- Kolonialismus (3)
- Kontrastive Linguistik (3)
- Korpora in DaF/DaZ (3)
- Korpusaufbereitung (3)
- Lehnwort (3)
- Part-of-Speech-Tagging = POS (3)
- Soziolinguistik (3)
- Sprachanalyse (3)
- Spracherwerb (3)
- Sprachgeografie (3)
- Standardsprache (3)
- annotation (3)
- digitale Infrastruktur (3)
- ASR (2)
- Archiv für Gesprochenes Deutsch (AGD) (2)
- Austrian Media Corpus (2)
- Automatische Sprachanalyse (2)
- Computerunterstützte Lexikografie (2)
- Datenbank für Gesprochenes Deutsch (DGD) (2)
- Datenbank für gesprochenes Deutsch = DGD (2)
- Datenschutz (2)
- Dialektologie (2)
- Digitales Wörterbuch der deutschen Sprache (DWDS) (2)
- Diskursanalyse (2)
- Dokumentation (2)
- Fachsprache (2)
- Forschung (2)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch = FOLK (2)
- Frame-Theorie (2)
- Französisch (2)
- GeWiss-Korpus (2)
- ISO/TEI (2)
- Infrastruktur (2)
- Institut für Deutsche Sprache <Mannheim> (2)
- Internet (2)
- Interoperabilität (2)
- Korpora (2)
- Lexikografie (2)
- MTAS (2)
- Maschinelles Lernen (2)
- Mehrebenenannotation (2)
- Mundart (2)
- Notation (2)
- Phonetik (2)
- Plurizentrische Sprache (2)
- Referenzkorpus (2)
- Ripuarian (2)
- Schriftsprache (2)
- Sprachgebrauch (2)
- Sprachpolitik (2)
- Sprachtechnologie (2)
- Sprachvariante (2)
- Sprachwandel (2)
- Syntax (2)
- Textlinguistik (2)
- Transkript (2)
- Videoaufzeichnung (2)
- Visualisierung (2)
- Web Services (2)
- Wiedervereinigung <Deutschland> (2)
- ZuMult (2)
- automatic transcription (2)
- automatische Annotation (2)
- computerunterstützte Lexikographie (2)
- corpora in GFL/GSL (2)
- corpus curation (2)
- corpus-based (2)
- metadata (2)
- online lexicography (2)
- pluricentric (2)
- spoken language corpora (2)
- spoken language data (2)
- transcription (2)
- Österreich (2)
- /e:/-Diphthongisierung (1)
- Abfrage (1)
- Abfragesprache (1)
- Abweichung (1)
- Akustisches Signal (1)
- Alemannisch (1)
- Altenbild (1)
- Alter (1)
- Analyse (1)
- Angewandte Gesprächsforschung (1)
- Anonymisierung (1)
- Arbeit mit Transkripten (1)
- Arbeitsablauf (1)
- Archiv für gesprochenes Deutsch (AGD) (1)
- Audioaufnahmen (1)
- Audioaufzeichnung (1)
- Aufgabendesign (1)
- Augenzeuge (1)
- Ausgewogenheit (1)
- Aussprache (1)
- Baumbank (1)
- BeDiaCo (1)
- Benutzerforschung (1)
- Best-Practice (1)
- Biografisches Interview (1)
- Brüdergemeine (1)
- CMC (1)
- Chinesisches Deutschlerner-Korpus (1)
- Clarin (1)
- CoNNAR (1)
- Component Metadata Infrastructure (CMDI) (1)
- Computerunterstützte Kommunikation (1)
- Conversation corpus (1)
- DMC (1)
- Darmstädter-Tagblatt-Korpus (1)
- Dateiformat (1)
- Datenanalyse (1)
- Datenanreicherung (1)
- Datenarchivierung (1)
- Datenaustausch (1)
- Datenerschließung (1)
- Datenerweiterung (1)
- Datenkompetenz (1)
- Datenkomposition (1)
- Datenkonvertierung (1)
- Datenmodell (1)
- Datensatz (1)
- Datenschutzrichtlinie (1)
- Datenstrukturierung (1)
- Datentyp (1)
- Datenvernetzung (1)
- Deutsch in Namibia (DNam) (1)
- Deutsch in Österreich (1)
- Deutsches Referenzkorpus (DeReKo) (1)
- Deutsches Spracharchiv (1)
- Deutschland (1)
- Diatopische Variation (1)
- Digital Herrnhut (1)
- Digitale Sprachressourcen (1)
- Digitalisierung (1)
- Discourse Lab (1)
- Diskursmarker (1)
- DiÖ-Korpus (1)
- Drei-Ebenen-Architektur (1)
- Dreiländereck (1)
- Dänisch (1)
- Edition (1)
- Einfache Sprache (1)
- Einleitung (1)
- Elektronische Publikation (1)
- Ellipse <Linguistik> (1)
- Empirische Forschung (1)
- Empirische Linguistik (1)
- Empirische Sprachdaten (1)
- Ethik (1)
- Ethischer Diskurs (1)
- Europa (1)
- Externe Ebene (1)
- FAIR data (1)
- FOLK (1)
- FOLKER (1)
- FORGE2021 (1)
- Fachwörterbuch (1)
- Fallstudie (1)
- Fernsehen (1)
- Format (1)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) (1)
- Forschungs- und Lehrkorpus für Gesprochenes Deutsch (FOLK) (1)
- Forschungsdateninfrastruktur (1)
- Forschungsdatenzentrum (FDZ) (1)
- Forschungsstand (1)
- Fremdsprache (1)
- Fremdsprachenlernen (1)
- Fremdsprachenunterricht (1)
- Fremdwort (1)
- GOLD standard (1)
- Gebärdensprache (1)
- Gemeinschaftsdiskurs (1)
- Geriatrie (1)
- German (1)
- German colonialism (1)
- German spoken language (1)
- Gesamtausgabe (1)
- Gesprochene Korpora (1)
- Gesprochenes Deutsch (1)
- Gesprächkorpus (1)
- Gesprächsaufnahme (1)
- Gesprächsforschung (1)
- Grammatik (1)
- Hamburger Zentrum für Sprachkorpora (1)
- Herder-Institut (Leipzig) (1)
- Heuristik (1)
- Historische Sprachwissenschaft (1)
- ISO-Norm (1)
- Information Retrieval (1)
- Interaktionsanalyse (1)
- Interaktionslinguistik (1)
- Internationalismus (1)
- Interne Ebene (1)
- Internetportal (1)
- Italienisch (1)
- Jugendsprache (1)
- Kicktionary (1)
- Kiezdeutsch (1)
- Kind (1)
- Koloniallinguistik (1)
- Kommentar (1)
- Konsortium (1)
- Kontextualisierung (1)
- Konzeptuelle Ebene (1)
- Kooperation (1)
- Korpora Kontoverse Diskurse (1)
- Korpus <Llinguistik> (1)
- Korpus GiesKaNe (1)
- Korpusanalsyse (1)
- Korpusarchitektur (1)
- Korpusaufbau (1)
- Korpusdesign (1)
- Korpustools (1)
- Kriminalisierung (1)
- Kritische Diskursanalyse (1)
- Lautschrift (1)
- Legitimierung (1)
- LeiKo (1)
- Leibniz-Institut für Deutsche Sprache (IDS) (1)
- Leichte Sprache (1)
- Leitfaden (1)
- Lernerkorpora (1)
- Lexikon <Psycholinguistik> (1)
- Linguistische Datenverarbeitung (1)
- Long-Term Archiving (1)
- Mann, Thomas (1)
- Massenmedien (1)
- Mennonite Low German (1)
- Mennonitendeutsch (1)
- Methode (1)
- Multimedia (1)
- Multimodale Korpora (1)
- Multirepräsentationale Daten (1)
- Multisituationale Daten (1)
- Mündliche Hochschulkommunikation (1)
- Mündliche Korpora (1)
- Mündliches Korpus (1)
- Mündlichkeit (1)
- Namibia (1)
- Nationale Forschungsdateninfrastruktur (NFDI) (1)
- Nationalismus (1)
- Natürliches sprachliches Handeln (1)
- Nex-Gen Agile Reference Corpus (NARC) (1)
- Niederdeutsch (1)
- Normung (1)
- Norwegisch (1)
- NottDeuYTSch (1)
- NottDeuYTSch corpus (1)
- Nutzungsrecht (1)
- Online-Wörterbuch (1)
- OrthoNormal (1)
- POS-Tagging (1)
- Parallel European Corpus of Informal Interaction (PECII) (1)
- Parallelkorpus (1)
- Partikelverb (1)
- Pflegeheim (1)
- Phonetische Korpora (1)
- Phonologie (1)
- Plenarprotokolle des Deutschen Bundestags (1)
- Poetik (1)
- Polnisch (1)
- Quelle (1)
- Quellenkritik (1)
- Recht (1)
- Rechtschreibung (1)
- Referenzkorpora (1)
- Replikationsstudie (1)
- Repräsentationsformate von Kontexten (1)
- Revolution <1989> (1)
- Rezension (1)
- Satzende (1)
- Schriftlichkeit (1)
- Schwedisch (1)
- Segmentierung (1)
- Social Media (1)
- Sozialwissenschaften (1)
- Soziolekt (1)
- Spoken Language Data (1)
- Sprache (1)
- Spracheinstellung (1)
- Sprachgeographie (1)
- Sprachgeschichte (1)
- Sprachhandeln (1)
- Sprachliche Minderheit (1)
- Sprachunterricht (1)
- Sprachvariation (1)
- Sprachwissenschaft (1)
- Sprachübersetzung (1)
- Sprecherwechsel (1)
- Standard (1)
- Stereotyp (1)
- Suchmaschine (1)
- Swiss-AL (1)
- Syntaktische Analyse (1)
- Systemlinguistik (1)
- TEI (1)
- TIGER (1)
- Texttechnologie (1)
- Textverarbeitungssoftware (1)
- Token <Linguistik> (1)
- Transkriptionswerkzeuge (1)
- Variationskorpora (1)
- Variationslinguistik (1)
- Vergleichende Interaktionsforschung (1)
- Vergleichende Sprachwissenschaft (1)
- Verhaltenswissenschaften (1)
- Vernetzung (1)
- Videaufzeichnung (1)
- Videoaufnahmen (1)
- VinKo (1)
- Visualisierung von Transkripten (1)
- Vorwort (1)
- WBÖ-Korpus (1)
- Webmonitor-Korpus (1)
- Westsamoa (1)
- Wiederverwendung (1)
- Wirtschaftswissenschaften (1)
- Wissensbasis (1)
- Wissenschaftsgeschichte (1)
- Wissenschaftskommunikation (1)
- Wortschatz (1)
- Wörterbuch der deutschen Gegenwartssprache (WDG) (1)
- YouTube (1)
- ZDL-Regionalkorpus (1)
- Zeitung (1)
- Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) (1)
- ZuMult data model (1)
- ZuMult-Datenmodell (1)
- acute hospital (1)
- age stereotypes (1)
- annotation tool (1)
- anonymization (1)
- cognitive impairment (1)
- computerunterstützte Transkription (1)
- contextual framework (1)
- conversation corpora (1)
- conversation database (1)
- corpora (1)
- corpora in DaF/DaZ (1)
- corpus linguistics (1)
- corpus access (1)
- corpus analysis (1)
- corpus construction (1)
- corpus creation (1)
- corpus linguistics (1)
- corpus retrieval (1)
- corpus search engine (1)
- corpus search platform (1)
- corpus storage (1)
- corpus treatment and editing (1)
- curation (1)
- database systems (1)
- deutsch-italienisch (1)
- digital communication (1)
- discourse marker (1)
- elderspeak (1)
- elektronische Lexikografie (1)
- format migration (1)
- functional status (1)
- functionalities of the Database for Spoken German (1)
- geschriebene Sprache (1)
- gesprochenes Deutsch (1)
- infrastructure (1)
- interoperability (1)
- language contact (1)
- language planning (1)
- language policy (1)
- language variation (1)
- legal issues (1)
- lexical borrowing (1)
- lexikalische Repräsentation (1)
- logical/conceptual level (1)
- long-term archival (1)
- mehrsprachige Ressource (1)
- methods of data elicitation (1)
- multi-layer corpora (1)
- multi-turn conversations (1)
- multimodal (1)
- mündliche Interaktion (1)
- mündliche Korpora (1)
- oral corpus (1)
- oral corpus platform (1)
- oral interaction (1)
- physical/internal level (1)
- query (1)
- query language (1)
- research infrastructures (1)
- sentence boundary detection (1)
- software tools (1)
- speech (1)
- spoken language transcripts (1)
- survey (1)
- sustainable archives (1)
- three-tier architecture (1)
- user survey (1)
- video (1)
- view/external level (1)
- visualisation of transcripts (1)
- web service (1)
- working with transcripts (1)
- youth language (1)
- zweisprachig (1)
- Älterer Mensch (1)
- Österreichischer Sprachraum (1)
- Übersetzung (1)
Publicationstate
- Veröffentlichungsversion (47)
- Zweitveröffentlichung (37)
- Postprint (9)
- Erstveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (45)
- Peer-Review (35)
- (Verlags-)lektorat (1)
- Peer-review (1)
- Verlags-Lektorat (1)
Publisher
- de Gruyter (23)
- European Language Resources Association (ELRA) (7)
- Institut für Deutsche Sprache (7)
- Narr (7)
- Cambridge Scholars Publ. (5)
- De Gruyter (5)
- European Language Resources Association (5)
- Leibniz-Institut für Deutsche Sprache (IDS) (5)
- Verlag für Gesprächsforschung (4)
- Linköping University Electronic Press (3)
Dieser Beitrag setzt sich mit Gesprächskorpora als einem besonderen Typus von Korpora gesprochener Sprache auseinander. Es werden zunächst wesentliche Eigenschaften solcher Korpora herausgearbeitet und einige der wichtigsten deutschsprachigen Gesprächskorpora vorgestellt. Der zweite Teil des Beitrags setzt sich dann mit dem Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) auseinander. FOLK hat sich zum Ziel gesetzt, ein wissenschaftsöffentliches Korpus von Interaktionsdaten aufzubauen, das methodisch und technisch dem aktuellen Forschungsstand entspricht. Die Herausforderungen, die sich beim Aufbau von FOLK in methodischer und korpustechnologischer Hinsicht stellen, werden in abschließenden Abschnitt diskutiert.
This article discusses questions concerning the creation, annotation and sharing of spoken language corpora. We use the Hamburg Map Task Corpus (HAMATAC), a small corpus in which advanced learners of German were recorded solving a map task, as an example to illustrate our main points. We first give an overview of the corpus creation and annotation process including recording, metadata documentation, transcription and semi-automatic annotation of the data. We then discuss the manual annotation of disfluencies as an example case in which many of the typical and challenging problems for data reuse – in particular the reliability of interpretative annotations – are revealed.
Einleitung
(2018)
Einleitung
(2023)
Einleitung
(2023)
Der Beitrag illustriert die Nutzung des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für interaktionslinguistische Fragestellungen anhand einer exemplarischen Studie. Zunächst werden die Stratifikation (Datenkomposition) des Korpus, das zugrundeliegende Datenmodell und dessen Annotationsebenen sowie Typen von Untersuchungsinteressen vorgestellt, für die das Korpus nutzbar ist. Im Hauptteil wird Schritt für Schritt anhand einer Studie zur Verwendung des Formats was heißt X in der sozialen Interaktion gezeigt, wie mit FOLK relevante Daten gefunden und analysiert werden können. Abschließend weisen wir auf einige Vorsichtsmaßnahmen bei der Benutzung des Korpus hin.
KonsortSWD ist das NFDI Konsortium für die Sozial-, Verhaltens-, Bildungs- und Wirtschaftswissenschaften. Für die äußerst vielfältigen Datentypen und Forschungsmethoden bauen die Beteiligten im Rahmen der NFDI eine bereits bestehende Forschungsdateninfrastruktur aus und ergänzen neue integrierende Dienste. Basis sind die heute 41 vom Rat für Sozial- und Wirtschaftsdaten akkreditierten Forschungsdatenzentren (FDZ). FDZ sind Spezialsammlungen zu jeweils spezifischen Forschungsdaten, z.B. aus der qualitativen Sozialforschung, und können so Forschende auf Basis einer ausführlichen Expertise zu diesen Daten beraten. Neben der Unterstützung der FDZ baut KonsortSWD auch neue Dienste in den Bereichen Datenproduktion, Datenzugang und Technische Lösungen auf.