Refine
Year of publication
Document Type
- Part of a Book (37)
- Conference Proceeding (31)
- Article (26)
- Contribution to a Periodical (9)
- Working Paper (9)
- Book (3)
- Other (3)
- Preprint (2)
Keywords
- Korpus <Linguistik> (79)
- Gesprochene Sprache (62)
- Transkription (32)
- Deutsch (28)
- Computerlinguistik (24)
- gesprochene Sprache (18)
- Annotation (12)
- Konversationsanalyse (11)
- Datenbank (9)
- Standardisierung (8)
- Gesprächsanalyse (7)
- Computerunterstützte Lexikographie (6)
- Forschungsdaten (6)
- Fußball (6)
- Sportsprache (6)
- oral corpora (6)
- Multimodalität (5)
- Software (5)
- Wörterbuch (5)
- spoken language (5)
- Automatische Spracherkennung (4)
- Forschungsmethode (4)
- Gesprächsdatenbank (4)
- Mehrsprachigkeit (4)
- Mündliche Kommunikation (4)
- Sprachdaten (4)
- Text Encoding Initiative (4)
- spoken German (4)
- Datenformat (3)
- Datenmanagement (3)
- Fußballsprache (3)
- Gesprächskorpora (3)
- Gesprächskorpus (3)
- Interaktion (3)
- Korpora in DaF/DaZ (3)
- Korpuslinguistik (3)
- Langzeitarchivierung (3)
- Linguistik (3)
- Metadaten (3)
- Part-of-Speech-Tagging = POS (3)
- Sprachanalyse (3)
- annotation (3)
- digitale Infrastruktur (3)
- ASR (2)
- Archiv für Gesprochenes Deutsch (AGD) (2)
- Automatische Sprachanalyse (2)
- Datenbank für Gesprochenes Deutsch (DGD) (2)
- Datenbank für gesprochenes Deutsch = DGD (2)
- Datenerhebung (2)
- Datenschutz (2)
- Englisch (2)
- Fachsprache (2)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch = FOLK (2)
- Frame-Theorie (2)
- Französisch (2)
- Germanistik (2)
- ISO/TEI (2)
- Institut für Deutsche Sprache <Mannheim> (2)
- Internet (2)
- Leibniz-Institut für Deutsche Sprache. Jahrestagung (58. : 2022 : Online) (2)
- MTAS (2)
- Notation (2)
- Plurizentrische Sprache (2)
- Ripuarian (2)
- Sprachgebrauch (2)
- Sprachgeografie (2)
- Sprachtechnologie (2)
- Syntax (2)
- Transkript (2)
- Videoaufzeichnung (2)
- Visualisierung (2)
- Web Services (2)
- Wiedervereinigung <Deutschland> (2)
- automatic transcription (2)
- automatische Annotation (2)
- computerunterstützte Lexikographie (2)
- corpora in GFL/GSL (2)
- corpus curation (2)
- corpus-based (2)
- online lexicography (2)
- pluricentric (2)
- spoken language corpora (2)
- spoken language data (2)
- transcription (2)
- Abfrage (1)
- Abfragesprache (1)
- Altenbild (1)
- Alter (1)
- Analyse (1)
- Anonymisierung (1)
- Arbeit mit Transkripten (1)
- Archiv für gesprochenes Deutsch (AGD) (1)
- Audioaufnahmen (1)
- Audioaufzeichnung (1)
- Augenzeuge (1)
- Ausgewogenheit (1)
- Benutzerforschung (1)
- Biografisches Interview (1)
- Clarin (1)
- Computerunterstützte Lexikografie (1)
- Conversation corpus (1)
- Dateiformat (1)
- Datenanalyse (1)
- Datenarchivierung (1)
- Datenaufbereitung (1)
- Datenaustausch (1)
- Datenkomposition (1)
- Datenkonvertierung (1)
- Datenmodell (1)
- Datenschutzrichtlinie (1)
- Datentyp (1)
- Deutsch in Namibia (DNam) (1)
- Deutsches Spracharchiv (1)
- Dialektologie (1)
- Digitale Sprachressourcen (1)
- Digitales Wörterbuch der deutschen Sprache (DWDS) (1)
- Diskursanalyse (1)
- Diskursmarker (1)
- Dokumentation (1)
- Drei-Ebenen-Architektur (1)
- Dänisch (1)
- Einleitung (1)
- Ellipse <Linguistik> (1)
- Empirische Forschung (1)
- Empirische Sprachdaten (1)
- Europa (1)
- Externe Ebene (1)
- FAIR data (1)
- FOLK (1)
- FOLKER (1)
- FORGE2021 (1)
- Forschung (1)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) (1)
- Forschungs- und Lehrkorpus für Gesprochenes Deutsch (FOLK) (1)
- Forschungsdateninfrastruktur (1)
- Forschungsdatenzentrum (FDZ) (1)
- Fremdsprache (1)
- Fremdsprachenlernen (1)
- Fremdsprachenunterricht (1)
- GOLD standard (1)
- GeWiss-Korpus (1)
- Geriatrie (1)
- German spoken language (1)
- Gesprochenes Deutsch (1)
- Gesprächkorpus (1)
- Gesprächsaufnahme (1)
- Gesprächsforschung (1)
- Hamburger Zentrum für Sprachkorpora (1)
- Herder-Institut (Leipzig) (1)
- ISO-Norm (1)
- Infrastruktur (1)
- Interaktionsanalyse (1)
- Interaktionslinguistik (1)
- Interne Ebene (1)
- Interoperabilität (1)
- Kicktionary (1)
- Kind (1)
- Kommentar (1)
- Konsortium (1)
- Kontrastive Linguistik (1)
- Konzeptuelle Ebene (1)
- Kooperation (1)
- Korpora (1)
- Korpusanalsyse (1)
- Korpusaufbereitung (1)
- Lautschrift (1)
- Leibniz-Institut für Deutsche Sprache (IDS) (1)
- Leitfaden (1)
- Lernerkorpora (1)
- Lexikon <Psycholinguistik> (1)
- Linguistische Datenverarbeitung (1)
- Maschinelles Lernen (1)
- Mennonite Low German (1)
- Mennonitendeutsch (1)
- Methode (1)
- Multimedia (1)
- Mundart (1)
- Mündliche Korpora (1)
- Mündliches Korpus (1)
- Namibia (1)
- Nationale Forschungsdateninfrastruktur (NFDI) (1)
- Niederdeutsch (1)
- Norwegisch (1)
- Nutzungsrecht (1)
- OrthoNormal (1)
- Partikelverb (1)
- Pflegeheim (1)
- Phonetik (1)
- Phonetische Korpora (1)
- Rechtschreibung (1)
- Revolution <1989> (1)
- Satzende (1)
- Schriftsprache (1)
- Schwedisch (1)
- Segmentierung (1)
- Sozialwissenschaften (1)
- Soziolinguistik (1)
- Spracherwerb (1)
- Sprachgeographie (1)
- Sprachkontakt (1)
- Sprachliche Minderheit (1)
- Sprachpolitik (1)
- Sprachvariante (1)
- Sprachübersetzung (1)
- Sprecherwechsel (1)
- Standard (1)
- Stereotyp (1)
- Suchmaschine (1)
- TEI (1)
- Textlinguistik (1)
- Texttechnologie (1)
- Textverarbeitungssoftware (1)
- Token <Linguistik> (1)
- Transkriptionswerkzeuge (1)
- Variationskorpora (1)
- Verhaltenswissenschaften (1)
- Vernetzung (1)
- Videaufzeichnung (1)
- Videoaufnahmen (1)
- Visualisierung von Transkripten (1)
- Wirtschaftswissenschaften (1)
- Wissenschaftsgeschichte (1)
- Wortschatz (1)
- Wörterbuch der deutschen Gegenwartssprache (WDG) (1)
- ZuMult (1)
- ZuMult data model (1)
- ZuMult-Datenmodell (1)
- acute hospital (1)
- age stereotypes (1)
- annotation tool (1)
- anonymization (1)
- cognitive impairment (1)
- computerunterstützte Transkription (1)
- contextual framework (1)
- conversation corpora (1)
- conversation database (1)
- corpora (1)
- corpora in DaF/DaZ (1)
- corpus access (1)
- corpus analysis (1)
- corpus construction (1)
- corpus creation (1)
- corpus linguistics (1)
- corpus search engine (1)
- corpus search platform (1)
- corpus treatment and editing (1)
- curation (1)
- discourse marker (1)
- elderspeak (1)
- format migration (1)
- functional status (1)
- functionalities of the Database for Spoken German (1)
- geschriebene Sprache (1)
- gesprochenes Deutsch (1)
- interoperability (1)
- language variation (1)
- legal issues (1)
- lexikalische Repräsentation (1)
- logical/conceptual level (1)
- long-term archival (1)
- metadata (1)
- methods of data elicitation (1)
- multi-turn conversations (1)
- multimodal (1)
- mündliche Interaktion (1)
- mündliche Korpora (1)
- oral corpus (1)
- oral corpus platform (1)
- oral interaction (1)
- physical/internal level (1)
- query (1)
- query language (1)
- research infrastructures (1)
- sentence boundary detection (1)
- software tools (1)
- speech (1)
- spoken language transcripts (1)
- survey (1)
- three-tier architecture (1)
- user survey (1)
- video (1)
- view/external level (1)
- visualisation of transcripts (1)
- web service (1)
- working with transcripts (1)
- Älterer Mensch (1)
- Übersetzung (1)
Publicationstate
- Veröffentlichungsversion (38)
- Zweitveröffentlichung (20)
- Postprint (9)
- Erstveröffentlichung (1)
Reviewstate
- Peer-Review (32)
- (Verlags)-Lektorat (24)
- Peer-review (1)
- Verlags-Lektorat (1)
Publisher
- de Gruyter (10)
- Institut für Deutsche Sprache (7)
- European Language Resources Association (ELRA) (6)
- European Language Resources Association (5)
- Leibniz-Institut für Deutsche Sprache (IDS) (5)
- Narr (4)
- Verlag für Gesprächsforschung (4)
- Cambridge Scholars Publ. (3)
- Linköping University Electronic Press (3)
- Springer (3)
Die Darstellung von und Arbeit mit Transkripten spielt in vielen forschungs- und anwendungsbezogenen Arbeiten mit Daten gesprochener Sprache eine wichtige Rolle. Der im ZuMult-Projekt entwickelte Prototyp ZuViel (Zugang zu Visualisierung von Transkripten) knüpft an etablierte Verfahren zur Transkriptdarstellung an und erweitert diese durch neue Möglichkeiten des interaktiven Arbeitens mit Transkripten im digitalen Medium. Der Beitrag führt in diese neuen Möglichkeiten ein und erklärt, wie sie in didaktischen DaF/DaZ-Kontexten aber auch hinsichtlich forschungsbezogener Perspektiven angewendet werden können
Im vorliegenden Artikel wird ein Überblick über das von der DFG geförderte Projekt Zugänge zu multimodalen Korpora gesprochener Sprache – Vernetzung und zielgruppenspezifische Ausdifferenzierung (ZuMult) gegeben. Dabei wird zunächst auf die Sprachdaten und auf die technische Basis der Applikationen eingegangen, die dem Projekt zugrunde liegen. Im Anschluss werden die weiteren Beiträge in diesem Themenheft von KorDaF kurz vorgestellt. Übergeordnetes Thema von ZuMult ist die Verbesserung der Zugänglichkeit von digitalen mündlichen Sprachdaten für verschiedene Anwendungen und Zielgruppen, wobei der Fokus dieses Themenhefts auf Applikationen und Anwender:innen aus der Fremdsprachendidaktik und der DaF-/DaZ-Forschung und -Lehre liegt. Die einzelnen Beiträge beleuchten zentrale methodische und/oder technische Aspekte dieses Themas und beschreiben die Architektur und verschiedene prototypische Anwendungen, die das Projekt entwickelt hat.
Transkriptionswerkzeuge sind spezialisierte Softwaretools für die Transkription und Annotation von Audio- oder Videoaufzeichnungen gesprochener Sprache. Dieses Kapitel erklärt einleitend, worin der zusätzliche Nutzen solcher Werkzeuge gegenüber einfacher Textverarbeitungssoftware liegt, und gibt dann einen Überblick über grundlegende Prinzipien und einige weitverbreitete Tools dieser Art. Am Beispiel der Editoren FOLKER und OrthoNormal wird schließlich der praktische Einsatz zweier Werkzeuge in den Arbeitsabläufen eines Korpusprojekts illustriert.
Vorwort
(2019)
As a part of the ZuMult-project, we are currently modelling a backend architecture that should provide query access to corpora from the Archive of Spoken German (AGD) at the Leibniz-Institute for the German Language (IDS). We are exploring how to reuse existing search engine frameworks providing full text indices and allowing to query corpora by one of the corpus query languages (QLs) established and actively used in the corpus research community. For this purpose, we tested MTAS - an open source Lucene-based search engine for querying on text with multilevel annotations. We applied MTAS on three oral corpora stored in the TEI-based ISO standard for transcriptions of spoken language (ISO 24624:2016). These corpora differ from the corpus data that MTAS was developed for, because they include interactions with two and more speakers and are enriched, inter alia, with timeline-based annotations. In this contribution, we report our test results and address issues that arise when search frameworks originally developed for querying written corpora are being transferred into the field of spoken language.