Refine
Year of publication
- 2021 (4) (remove)
Document Type
- Article (1)
- Book (1)
- Part of a Book (1)
- Conference Proceeding (1)
Has Fulltext
- yes (4)
Is part of the Bibliography
- yes (4)
Keywords
- Gesprochene Sprache (2)
- Korpus <Linguistik> (2)
- Transkription (2)
- Alemannisch (1)
- Annotation (1)
- Computerlinguistik (1)
- Datenbank (1)
- Datenmanagement (1)
- Dialektologie (1)
- Dreiländereck (1)
Publicationstate
- Veröffentlichungsversion (3)
- Postprint (1)
- Zweitveröffentlichung (1)
Reviewstate
- Peer-Review (3)
- (Verlags)-Lektorat (1)
Publisher
- CLARIN (1)
- Edinburgh University Press (1)
- IDS-Verlag (1)
- Zenodo (1)
Der Beitrag beschreibt die Entwicklung und Anwendung des TEI-basierten ISO-Standards ISO 24624:2016 Transcription of spoken language, der seit einigen Jahren für gesprochensprachliche Forschungsdaten aus unterschiedlichen Kontexten eingesetzt wird. Ein standardisiertes Dateiformat ermöglicht Interoperabilität zwischen verschiedenen Werkzeugen und weiteren Angeboten von Datenzentren und Infrastrukturen. Durch die methodologisch fundierte Abwägung zwischen Standardisierung und Flexibilität kann der ISO/TEI-Standard zudem Forschungsdaten aus verschiedenen Forschungskontexten abbilden, und so interdisziplinäre Vorhaben erleichtern. Der Beitrag stellt einige Anwendungsbereiche aus dem Lebenszyklus gesprochensprachlicher Forschungsdaten vor, in denen auf dem ISO/TEI-Standard basierenden Erweiterungen existierender Softwarelösungen erfolgreich umgesetzt werden konnten, und zeigt weitere Beispiele für die zunehmende Verbreitung des Formats.
In diesem Buch werden auf einer großen empirischen Basis die regionalen Sprechweisen von verschiedenen Bevölkerungsgruppen in einem kleinen Gebiet im alemannischen Sprachraum untersucht. Als Datengrundlage dienen aktuelle, spontansprachliche und fragebuchbasierte Daten, die einander gegenübergestellt und diachron mit den Ergebnissen des Südwestdeutschen Sprachatlas (SSA) aus den 1970er Jahren verglichen werden. Es werden vorwiegend datenaggregierende Verfahren angewendet, um die regionale und soziale Gebundenheit der vorgefundenen Variation zu erfassen. Mit Hilfe von Dialektabstandsmessungen werden ausgewählte, überwiegend phonologische Merkmale im Hinblick auf Dialektwandelprozesse untersucht. Außerdem wird gezeigt, dass mit dialektometrischen Verfahren explorative Aggregatanalysen möglich sind, die es erlauben, Sprachräume zu identifizieren und dialektologisch zu beschreiben.
This paper describes the TEI-based ISO standard 2462:2016 “Transcription of spoken language” and other formats used within CLARIN for spoken language resources. It assesses the current state of support for the standard and the interoperability between these formats and with relevant tools and services. The main idea behind the paper is that a digital infrastructure providing language resources and services to researchers should also allow the combined use of resources and/or services from different contexts. This requires syntactic and semantic interoperability. We propose a solution based on the ISO/TEI format and describe the necessary steps for this format to work as an exchange format with basic semantic interoperability for spoken language resources across the CLARIN infrastructure and beyond.
In this paper, we present an overview of freely available web applications providing online access to spoken language corpora. We explore and discuss various solutions with which the corpus providers and corpus platform developers address the needs of researchers who are working with spoken language. The paper aims to contribute to the long-overdue exchange and discussion of methods and best practices in the design of online access to spoken language corpora.