Volltext-Downloads (blau) und Frontdoor-Views (grau)
The search result changed since you submitted your search request. Documents might be displayed in a different sort order.
  • search hit 46 of 83
Back to Result List

Interaction of technology and methodology in building and sharing an annotated learner corpus of spoken German

  • This paper discusses the technological and methodological challenges in creating and sharing HAMATAC, the Hamburg Map Task Corpus. The first version of the corpus, consisting of 24 recordings with orthographic transcriptions and metadata, is publicly available. A second version featuring different types of linguistic annotation is in progress. I will describe how the various software tools and data formats of the EXMARaLDA system were used for transcription and multi-level annotation, to compile recordings and transcriptions into a corpus and manage metadata, to publish the corpus, and how they can be used for carrying out corpus queries (KWIC) and analyses. Some recurrent issues in corpus building and sharing and the interaction of technological and methodological aspects will be illustrated using HAMATAC.
  • Este artículo trata los retos tecnológicos y metodológicos de la creación y publicación de HAMATAC, el Hamburg Map Task Corpus. La primera versión del corpus, que consiste en 24 grabaciones con transcripción ortográfica y metadatos, está disponible públicamente. Está en desarrollo una segunda versión que incluye distintos tipos de anotación lingüística. Voy a describir cómo las diversas herramientas de software y formatos de datos del sistema EXMARaLDA se utilizaron para la transcripción y la anotación multinivel, para reunir grabaciones y transcripciones en un corpus, para administrar los metadatos y para publicar el corpus, y cómo pueden ser usados para realizar consultas en el corpus (KWIC) y análisis. Se ilustrarán usando HAMATAC algunos de los cuestiones recurrentes de la creación y publicación de un corpus y la interacción de los aspectos tecnológicos y metodológicos.

Export metadata

Additional Services

Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Hanna HedelandORCiD
URN:urn:nbn:de:bsz:mh39-97212
URL:http://www.aelinco.es/en/proceedings-related-publications
ISBN:978-84-694-6225-6
Parent Title (Spanish):Actas del III Congreso Internacional de Lingüística de Corpus. Tecnologías de la Información y las Comunicaciones: Presente y Futuro en el Análisis de Corpus [7.-9. April 2011, València]
Publisher:Editorial Universitat Politècnica de València
Place of publication:València
Editor:María Luisa Carrió Pastor, Miguel Ángel Candel Mora
Document Type:Conference Proceeding
Language:English
Year of first Publication:2011
Date of Publication (online):2020/03/22
Publicationstate:Zweitveröffentlichung
Reviewstate:Peer-Review
Tag:learner corpus; multi-level annotation; spoken language; transcription
anotación multinivel; corpus de aprendices; lenguaje oral; transcripción
GND Keyword:Annotation; Gesprochene Sprache; Korpus <Linguistik>; Methodologie; Transkription
First Page:87
Last Page:100
DDC classes:400 Sprache / 400 Sprache, Linguistik
Open Access?:ja
Linguistics-Classification:Computerlinguistik
Licence (German):License LogoUrheberrechtlich geschützt