Refine
Year of publication
- 2004 (9) (remove)
Document Type
- Conference Proceeding (4)
- Part of a Book (3)
- Book (2)
Has Fulltext
- yes (9)
Keywords
- Gesprochene Sprache (9) (remove)
Publicationstate
- Veröffentlichungsversion (3)
- Postprint (1)
- Zweitveröffentlichung (1)
Reviewstate
Publisher
Das Bild von der 'Sprache der DDR' in der alten Bundesrepublik oder: Haben sie so gesprochen?
(2004)
Die Textproduktion unter Bedingungen konzeptioneller Mündlichkeit basiert - nicht nur im bevorzugt untersuchten Alltagsgespräch - auf einer ganzen Reihe von Routinen: Kompetente Sprecher können ohne größeren Verbrauch von Planungsressourcen auf mehr oder weniger feste Äußerungsteile und -strukturen zurückgreifen, um bestimmte kommunikative Aufgaben und Handlungen (wie Eröffnung und Beendigung von Gesprächen, Themenbearbeitung und Themenwechsel, Durchführung von Korrekturen/Reparaturen, Kommentierung von Äußerungen usw.) auf bewährte und angemessene Weise zu bewältigen. Ausgehend von einer Diskussion des Konzepts sprachlicher Formelhaftigkeit verfolgt der Beitrag das Ziel, anhand ausgewählter authentischer Beispieltexte zu zeigen, welche Rolle die entsprechenden sprachlichen Mittel und Strukturen auf den verschiedenen Ebenen mündlicher Kommunikation spielen.
We present the annotation of information structure in the MULI project. To learn more about the information structuring means in prosody, syntax and discourse, theory- independent features were defined for each level. We describe the features and illustrate them on an example sentence. To investigate the interplay of features, the representation has to allow for inspecting all three layers at the same time. This is realised by a stand-off XML mark-up with the word as the basic unit. The theory-neutral XML stand-off annotation allows integrating this resource with other linguistic resources such as the Tiger Treebank for German or the Penn treebank for English.
The aim of this paper is to highlight the actual need for corpora that have been annotated based on acoustic information. The acoustic information should be coded in features or properties and is needed to inform further processing systems, i.e. to present a basis for a speech recognition system using linguistic information. Feature annotation of existing corpora in combination with segmental annotation can provide a powerful training material for speech recognition systems, but will as well challenge the further processing of features to segments and syllables. We present here the theoretical preliminaries for our multilingual feature extraction system, that we are currently working on.
Das Buch reflektiert die Entwicklung der Erforschung gesprochener Sprache in den letzten 30 Jahren und erarbeitet auf dieser Grundlage eine eigene theoretische Konzeptualisierung des Gegenstandes. Zunächst wird die Spezifik mündlicher Kommunikation und gesprochener Sprache charakterisiert. Dazu werden die Grundbedingungen mündlicher Verständigung herausgearbeitet und in ihrem Einfluss auf die Ausbildung kommunikativer Verfahren und sprachlicher Mittel beschrieben. Der zweite Teil behandelt die methodologische Frage, ob und inwieweit die Untersuchung gesprochener Sprache spezifische Analyse- und Beschreibungskategorien erfordert. Dabei wird insbesondere das Problem der Einheiten in gesprochener Sprache diskutiert. Die empirische Untersuchung und theoretische Modellierung einer bestimmten grammatischen Konstruktion, der Operator- Skopus-Struktur, die in den letzten Jahren in der gesprochenen Sprache stark expandiert, stehen im Zentrum der exemplarischen Analysen des Schlussteils.
This paper attempts a new look at computer assisted transcription as it is commonly practised within the fields of discourse analysis and language acquisition studies. The first part proposes a bridge between discourse analytical methodology and text technological methods with the concept of modelling as its central idea. The second part demonstrates the EXMARaLDA system, a set of formats and tools for computer assisted transcription that builds on the ideas developed in the first part and implements them in a way that can lead to significant improvement in current research practice.
This paper describes EXMARaLDA, an XML-based framework for the construction, dissemination and analysis of corpora of spoken language transcriptions. Departing from a prototypical example of a “partitur” (musical score) transcription, the EXMARaLDA “single timeline, multiple tiers” data model and format is presented alongside with the EXMARaLDA Partitur-Editor, a tool for inputting and visualizing such data. This is followed by a discussion of the interaction of EXMARaLDA with other frameworks and tools that work with similar data models. Finally, this paper presents an extension of the “single timeline, multiple tiers” data model and describes its application within the EXMARaLDA system.