Refine
Year of publication
- 2015 (16) (remove)
Document Type
- Part of a Book (7)
- Working Paper (3)
- Article (2)
- Conference Proceeding (2)
- Book (1)
- Other (1)
Has Fulltext
- yes (16) (remove)
Keywords
- Gesprochene Sprache (16) (remove)
Publicationstate
Reviewstate
- Peer-Review (3)
- (Verlags)-Lektorat (2)
- Verlags-Lektorat (1)
Publisher
Ph@ttSessionz and Deutsch heute are two large German speech databases. They were created for different purposes: Ph@ttSessionz to test Internet-based recordings and to adapt speech recognizers to the voices of adolescent speakers, Deutsch heute to document regional variation of German. The databases differ in their recording technique, the selection of recording locations and speakers, elicitation mode, and data processing.
In this paper, we outline how the recordings were performed, how the data was processed and annotated, and how the two databases were imported into a single relational database system. We present acoustical measurements on the digit items of both databases. Our results confirm that the elicitation technique affects the speech produced, that f0 is quite comparable despite different recording procedures, and that large speech technology databases with suitable metadata may well be used for the analysis of regional variation of speech.
Feedback utterances are among the most frequent in dialogue. Feedback is also a crucial aspect of all linguistic theories that take social interaction involving language into account. However, determining communicative functions is a notoriously difficult task both for human interpreters and systems. It involves an interpretative process that integrates various sources of information. Existing work on communicative function classification comes from either dialogue act tagging where it is generally coarse grained concerning the feed- back phenomena or it is token-based and does not address the variety of forms that feed- back utterances can take. This paper introduces an annotation framework, the dataset and the related annotation campaign (involving 7 raters to annotate nearly 6000 utterances). We present its evaluation not merely in terms of inter-rater agreement but also in terms of usability of the resulting reference dataset both from a linguistic research perspective and from a more applicative viewpoint.
Mit dem cGAT-Handbuch stellt das FOLK-Projekt eine Richtlinie für das computergestützte Transkribieren nach GAT 2 zur Verfügung. Das Handbuch wurde anhand der Transkriptionspraxis in FOLK entwickelt und enthält eine Vielzahl von authentischen Beispielen, die mit dem zugehörigen Audio auch über die Datenbank für Gesprochenes Deutsch (DGD) abgerufen werden können.
In diesem Beitrag möchte ich die These vertreten, dass Varianz das konstitutive Merkmal von Sprache ist - der geschriebenen, aber insbesondere auch der gesprochenen. Demgegenüber stand in der Linguistik über lange Zeit die Vorstellung im Vordergrund, dass Sprache ein homogener Gegenstand sei - und sie dies, um wechselseitige Verständigung zu ermöglichen, auch sein müsse. Ich werde zunächst in Abschnitt 2 diese Homogenitätsthese in Erinnerung rufen, um dann in Abschnitt 3 zu explizieren, was ich unter sprachlicher Varianz verstehe. In Abschnitt 4 werde ich einige theoretische Konzepte zur linguistischen Modellierung von Varianz skizzieren und ihre Grundannahmen explizieren. Die besondere Vielfalt der Varianz in der gesprochenen Sprache und die Gründe für diese Vielfalt stehen im Mittelpunkt von Abschnitt 5. Schließen werde ich, indem ich in Abschnitt 6 ein alternatives Konzept zur Modellierung von Varianz vorstelle, das für die Beschreibung der Varianz in der gesprochenen Sprache in besonderer Weise geeignet ist. Es konzeptualisiert Varianz als graduelles und kontinuierliches Phänomen, nicht als qualitative Differenz zwischen in sich annähernd homogenen Entitäten.
In my article I argue the need for an existence of grammar in spoken language. It would have the same functions as the grammar of written language: describing and explaining the fundamental units of spoken language and their features, describing the composition of those units and their conjunction. The basic units in the grammar of spoken language can be named as: the sound, the word, the functional unit, the conversational turn and the conversation itself. Further the central characteristics of spoken language and their impact on grammar have to be taken into account. They are: the interactivity, the multimodality, the processabihty and the great variability. After displaying my concepts I discuss three alternative concepts of a grammar in spoken language: online-syntax, construction grammar and multimodal grammar. The article concludes by discussing the role of spoken language grammar in language and foreign language teaching.
Der Beitrag widmet sich der Frage, nach welchen Einheiten das Sprechen in der Interaktion auf der ‚mittleren Ebene‘ strukturiert ist. Die Diskussion geht aus von für die gesprochene Sprache typischen bzw. spezifischen Phänomenen, die Kriterien normgrammatisch vollständiger Sätze zuwider laufen, wie z. B. Ellipsen, Expansionen und Diskursmarkern. Anschließend werden die in der Literatur der vergangenen etwa 40 Jahre theoretisch entwickelten und empirisch untersuchten Einheitenkonzepte diskutiert und im Hinblick auf ihre Leistungsfähigkeit zur Beschreibung und Erklärung nicht-normgrammatischer Phänomene evaluiert.
Maskierung
(2015)
Aus forschungsethischen Gründen müssen die Daten aus Gesprächsaufzeichnungen, die Metadaten sowie die Transkripte maskiert werden. Der Beitrag stellt Arbeitsschritte der Maskierung vor, die auf den Erfahrungen bei der Datenaufbereitung der Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für die Veröffentlichung in der Datenbank für Gesprochenes Deutsch (DGD) basieren.