Refine
Year of publication
- 2015 (16) (remove)
Document Type
- Part of a Book (7)
- Working Paper (3)
- Article (2)
- Conference Proceeding (2)
- Book (1)
- Other (1)
Has Fulltext
- yes (16)
Keywords
- Gesprochene Sprache (16) (remove)
Publicationstate
Reviewstate
- Peer-Review (3)
- (Verlags)-Lektorat (2)
- Verlags-Lektorat (1)
Publisher
Feedback utterances are among the most frequent in dialogue. Feedback is also a crucial aspect of all linguistic theories that take social interaction involving language into account. However, determining communicative functions is a notoriously difficult task both for human interpreters and systems. It involves an interpretative process that integrates various sources of information. Existing work on communicative function classification comes from either dialogue act tagging where it is generally coarse grained concerning the feed- back phenomena or it is token-based and does not address the variety of forms that feed- back utterances can take. This paper introduces an annotation framework, the dataset and the related annotation campaign (involving 7 raters to annotate nearly 6000 utterances). We present its evaluation not merely in terms of inter-rater agreement but also in terms of usability of the resulting reference dataset both from a linguistic research perspective and from a more applicative viewpoint.
In my article I argue the need for an existence of grammar in spoken language. It would have the same functions as the grammar of written language: describing and explaining the fundamental units of spoken language and their features, describing the composition of those units and their conjunction. The basic units in the grammar of spoken language can be named as: the sound, the word, the functional unit, the conversational turn and the conversation itself. Further the central characteristics of spoken language and their impact on grammar have to be taken into account. They are: the interactivity, the multimodality, the processabihty and the great variability. After displaying my concepts I discuss three alternative concepts of a grammar in spoken language: online-syntax, construction grammar and multimodal grammar. The article concludes by discussing the role of spoken language grammar in language and foreign language teaching.
Ph@ttSessionz and Deutsch heute are two large German speech databases. They were created for different purposes: Ph@ttSessionz to test Internet-based recordings and to adapt speech recognizers to the voices of adolescent speakers, Deutsch heute to document regional variation of German. The databases differ in their recording technique, the selection of recording locations and speakers, elicitation mode, and data processing.
In this paper, we outline how the recordings were performed, how the data was processed and annotated, and how the two databases were imported into a single relational database system. We present acoustical measurements on the digit items of both databases. Our results confirm that the elicitation technique affects the speech produced, that f0 is quite comparable despite different recording procedures, and that large speech technology databases with suitable metadata may well be used for the analysis of regional variation of speech.
Mit dem cGAT-Handbuch stellt das FOLK-Projekt eine Richtlinie für das computergestützte Transkribieren nach GAT 2 zur Verfügung. Das Handbuch wurde anhand der Transkriptionspraxis in FOLK entwickelt und enthält eine Vielzahl von authentischen Beispielen, die mit dem zugehörigen Audio auch über die Datenbank für Gesprochenes Deutsch (DGD) abgerufen werden können.
Ziel des vorliegenden Beitrags ist es, auszuloten, wie Sprechen und Handeln, das wir aus dem Alltag kennen, einzuschätzen ist, wenn es im Fernsehen und vor allem im so genannten Reality-TV erscheint. Einen guten Einstieg, diese Problemstellung zu illustrieren, bieten Pannen, wie man sie etwa aus Nachrichtensendungen wie der Tagesschau kennt.
Nach einer Definition der Begriffe ‚multimodale Verständigung‘ und ‚gesprochene Sprache‘ werden im vorliegenden Beitrag Prozessualität, Interaktivität und Multimodalität als zentrale Besonderheiten multimodaler Verständigung beschrieben und in ihren möglichen Auswirkungen auf die Syntax gesprochener Sprache charakterisiert. Als aktuelle Konzepte zur syntaktischen Beschreibung gesprochener Sprache stelle ich dann die on line-Syntax, die Konstruktionsgrammatik und die multimodale
Grammatik vor. Als Probleme der syntaktischen Beschreibung gesprochener Sprache diskutiere ich die Beschreibungskategorien sowie die Varianz gesprochener Sprache, die eine eindeutige kategoriale Erfassung erschwert. Als Gegenstand syntaktischer Beschreibung werden die funktionalen Einheiten und der Gesprächsbeitrag eingeführt (Abschnitt 2). Sodann stelle ich Ausschließlichkeit, quantitative Differenz und funktionale Differenz als zu unterscheidende Formen von Besonderheiten vor. Es schließen sich Darstellungen zur Syntax im Formulierungsprozess, zu spezifischen syntaktischen Strukturen und Konstruktionen und zur Syntax ‚elliptischer‘ Gesprächsbeiträge an (Abschnitt 3). Zum Abschluss werden zusammenfassend allgemeine Tendenzen der Syntax gesprochener Sprache benannt (Abschnitt 4).
Metalinguistic awareness of standard vs standard usage. The case of determiners in spoken German
(2015)
Maskierung
(2015)
Aus forschungsethischen Gründen müssen die Daten aus Gesprächsaufzeichnungen, die Metadaten sowie die Transkripte maskiert werden. Der Beitrag stellt Arbeitsschritte der Maskierung vor, die auf den Erfahrungen bei der Datenaufbereitung der Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für die Veröffentlichung in der Datenbank für Gesprochenes Deutsch (DGD) basieren.
Transkriptionsaufwand
(2015)
Während die Erhebung von Gesprächsdaten zwar zeitaufwändig, aber doch noch relativ zügig zu bewältigen ist, handelt es sich bei der Transkription um eine langwierige Aufgabe, die oft unterschätzt wird. Damit Studierende, Promovierende sowie WissenschaftlerInnen, die Exposés, Arbeitspläne usw. aufstellen oder Zuschüsse für Projekte beantragen müssen, zukünftig über fundiertere Werte verfügen und damit realistischere Aussagen über den benötigten Aufwand (zeitliche wie personelle Ressourcen) treffen können, stellt der Beitrag die Ergebnisse einer Erhebung des Transkriptionsaufwandes im FOLK-Projekt vor.
In diesem Beitrag möchte ich die These vertreten, dass Varianz das konstitutive Merkmal von Sprache ist - der geschriebenen, aber insbesondere auch der gesprochenen. Demgegenüber stand in der Linguistik über lange Zeit die Vorstellung im Vordergrund, dass Sprache ein homogener Gegenstand sei - und sie dies, um wechselseitige Verständigung zu ermöglichen, auch sein müsse. Ich werde zunächst in Abschnitt 2 diese Homogenitätsthese in Erinnerung rufen, um dann in Abschnitt 3 zu explizieren, was ich unter sprachlicher Varianz verstehe. In Abschnitt 4 werde ich einige theoretische Konzepte zur linguistischen Modellierung von Varianz skizzieren und ihre Grundannahmen explizieren. Die besondere Vielfalt der Varianz in der gesprochenen Sprache und die Gründe für diese Vielfalt stehen im Mittelpunkt von Abschnitt 5. Schließen werde ich, indem ich in Abschnitt 6 ein alternatives Konzept zur Modellierung von Varianz vorstelle, das für die Beschreibung der Varianz in der gesprochenen Sprache in besonderer Weise geeignet ist. Es konzeptualisiert Varianz als graduelles und kontinuierliches Phänomen, nicht als qualitative Differenz zwischen in sich annähernd homogenen Entitäten.
Die Programmbereiche „Korpuslinguistik“ und „Mündliche Korpora“ haben am IDS die Aufgabe, Grundlagen für die empirische Erforschung der deutschen Sprache zu legen. Unter anderem sammeln und erstellen sie schriftliche und mündliche Korpora, bereiten sie für eine wissenschaftliche Nutzung auf und stellen sie über Web-Oberflächen (COSMAS, DGD2 demnächst KorAP) zur Verfügung. Unser Beitrag gibt zunächst einen Überblick über Entstehungsgeschichte und aktuellen Stand dieser Arbeiten. Mit einem Blick in die Zukunft widmen wir uns auch der Frage, ob und in welcher Weise das Schlagwort ,Big Data‘ für diese Arten linguistischer Ressourcen relevant ist. In Bezug auf die schriftlichen Korpora wird dabei insbesondere über die diesjährige DEREKo-Erweiterung um über 17 Milliarden Wörter und die damit verbundenen Arbeiten berichtet. In diesem Zusammenhang werden u.a. DeReKos Design, die zugrundeliegende Akquisitionsstrategie und Überlegungen zu Dispersion und Stratifizierbarkeit diskutiert. Die spezifischen Herausforderungen, die sich beim Aufbau eines großen Gesprächskorpus stellen, werden am Beispiel des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) diskutiert. Dabei steht außer Frage, dass angesichts des Aufwandes, den Feldzugang sowie Erschließung der im Feld gewonnenen Audio- und Videodaten bedeuten, vergleichbare Datenmengen und Wachstumsraten wie bei Textkorpora nicht zu erreichen sind. Für den Aufbau umfangreicher mündlicher Korpora ist daher die Entwicklung eines eigenen Methodeninstrumentariums notwendig.
Der Beitrag widmet sich der Frage, nach welchen Einheiten das Sprechen in der Interaktion auf der ‚mittleren Ebene‘ strukturiert ist. Die Diskussion geht aus von für die gesprochene Sprache typischen bzw. spezifischen Phänomenen, die Kriterien normgrammatisch vollständiger Sätze zuwider laufen, wie z. B. Ellipsen, Expansionen und Diskursmarkern. Anschließend werden die in der Literatur der vergangenen etwa 40 Jahre theoretisch entwickelten und empirisch untersuchten Einheitenkonzepte diskutiert und im Hinblick auf ihre Leistungsfähigkeit zur Beschreibung und Erklärung nicht-normgrammatischer Phänomene evaluiert.
Mit den Methoden der Interaktionalen Linguistik und der Konversationsanalyse untersucht die vorliegende Arbeit syntaktische Ko-Konstruktionen im gesprochenen Deutsch, wobei der Fokus auf Vervollständigungen eines zweiten Sprechers vor einem möglichen syntaktischen Abschlusspunkt liegt. Auf der Basis von 199 Ko-Konstruktionen aus informellen Interviews und Tischgesprächen leistet die Arbeit eine erste umfassende Analyse der gemeinsamen Konstruktion einer syntaktischen Gestalt durch zwei Sprecher im Deutschen.
Die Struktur der Ko-Konstruktionen wird in einem ersten Schritt über die Basisoperationen der Online-Syntax, Projektion und Retraktion, beschrieben. Im Fokus steht hier die Frage, an welchen Projektionen sich der zweite Sprecher orientiert, wobei sowohl syntaktische und prosodische als auch semanto-pragmatische Aspekte in die Analyse miteinbezogen werden. In einem zweiten Schritt wird die zeitliche und sequenzielle Organisation der Ko-Konstruktionen detailliert herausgearbeitet. Ein Schwerpunkt liegt hier auf einer genauen Darstellung und Analyse der verschiedenen Handlungsoptionen des ersten Sprechers nach der ko-konstruierten Vervollständigung.