Refine
Year of publication
Document Type
- Part of a Book (9)
- Conference Proceeding (8)
- Article (6)
- Book (1)
- Doctoral Thesis (1)
- Other (1)
Has Fulltext
- yes (26)
Keywords
- Prosodie (26) (remove)
Publicationstate
- Veröffentlichungsversion (26) (remove)
Reviewstate
Publisher
- de Gruyter (5)
- EDP Sciences (1)
- European Language Resources Association (1)
- IDS-Verlag (1)
- Institute for Logic, Language and Computation (1)
- Institute of Cybernetics, Institute of the Estonian Language (1)
- International Speech Communication Association (1)
- Istituto Italiano di Studi Germanici (1)
- Language Science Press (1)
- Narr (1)
In diesem Beitrag stellen wir die Ergebnisse einer Studie über die Intonation von Frageaktivitäten in deutschen Alltagsgesprächen vor. Unsere Untersuchung erforscht, inwieweit die Intonation zur Kontextualisierung von konversationellen Fragen beiträgt. In der Analyse stützen wir uns auf das autosegmental-metrische Modell von Peters und das taxonomische Modell der interaktionalen Prosodieforschung von Selting. Diese Modelle beschreiben jeweils phonologische oder pragmatische Aspekte der Frageintonation, zwei Dimensionen, die für sich genommen, keine vollständige Beschreibung liefern können. Auf der Grundlage authentischer Gesprächsdaten aus dem Korpus FOLK argumentieren wir für die Kompatibilität des autosegmental-metrischen Modells von Peters und des taxonomischen Modells der Frageintonation von Selting. Die Merkmale aus beiden Modellen lassen sich zu Bündeln kombinieren, die es erlauben, die Intonation von Fragen zu erfassen.
Die vorliegende Dissertation beschäftigt sich mit verschieden Methoden zur Erhebung von perzeptuellen Prominenzurteilen von naiven Hörern im Deutschen. Es werden zwei Experimente vorgestellt, die sich zum einen mit der Verwendung von verschiedenen Skalen, zum anderen mit der Verwendung von unterschiedlichen Bewertungsebenen zur Beurteilung von perzeptueller Prominenz beschäftigen. Die Ergebnisse zeigen, dass Ergebnisse von Studien, welche auf unterschiedlichen Erhebungstechniken beruhen nicht ohne weiteres vergleichbar sind. Die Arbeit untersucht außerdem die Effekte einer Normalisierung der Prominenzurteile. Die Dissertation schließt mit einem Ausblick für zukünftige Studien. Hierbei werden hauptsächlich die vielfältigen Interaktionen von verschiedenen Quellen und dem Kontext bei der Beurteilung der perzeptuellen Prominenz adressiert.
The term “pivot” usually refers to two overlapping syntactic units such that the completion of the first unit simultaneously launches the second. In addition, pivots are generally said to be characterized by the smooth prosodic integration of their syntactic parts. This prosodic integration is typically achieved by prosodic-phonetic matching of the pivot components. As research on such turns in a range of languages has illustrated, speakers routinely deploy pivots so as to be able to continue past a point of possible turn completion, in the service of implementing some additional or revised action. This article seeks to build on, and complement, earlier research by exploring two issues in more detail as follows: (1) what exactly do pivotal turn extensions accomplish on the action dimension, and (2) what role does prosodic-phonetic packaging play in this? We will show that pivot constructions not only exhibit various degrees of prosodic-phonetic (non-)integration, i.e., differently strong cesuras, but that they can be ordered on a continuum, and that this cline maps onto the relationship of the actions accomplished by the components of the pivot construction. While tighter prosodic-phonetic integration, i.e., weak(er) cesuring, co-occurs with post-pivot actions whose relationship to that of the pre-pivot tends to be rather retrospective in character, looser prosodic-phonetic integration, i.e., strong(er) cesuring, is associated with a more prospective orientation of the post-pivot’s action. These observations also raise more general questions with regard to the analysis of action.
Aus Platzgründen musste in der Druckfassung des Artikels „Beobachtungen zu Frequenz und Funktionen von ja in deutscher Spontansprache“ (in: Deutsche Sprache 50, S. 336–363; https://doi.org/10.37307/j.1868-775X.2022.04.04) auf den Abdruck der illustrierenden Abbildungen 2–18 im Abschnitt 5.2 verzichtet werden. Das entsprechende Kapitel inklusive aller Abbildungen ist hier abrufbar.
Eine wichtige und häufig unterschätzte Aufgabe beim Erwerb einer zweiten Sprache ist es, sich die rhythmisch-prosodischen Muster der Zielsprache anzueignen (Kaltenbacher 1998; Gut/Trouvin/Barry 2007; Rautenberg 2012). Wie erfolgreich Lerner/innen dabei sind, ist auch davon abhängig, ob sie analoge Muster in ihrer Ausgangssprache vorfinden und damit bereits für eine zielsprachennahe Rhythmus- und Akzentwahrnehmung sensibilisiert sind. Liegen solche analogen Muster nicht vor, ist es Aufgabe von Lehrprogrammen, die Rhythmus- und Akzentstrukturen als relevante Lernhilfen sichtbar zu machen.
Soweit ich sehe, liegen hier bislang kaum zielführende Konzepte vor (so auch Richter 2008). Findet der Zweitspracherwerb in der Grundschule statt, ist sogar das Gegenteil der Fall. Denn im Schriftspracherwerb, der den weitaus intensivsten Teil des Deutschunterrichts der Grundschule ausmacht, werden die Kinder mit noch genauer zu beschreibenden Schreib- und Lese-Lern-Verfahren auf die phonologische Segmentstruktur festgelegt; Rhythmus und Akzent werden nivelliert bzw., wie zu zeigen sein wird, für andere Arbeitsaufgaben funktionalisiert, so dass eine zielsprachennahe Orientierung an rhythmisch-prosodischen Strukturen tendenziell blockiert wird.
Das hat Auswirkungen nicht nur auf den Erwerb der gesprochenen Sprache, sondern auch auf den Schriftspracherwerb selbst. Denn die Schrift buchstabiert nicht einfach Lautketten aus, sondern ist selbst rhythmus-sensitiv. Verschriftet werden neben segmentalen Lauteigenschaften, Silben- und Akzentmuster, morphologische und syntaktische Strukturen. Eine einseitige Fixierung der Kinder auf die lautlich-segmentale Seite der Schrift führt nicht nur zu einer vereinseitigten Schrifttheorie, sondern zugleich dazu, dass weitere strukturelle Eigenschaften, darunter Silben- und Akzentmuster, weder in den Aufmerksamkeitsfokus der Kinder gelangen noch für das Schreiben und Lesen genutzt werden können. Wie u.a. Ashby (2006) gezeigt hat, ist aber gerade die Realisierung der prosodisch-rhythmischen Struktur eine wesentliche Komponente für die Leseflüssigkeit.
Im vorliegenden Beitrag geht es nach einem Abriss über herkömmliche, im Erstunterricht zugrundegelegte Schriftspracherwerbsmodelle und ihre Folgen für die Sprachwahrnehmung um die Rekonstruktion der Wortschreibung des Deutschen; gezeigt wird, wie phonographische, silbische, prosodische und morphologische Eigenschaften im Kernwortschatz miteinander interagieren, um eine reguläre Wortschreibung zu erzeugen.
Eine Gegenüberstellung des Deutschen und des Türkischen wird zeigen, dass sowohl in Bezug auf die Akzent- als auch in Bezug auf die Rhythmusstrukturen relevante Unterschiede bestehen, die bei Kindern mit Türkisch als erster Sprache zu Problemen beim Zugriff auf die für die Verschriftung deutscher Wörter wichtigen prosodischen Strukturen führen können, die durch fehlgehende Lehr-Lernprogramme weiter verschärft werden.
Zuletzt werden neuere Modelle des Schriftspracherwerbs vorgestellt, die es auf der Grundlage einer ausgebauten Schrifttheorie erlauben, den Lerner/innen von Beginn an einen Zugriff auf diejenigen Einheiten zu ermöglichen, die Fixpunkte für das geschriebene und für das gesprochene Deutsch darstellen.
The naturalness of synthetic speech depends strongly on the prediction of appropriate prosody. For the present study the original annotation of the German speech database “Kiel Corpus of Read Speech” was extended automatically with syntactic features, word frequency, and syllable boundaries. Several classification and regression trees for predicting symbolic prosody features, postlexical phonological processes, duration, and F0 were trained on this database. The perceptual evaluation showed that the overall perceptual quality of the German text-to-speech system MARY can be significantly improved by training all models that contribute to prosody prediction on the same database. Furthermore, it showed that the error introduced by symbolic prosody prediction perceptually equals the error produced by a direct method that does not exploit any symbolic prosody features.
This special issue investigates early responses—responsive actions that (start to) unfold while the production of the responded-to turn and action is still under way. Although timing in human conduct has gained intense interest in research, the early production of responsive actions has so far largely remained unexplored. But what makes early responses possible? What do such responses tell us about the complex interplay between syntax, prosody, and embodied conduct? And what sorts of actions do participants accomplish by means of such early responses? By addressing these questions, the special issue seeks to offer new advances in the systematic analysis of temporal organization in interaction, contributing to broader discussions in the language and cognitive sciences as to the social coordination of human conduct. In this introductory article, we discuss the role of temporality and sequentiality in social interaction, specifically focusing on projective and anticipatory mechanisms and the interplay between multiple semiotic resources, which are crucial for making early responses possible.
Designing a Bilingual Speech Corpus for French and German Language Learners: a Two-Step Process
(2014)
We present the design of a corpus of native and non-native speech for the language pair French-German, with a special emphasis on phonetic and prosodic aspects. To our knowledge there is no suitable corpus, in terms of size and coverage, currently available for the target language pair. To select the target L1-L2 interference phenomena we prepare a small preliminary corpus (corpus1), which is analyzed for coverage and cross-checked jointly by French and German experts. Based on this analysis, target phenomena on the phonetic and phonological level are selected on the basis of the expected degree of deviation from the native performance and the frequency of occurrence. 14 speakers performed both L2 (either French or German) and L1 material (either German or French). This allowed us to test, recordings duration, recordings material, the performance of our automatic aligner software. Then, we built corpus2 taking into account what we learned about corpus1. The aims are the same but we adapted speech material to avoid too long recording sessions. 100 speakers will be recorded. The corpus (corpus1 and corpus2) will be prepared as a searchable database, available for the scientific community after completion of the project.
Laute und leise Prosodie
(2006)
Dass die Prosodie uns beim Verständnis der gesprochenen Sprache unterstützt, ist selbstverständlich. Syntaktisch und semantisch mehrdeutige Sätze werden oft erst auf ihrer Basis richtig interpretiert. Weniger selbstverständlich ist, dass auch bei leise gelesener Sprache die Prosodie nicht auszuschalten ist. Eine abstrakte prosodische Struktur wird auf geschriebenen Texten aufgebaut, die der unmarkierten Informationsstruktur entspricht, es sei denn, kontextuelle Faktoren lösen spezielle diskursstrukturelle Merkmale und somit eine markierte prosodische Struktur aus. Aus diesem Grund ist auch die Prosodie ein wichtiger Faktor für die Verarbeitung von sog. Garden-Path-Sätzen und anderen lokal ambigen Sätzen: Es wird zuerst eine unmarkierte prosodische Struktur aufgebaut, die dann aufgrund weiterer morpho-syntaktischer Evidenz revidiert werden muss. Diese Reanalyse der syntaktischen und prosodischen Struktur geht mit erhöhten Verarbeitungskosten einher. Verlängerte Lesezeiten bei Sätzen mit markierter syntaktischer Struktur, wie z. B. bei Topikalisierungen und Scrambling, werden dadurch erklärt, dass neben der komplexeren Syntax auch eine markierte, weil aufwändige, prosodische Struktur aufgebaut werden muss. Im vorliegenden Beitrag wird ein Modell der Prosodie des Deutschen zusammengefasst, das die unmarkierte und markierte Prosodie erfasst und ihre Rolle beim Sprachverstehen beleuchtet. Silverman (1987) zeigt für das Englische, dass die Prosodie auch auf der Textebene eine disambiguierende Rolle spielt und dass die Skalierung der Tonakzente sowie die Dauerverhältnisse zwischen Sätzen uns dabei helfen, die richtigen Bezüge zwischen anaphorischen Elementen zu verstehen. Dieser Aspekt der Prosodie ist aber bisher kaum untersucht. Der Schwerpunkt der vorliegenden Analyse konzentriert sich deshalb auf den Satz.
In order to explore the influence of context on the phonetic design of talk-in-interaction, we investigated the pitch characteristics of short turns (insertions) that are produced by one speaker between turns from another speaker. We investigated the hypothesis that the speaker of the insertion designs her turn as a pitch match to the prior turn in order to align with the previous speaker’s agenda, whereas non-matching displays that the speaker of the insertion is non-aligning, for example to initiate a new action. Data were taken from the AMI meeting corpus, focusing on the spontaneous talk of first-language English participants. Using sequential analysis, 177 insertions were classified as either aligning or non-aligning in accordance with definitions of these terms in the Conversation Analysis literature. The degree of similarity between the pitch contour of the insertion and that of the prior speaker’s turn was measured, using a new technique that integrates normalized F0 and intensity information. The results showed that aligning insertions were significantly more similar to the immediately preceding turn, in terms of pitch contour, than were non-aligning insertions. This supports the view that choice of pitch contour is managed locally, rather than by reference to an intonational lexicon.
This conversation analytic study compares the use of negation particles in spoken German and Persian, namely nein/nee and na. While these particles have a range of functions in both languages (Ghaderi 2022; Imo 2017), their use in response to news remains understudied. We focus on nein/nee and na in two sequential contexts: (i) after prior disconfirmations (Extract (a)) and (ii) in response to either solicited or unsolicited informings (see Extracts (b) and (c), respectively). In both contexts, nein/nee and na mark unexpectedness and open up an opportunity space for more, but they do so in different ways and with different outcomes. Nein/nee- and na-turns after disconfirming, often minimal responses to first-position confirmable turns mark the prior as unexpected (or even contrasting with the nein/nee/na-speaker’s expectations) and thus as expandable/accountable (cf. Ford 2001; Gubina/Betz 2021). Nein/nee/na-turns after informings (e.g., announcements that display a story teller’s negative emotional stance) differ not only in sequential position but also in prosodic realization. They can be either falling or rising, but all are characterized by marked prosody, i.e., lengthening, very low onset, smiling or breathy voice, or high overall pitch. Through position and turn design features, such nein/nee- and na-turns not only mark a prior turn as counter to (normative) expectations, but may also display the speaker’s affective stance and affiliate with the affective stance of the prior interactant. By comparing the use of nein/nee and na in German and Persian in the two functions illustrated in Extracts (a) and (b/c), we will show (i) how nein/nee- and na-turns shape interactional trajectories after responsive actions and (ii) what role the particles play in managing news and stance-taking as well as epistemic and affective positioning. Apart from revealing similarities in the use of German and Persian negation particles, the results of our crosslinguistic comparison will demonstrate that even if different languages have similar practices for specific actions, the use of these practices is language- and culture-specific. This means that even similar practices in different languages have their own “collateral effects” (Sidnell/Enfield 2012), linguistic and prosodic characteristic features, and, at least sometimes, consequences for social actions accomplished in the specific language (e.g., Dingemanse/Blythe/Dirksmeyer 2014; Evans/Levinson 2009; Floyd/Rossi/Enfield (eds.) 2020; Fox et al. 2009). Our study uses the method of Conversation Analysis (Sidnell/Stivers (eds.) 2013) and draws on more than 80 hours of audio and video recordings of spontaneous interactions (co-present, via video link, and on the telephone) in everyday and institutional contexts.
The Perceptual Effect of L1 Prosody Transplantation on L2 Speech: The Case of French Accented German
(2016)
Research has shown that language learners are not only challenged by segmental differences between their native language (L1) and the second language (L2). They also have problems with the correct production of suprasegmental structures, like phone/syllable duration and the realization of pitch. These difficulties often lead to a perceptible foreign accent. This study investigates the influence of prosody transplantation on foreign accent ratings. Syllable duration and pitch contour were transferred from utterances of a male and female German native speaker to utterances of ten French native speakers speaking German. Acoustic measurements show that French learners spoke with a significantly lower speaking rate. As expected, results of a perception experiment judging the accentedness of 1) German native utterances, 2) unmanipulated and 3) manipulated utterances of French learners of German suggest that the transplantation of the prosodic features syllable duration and pitch leads to a decrease in accentedness rating. These findings confirm results found in similar studies investigating prosody transplantation with different L1 and L2 and provide a beneficial technique for (computer-assisted) pronunciation training.
Neben kurzen Bestandsaufnahmen vom Status der Prosodie in Grammatiken und in DaF-Didaktiken und -Lehrwerken wird Prosodie näher bestimmt und ihre wichtigsten Eigenschaften und Funktionen in Wort, Ausspruch und Gespräch beschrieben. Im Weiteren wird vor allem die bedeutungsgestaltende Funktion der Prosodie herausgearbeitet. Aus phonologischer Sicht sehen wir die Informationsstruktur als zentral für die Vermittlung der Prosodie an. Anhand von Akzentgruppe und Intonationsphrase wird ihre Rolle bei der rhythmischen Gliederung von Aussprüchen vorgestellt. Als weiteres Beispiel für die kommunikative Funktion von Prosodie wird ihre Rolle beim Ausdruck von Emotion behandelt.
Alors que de nombreuses études en analyse conversationnelle se sont intéressées à la manière dont des locuteurs co-construisent un tour de parole (notamment sur le plan syntaxique et prosodique), la façon dont la co-construction est ensuite évaluée n'a pas encore été étudiée en profondeur au sein de la littérature interactionniste. Ici, nous étudions deux pratiques permettant à un locuteur de valider une co-construction, à savoir l'acquiescement simple et l'hétéro-répétition de la complétion. En menant une analyse séquentielle et multimodale de plusieurs séquences de co-construction en français, nous montrons qu’à travers ces deux procédés – qui semblent au premier abord similaires dans leur fonctionnement – les locuteurs effectuent une évaluation très différente : tandis que l'acquiescement simple valide la complétion proposée uniquement comme une version possible, l'hétéro-répétition la valide comme étant une complétion complètement adéquate. Cette contribution met en évidence que les interactants exploitent des ressources audibles aussi bien que visibles afin de manifester si et dans quel sens ils acceptent la complétion de leur tour de parole de la part d’un coparticipant. Nous soulignons l’importance d’étudier en détail les différents formatages possibles des tours évaluant une complétion afin de pouvoir distinguer différentes formes « d’acceptation » et de révéler la manière dont les locuteurs peuvent finement négocier leur position en tant que (co-)auteur ou destinataire d’un tour de parole.
Der Begriff Wortprosodie bezeichnet hier die Organisation von Segmenten in die hierarchisch geordneten Konstituenten Silbe, Fuß und phonologisches Wort. Evidenz für solch eine Organisation und die ihr zugrundeliegenden Regeln findet sich in gewissen distributioneilen sowie phonetischen Besonderheiten von Segmenten. In diesem Beitrag versuche ich eine Darstellung der wesentlichen Züge der deutschen Wortprosodie als Interaktion miteinander in Konflikt stehender Beschränkungen im Sinne der Optimalitätstheorie. Im Mittelpunkt steht die Herausarbeitung unmarkierter prosodischer Strukturen auf der phonologisch-lexikalischen Ebene, da unmarkierte Strukturen einen wichtigen Bezugspunkt für die Beurteilung von Varianten bilden. Zugleich ergibt sich eine neue Perspektive auf das Verhältnis von Norm und Regel.
Trubetzkoy's recognition of a delimitative function of phonology, serving to signal boundaries between morphological units, is expressed in terms of alignment constraints in Optimality Theory, where the relevant constraints require specific morphological boundaries to coincide with phonological structure (Trubetzkoy 1936, 1939, McCarthy & Prince 1993). The approach pursued in the present article is to investigate the distribution of phonological boundary signals to gain insight into the criteria underlying morphological analysis. The evidence from English and Swedish suggests that necessary and sufficient conditions for word-internal morphological analysis concern the recognizability of head constituents, which include the rightmost members of compounds and head affixes. The claim is that the stability of word-internal boundary effects in historical perspective cannot in general be sufficiently explained in terms of memorization and imitation of phonological word form. Rather, these effects indicate a morphological parsing mechanism based on the recognition of word-internal head constituents. Head affixes can be shown to contrast systematically with modifying affixes with respect to syntactic function, semantic content, and prosodic properties. That is, head affixes, which cannot be omitted, often lack inherent meaning and have relatively unmarked boundaries, which can be obscured entirely under specific phonological conditions. By contrast, modifying affixes, which can be omitted, consistently have inherent meaning and have stronger boundaries, which resist prosodic fusion in all phonological contexts. While these correlations are hardly specific to English and Swedish it remains to be investigated to which extent they hold cross-linguistically. The observation that some of the constituents identified on the basis of prosodic evidence lack inherent meaning raises the issue of compositionality. I will argue that certain systematic aspects of word meaning cannot be captured with reference to the syntagmatic level, but require reference to the paradigmatic level instead. The assumption is then that there are two dimensions of morphological analysis: syntagmatic analysis, which centers on the criteria for decomposing words in terms of labelled constituents, and paradigmatic analysis, which centers on the criteria for establishing relations among (whole) words in the mental lexicon. While meaning is intrinsically connected with paradigmatic analysis (e.g. base relations, oppositeness) it is not essential to syntagmatic analysis.
The phonological word (henceforth pword) differs from lower units of the prosodic hierarchy (e.g. foot, syllable) in that its boundaries must align with morphological boundaries. While languages are claimed to differ w.r.t. the questions of whether and which word-internal constituents (e.g. stems, prefixes, suffixes, members of compounds) form a pword there is no consensus regarding the question of which diagnostics are relevant for determining pword structure. In this paper it is argued that systematic correlations between various suprasegmental properties (e.g. stress patterns, syllable structure) motivate the existence of word-internal pwords in German.
Head alignment in German compounds: Implications for prosodic constituency and morphological parsing
(2022)
The notion of head alignment was introduced to account for the observation that in a word with multiple feet, one is more prominent than the others. In particular, this notion is meant to capture the characteristic edge-orientation of main stress by requiring the (left or right) word boundary and the respective (left or right) boundary of the head foot to coincide (McCarthy & Prince 1993). In the present paper the notion of head alignment will be applied to compounds, which are also characterized by the property that one of their members, located in a margin position, is most prominent.
The adequacy of an analysis in terms of head alignment hinges on the question of whether observable prominence peaks associate with the boundaries of independently motivated constituents. It will be argued that such links exist for German compounds, indicating reference to at least three distinct compound categories established on morphological grounds: copulative, phrasal, and a default class of “regular” compounds. The evidence for the relevant distinctions sheds light on morphological parsing, indicating that compound categories can be – and often are – determined by properties pertaining to their complete form, rather than by conditions affecting their (original) construction.
Identity effects in phonology are deviations from regular phonological form (i.e. canonical patterns) which are due to the relatedness between words. More specifically, identity effects are those deviations which have the function to enhance similarity in the surface phonological form of morphologically related words. In rule-based generative phonology the effects in question are described by means of the cycle. For example, the stress on the second syllable in cond[ɛ]nsation as opposed to the stresslessness of the second syllable in comp[ǝ]nsation is described by applying the stress rules initially to the sterns thereby yielding condénse and cómpensàte. Subsequently the stress rules are reapplied to the affixed words with the initial stress assignment (i.e. stress on the second syllable in condense, but not in compensate) leaving its mark in the output form (cf. Chomsky and Halle 1968). A second example are words like lie[p]los 'unloving' in German, which shows the effects of neutralization in coda position (i.e. only voiceless obstruents may occur in coda position) even though the obstruent should 'regularly' be syllabified in head position (i.e. bl is a wellformed syllable head in German). Here the stern is syllabified on an initial cycle, obstruent devoicing applies (i.e. lie[p]) and this structure is left intact when affixation applies (i.e. lie[p ]Ios ) (cf. Hall 1992). As a result the stern of lie[p]los is identical to the base lie[p].
Handschrift ist ein alltägliches Phänomen – sie begegnet uns in der Schule, auf Einkaufszetteln oder auch als Unterschrift. Über die grammatischen und insbesondere die graphematischen Grundlagen der Handschrift wissen wir allerdings nur wenig. Dabei bieten Handschriften mehr Variationsmöglichkeiten als etwa Druckschriften und können deshalb mehr grammatische Strukturen sichtbar machen, als dies in gedruckten Texten der Fall ist.
Die vorliegende Untersuchung zeigt, dass strukturelle Eigenheiten einer Handschrift oft mit grammatischen Eigenheiten zusammenfallen, etwa durch die Markierung komplexer Grapheme, Silben-, Morphem- und Fußgrenzen oder auch durch die Auszeichnung bestimmter Buchstabenformen wie ‹e›, wenn es mit Schwa korrespondiert. Dazu werden Abituraufsätze untersucht, graphetisch und grammatisch annotiert und ausgewertet.
This paper describes work directed towards the development of a syllable prominence-based prosody generation functionality for a German unit selection speech synthesis system. A general concept for syllable prominence-based prosody generation in unit selection synthesis is proposed. As a first step towards its implementation, an automated syllable prominence annotation procedure based on acoustic analyses has been performed on the BOSS speech corpus. The prominence labeling has been evaluated against an existing annotation of lexical stress levels and manual prominence labeling on a subset of the corpus. We discuss methods and results and give an outlook on further implementation steps.
Smooth turn-taking in conversation depends in part on speakers being able to communicate their intention to hold or cede the floor. Both prosodic and gestural cues have been shown to be used in this context. We investigate the interplay of pitch movements and hand gestures at locations at which speaker change becomes relevant, comparing their use in German and Swedish. We find that there are some shared functions of prosody and gesture with regard to turn-taking in the two languages, but that these shared functions appear to be mediated by the different phonological demands on pitch in the two languages.