Refine
Year of publication
- 2003 (14) (remove)
Document Type
- Article (12)
- Conference Proceeding (2)
Has Fulltext
- yes (14)
Is part of the Bibliography
- no (14)
Keywords
- Deutsch (6)
- Computerlinguistik (3)
- Gesprochene Sprache (2)
- Korpus <Linguistik> (2)
- XML (2)
- Annotation (1)
- Automatische Sprachproduktion (1)
- Baumgrammatik (1)
- Bedrohte Sprache (1)
- Computerunterstützte Lexikographie (1)
Publicationstate
- Veröffentlichungsversion (8)
- Zweitveröffentlichung (3)
- Postprint (2)
Reviewstate
- Peer-Review (14) (remove)
Publisher
- Schmidt (3)
- Association for Computational Linguistics (2)
- De Gruyter Oldenbourg (1)
- Herder-Institut (1)
- Kluwer (1)
- Kossuth/Nodus (1)
- Metzler (1)
- Narr (1)
- Universität zu Köln (1)
The paper investigates the evolution of document grammars from a linguistic point of view. Document grammars have been developed in the past decades in order to formalize knowledge on the structure of textual information. A well-known instance of a document grammar is the »Document Type Definition« (DTD) as part of the Extensible Markup Language (XML). DTDs allow to define so-called tree grammars that constrain the application of tag-sets in the process of annotation of a document. In an XML-based document workflow, DTDs play a crucial role for validation and transforming huge amounts of texts in standardized data formats. An interesting point in the development of XML DTDs is the fact that the restriction of the formal expressiveness paved the way to understand the formal properties of document grammars better and to develop more a powerful version like XML Schema recently. In this sense, the simplicity of the original approach, resulting from the necessary restriction of previous approaches, yielded new complexity on formally understood grounds.
In order to determine priorities for the improvement of timing in synthetic speech this study looks at the role of segmental duration prediction and the role of phonological symbolic representation in the perceptual quality of a text-to-speech system. In perception experiments using German speech synthesis, two standard duration models (Klatt rules and CART) were tested. The input to these models consisted of a symbolic representation which was either derived from a database or a text-to-speech system. Results of the perception experiments show that different duration models can only be distinguished when the symbolic representation is appropriate. Considering the relative importance of the symbolic representation, post-lexical segmental rules were investigated with the outcome that listeners differ in their preferences regarding the degree of segmental reduction. As a conclusion, before fine-tuning the duration prediction, it is important to derive an appropriate phonological symbolic representation in order to improve timing in synthetic speech.
Wohlgeformte XML-Dokumente lassen sich als Bäume interpretieren und diese wiederum durch Grammatiken beschreiben. Dokumentgrammatiken weisen einige Besonderheiten auf, die sie von Grammatiken für natürliche Sprachen oder Programmiersprachen unterscheidet. Dieser Beitrag erläutert die Verarbeitungsmöglichkeiten, die aus der Nutzung von formalen Dokumentgrammatiken erwachsen.
Das hier vorgestellte Dissertationsvorhaben am Institut für Englische Philologie der Freien Universität Berlin möchte der Frage auf den Grund gehen, welche Veränderungen in der Sprachpolitik gegenüber bedrohten Sprachen durch die Einrichtung dezentraler Parlamente erreicht werden können. Untersucht wird die Sprachpolitik gegenüber der gälischen Sprache in Schottland sowie der samischen Sprache in Norwegen. Kern der Untersuchungen wird dabei die Frage sein, welche politischen Initiativen zur Sprachunterstützung es in den letzten Jahren gegeben hat. Insbesondere soll darauf eingegangen werden, dass es mit dem Schottischen Parlament sowie dem Sameting in Norwegen jetzt parlamentarische Vertretungen gibt, in denen die jeweilige Sprachgruppe wesentlich größeren Einfluss geltend machen kann als dies vormals der Fall war.
Vorbemerkung und Dank
(2003)
Die in der gesprochenen Umgangssprache und in Dialekten weit verbreitete nominale Possessorkonstruktion des Typs dem Vater sein Hut tanzt in morphologischer, syntaktischer und semantischer Hinsicht außer der Reihe. Dessen ungeachtet hält sie sich hartnäckig in den genannten Varietäten und erscheint somit als funktional angemessen.
Der Beitrag gibt einen Überblick über die Datenlage im Deutschen und stellt die Analysevorschläge im Hinblick auf Morphologie, syntaktische und semantische Struktur vor. Der Blick auf andere Sprachen und die Beschreibungsansätze in der allgemeinen Sprachtypologie erlauben eine neue Perspektive, die diese Konstruktion in den Kontext grundsätzlicher Alternativen für die Markierung syntaktischer Relationen („head-marking“ versus „dependent-marking“) einordnet. Auch dem viel diskutierten Thema der Entstehung der Konstruktion auf dem Wege von Reanalyse oder Grammatikalisierung sind unter dieser übergreifenden Perspektive neue Aspekte abzugewinnen. Abschließend wird der Frage nachgegangen, welche Eigenschaften diese Konstruktion trotz grammatischer Sonderwege und Sanktionierung durch die normative Grammatik für die Sprecher attraktiv machen.
Was sind die Grundeinheiten gesprochener Sprache? Ein altes Problem und ein neuer Lösungsvorschlag
(2003)
This article revives the question of what the fundamental units of spoken language are. In chapter 2 some answers of current and previous theory are listed. In chapter 3 I argue that turns are the basic units of conversation, although the question of the constituents of a single turn arises. In chapter 4 a turn is broken down into atomistic units: the functional units. A functional unit is the smallest constituent of interaction to which a recipient can ascribe function for the communicative process. Functional units are distinguished into three types: contigently independent, projective and associated. A tentative account of different subtypes is suggested.
Mit diesem Papier sollen LexikografInnen an ein Automatisierungstool der Textanalyse innerhalb der Korpuslinguistik herangeführt werden. Das am IDS entwickelte statistische Recherche- und Analysewerkzeug Cosmas bietet neue Zugänge zur Gewinnung semantischer Informationen über Wörter. Die Nutzungsmöglichkeiten dieses Instrumentariums für die Lesartendisambiguierung von Lexemen und deren Verifizierung mittels Kollokations- und Kontextanalyse werden erläutert, und anhand des Beispiels cool wird gezeigt, inwieweit sich semantische Informationen durch automatische Statistik extrahieren lassen. Dabei wird auf die Vor- und Nachteile der computerbasierten Analyse eingegangen. Darüber hinaus wird dargestellt, wie empirische lexikografische Disambiguierung modellgeleitet validiert werden kann. Um die Unterschiede zwischen herkömmlichen Beschreibungsmöglichkeiten und neuen statistischen Verfahren zu verdeutlichen, werden die Lesarten zu cool, wie sie im Duden GWDS (2000) dargestellt sind, mit den identifizierten Lesarten der Analyse mit Cosmas verglichen.