430 Deutsch
Refine
Document Type
- Part of a Book (5)
- Article (4)
- Conference Proceeding (2)
- Doctoral Thesis (1)
- Working Paper (1)
Is part of the Bibliography
- no (13)
Keywords
- XML (13) (remove)
Publicationstate
- Zweitveröffentlichung (7)
- Veröffentlichungsversion (3)
- Postprint (2)
Reviewstate
Publisher
- VS Verlag für Sozialwissenschaften (2)
- Aarhus University, School of Business and Social Sciences (1)
- Bielefeld University (1)
- De Gruyter Oldenbourg (1)
- Ediçoes Colibri (1)
- Institut für Kommunikationsforschung und Phonetik (1)
- Libri Books on Demand (1)
- Metzler (1)
- Stauffenburg Verlag (1)
- Universitätsverlag Rhein-Ruhr OHG (1)
FnhdC/HTML und FnhdC/S
(2007)
Wohlgeformte XML-Dokumente lassen sich als Bäume interpretieren und diese wiederum durch Grammatiken beschreiben. Dokumentgrammatiken weisen einige Besonderheiten auf, die sie von Grammatiken für natürliche Sprachen oder Programmiersprachen unterscheidet. Dieser Beitrag erläutert die Verarbeitungsmöglichkeiten, die aus der Nutzung von formalen Dokumentgrammatiken erwachsen.
The paper investigates the evolution of document grammars from a linguistic point of view. Document grammars have been developed in the past decades in order to formalize knowledge on the structure of textual information. A well-known instance of a document grammar is the »Document Type Definition« (DTD) as part of the Extensible Markup Language (XML). DTDs allow to define so-called tree grammars that constrain the application of tag-sets in the process of annotation of a document. In an XML-based document workflow, DTDs play a crucial role for validation and transforming huge amounts of texts in standardized data formats. An interesting point in the development of XML DTDs is the fact that the restriction of the formal expressiveness paved the way to understand the formal properties of document grammars better and to develop more a powerful version like XML Schema recently. In this sense, the simplicity of the original approach, resulting from the necessary restriction of previous approaches, yielded new complexity on formally understood grounds.
This paper presents the application of the <tiger2/> format to various linguistic scenarios with the aim of making it the standard serialisation for the ISO 24615 [1] (SynAF) standard. After outlining the main characteristics of both the SynAF metamodel and the <tiger2/> format, as extended from the initial Tiger XML format [2], we show through a range of different language families how <tiger2/> covers a variety of constituency and dependency based analyses.
Im Folgenden wird eine texttechnologische Komponente zur Expansion eines XML- annotierten Stammformenlexikons, das auf Einträgen eines Standardwörterbuchs basiert, vorgestellt. Diese Expansion wurde in der Document Style Semantics and Specification Language implementiert. Ihr Ergebnis ist ein Vollformenlexikon, das ebenfalls in XML repräsentiert ist.