Sprachressourcen in der Standardisierung
- Wir berichten über internationale Normungsarbeit im Bereich von Sprachressourcen. Die Normen werden von internationalen Arbeitsgruppen im Rahmen der International Organization for Standardization(ISO) entwickelt und jeweils national von entsprechenden Gruppen, in Deutschland koordiniert vom Deutschen Institut für Normung (DIN), begleitet und diskutiert. Für die automatische Sprachverarbeitung besteht seit Jahren zunehmend Bedarf an elektronischen Ressourcen: Lexika, Korpora, Grammatiken, Annotationskonventionen, Sprachdatensammlungen, usw. Damit solche Ressourcen über einen einzelnen Anwendungskontext hinaus wiederverwertbar sind und zwischen Arbeitsgruppen ausgetauscht werden können, wird an einer Normung ihrer Repräsentationsformate und der zur Beschreibung von Ressourceninhalten benutzbaren Vokabularien gearbeitet (Datenkategorien). Waren in der Vergangenheit Standardisierungsbemühungen auf bestimmte Ausschnitte aus dem Spektrum der linguistischen Beschreibungen von Ressourcen beschränkt(z.B. die EU-Projekte SAM im Bereich gesprochener Sprache, EAGLES und ISLE im Bereich von Morphosyntax, Syntax, lexikalischer Semantik in Texten und Lexika und Sprachtechnologie), so ist die Zielsetzung der 2002 und 2003 gegründeten ISO (TC37SC4) bzw. DIN (NAT AA6) Arbeitsgruppenbreiter: es geht um Metarichtlinien für die Repräsentation und Annotation von Texten ebenso wie um Datenkategorien für Lexika, morphologische und morphosyntaktische Analyse, usw. Wir beschreiben den aktuellen Stand der Normungsdiskussion.
Author: | Thorsten TrippelORCiD, Thierry DeclerckORCiD, Ulrich HeidORCiD |
---|---|
URN: | urn:nbn:de:bsz:mh39-126662 |
DOI: | https://doi.org/10.21248/jlcl.20.2005.73 |
ISSN: | 2190-6858 |
Parent Title (German): | Journal for Language Technology and Computational Linguistics |
Publisher: | Gesellschaft für Sprachtechnologie und Computerlinguistik |
Place of publication: | Hildesheim |
Document Type: | Article |
Language: | German |
Year of first Publication: | 2005 |
Date of Publication (online): | 2024/05/06 |
Publishing Institution: | Leibniz-Institut für Deutsche Sprache (IDS) |
Publicationstate: | Veröffentlichungsversion |
Reviewstate: | Peer-Review |
GND Keyword: | Annotation; Daten; Online-Ressource; Sprachverarbeitung; Standardisierung |
Volume: | 20 |
Issue: | 2 |
First Page: | 17 |
Last Page: | 29 |
DDC classes: | 400 Sprache / 400 Sprache, Linguistik |
Open Access?: | ja |
Linguistics-Classification: | Computerlinguistik |
Licence (English): | Creative Commons - Attribution 4.0 International |