Volltext-Downloads (blau) und Frontdoor-Views (grau)

Sprachressourcen in der Standardisierung

  • Wir berichten über internationale Normungsarbeit im Bereich von Sprachressourcen. Die Normen werden von internationalen Arbeitsgruppen im Rahmen der International Organization for Standardization(ISO) entwickelt und jeweils national von entsprechenden Gruppen, in Deutschland koordiniert vom Deutschen Institut für Normung (DIN), begleitet und diskutiert. Für die automatische Sprachverarbeitung besteht seit Jahren zunehmend Bedarf an elektronischen Ressourcen: Lexika, Korpora, Grammatiken, Annotationskonventionen, Sprachdatensammlungen, usw. Damit solche Ressourcen über einen einzelnen Anwendungskontext hinaus wiederverwertbar sind und zwischen Arbeitsgruppen ausgetauscht werden können, wird an einer Normung ihrer Repräsentationsformate und der zur Beschreibung von Ressourceninhalten benutzbaren Vokabularien gearbeitet (Datenkategorien). Waren in der Vergangenheit Standardisierungsbemühungen auf bestimmte Ausschnitte aus dem Spektrum der linguistischen Beschreibungen von Ressourcen beschränkt(z.B. die EU-Projekte SAM im Bereich gesprochener Sprache, EAGLES und ISLE im Bereich von Morphosyntax, Syntax, lexikalischer Semantik in Texten und Lexika und Sprachtechnologie), so ist die Zielsetzung der 2002 und 2003 gegründeten ISO (TC37SC4) bzw. DIN (NAT AA6) Arbeitsgruppenbreiter: es geht um Metarichtlinien für die Repräsentation und Annotation von Texten ebenso wie um Datenkategorien für Lexika, morphologische und morphosyntaktische Analyse, usw. Wir beschreiben den aktuellen Stand der Normungsdiskussion.

Export metadata

Additional Services

Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Thorsten TrippelORCiD, Thierry DeclerckORCiD, Ulrich HeidORCiD
URN:urn:nbn:de:bsz:mh39-126662
DOI:https://doi.org/10.21248/jlcl.20.2005.73
ISSN:2190-6858
Parent Title (German):Journal for Language Technology and Computational Linguistics
Publisher:Gesellschaft für Sprachtechnologie und Computerlinguistik
Place of publication:Hildesheim
Document Type:Article
Language:German
Year of first Publication:2005
Date of Publication (online):2024/05/06
Publishing Institution:Leibniz-Institut für Deutsche Sprache (IDS)
Publicationstate:Veröffentlichungsversion
Reviewstate:Peer-Review
GND Keyword:Annotation; Daten; Online-Ressource; Sprachverarbeitung; Standardisierung
Volume:20
Issue:2
First Page:17
Last Page:29
DDC classes:400 Sprache / 400 Sprache, Linguistik
Open Access?:ja
Linguistics-Classification:Computerlinguistik
Licence (English):License LogoCreative Commons - Attribution 4.0 International