TY - JOUR U1 - Wissenschaftlicher Artikel A1 - Trippel, Thorsten A1 - Declerck, Thierry A1 - Heid, Ulrich T1 - Sprachressourcen in der Standardisierung JF - Journal for Language Technology and Computational Linguistics N2 - Wir berichten über internationale Normungsarbeit im Bereich von Sprachressourcen. Die Normen werden von internationalen Arbeitsgruppen im Rahmen der International Organization for Standardization(ISO) entwickelt und jeweils national von entsprechenden Gruppen, in Deutschland koordiniert vom Deutschen Institut für Normung (DIN), begleitet und diskutiert. Für die automatische Sprachverarbeitung besteht seit Jahren zunehmend Bedarf an elektronischen Ressourcen: Lexika, Korpora, Grammatiken, Annotationskonventionen, Sprachdatensammlungen, usw. Damit solche Ressourcen über einen einzelnen Anwendungskontext hinaus wiederverwertbar sind und zwischen Arbeitsgruppen ausgetauscht werden können, wird an einer Normung ihrer Repräsentationsformate und der zur Beschreibung von Ressourceninhalten benutzbaren Vokabularien gearbeitet (Datenkategorien). Waren in der Vergangenheit Standardisierungsbemühungen auf bestimmte Ausschnitte aus dem Spektrum der linguistischen Beschreibungen von Ressourcen beschränkt(z.B. die EU-Projekte SAM im Bereich gesprochener Sprache, EAGLES und ISLE im Bereich von Morphosyntax, Syntax, lexikalischer Semantik in Texten und Lexika und Sprachtechnologie), so ist die Zielsetzung der 2002 und 2003 gegründeten ISO (TC37SC4) bzw. DIN (NAT AA6) Arbeitsgruppenbreiter: es geht um Metarichtlinien für die Repräsentation und Annotation von Texten ebenso wie um Datenkategorien für Lexika, morphologische und morphosyntaktische Analyse, usw. Wir beschreiben den aktuellen Stand der Normungsdiskussion. KW - Standardisierung KW - Sprachverarbeitung KW - Annotation KW - Daten KW - Online-Ressource Y1 - 2005 UN - https://nbn-resolving.org/urn:nbn:de:bsz:mh39-126662 SN - 2190-6858 SS - 2190-6858 U6 - https://doi.org/10.21248/jlcl.20.2005.73 DO - https://doi.org/10.21248/jlcl.20.2005.73 VL - 20 IS - 2 SP - 17 EP - 29 PB - Gesellschaft für Sprachtechnologie und Computerlinguistik CY - Hildesheim ER -