Nachhaltige Dokumentation virtueller Forschungsumgebungen
- In den letzten Jahren werden immer mehr virtuelle Forschungsumgebungen für die maschinelle Sprachverarbeitung zur Verfügung gestellt. Diese sollten zum einen nachhaltig und zum anderen für potenzielle Nutzer vergleichbar dokumentiert werden. In diesem Beitrag werden daher Bedingungen für die Nachhaltigkeit insbesondere von NLP- (Natural Language Processing) Werk-zeugen beschrieben: Die Dokumentation sollte nicht nur die Software, son-dern auch ihre Evaluierung anhand einer – ebenfalls gut dokumentierten – Testsuite umfassen. Im Beitrag werden auch Möglichkeiten dargestellt, den Dokumentationsvorgang selbst anhand von DocBook XML zu automatisieren.
- hroughout the last years, an increasing number of virtual research environ-ments have been offered in the field of Natural Language Processing (NLP). These should be documented in a sustainable way that also guarantees com-parability for potential users. This paper thus describes constraints for the sustainability of NLP-environments: the documentation must describe not only the software from the developer’s view, but also its evaluation accor-ding to a testsuite, which is itself to be documented comprehensively. The paper also describes the possibility of automating the documentation proc-esses by utilizing DocBook XML.
Author: | Gertrud FaaßORCiD, Ulrich HeidORCiDGND |
---|---|
URN: | urn:nbn:de:bsz:mh39-120106 |
DOI: | https://doi.org/10.5281/zenodo.4134528 |
Parent Title (German): | Information und Wissen: global, sozial und frei? Proceedings des 12. Internationalen Symposiums für Informationswissenschaft (ISI 2011) |
Publisher: | Werner Hülsbusch |
Place of publication: | Glückstadt |
Editor: | Joachim Griesbaum, Thomas Mandl, Christa Womser-Hacker |
Document Type: | Conference Proceeding |
Language: | German |
Year of first Publication: | 2011 |
Date of Publication (online): | 2023/07/13 |
Publishing Institution: | Leibniz-Institut für Deutsche Sprache (IDS) |
Publicationstate: | Veröffentlichungsversion |
Reviewstate: | Peer-Review |
GND Keyword: | Dokumentation; Forschung; Nachhaltigkeit; Natürliche Sprache; Sprachverarbeitung; Web Services |
First Page: | 85 |
Last Page: | 95 |
DDC classes: | 400 Sprache / 400 Sprache, Linguistik |
Open Access?: | ja |
Linguistics-Classification: | Computerlinguistik |
Licence (English): | Creative Commons - Attribution 4.0 International |