400 Sprache
Refine
Document Type
- Conference Proceeding (5) (remove)
Language
- German (5) (remove)
Has Fulltext
- yes (5)
Keywords
- Forschungsdaten (3)
- Korpus <Linguistik> (3)
- Digital Humanities (2)
- Infrastruktur (2)
- Text (2)
- Archiv (1)
- Archivierung (1)
- DHd2023 (1)
- Datenbank (1)
- Datendomäne Sammlungen (1)
Publicationstate
Reviewstate
- (Verlags)-Lektorat (2)
- Peer-Review (2)
Publisher
- Zenodo (2)
- Acta Press (1)
- Leibniz-Institut für Deutsche Sprache (IDS) (1)
- tcworld (1)
Als Teil der NFDI vernetzt Text+ ortsverteilt verschiedenste Daten und Dienste für die geisteswissenschaftliche Forschung und stellt sie der wissenschaftlichen Gemeinschaft FAIR zur Verfügung. In diesem Beitrag beschreiben wir die Umsetzung beispielhaft im Bereich der Text+ Datendomäne Sammlungen anhand von Korpora, die in verschiedenen Disziplinen Verwendung finden. Die Infrastruktur ist auf Erweiterbarkeit ausgelegt, so dass auch weitere Ressourcen über Text+ verfügbar gemacht werden können. Enthalten ist auch ein Ausblick auf weitere zu erwartende Entwicklungen. Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.
This paper describes a new approach to improve the analysis and categorization of web documents using statistical methods for template based clustering as well as semantical analysis based on terminological ontologies. A domain-specific environment serves for prove of concept. In order to demonstrate the widespread practical benefit of our approach, we outline a combined mathematical and semantical framework for information retrieval on internet resources.