Lecture Notes in Informatics
Refine
Document Type
- Part of a Book (1)
- Conference Proceeding (1)
Has Fulltext
- yes (2)
Is part of the Bibliography
- no (2)
Keywords
- Automatische Sprachanalyse (1)
- Fachsprache (1)
- Hyperlink (1)
- Korpus <Linguistik> (1)
- Korpusanalyseplattform (KorAP) (1)
- Terminologie (1)
- Wissenserwerb (1)
- XML (1)
Publicationstate
- Postprint (1)
- Veröffentlichungsversion (1)
Reviewstate
- (Verlags)-Lektorat (1)
- Peer-Review (1)
220
Linguistic query systems are special purpose IR applications. We present a novel state-of-the-art approach for the efficient exploitation of very large linguistic corpora, combining the advantages of relational database management systems (RDBMS) with the functional MapReduce programming model. Our implementation uses the German DEREKO reference corpus with multi-layer
linguistic annotations and several types of text-specific metadata, but the proposed strategy is language-independent and adaptable to large-scale multilingual corpora.
P-14
Der Kurzbeitrag berichtet über ein Projekt ”Hypertextualisierung auf textgrammatischer Grundlage“ (HyTex), in dem erforscht wird, wie sich linear organisierte Dokumente mit semiautomatischen Methoden auf der Grundlage von textgrammatischem Markup und der linguistisch motivierten Modellierung terminologischen Wissens in delinearisierte Hyperdokumente überführen lassen. Ziel ist es, eine Sammlung von Fachtexten so in einen Hypertext zu überführen, dass terminologiebedingte Verständnisschwierigkeiten beim Lesen durch entsprechende Linkangebote aufgelöst werden, so dass die Fachtexte auch von Semi-Experten der Domäne selektiv gelesen werden können. Der Schwerpunkt des Beitrags liegt auf der Modellierung terminologischen Wissens mit XML Topic Maps und dessen Stellenwert für die automatische Erzeugung von Hyperlinks.