Möglichkeiten der maschinellen Unterstützung bei der Arbeit mit Interaktionskorpora
- ln diesem Beitrag sollen anhand von Materialien aus Gesprächskorpora des IDS Schwierigkeiten und Möglichkeiten der maschinellen Recherche vorgeführt werden. Grundlage dafür sind Gesprächstranskripte, die in digitaler Form vorliegen und in einem System mit Rechercheprozeduren zugreifbar sind. Mit diesem Ziel wird auf Rechercheverfahren zurückgegriffen, die in den 1990er Jahren in einem Projekt SHRGF.S im IDS als Anwendung der COSMAS-Technologie auf Gesprächskorpora entwickelt wurden. Die hier gegebenen Recherchemöglichkeiten werden an einem Auswahlkorpus von Gesprächstranskripten mit einem Gesamtumfang von 87.629 laufenden Wörtern versuchsweise angewendet und in ihren Beschränkungen und ihrer Fruchtbarkeit für explorative Untersuchungen betrachtet. Damit soll ein Beitrag zur Klärung der Frage geleistet werden, welche Recherchemöglichkeiten aus einer gesprächsanalytischen Perspektive vorstellbar und erwünscht sind und insofern bei der weiteren korpustechnologischen Entwicklung berücksichtigt werden sollten.
Author: | Werner Kallmeyer |
---|---|
URN: | urn:nbn:de:bsz:mh39-56120 |
DOI: | https://doi.org/10.1515/9783110439083-012 |
ISBN: | 978-3-11-019273-5 |
Parent Title (German): | Sprachkorpora – Datenmengen und Erkenntnisfortschritt |
Series (Serial Number): | Jahrbuch / Institut für Deutsche Sprache (2006) |
Publisher: | de Gruyter |
Place of publication: | Berlin, New York |
Editor: | Werner Kallmeyer, Gisela Zifonun |
Document Type: | Part of a Book |
Language: | German |
Year of first Publication: | 2007 |
Date of Publication (online): | 2016/11/23 |
Publicationstate: | Veröffentlichungsversion |
Reviewstate: | (Verlags)-Lektorat |
GND Keyword: | Gesprochene Sprache; Information Retrieval; Korpus <Linguistik> |
First Page: | 203 |
Last Page: | 234 |
DDC classes: | 400 Sprache / 400 Sprache, Linguistik |
Open Access?: | ja |
Leibniz-Classification: | Sprache, Linguistik |
Linguistics-Classification: | Korpuslinguistik |
Licence (German): | Creative Commons - Namensnennung-Nicht kommerziell-Keine Bearbeitung 3.0 Deutschland |