Refine
Document Type
- Part of a Book (2)
- Article (1)
- Conference Proceeding (1)
Has Fulltext
- yes (4)
Keywords
- Kategorisierung (4) (remove)
Publicationstate
- Veröffentlichungsversion (4) (remove)
Reviewstate
- (Verlags)-Lektorat (2)
- Peer-Review (2)
Publisher
- De Gruyter (1)
- La Rochelle University (1)
- Narr (1)
- Winter (1)
We present a simple tool for extracting text and markup information from printouts of (not only) scientific documents. While the heavy-lifting OCR is done by off-the-shelf tesseract, our focus is on detection, extraction, and basic categorization of color-highlighted text sections, as well as on providing a framework for downstream processing of extraction results. The tool can be useful for document analysis tasks that must, or benefit from being able to, use printed paper.
Dieser Beitrag gibt einen Überblick über die methodischen Ausgangspunkte des Projekts MIT. Qualität und stellt einige zentrale Erkenntnisse zur Modellbildung, der korpuslinguistischen Analyse und Akzeptabilitätserhebungen in der Sprachgemeinschaft vor. Wir zeigen dabei, wie bestehende Textqualitätsmodelle anhand einer Analyse einschlägiger Ratgeberliteratur erweitert werden können. Es wurden zwei empirische Fallstudien durchgeführt, die beide auf die Herstellung von textueller Kohärenz mittels des Kausalkonnektors weil fokussieren. Wir stellen zunächst eine korpuskontrastive Analyse vor. Weiterhin zeigen wir, wie man anhand verschiedener Aufgabenstellungen diverse Aspekte von Akzeptabilität in der Sprachgemeinschaft abprüfen kann.
Der Beitrag stellt zunächst einige allgemeine Überlegungen zu Kategorisierungen von Sprachen an. Dann werden die Sprachenvielfalt im Baltikum und Statistiken von Deutschsprechern vorgestellt, bevor verschiedene Studien zum Deutschen im Baltikum erläutert werden. Auf dieser Grundlage erfolgt eine Einordnung des Baltikums in Modelle der internationalen Stellung des Deutschen, mit deren Hilfe das Konzept Ergänzungssprache begründet wird. Schließlich werden einige Überlegungen dazu angestellt, welcher Nutzwert durch diese Konzeptualisierung entsteht.