400 Sprache, Linguistik
Refine
Document Type
- Part of a Book (4)
- Article (1)
- Conference Proceeding (1)
Has Fulltext
- yes (6)
Keywords
- Kategorisierung (6) (remove)
Publicationstate
- Veröffentlichungsversion (4)
- Postprint (1)
- Zweitveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (4)
- Peer-Review (2)
Publisher
- De Gruyter (1)
- Kunstakademie Vilnius (1)
- La Rochelle University (1)
- Narr (1)
- Winter (1)
- de Gruyter (1)
We present a simple tool for extracting text and markup information from printouts of (not only) scientific documents. While the heavy-lifting OCR is done by off-the-shelf tesseract, our focus is on detection, extraction, and basic categorization of color-highlighted text sections, as well as on providing a framework for downstream processing of extraction results. The tool can be useful for document analysis tasks that must, or benefit from being able to, use printed paper.
konzeptuelle Basisebene
(2018)
In der akademischen Diskussion zum Global English hat sich seit den 1980er Jahren ein Modell etabliert, das die Staaten, in denen Englisch gesprochen wird, idealtypisch in drei Kreise einteilt: Den Inneren Kreis, in dem Englisch wichtigste Sprache der Gesellschaft sowie L1 eines Großteils der Bevölkerung ist, den Äußeren Kreis, wo Englisch L2 und eine wichtige Sprache unter mehreren ist, sowie den Erweiterten oder Expandierenden Kreis, in dem Englisch als Fremdsprache und als Lingua Franca dominiert (Kachru, 1985). Dieser Beitrag zeigt anhand einer Bestandsaufnahme gesellschaftlicher Funktionen des Deutschen weltweit, dass dieses Modell auch auf das Deutsche übertragen werden kann. Allerdings unterscheidet sich das Deutsche in einigen erheblichen Aspekten vom Englischen: Zum Inneren Kreis gehören die Länder des deutschsprachigen Kerngebietes, zum Äußeren Kreis Länder, in denen Deutsch anerkannte Minderheitensprache ist, und zum Erweiterten (oder im Falle des Deutschen eher Bröckelnden) Kreis Länder, in denen es einzelne deutsche Sprachinseln oder eine deutschsprachige Diaspora gibt, wobei letztere auch erst in jüngster Zeit entstanden sein kann. Schließlich diskutiert der Aufsatz die Position des Baltikums in diesem Modell.
Dieser Beitrag gibt einen Überblick über die methodischen Ausgangspunkte des Projekts MIT. Qualität und stellt einige zentrale Erkenntnisse zur Modellbildung, der korpuslinguistischen Analyse und Akzeptabilitätserhebungen in der Sprachgemeinschaft vor. Wir zeigen dabei, wie bestehende Textqualitätsmodelle anhand einer Analyse einschlägiger Ratgeberliteratur erweitert werden können. Es wurden zwei empirische Fallstudien durchgeführt, die beide auf die Herstellung von textueller Kohärenz mittels des Kausalkonnektors weil fokussieren. Wir stellen zunächst eine korpuskontrastive Analyse vor. Weiterhin zeigen wir, wie man anhand verschiedener Aufgabenstellungen diverse Aspekte von Akzeptabilität in der Sprachgemeinschaft abprüfen kann.
Der Beitrag stellt zunächst einige allgemeine Überlegungen zu Kategorisierungen von Sprachen an. Dann werden die Sprachenvielfalt im Baltikum und Statistiken von Deutschsprechern vorgestellt, bevor verschiedene Studien zum Deutschen im Baltikum erläutert werden. Auf dieser Grundlage erfolgt eine Einordnung des Baltikums in Modelle der internationalen Stellung des Deutschen, mit deren Hilfe das Konzept Ergänzungssprache begründet wird. Schließlich werden einige Überlegungen dazu angestellt, welcher Nutzwert durch diese Konzeptualisierung entsteht.