Textlinguistik / Schriftsprache
Refine
Year of publication
Document Type
- Article (31)
- Conference Proceeding (8)
- Part of Periodical (1)
- Review (1)
Has Fulltext
- yes (41)
Keywords
- Deutsch (14)
- Qualität (5)
- Textproduktion (5)
- Computerlinguistik (4)
- Schriftsprache (4)
- Textkohärenz (4)
- Computerunterstützte Kommunikation (3)
- Erzählforschung (3)
- Handlungsstruktur <Literatur> (3)
- Handschrift (3)
Publicationstate
- Veröffentlichungsversion (23)
- Zweitveröffentlichung (15)
- Postprint (4)
- Preprint (1)
Reviewstate
- Peer-Review (41) (remove)
Publisher
- Erich Schmidt (10)
- Bibliographisches Institut (4)
- Zenodo (3)
- Dagstuhl (2)
- Helmut Buske (2)
- Institut für Deutsche Sprache (2)
- Benjamins (1)
- Buske (1)
- Dipartimento di Linguistica, Università di Pisa (1)
- Friedrich (1)
Quotation marks are substantially used for direct speech and citations. For the ‘modalizing’ use, the Official Rules state that a “different understanding than usual” is indicated; they give very little information on the use of quotation marks beyond literal reference. It therefore seems all the more interesting to investigate the usage of modalizing quotation marks. In the present analysis, we studied the school-leaving examinations of an entire year. School-leaving examinations are texts by persons whose institutional acquisition of written language can be regarded as complete; they are texts written by skilled writers. The investigation takes into account both formal and functional observations. We recognized differences between school subjects that can be interpreted with regard to the concept of educational language. The writers described here showed a high sensitivity (conscious or unconscious) to the use of quotation marks, which we call the “struggle for educational language”. This may be related to the corpus investigated here. However, our study constitutes a solid basis for further corpus studies on quotation marks.
We present a simple tool for extracting text and markup information from printouts of (not only) scientific documents. While the heavy-lifting OCR is done by off-the-shelf tesseract, our focus is on detection, extraction, and basic categorization of color-highlighted text sections, as well as on providing a framework for downstream processing of extraction results. The tool can be useful for document analysis tasks that must, or benefit from being able to, use printed paper.
Orthographie ist ein Thema, das spätestens seit der Rechtschreibreform 1996 nicht nur die wissenschaftliche Forschung, sondern auch den öffentlichen Diskurs entscheidend geprägt hat. Aus Anlass von „20 Jahren Rat für deutsche Rechtschreibung“ war dieses Thema auch Gegenstand der 59. Jahrestagung des Leibniz-Instituts für Deutsche Sprache.
The workshop presents ATHEN 1 (Annotation and Text Highlighting Environment), an extensible desktop-based annotation environment which supports more than just regular annotation. Besides being a general purpose annotation environment, ATHEN supports indexing and querying support of your data as well as the ability to automatically preprocess your data with Meta information. It is especially suited for those who want to extend existing general purpose annotation tools by implementing their own custom features, which cannot be fulfilled by other available annotation environments. On the according gitlab, we provide online tutorials, which demonstrate the use of specific features of ATHEN
The question of whether a letter is a grapheme or not is a perennial issue in writing research. The answer depends on which criteria are used to differentiate between letters and graphemes and, ultimately,how the unit ‘grapheme’ is defined. This problem is particularly relevant to complex graphemes, i.e. sequences of letters that behave like a single grapheme in certain respects. Typical for German is the ‹ch›. This paper argues for a scalar concept of graphemes, which compares the grapheme status of each of the units under investigation. For this purpose, new criteria for the identification of complex graphemes are used, which originate from handwriting analysis. There, it is shown that complex graphemes are connected with each other disproportionately often and also have deviating letter forms disproportionately often.
In contrast to printed letters, handwritten texts show a larger amount of variation regarding letter shape and letter contact. This variation though might not be totally random but could follow a certain grammatical or structural function. By analysing a corpus of 10.117 graphs written by four writers, this paper explores which structures and which functions correlate. More precisely, it will be shown that the shape of certain letters might indicate syllabic, morphologic od prosodic structures. In addition, it will be shown that handwritten texts present the words’ structure better than printed texts could do. Overall, this paper points out how handwritten scripts show the graphematic principles known from printing even better than printed texts do.
Dieser Beitrag stellt einen Versuch dar, ein graphematisches Prinzip auf Handschriften anzuwenden und argumentiert, dass die Betrachtung von Handschriften unterstützende Evidenzen für graphematische Theorien liefern kann. Exemplarisch wird dazu die graphematische Längenhierarchie ausgewählt. Die Längenhierarchie ist ein gut beschriebenes Phänomen in der deutschen Schriftsprache. Bislang wurde sie jedoch nur für Druckschriften aufgestellt. Der vorliegende Artikel untersucht die Möglichkeit, eine Längenhierarchie für Handschriften aufzustellen und stützt sich dabei besonders auf die Schulausgangsschriften. Insbesondere werden Unterschriften betrachtet, die als eine Extremform der Handschriftlichkeit interpretiert werden. Ich gehe davon aus, dass nichts so häufig handgeschrieben wird wie die eigene Unterschrift und dass deshalb dort Prinzipien eines „ökonomischen Schreibens“ am deutlichsten auftreten werden, d.h. dass die Schreibungen, die besonders wichtig für das Lesen sind auch besonders deutlich geschrieben werden und die rezeptiv vernachlässigbaren Strukturen weniger deutlich. Hierzu wird die Alltagsbeobachtung analysiert, dass in Unterschriften oft die langen Buchstaben besonders deutlich und die kompakten Buchstaben eher undeutlich produziert werden, sie werden nivelliert. Es zeigt sich, dass die Häufigkeiten der Nivellierungen jedes Buchstabens auf eine skalare Verteilung der Buchstaben hindeuten. Damit wird die Idee einer Längenhierarchie und einer graphematischen Silbe als Leseerleichterung gestützt.
Die vorgestellte Studie untersucht die Anteile unterschiedlicher Redewiedergabeformen im Vergleich zwischen zwei Literaturtypen von gegensätzlichen Enden des Spektrums: Hochliteratur – definiert als Werke, die auf der Auswahlliste von Literaturpreisen standen – und Heftromanen, massenproduzierten Erzählwerken, die zumeist über den Zeitschriftenhandel vertrieben werden und früher abwertend als „Romane der Unterschicht” (Nusser 1981) bezeichnet wurden. Unsere These ist, dass sich diese Literaturtypen hinsichtlich ihrer Erzählweise unterscheiden, und sich dies in den verwendeten Wiedergabeformen niederschlägt. Der Fokus der Untersuchung liegt auf der Dichotomie zwischen direkter und nicht-direkter Wiedergabe, die schon in der klassischen Rhetorik aufgemacht wurde.
There are strict formal requirements for the use of a comma. However, there are none regarding the comma’s actual shape. In printed fonts, it is determined by the font’s specification. In hand-written texts though, the shape of the comma is variable; most writers choose from a set of straight, convex and concave shapes. By using a corpus of 1464 commas written by 99 individuals, we will present three case studies of persons whose comma shapes do somehow correlate with linguistic structures. With that, we might identify a few (possibly subconscious) shaping strategies. Some writers might mark a norm insecurity by a different comma form, others might mark the function of the entity which is segmented by the comma, or the comma type itself (sentence boundary, exposition or coordination).