Refine
Document Type
- Part of a Book (3)
- Article (1)
- Doctoral Thesis (1)
Keywords
- Informationsstruktur (5) (remove)
Publicationstate
- Veröffentlichungsversion (5) (remove)
Reviewstate
Publisher
- de Gruyter (3)
- Bielefeld University (1)
In diesem Aufsatz geht es um die informationsstrukturellen Kategorien Fokus und kontrastives Topik, die durch charakteristische Intonationsmuster signalisiert werden. Diese werden in Anlehnung an die aktuelle formale semantische/pragmatische Forschung charakterisiert und anhand deutscher Beispiele veranschaulicht. Es wird für eine Theorie plädiert, in der Fokus und kontrastives Topik auf den Diskurskontext Bezug nehmen, in der ihre Funktion also wesentlich die Stiftung von Textkohärenz ist. Gleichzeitig wird gezeigt, wie diese Grundbedeutung trotzdem zur Vermittlung von neuer Information benutzt werden kann. Abschließend kommt kurz zur Sprache, wie sich Fokus und kontrastives Topik in geschriebenen Texten bemerkbar machen.
Languages employ different strategies to transmit structural and grammatical information. While, for example, grammatical dependency relationships in sentences are mainly conveyed by the ordering of the words for languages like Mandarin Chinese, or Vietnamese, the word ordering is much less restricted for languages such as Inupiatun or Quechua, as these languages (also) use the internal structure of words (e.g. inflectional morphology) to mark grammatical relationships in a sentence. Based on a quantitative analysis of more than 1,500 unique translations of different books of the Bible in almost 1,200 different languages that are spoken as a native language by approximately 6 billion people (more than 80% of the world population), we present large-scale evidence for a statistical trade-off between the amount of information conveyed by the ordering of words and the amount of information conveyed by internal word structure: languages that rely more strongly on word order information tend to rely less on word structure information and vice versa. Or put differently, if less information is carried within the word, more information has to be spread among words in order to communicate successfully. In addition, we find that–despite differences in the way information is expressed–there is also evidence for a trade-off between different books of the biblical canon that recurs with little variation across languages: the more informative the word order of the book, the less informative its word structure and vice versa. We argue that this might suggest that, on the one hand, languages encode information in very different (but efficient) ways. On the other hand, content-related and stylistic features are statistically encoded in very similar ways.
In der linguistischen Forschung wird häufig auf die besondere informationsstrukturelle Funktion der Randpositionen des Satzes hingewiesen: Diese sind nicht nur für die Gewichtung des satzinternen Materials nach Hintergrund und Vordergrund relevant, sondern tragen auch zur Sicherung der Kohärenz im Diskurs bei. Dabei wird vor allem mit Hinweis auf kognitive und funktionale Prinzipien die universelle Gültigkeit der Topik-Fokus-Abfolge betont, mit der initialen (oder frühen) Platzierung des kontextuell verankerten Satzgegenstandes (des so genannten Topiks) und der späteren Erwähnung der Kernaussage (des Fokus).
In dem vorliegenden Artikel wird die Relevanz des linken Satzrandes für die Herstellung des Diskurszusammenhanges und die Universalität der Topik-Fokus-Ordnung überprüft. Zum einen scheint die Funktion des Satzanfangs komplex: Mit dem ersten Glied der Aussagesätze wird nämlich in vielen Sprachen nicht nur an etwas Gesagtes angeschlossen, sondern kann auch etwas Wichtiges hervorgehoben werden. Zum anderen sind die Unterschiede zwischen den Sprachen beträchtlich, was auf den Einfluss struktureller Gegebenheiten hindeutet.
Zur Lösung der Probleme wird ein neues informationsstrukturelles Prinzip vorgeschlagen, das auf der „C-Markiertheit“ (Kohärenzmarkiertheit) der Konstituenten aufbaut. Demnach sind nicht nur kontextuell gegebene, sondern auch kontrastive Elemente relevant für die Herstellung der Kohärenz (und somit C-markiert), da diese die Zuordnung zu ähnlichen oder identischen Mengen bzw. Skalen voraussetzen. Als universelle Strategie der pragmatischen Ordnung ist somit der so genannte „C-Constraint“ zu betrachten, der die initiale Platzierung der C-markierten Konstituenten vorschreibt, unabhängig von ihrem Topik- oder Fokusstatus.
Der typologischen Vielfalt bezüglich der Besetzung des linken Satzrandes wird durch die Beachtung relevanter struktureller Parameter in sieben genetisch und typologisch unterschiedlichen europäischen Sprachen (Deutsch, Englisch, Schwedisch, Französisch, Russisch, Finnisch, Ungarisch) — und durch die Aufstellung der so genannten „C-Hierarchie“ — Rechnung getragen. Deren drei Hauptkategorien weisen bezüglich der Zulassung von C-markierten kontrastiven Elementen und von unterschiedlichen Typen nicht C-markierter Fokusglieder am Satzanfang eine bedeutende Variation auf.
Im Zentrum der Dissertation steht der Begriff Informationsmodellierung oder genauer der Begriff der "textuellen Informationsmodellierung", wobei auf einer bereits vorgeschlagenen Unterscheidung einer primären und einer sekundären Ebene der Informationsstrukturierung aufgebaut wird. Der Gegenstand der primären Ebene sind die textuellen Daten selbst sowie ihre Strukturierung, wohingegen die sekundäre Ebene beschreibt, wie die für die primären Ebenen verwendeten Regelwerke mit alternativen Regelwerken in Beziehung gesetzt werden können. Der Einteilung in eine primäre und eine sekundäre Informationsstrukturierung wird in der Dissertation das Konzept der multiplen Informationsstrukturierung nebengeordnet. Dieses Konzept ist so zu verstehen, dass die primäre Ebene bei Bedarf vervielfacht wird - jedoch bezieht sich jede dieser Ebenen auf dieselbe Datengrundlage. Hierbei ergeben sich auch Auswirkungen auf die sekundäre Informationsstrukturierung. Die Informationsmodellierung erfolgt mit Auszeichnungssprachen. Die Standard Generalized Markup Language (SGML) stellt hierfür einen Rahmen dar, jedoch wurde dieser Formalismus seit seiner 1986 erfolgten Standardisierung nicht nur weiterentwickelt, sondern es wurde mit der Extensible Markup Language (XML) im Jahr 1998 eine wesentlich einfachere Untermenge dieser Sprache definiert, die zudem das derzeitige Zentrum weiterer Entwicklungen auf dem Gebiet der Auszeichnungssprachen darstellt. Der entwickelte Ansatz zur Modellierung linguistischer Information basiert auf der Extensible Markup Language (XML), wobei die weitergehenden Möglichkeiten von SGML selbstverständlich ebenfalls dargestellt und diskutiert werden. Mittels XML können Informationen, die sich nicht in bestimmten Hierarchien (mittels mathematischer Bäume) strukturieren lassen, nicht in einer natürlichen Weise repräsentiert werden. Eine Lösung dieses Problems liegt in der Aufteilung der Strukturierung auf verschiedene Ebenen. Diese neue Lösung wird dargestellt, diskutiert und modelliert.