Refine
Year of publication
- 2007 (64) (remove)
Document Type
- Part of a Book (44)
- Article (18)
- Book (2)
Language
- German (64) (remove)
Has Fulltext
- yes (64)
Keywords
- Deutsch (33)
- Korpus <Linguistik> (15)
- Gesprochene Sprache (6)
- Konversationsanalyse (5)
- Rechtschreibung (5)
- Verb (5)
- Grammatik (4)
- Kommunikation (4)
- Institut für Deutsche Sprache <Mannheim> (3)
- Lexikographie (3)
Publicationstate
- Veröffentlichungsversion (64) (remove)
Reviewstate
Publisher
- de Gruyter (22)
- Narr (15)
- Institut für Deutsche Sprache (2)
- Lang (2)
- Olms (2)
- Schmidt (2)
- Verlag für Gesprächsforschung (2)
- De Gruyter (1)
- Editura Paideia (1)
- Francke (1)
Der Beitrag zeigt, auf welch grundlegende Weise das Paradigma der Corpus-Driven-Linguistics (CDL) die linguistische Beschreibung sprachlichen Usus auf der Basis mathematisch-statistischer Clusteringverfahren bestimmt. Es soll deutlich werden, wie sich diese Prämissen im Forschungsschwerpunkt zur linguistischen Systematisierung und Interpretation von Kookkurrenzdaten manifestieren.
Arbeitet man als muttersprachlicher Sprecher des Deutschen mit Corpora gesprochener oder geschriebener deutscher Sprache, dann reflektiert man in aller Regel nur selten über die Vielzahl von kulturspezifischen Informationen, die in solchen Texten kodifiziert sind - vor allem, wenn es sich bei diesen Daten um Texte aus der Gegenwart handelt. In den meisten Fällen hat man nämlich keinerlei Probleme mit dem in den Daten präsupponierten und als allgemein bekannt erachteten Hintergrundswissen. Betrachtet man dagegen Daten in Corpora, die andere - vor allem nicht-indoeuropäische - Sprachen dokumentieren, dann wird einem schnell bewusst, wieviel an kulturspezifischem Wissen nötig ist, um diese Daten adäquat zu verstehen. In meinem Beitrag illustriere ich diese Beobachtung an einem Beispiel aus meinem Corpus des Kilivila, der austronesischen Sprache der Trobriand-Insulaner von Papua-Neuguinea. Anhand eines kurzen Ausschnitts einer insgesamt etwa 26 Minuten dauernden Dokumentation, worüber und wie sechs Trobriander miteinander tratschen und klatschen, zeige ich, was ein Hörer oder Leser eines solchen kurzen Daten-Ausschnitts wissen muss, um nicht nur dem Gespräch überhaupt folgen zu können, sondern auch um zu verstehen, was dabei abläuft und wieso ein auf den ersten Blick absolut alltägliches Gespräch plötzlich für einen Trobriander ungeheuer an Brisanz und Bedeutung gewinnt. Vor dem Hintergrund dieses Beispiels weise ich dann zum Schluss meines Beitrags darauf hin, wie unbedingt nötig und erforderlich es ist, in allen Corpora bei der Erschließung und Kommentierung von Datenmaterialien durch sogenannte Metadaten solche kulturspezifischen Informationen explizit zu machen.
Christian Cay Lorenz Hirschfeld (1742-1792) beschrieb in seiner "Theorie der Gartenkunst" die Stellung des Menschen in der Natur und spiegelte die gesellschaftlichen Zustände. Dabei stellte er eine Verbindung zwischen der Kunstform des Landschaftsgartens und der Verbesserung der Menschheit her. In diesem Band wird exemplarisch vorgeführt, mit welchem lexematischen Material er die Kombination aus differenzierter Beschreibung und beabsichtigter ästhetischer Erziehung in moralischer Absicht innerhalb des vom Sprachsystem lexikalisch vorgegebenen Rahmens umsetzte und welche sprachlichen Strategien aus diesen Intentionen resultierten.
Zunehmend werden Videos und ihre Präsentation für die gesprächsanalytische Arbeitspraxis wichtig. Dieser Beitrag gibt praxisorientierte Hilfestellungen für die Einbettung von Audio- und Videodateien in Microsoft Powerpoint 2003 unter Windows XP, geht auf unterschiedliche Dateitypen ein und stellt Software zum Konvertieren und Editieren von Videodateien vor. Als besonders elaborierte Präsentationstechnik wird Screenrecording-Software beschrieben, mit der Bildschirmfilme von Abläufen z.B. in Transkriptionssoftware erstellt werden können, um so Video, Transkript und Analyse simultan in Powerpoint darzustellen.
Das elexiko-Portal: Ein neuer Zugang zu lexikografischen Arbeiten am Institut für Deutsche Sprache
(2007)
Das elexiko-Portal soll verschiedene lexikografische Projekte des IDS in einem Verbund zusammenführen und - soweit das die Inhalte zulassen - gemeinsame Recherchemöglichkeiten über verschiedene lexikografische Produkte hinweg bieten. In diesem Aufsatz geht es v. a. darum zu zeigen, wie die XML-basierte Modellierung für das Portal aufgebaut ist, um zum einen die Basis für diese flexiblen Zugriffsstrukturen zu legen und zum anderen der Verschiedenheit der beteiligten Projekte Rechnung zu tragen. Gleichzeitig werden Perspektiven für eine flexiblere Darstellung der Daten und für die zukünftige Weiterentwicklung von Recherchemöglichkeiten aufgezeigt.
Wer sich mit grammatischen Phänomenen historischer Sprachstufen beschäftigt, kann seine empirischen Daten bekanntermaßen nicht auf der Grundlage von Sprecherurteilen gewinnen, sondern muss zunächst Korpusrecherchen betreiben. Die Größe des auszuwählenden Korpus ist sehr stark phänomenabhängig: So reicht es im Bereich der Syntax in der Regel nicht aus, kleinere Textausschnitte aus verschiedenen Textquellen zu einem Korpus zusammenzufügen, vielmehr müssen vollständige Texte nicht nur nach raum-zeitlichen Koordinaten, sondern auch textsortenabhängig ausgewählt werden, um ein repräsentatives Korpus für eine spezifische Sprachstufe zu erstellen. Da eine manuelle Sichtung dieser doch recht großen Korpora sich sehr zeitaufwändig gestaltet, bietet sich gerade im Bereich der historischen Syntax der Einsatz von syntaktisch annotierten, digitalen Korpora an. Im folgenden Beitrag wird der Aufbau einer solchen Baumbank für das Frühneuhochdeutsche einschließlich der verfügbaren Recherchemöglichkeiten vorgestellt.
Es gibt viele linguistische Forschungsfragen, für deren Beantwortung man Korpusdaten qualitativ und quantitativ auswerten möchte. Beide Auswertungsmethoden können sich auf den Korpustext, aber auch auf Annotationsebenen beziehen. Jede Art von Annotation, also Kategorisierung, stellt einen kontrollierten und notwendigen Informationsverlust dar. Das bedeutet, dass jede Art von Kategorisierung auch eine Interpretation der Daten ist. In den meisten großen Korpora wird zu jeder vorgesehenen Annotationsebene, wie z. B. Wortart-Ebene oder Lemma-Ebene, genau eine Interpretation angeboten. In den letzten Jahren haben sich neben den großen, ,,flach“ annotierten Korpora Korpusmodelle herausgebildet, mit denen man konfligierende Informationen kodieren kann, die so genannten Mehrebenen-Modelle (multilevel standoff corpora), in denen alle Annotationsebenen unabhängig vom Text gespeichert werden und nur auf bestimmte Textanker verweisen. Ich argumentiere anhand der Fehlerannotation in einem Lernerkorpus dafür, dass zumindest Korpora, in denen es stark variierende Annotationsbedürfnisse und umstrittene Analysen geben kann, davon profitieren, in Mehrebenen-Modellen kodiert zu werden.
Der Begriff und die Rolle von Daten in einer Wissenschaft hängen eng mit ihrem Selbstverständnis zusammen. Als erstes ist zu überlegen, inwiefern Linguistik eine empirische Wissenschaft ist und also von Daten abhängt.
Während in den Philologien ein Korpus die Grundlage einer Disziplin abgibt, die ohne es nicht bestünde, ist in der Linguistik ein Korpus nur ein Weg, an Daten zu kommen. Hier ist zu diskutieren, welche relativen Meriten die alternativen Wege im Hinblick auf die angestrebten Ziele haben.
Während manches auf uns gekommene Korpus seine Sprache sicher nicht angemessen repräsentiert, könnte eine heute von Linguisten erstellte Dokumentation diesen Anspruch im Prinzip einlösen. Hier stellt sich die Frage, ob das - angesichts des infiniten Charakters der Sprache - überhaupt möglich ist und in wieweit die Repräsentativität wieder von den angestrebten Zielen abhängt.
Dies sind alles Fragen linguistischer Methodologie. Eine Zeitlang hat man in der Linguistik geglaubt, ohne Methodologie zu Theorien gelangen zu können. Seit sich das als irrig herausgestellt hat, ist die Entwicklung von Methoden ein fühlbares Desiderat geworden. Wie man repräsentative Daten erhebt, wie man ein Korpus zusammenstellt und nutzt, wie man eine Sprache dokumentiert, sind alles Fragen, die eigentlich in die Alltagsroutine einer Wissenschaft fallen müssten. Dass sie noch weitgehend ungeklärt sind, ist ein Symptom dafür, dass die Linguistik noch keine erwachsene Wissenschaft ist.
Der Wortschatzausschnitt der deutschen Kommunikationsverben – eine empirische Bestandsaufnahme
(2007)
In Deutschland gibt es Anzeichen für ein zunehmendes Interesse an der eigenen Sprache. Dennoch ergeben sich hier wie in anderen europäischen Ländern mit der kommunikativen Internationalisierung Probleme für die weitere Entwicklung der Hochsprachen, die für die kulturelle Vielfalt des Kontinents konstitutiv sind. Die steigende Tendenz, Englisch als einzige internationale Verkehrssprache und auch national als Fachsprache in mehreren Domänen zu verwenden, wird verstärkt durch einen Fremdsprachenunterricht, der in Deutschland wie in anderen Ländern Englisch zu Lasten anderer Sprachen bevorzugt. Dieser Entwicklung sucht die Europäische Union zu begegnen, indem sie das Ziel M + 2 Sprachen (Muttersprache plus zwei andere Sprachen) für alle Europäer propagiert. Dieses Programm wird auch von der Europäischen Föderation nationaler Sprachinstitutionen (EFNIL) unterstützt, das Netzwerke der zentralen Spracheinrichtungen der EU- Staaten, das sich für die Erhaltung und Weiterentwicklung der europäischen Sprachenvielfalt und die Mehrsprachigkeit der Europäer einsetzt. Für dieses Ziel sind aber Einsicht und Interesse bei vielen Deutschen noch zu wecken oder zu verstärken.
Deutscher Wortschatz im Internet: Das Informationssystem elexiko und sein Modulprojekt Neologismen
(2007)
Deutsches Fremdwörterbuch R-Z: Rückblick und Ausblick. Zum Gedenken an Gerhard Strauß (1941-2006)
(2007)
Dieser Beitrag gliedert sich in zwei Teile. Der erste ist ein Rückblick auf das Deutsche Fremdwörterbuch in seinem (wörterbuch-)geschichtlichen Kontext, auf seine Entstehung und seine Fertigstellung im Institut für Deutsche Sprache (IDS). Der zweite ist ein eher persönlich gefärbter Ausblick auf die Lexikologie und Lexikographie des Fremdworts im Deutschen, der auf meinen während der Fertigstellung des Fremdwörterbuchs gemachten Erfahrungen beruht. Er geht exemplarisch auf zwei Fragenkomplexe näher ein, die nach meiner Überzeugung bei fundierten und sachgemäßen historischen Untersuchungen zum deutschen Fremdwort mitberücksichtigt werden müssen.