Refine
Year of publication
- 2013 (8) (remove)
Document Type
- Part of a Book (5)
- Conference Proceeding (2)
- Article (1)
Is part of the Bibliography
- no (8)
Keywords
- Korpus <Linguistik> (4)
- XML (3)
- Computerlinguistik (1)
- Computerunterstützte Lexikografie (1)
- Germanistik (1)
- Gesprochene Sprache (1)
- Grundschulkind (1)
- Informationsmanagement (1)
- Korpusanalyseplattform (KorAP) (1)
- Langzeitarchivierung (1)
Publicationstate
Reviewstate
Publisher
The goal of the present chapter is to explore the possibility of providing the research (but also the industrial) community that commonly uses spoken corpora with a stable portfolio of well-documented standardized formats that allow a high reuse rate of annotated spoken resources and, as a consequence, better interoperability across tools used to produce or exploit such resources.
The KorAP project (“Korpusanalyseplattform der nächste Generation”, “Corpus-analysis platform of the next generation”), carried out at the Institut fUr Deutsche Sprache (IDS) in Mannheim, Germany, has as its goal the development of a modem, state-of-the-art corpus-analysis platform, capable of handling very large corpora and opening the perspectives for innovative linguistic research. The platform will facilitate new linguistic findings by making it possible to manage and analyse extremely large amounts of primary data and annotations, while at the same time allowing an undistorted view of the primary un-annotated text, and thus fully satisfying expectations associated with a scientific tool. The project started in July 2011 and is funded till June 2014. The demo presentation in December will be the first version following a preliminary feature freeze, and will open the alpha testing phase of the project.
Igel is a small XQuery-based web application for examining a collection of document grammars; in particular, for comparing related document grammars to get a better overview of their differences and similarities. In its initial form, Igel reads only DTDs and provides only simple lists of constructs in them (elements, attributes, notations, parameter entities). Our continuing work is aimed at making Igel provide more sophisticated and useful information about document grammars and building the application into a useful tool for the analysis (and the maintenance!) of families of related document grammars
Forschungsdatenmanagement in den Geisteswissenschaften am Beispiel der germanistischen Linguistik
(2013)
Die Kernaufgabe des Instituts für Deutsche Sprache (IDS) ist die Erforschung und Dokumentation der deutschen Sprache. Dazu sammelt und archiviert das IDS einen umfangreichen Bestand an Forschungsprimärdaten in Form von Korpora der geschriebenen und gesprochenen Sprache sowie Sekundärdaten, wie zum Beispiel lexikographische Ressourcen. Dieser Beitrag gibt einen Überblick über den Datenbestand des IDS und die laufenden Forschungskooperationen im Bereich der Langzeitarchivierung. In diesem Kontext wird das im Aufbau befindliche Langzeitarchivdes IDS mit seiner Architektur, den zugrundeliegenden Prinzipien zur Daten- und Metadatenmodellierung sowie den daraus abgeleiteten Erfassungsprozessen vorgestellt. Der Beitrag schließt ab mit einem Ausblick auf die Herausforderungen und Perspektiven des Forschungsdatenmanagements aus Sicht der germanistischen Linguistik.
Anhand von Texten aus den Jahren 1972 und 2002 wurden die Schreibkompetenzen von 530 Viertklässlern aus dem östlichen Ruhrgebiet untersucht und miteinander verglichen. In einer Nachfolgestudie kamen im Dezember 2012 noch 437 Texte hinzu, die zurzeit ausgewertet werden. Als außersprachliche Variablen wurden u.a. soziale Schicht, Ein-/Mehrsprachigkeit, Geschlecht und die Sekundarschulempfehlung erfasst. Die Texte wurden in Bezug auf Schriftbild, Textlänge, Wortschatz, Textgestaltung, Rechtschreibung, Zeichensetzung und Grammatik untersucht. Neben der grundsätzlichen Frage nach den historisch bedingten Unterschieden im Schreibverhalten ermöglicht das Untersuchungsdesign eine differenzierte Analyse des Schriftsprachwandels in der Grundschule über einen Zeitraum von 40 Jahren.
Die Ergebnisse zeigen, dass sich generell keine Entwicklung zu defizitären Texten („Sprachverfall“) beobachten lässt. Stattdessen ergibt sich ein differenziertes Bild schriftsprachlichen Wandels mit erfreulichen und weniger erfreulichen Tendenzen. Während beispielsweise für die Bereiche Wortschatz und Textgestaltung beachtliche Verbesserungen erzielt werden konnten, finden sich in den neueren Texten beinahe doppelt so viele Rechtschreibfehler. Es zeigt sich auch, dass 2002 und 2012 die soziale Schicht und die Zuordnung der Schülerinnen und Schüler nach Sekundarschulen (Übergangsempfehlung) in einem wesentlich stärkeren Bezug zu den schriftsprachlichen Leistungen stehen als 1972. Positive Entwicklungen lassen sich vor allem bei Kindern aus der oberen Mittelschicht beobachten, während Kinder aus der Unterschicht mit einer Hauptschulempfehlung gegenüber 1972 deutlich schlechtere Leistungen zeigen. Gegenwärtig wird untersucht, ob sich der Trend bis heute fortgesetzt hat. Zur Rechtschreibung liegen bereits erste Ergebnisse vor.