Refine
Year of publication
- 2016 (113) (remove)
Document Type
- Article (42)
- Part of a Book (41)
- Book (12)
- Conference Proceeding (12)
- Part of Periodical (4)
- Other (1)
- Preprint (1)
Keywords
- Deutsch (113) (remove)
Publicationstate
- Veröffentlichungsversion (64)
- Zweitveröffentlichung (7)
- Postprint (3)
- Erstveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (42)
- Peer-Review (25)
- Peer-Revied (3)
- Peer-review (3)
- Peer Review (1)
- Qualifikationsarbeit (Dissertation, Habilitation) (1)
Publisher
- Institut für Deutsche Sprache (22)
- de Gruyter (10)
- Retorika (8)
- De Gruyter (5)
- European Language Resources Association (ELRA) (5)
- E. Schmidt (4)
- Peter Lang (4)
- Winter (4)
- Buske (3)
- Frank & Timme (3)
Brown clustering has been used to help increase parsing performance for morphologically rich languages. However, much of the work has focused on using clustering techniques to replace terminal nodes or as a feature for parsing. Instead, we choose to examine how effectively Brown clustering is for unlexicalized parsing by creating data-driven POS tagsets which are then used with the Berkeley parser. We investigate cluster sizes as well as on what information (e.g. words vs. lemmas) clustering will yield the best parser performance. Our results approach the current state of the art results for the German T¨uBa-D/Z treebank when using parser internal tagging.
Deutsches Fremdwörterbuch
(2016)
Konnexion in argumentativen Texten. Gebrauchsunterschiede in Deutsch als L2 vs. Deutsch als L1
(2016)
Für die Kodierung interpropositionaler semantischer Relationen wie Additivität, Adversativität, Kausalität etc. steht im Deutschen wie in vielen anderen Sprachen ein reichhaltiges Inventar von Konnektoren unterschiedlicher syntaktischer Kategorien zur Verfügung. Einige semantische Relationen müssen jedoch nicht explizit kodiert werden, da sie auf der Basis übereinzelsprachlicher Erwartungen an „normale“ Sachverhaltszusammenhänge aus dem Kontext erschließbar sind. Ob diese Relationen dann auch von Schreibern ausbuchstabiert werden, ist einzelsprach-spezifisch unterschiedlich. Der Beitrag untersucht vor diesem Hintergrund die Kodierung interpropositionaler Relationen bei Lernern des Deutschen als Fremdsprache. Die Analyse eines Lernerkorpus mit Essays fortgeschrittener Deutschlerner aus Schweden, China und Weißrussland (KobaltDaF-Korpus) und eines muttersprachlichen Kontrollkorpus zeigt, dass Lerner von den Mustern der Muttersprachler quantitativ und qualitativ abweichen. Der Beitrag beschreibt diese Abweichungen und diskutiert mögliche Erklärungen.
This paper is about the workflow for construction and dissemination of FOLK (Forschungs - und Lehrkorpus Gesprochenes Deutsch – Research and Teaching Corpus of Spoken German), a large corpus of authentic spoken interaction data, recorded on audio and video. Section 2 describes in detail the tools used in the individual steps of transcription, anonymization, orthographic normalization, lemmatization and POS tagging of the data, as well as some utilities used for corpus management. Section 3 deals with the DGD (Datenbank für Gesprochenes Deutsch - Database of Spoken German) as a tool for distributing completed data sets and making them available for qualitative and quantitative analysis. In section 4, some plans for further development are sketched.
Der vorliegende Aufsatz untersucht die Syntax und Semantik sogenannter Postponierer, d.h. konjunktionaler Konnektoren, die den von ihnen eingeleiteten Nebensatz dem Hauptsatz stets nachstellen. Anhand von sodass und zumal werden die Kerneigenschaften solcher Konnektoren im Deutschen vorgestellt. Am Beispiel der italienischen Konjunktionen cosicché, tanto più che und perché wird diskutiert, ob der Begriff des Postponierers für den Sprachvergleich genutzt werden kann. In einem nächsten Schritt werden die Postponierer des Deutschen unter Beiziehung sprachgeschichtlicher Argumente präziser beschrieben und im Übergangsfeld zwischen Adverbkonnektoren und Subjunktoren verortet. Es zeigt sich, dass die untersuchten Konnektoren sich letztlich sehr unterschiedlich verhalten, sodass es fraglich erscheint, ob ihre Zusammenfassung zu einer gemeinsamen Klasse gerechtfertigt ist.
Der Aufsatz knüpft an die Diskussion zur Verwendung von formalen grammatischen Kategorien im Sprachvergleich an (vgl. insbesondere Haspelmath 2007, 2010a, b und Newmeyer 2007, 2010). Es wird dabei nicht danach gefragt, ob sprachübergreifende grammatische Kategorien (oder genauer gesagt Kategorienausprägungen) existieren oder nicht bzw. ob einzelsprachliche grammatische Kategorien im Sprachvergleich sinnvoll einsetzbar sind, sondern wie ähnlich bzw. unterschiedlich einzelsprachliche Kategorien bzw. Kategorisierungen sind. Das Ziel ist damit, eine Methode zur Messung des Äquivalenzgrades von grammatischen Kategorien in verschiedenen Sprachen zu präsentieren; dies wird am Beispiel des IMPERATIVS im Deutschen, Englischen, Polnischen und Tschechischen illustriert.