Refine
Year of publication
Document Type
- Part of a Book (48)
- Article (22)
- Conference Proceeding (12)
- Book (2)
- Other (1)
- Working Paper (1)
Keywords
- Deutsch (55)
- Verb (17)
- Sprachkontakt (14)
- Kolonialismus (12)
- Korpus <Linguistik> (12)
- Englisch (10)
- Lehnwort (8)
- Argumentstruktur (7)
- Valenz (7)
- Wörterbuch (7)
Publicationstate
- Veröffentlichungsversion (22)
- Zweitveröffentlichung (13)
- Postprint (1)
Reviewstate
- (Verlags)-Lektorat (21)
- Peer-Review (14)
- Verlags-Lektorat (4)
- Peer-review (2)
- Review-Status-unbekannt (1)
Publisher
- De Gruyter (10)
- de Gruyter (10)
- Institut für Deutsche Sprache (5)
- Narr Francke Attempto (4)
- Niemeyer (4)
- IDS-Verlag (3)
- Winter (3)
- Akademie-Verlag (2)
- Buske (2)
- De Gruyter Mouton (2)
The paper explores factors that influence the distribution of constituent words of compounds over the head and modifier position. The empirical basis for the study is a large database of German compounds, annotated with respect to the morphological structure of the compound and the semantic category of the constituents. The study shows that the polysemy of the constituent word, its constituent family size, and its semantic category account for tendencies of the constituent word to occur in either modifier or head position. Furthermore, the paper explores the degree to which the semantic category combination of head and modifier word, e.g., x=substance and y=artifact, indicates the semantic relation between the constituents, e.g., y_consists_of_x.
Corpus REDEWIEDERGABE
(2020)
This article presents the corpus REDEWIEDERGABE, a German-language historical corpus with detailed annotations for speech, thought and writing representation (ST&WR). With approximately 490,000 tokens, it is the largest resource of its kind. It can be used to answer literary and linguistic research questions and serve as training material for machine learning. This paper describes the composition of the corpus and the annotation structure, discusses some methodological decisions and gives basic statistics about the forms of ST&WR found in this corpus.
Projektvorstellung – Redewiedergabe. Eine literatur- und sprachwissenschaftliche Korpusanalyse
(2018)
Das laufende DFG-Projekt „Redewiedergabe“ stellt einen Anwendungsfall quantitativer Sprach-und Literaturwissenschaft dar und beschäftigt sich mit dem Phänomen „Redewiedergabe“ auf der Grundlage großer Datenmengen. Zu diesem Zweck wird zum einen ein Korpus manuell mit Redewiedergabeformen annotiert, zum anderen werden Verfahren zur automatischen Erkennung des Phänomens entwickelt. Ziel ist es, Forschungsfragen nach der Entwicklung von Redewiedergabe vor allem im 19. Jahrhundert zu beantworten.
In diesem Beitrag wird das Redewiedergabe-Korpus (RW-Korpus) vorgestellt, ein historisches Korpus fiktionaler und nicht-fiktionaler Texte, das eine detaillierte manuelle Annotation mit Redewiedergabeformen enthält. Das Korpus entsteht im Rahmen eines laufenden DFG-Projekts und ist noch nicht endgültig abgeschlossen, jedoch ist für Frühjahr 2019 ein Beta-Release geplant, welches der Forschungsgemeinschaft zur Verfügung gestellt wird. Das endgültige Release soll im Frühjahr 2020 erfolgen. Das RW-Korpus stellt eine neuartige Ressource für die Redewiedergabe-Forschung dar, die in dieser Detailliertheit für das Deutsche bisher nicht verfügbar ist, und kann sowohl für quantitative linguistische und literaturwissenschaftliche Untersuchungen als auch als Trainingsmaterial für maschinelles Lernen dienen.
Der Aufsatz befasst sich mit den Besonderheiten der Struktur, der Funktion, der Selektion und des Gebrauchs von Subjektsätzen im Deutschen und Rumänischen. Am Beispiel der Argumentrealisierung bei Psych-Verben wird erkundet, inwiefern sprachübergreifende semantische Bedingungen diese Besonderheiten erklären und in welchem Maße sie von einzelsprachlichen und lexikalischen Besonderheiten gesteuert sind. Im Fokus der Studie stehen dabei (i) die Einordnung des Deutschen und des Rumänischen hinsichtlich der zu beobachtenden typologischen Varianz bei Subjektsätzen, (ii) die Besonderheiten der Aufteilung von Argumenten von Psych-Verben auf zwei Satzglieder durch Argumentdoppelung und Argumentspaltung und (iii) die Ermittlung verbidiosynkratischer, sprachspezifischer und sprachübergreifender Präferenzen bei der Realisierung der Argumente von Psych-Verben über eine quantitative Korpusstudie.
Zwischen Hawaii und Neuseeland, Neuguinea und der Osterinsel erstreckt sich die Inselwelt des Pazifiks, die wir als „Südsee“ kennen. Traditionell wird sie in drei große Inselgebiete aufgeteilt: Polynesien im Osten, Mikronesien im Nordwesten und Melanesien im Westen (s. Abb. 1 auf Seite 3). Die Südsee weist eine Sprachenvielfalt auf wie kaum eine andere Region der Erde. Überraschenderweise haben dabei nicht wenige der etwa 1000 Sprachen, die in der Südsee gesprochen werden, deutsche Lehnwörter in ihren Wortschatz integriert. So stößt man auf Wörter wie kaisa im Samoanischen (aus dt. Kaiser), kumi im Marshallesischen (aus dt. Gummi) und karmoból im Palauischen (aus dt. Grammophon).