Korpuslinguistik
Refine
Year of publication
Document Type
- Part of a Book (200)
- Conference Proceeding (161)
- Article (105)
- Book (34)
- Part of Periodical (10)
- Other (9)
- Working Paper (7)
- Review (4)
- Doctoral Thesis (3)
- Preprint (3)
Language
- German (274)
- English (265)
- Multiple languages (1)
Keywords
- Korpus <Linguistik> (457)
- Deutsch (165)
- Gesprochene Sprache (64)
- Annotation (56)
- Forschungsdaten (36)
- Computerlinguistik (33)
- Korpuslinguistik (28)
- corpus linguistics (27)
- Deutsches Referenzkorpus (DeReKo) (25)
- Grammatik (25)
Publicationstate
- Veröffentlichungsversion (322)
- Zweitveröffentlichung (142)
- Postprint (23)
- Erstveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (237)
- Peer-Review (202)
- Peer-review (5)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (5)
- Zweitveröffentlichung (3)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (2)
- Verlags-Lektorat (2)
- Peer-reviewed (1)
- Review-Status-unbekannt (1)
- Verlagslektorat (1)
Publisher
- de Gruyter (81)
- Institut für Deutsche Sprache (58)
- Narr (33)
- European Language Resources Association (ELRA) (25)
- European Language Resources Association (24)
- Leibniz-Institut für Deutsche Sprache (IDS) (20)
- Narr Francke Attempto (15)
- Leibniz-Institut für Deutsche Sprache (11)
- Linköping University Electronic Press (10)
- CLARIN (8)
Some grammatical phenomena that only seldom appear in the corpora of written language often coincide with Speakers' uncertainty about a given form's grammatical Status. Such display of uncertainty is often subject to prescriptive criticism, which pays little attention to actual usage. However, thorough and discriminating corpus analyses can help in a proper description of various low-frequency phenomena and in situating them more adequately in the grammatical System, against the background of different contexts, communicative situations, and language varieties. To exemplify this potential, this study examines three linguistic phenomena in German, using a corpus-based approach: the dative singular ending -e, the construction aus aller Herren Länder, which lacks the dative plural ending -t and the non-standard preterite form frug. The results can be seen as a contribution to a more precise grammatical description on the one hand and, on the other, as a basis for an improved, more usage-oriented approach in providing practical advice to language users.
KonfeThe volume contains 23 papers read at the international conference “Historical Corpora 2012”, which was hosted by the LOEWE Research Cluster “Digital Humanities” of the State of Hesse at the University of Frankfurt on December 6-8, 2012. All in all, the conference comprised 27 individual papers plus five keynote speeches, three of which have been integrated in the present volume, too.
The contributions, which have been duly updated, take a broad variety of perspectives on “historical corpora”, including their structuring, their management, and various facets of the increase of knowledge they can provide. In addition to this, the papers cover a large amount of different languages, German – in nearly all its historical facettes – being the most widely addressed; however, the range of vernaculars treated extends far beyond that, across the Romance languages into the Caucasus and from the recent past down into antiquity. Differences also concern the linguistic interests prevailing in the papers, which may focus on syntactic, semantic, pragmatic, lexicological or other phenomena.
Wenn sich ein Partizip II in Bedeutung und Gebrauch verselbstständigt, dann sprechen Linguisten von einer Lexikalisierung. Es entsteht ein Pseudo-Partizip, das nicht mehr als Verbform identifiziert werden kann. Doch wie systematisch lassen sich Partizipien erfassen, deren Verhalten teilweise auf Lexikalisierung schließen lässt, die aber zugleich eine transparente verbale Basis im Gegenwartsdeutschen aufzuweisen scheinen?
Dieser Band beschreibt Partizipien II von Experiencer-Objekt-Verben wie verwirrt, frustriert oder begeistert auf Grundlage ihrer besonderen Semantik und analysiert den Gebrauch von 21 ausgewählten Exemplaren mit korpuslinguistischen Mitteln sowohl qualitativ als auch quantitativ. Im Mittelpunkt stehen die Verwendungen in Kombination mit den Kopula- oder Passivhilfsverben sein und werden sowie mit dem Kausativverb machen, in denen die Partizipialformen in verbalem und/oder adjektivischem Gebrauch vorliegen. Dabei ergeben sich einige bemerkenswerte Ergebnisse und bisher nicht wahrgenommene Korrelationen.
Der korpuslinguistische Ansatz des Projekts »Korpusgrammatik« eröffnet neue Perspektiven auf unsere Sprachwirklichkeit allgemein und grammatische Regularitäten im Besonderen. Der vorliegende Band klärt auf, wie man korpuslinguistisch nach dem Standard fragen kann, wie die Projektkorpora aufgebaut und in einer Korpusdatenbank erschlossen sind, wie man in einem automatischen Abfragesystem der Variabilität der Sprache zu Leibe rückt und sie sogar messbar macht, schließlich aber auch, wo die Grenzen quantitativer Korpusanalysen liegen. Pilotstudien deuten an, wie der Ansatz unsere grammatischen Horizonte erweitert und die Grammatikografie voranbringt.
Investigating the history of a language depends on fragmentary sources, but electronic corpora offer the possibility of alleviating the problem of ‘bad data’. However they cannot overcome it totally, and crucial questions thus arise of the optimal architecture for such a corpus, the problem of how representative even a large corpus can be of actual language use at a particular time, and how a historical corpus can best be annotated and provided with tools to maximize its usefulness as a resource for future researchers. Immense strides have been made in recent years in addressing these questions, with exciting new methods and technological advances. The papers in this volume, which were presented at a conference on New Methods in Historical Corpora (Manchester 2011), exemplify the range of these developments in investigating the diachrony of languages as distinct as English, German, Latin, Spanish, French and Slovene and developing appropriate tools for the analysis of historical corpora in these languages.
Die Nutzung von Korpora hat die Grammatikforschung in den letzten Jahren wirkungsvoll vorangebracht und birgt immer noch großes Potenzial. Korpora vermitteln Einsichten in den Sprachgebrauch und ermöglichen es, auch Phänomenen auf die Spur zu kommen, die in der Grammatikografie bisher unbeachtet blieben. Die Beiträge zur Dritten Internationalen Konferenz Grammatik und Korpora (Mannheim 2009) thematisieren zum einen korpusgestützte grammatische Untersuchungen zu verschiedenen Sprachen, zum anderen übereinzelsprachlich ausgerichtete methodologisch-korpuslinguistische Ansätze. Einblicke in laufende Forschungsvorhaben runden den Band ab, der sowohl für Grammatiker mit Interesse an korpuslinguistischen Methoden als auch für Korpuslinguisten gedacht ist, die grammatiktheoretische Fragen nicht ignorieren wollen.
Contemporary studies on the characteristics of natural language benefit enormously from the increasing amount of linguistic corpora. Aside from text and speech corpora, corpora of computer-mediated communication (CMC) Position themselves between orality and literacy, and beyond that provide in- sight into the impact of "new", mainly intemet-based media on language beha- viour. In this paper, we present an empirical attempt to work with annotated CMC corpora for the explanation of linguistic phenomena. In concrete terms, we implement machine leaming algorithms to produce decision trees that reveal rules and tendencies about the use of genitive markers in German.
Editorial
(2013)