Korpuslinguistik
Refine
Year of publication
Document Type
- Conference Proceeding (94)
- Part of a Book (92)
- Article (51)
- Book (14)
- Part of Periodical (10)
- Other (4)
- Working Paper (4)
- Review (3)
- Doctoral Thesis (2)
- Bachelor Thesis (1)
Language
- German (151)
- English (123)
- Multiple languages (1)
Is part of the Bibliography
- no (275) (remove)
Keywords
- Korpus <Linguistik> (215)
- Deutsch (85)
- Annotation (29)
- Gesprochene Sprache (23)
- Computerlinguistik (14)
- Institut für Deutsche Sprache <Mannheim> (13)
- Grammatik (12)
- corpus linguistics (12)
- Corpus linguistics (11)
- Textkorpus (10)
Publicationstate
- Veröffentlichungsversion (168)
- Zweitveröffentlichung (52)
- Postprint (4)
Reviewstate
Publisher
- Institut für Deutsche Sprache (45)
- de Gruyter (40)
- Narr (26)
- European Language Resources Association (ELRA) (12)
- Leibniz-Institut für Deutsche Sprache (7)
- Leibniz-Institut für Deutsche Sprache (IDS) (7)
- European Language Resources Association (5)
- Niemeyer (4)
- Nisaba (4)
- Extreme Markup Languages Conference (3)
Deutsch ist keine isolierte Sprache. Seine heutige Gestalt ist von anderen europäischen Sprachen beeinflusst. Eine jahrhundertelange Auseinandersetzung mit antikem, italienischem, französischem und schließlich englischem Weltverständnis bescherten uns mit einem abendländischen Begriffsgefüge auch einen gemeinsamen Wortschatz, der sich vielfach von griechischen und lateinischen Wurzeln ableitet und willkommene Brücken zu anderen Sprachen baut. Diesem »lessico intellettuale europeo« (so der Titel eines europäischen Langzeitprojekts) verdankten frühere Bildungseliten die Leichtigkeit gegenseitigen Verständnisses in einem durchaus polyphonen europäischen Diskurs, in dem kulturelle und sprachliche Identitäten im nationalen und regionalen Rahmen gewahrt waren. So soll es auch in einem vereinigten Europa bleiben. Ein demokratisches Europa beruht auf der Akzeptanz unterschiedlicher Kulturräume bei gleichzeitiger Anerkennung allgemeinverbindlicher Diskursregeln. Funktionieren kann das nur, insoweit es gelingt, Mehrsprachigkeit zu verallgemeinern. Hier kommen auf die nationalen Sprachinstitute in Europa neue Aufgaben zu.
Eine angemessene, sachgemäße Diskussion über Stärken und Schwächen, Möglichkeiten und Grenzen der Korpuslinguistik ist überschattet von vielen Mythen, die sich mittlerweile eingebürgert haben und die in vielen Diskussionen – gerade unter Linguisten – immer wieder aufkommen. An dieser Stelle möchten wir einige der verbreitetsten Mythen zusammenstellen und die Hintergründe aus dieser korpuslinguistischen Perspektive erörtern.
Die im Folgenden dargestellte korpusgesteuerte Methode "UWV-Analysemodell" wurde auf der Basis der Forschungen zu usuellen Wortverbindungen (UWV) (vgl. Steyer 2000, 2003, 2004, Steyer/Lauer 2007, Brunner/Steyer 2007, Steyer 2008, Steyer demn.) und zahlreicher, exhaustiver Analysen in den letzten Jahren entwickelt. Ziel war ein empirisches Vorgehensmodell, das es ermöglicht, die Differenziertheit und Vernetztheit von Wortverbindungen auf verschiedenen Abstraktionsebenen ausgehend von Kookkurrenzdaten angemessen darzustellen. Daher ging es in dieser Arbeitsphase nicht darum, usuelle Wortverbindungen des Deutschen möglichst umfassend und in großer Menge zu inventarisieren, sondern die "innere Natur" von Wortverbindungen zwischen Varianz und Invarianz mit unterschiedlichen Graden an lexikalischer Spezifiziertheit sowie ihre wechselseitigen Verbindungen im Detail zu erfassen und zu beschreiben.