Refine
Year of publication
Document Type
- Part of a Book (17)
- Article (8)
- Conference Proceeding (3)
- Working Paper (3)
- Book (1)
- Other (1)
- Report (1)
Keywords
- Korpus <Linguistik> (23)
- Deutsch (10)
- Distribution <Linguistik> (7)
- Kollokation (6)
- Institut für Deutsche Sprache <Mannheim> (4)
- Methode (4)
- Forschungsmethode (3)
- Wortschatz (3)
- Automatische Sprachanalyse (2)
- Categories of PSMs (2)
Publicationstate
- Veröffentlichungsversion (22)
- Zweitveröffentlichung (3)
- Postprint (1)
Reviewstate
- (Verlags)-Lektorat (18)
- Peer-Review (4)
- Verlags-Lektorat (1)
Publisher
Sehr große Korpora – wie das Deutsche Referenzkorpus DeReKo – bieten eine breite Basis für die empirische Forschung. Sie bringen aber auch Herausforderungen mit sich, da sich weder Eigenschaften ihrer Zusammensetzung noch derer von Recherche- und Analyseergebnissen mit einfachen Mitteln erschließen lassen. Dafür bedarf es Verfahren geschickter Sortierung, Gruppierung oder des Clusterings, kurzum: strukturentdeckender Methoden. In Kombination mit Visualisierungstechniken kann so die Wahrnehmung bestimmter Eigenschaften und Zusammenhänge unterstützt und die Aufmerksamkeit auf bestimmte Phänomene, ggf. in Anlehnung an präferenzrelationale Befunde, gelenkt werden. Neben der illustrativen Funktion geht es in diesem Beitrag vor allem um das erkenntnisleitende Potenzial derartiger Verfahren in Kombination. Aus verschiedenen Bereichen werden Beispiele gezeigt, die am IDS oder in Kooperationen zum Einsatz kommen, sowohl zur dokumentarischen und reflexiven Kontrolle von Eigenschaften der Korpuszusammensetzung als auch hinsichtlich korpusanalytischer Methodik, um die qualitative Interpretation von Analysebefunden und die Abduktion von Hypothesen stimulierend zu unterstützen.
Korpuslinguistik
(2012)
This introductory tutorial describes a strictly corpus-driven approach for uncovering indications for aspects of use of lexical items. These aspects include ‘(lexical) meaning’ in a very broad sense and involve different dimensions, they are established in and emerge from respective discourses. Using data-driven mathematical-statistical methods with minimal (linguistic) premises, a word’s usage spectrum is summarized as a collocation profile. Self-organizing methods are applied to visualize the complex similarity structure spanned by these profiles. These visualizations point to the typical aspects of a word’s use, and to the common and distinctive aspects of any two words.
Valenz und Kookkurrenz
(2015)
Eine angemessene, sachgemäße Diskussion über Stärken und Schwächen, Möglichkeiten und Grenzen der Korpuslinguistik ist überschattet von vielen Mythen, die sich mittlerweile eingebürgert haben und die in vielen Diskussionen – gerade unter Linguisten – immer wieder aufkommen. An dieser Stelle möchten wir einige der verbreitetsten Mythen zusammenstellen und die Hintergründe aus dieser korpuslinguistischen Perspektive erörtern.
Das IDS, insbesondere der Programmbereich Korpuslinguistik, bekommt häufig Anfragen zum Wortbestand der deutschen Sprache, sei es, welche Wörter besonders häufig sind, sei es, nach (Listen von) Wörtern mit bestimmten Eigenschaften. Zu dem Themenschwerpunkt „häufigkeitsbasierte Wortlisten“ wurde unter dem Schlagwort DeReWo eine Plattform eingerichtet, auf der Erkenntnisse und Ergebnisse zu diesem Bereich erarbeitet und veröffentlicht werden (<www.ids-mannheim.de/kl/projekte/methode/derewo.html>). Die Frage nach dem „längsten Wort der deutschen Sprache“ hat zwar gewisse Berührungspunkte zu diesem Schwerpunkt, sie hebt sich aber doch ein wenig ab. Deshalb soll sie an dieser Stelle in Form eines fiktiven Gesprächs thematisiert werden (auch wenn eine konkrete Anfrage für eine Kindersendung den Anlass geliefert hat).