Lexikographie, Wörterbücher
Refine
Year of publication
Document Type
- Part of a Book (329)
- Article (218)
- Book (57)
- Conference Proceeding (35)
- Review (31)
- Other (10)
- Doctoral Thesis (3)
- Report (2)
- Contribution to a Periodical (1)
Keywords
- Deutsch (438)
- Wörterbuch (251)
- Lexikographie (87)
- Rezension (79)
- Computerunterstützte Lexikographie (73)
- Korpus <Linguistik> (72)
- Lexikografie (69)
- Online-Wörterbuch (55)
- Neologismus (49)
- Wortschatz (48)
Publicationstate
- Veröffentlichungsversion (297)
- Zweitveröffentlichung (97)
- Postprint (14)
Reviewstate
Publisher
- de Gruyter (104)
- Institut für Deutsche Sprache (95)
- Narr (48)
- Niemeyer (46)
- Schwann (45)
- Akademie-Verlag (21)
- Lang (21)
- Narr Francke Attempto (12)
- Erich Schmidt (9)
- Olms (9)
This chapter describes the use of wikis in a cooperation project between the Institute of the German Language (IDS), the University of Mannheim, and two secondary schools. Pupils were introduced into using text corpora and corpus tools to create their own dictionary articles in the style of the Wiktionary. We outline the goals and the structure of the project and describe the wiki-based dictionary and other didactic material provided in our framework.
Wörterbücher sind oft ein Spiegelbild ihrer Zeit, d. h., der jeweilige kulturelle Kontext beeinflusst, wie die im Wörterbuch abgebildete Sprache beschrieben wird. Dies gilt für viele sprachliche Ausdrücke, besonders aber für Personenbezeichnungen wie Mann oder Frau, da sich hier Rollenzuschreibungen oder als typisch angesehene Eigenschaften im Sprachgebrauch spiegeln. Um die Beschreibung im Wörterbuch zwar zeitgebunden, aber möglichst neutral zu halten, sind moderne wissenschaftliche Wörterbücher in der Regel korpusbasiert. Das bedeutet, dass die im Wörterbuch beschriebene Sprache anhand von großen sprachlichen Datenmengen analysiert wird. Solche großen linguistischen Textsammlungen zum Schriftsprachgebrauch basieren jedoch sehr häufig auf Pressetexten. In diesem Beitrag wird untersucht, wie sich der sprachliche Kontext von den Wörtern Mann und Frau in Pressetexten von dem in anderen Textsammlungen unterscheidet und welche Fragen in diesem Kontext für die Lexikografie aufgeworfen werden.
Researching and recording new lexical items and senses holds a well-established position within German linguistics. The first corpus-based online dictionary (the Neologism Dictionary 2006ff.) was introduced in 2006 and focused on collecting and describing neologisms which had emerged and become established over the three decades from 1900 to 2020. In 2022, a new concept was developed to elevate lexicographic aspirations by integrating linguistic as well as encyclopaedic knowledge, and by introducing innovative presentational approaches. In this paper, the key changes and concepts of the new resource (published in platform OWID) will be highlighted, in particular its main aim, which is to merge an online dictionary with a dynamic informative dashboard. This combination offers headword-specific details for general reference and comprehensive information related to neologisms that transcends individual units, presented in various formats. Particular emphasis will be placed on the significant connection between neology and (critical) discourse, a facet that has previously played a minor role in lexicographic practices.
In this paper, the creation and representation of a digital dialect lexicon from existing internet sources and books is presented. The creation procedure can serve as a role model for similar projects on other dialects and points toward a new cost saving way to produce NLP resources by use of the internet in a manner similar to human-based computation. Dialect lexica can facilitate NLP and improve POS-tagging for German language resources in general. The representation standard used is LMF. It will be demonstrated how this lexicon can be used as a tool in literature science, linguistics, and computational linguistics. The critical edition of Hugo von Hofmannsthal’s works is a well-suited corpus for the aforementioned research fields and the inspiration to build this tool.
Das unregelmäßige Verb und seine Bildungen im Definitionskorpus des Langenscheidt-Wörterbuchs
(2013)
Der Anlass zu der vorliegenden Untersuchung ergab sich aus einer Unterrichtsstunde an der Pädagogischen Fakultät in Budweis, in der ein Internet-Artikel über „gesunde“ Sportarten (siehe Literaturverzeichnis) gelesen wurde. Die Bedeutung des adjektivierten Partizips „verschlissen“ im Satz „Für Menschen mit verschlissenen Gelenken ist Laufen nicht geeignet“ wurde zwar von den Studierenden ungefähr begriffen; als sie aber ihre Einschätzung im Wörterbuch überprüfen wollen, fanden sie den Ausdruck, der als lexikalisiertes Partizip sehr gut vorstellbar wäre, weder in den 1 200-1 700-seitigen Großwörterbüchern Langenscheidt (2008), Pons (2004) und WAHRIG (2008), noch im Wörterbuch Deutsch als Fremdsprache (2000). Das Partizip verschlissen war zwar unter verschleißen zu finden; wer allerdings die Verben schleißen oder sich verschleißen nicht kennt, die bei der Bestimmung der Bedeutung geholfen hätten, oder wer das Partizip nach dem historischen Wortbildungsmodell ei – i – i nicht ableiten kann, hat eigentlich keine Chance, das Wort zu finden. Wie wichtig verschlissen für die geläufige Kommunikation auf dem B1-B2-Niveau ist, konnten DaF-Lernende nicht einschätzen; ihnen fehlte die erlebte sprachliche Realität dazu. Die von mir gefragten Lehrerinnen und Lehrer schätzten die Anzahl der unvermeidlich zu lernenden unregelmäßigen Verben auf 60 bis 80.
Kaum ein modernes Wörterbuch, das heute ohne Korpus im Hintergrund erscheint. Alle großen Wörterbuchverlage nutzen heute mehr oder weniger intensiv Korpora zur Erstellung ihrer Wörterbücher, sei es zur Bereitstellung authentischer Beispielsätze, zur Kontrolle der Bedeutungsvarianten bzw. deren grammatischer Eigenschaften oder zur Entscheidung darüber, ob ein Lemma ins Wörterbuch aufgenommen wird oder nicht. Bei diesen Verfahren spricht man von korpusgestütztem Vorgehen.1 Das Korpus dient als Stütze für die Lexikographen, die ihre Einträge mithilfe des Korpus optimieren. Im Folgenden sollen der Aufbau des Herder-BYU-Korpus, die korpusgeleitete Vorgehensweise bei der Erstellung des Häufigkeitswörterbuchs und damit ein hergehende Schwierigkeiten vorgestellt werden.
Unter der Thematik „Wortbildung in Wörterbüchern“ wird sowohl diskutiert, wie im Wörterbuch Beziehungen und Vernetzungen der Wörter untereinander - wie sie im Wortschatz vorliegen - verdeutlicht werden können, als auch, wie Regelmäßigkeiten in der Wortbildung abgebildet werden können. In diesem Beitrag werden zunächst die Gründe für Wortbildungsangaben aus der Forschungsliteratur der letzten 20 bis 30 Jahre skizziert. Anschließend werden die daraus resultierenden Empfehlungen zur Darstellung und Gestaltung von Wortbildungsbeziehungen vorgestellt, wobei sich die Vorschläge hauptsächlich auf gedruckte Wörterbücher beziehen. Selbst die Literatur des vergangenen Jahrzehnts blendet die elektronischen Wörterbücher noch weitgehend aus. Inwieweit die Forderungen aus der Metalexikographie umgesetzt wurden, soll an aktuellen deutschen Print- und elektronischen Wörterbüchern - sowohl allgemeinsprachlichen als auch Lernerwörterbüchern - überprüft werden (Kap. 3). Der Überblick wird von einer umfangreichen Literaturliste zur Thematik abgeschlossen.
Variation im Bereich der schwachen Substantive. Wege zur Korpuszusammenstellung und -auswertung
(2013)
Die linguistische Forschung hat prinzipiell zwei Möglichkeiten, wie sie das sprachliche Material erwerben kann, mit dem sie die Ergebnisse ihrer wissenschaftlichen Arbeit begründet. Es handelt sich einerseits um selbst kreierte, die präsentierte Hypothese unterstützende Beispiele, die weitgehend auf Kenntnissen und dem Sprachvermögen des jeweiligen Linguisten beruhen. Diese Beispiele können jedoch auch absichtlich und zweckmäßig gewählte Belege konkreter sprachlicher Äußerungen darstellen. Andererseits entstehen immer häufiger empirisch verankerte Arbeiten, die sich bewusst einzig an der konkret belegten Sprachverwendung orientieren und deskriptiv arbeiten. Diese zwei methodologischen Zugänge repräsentieren die markanten Endpunkte einer Skala, zwischen denen jedoch mehrere Übergangsstufen festzustellen sind, die bei der Untersuchung diverser Phänomene auf allen Ebenen des Sprachsystems erfolgreich anzuwenden sind.
Nach Schmitz gibt es (wohl mindestens) drei Motive, statistische Methoden in der Textlinguistik anzuwenden: das linguistische, das mathematische und das anwendungsbezogene und Fremdsprachenlernen. Zu dem ersten heißt es näher: "Textstatistik untersucht alle quantifizierbaren Eigenschaften von Texten, um sie zu charakterisieren, untereinander zu vergleichen und zu klassifizieren, auf historische, geographische, soziale oder psychologische Entstehungsbedingungen zu schließen und um Gesetze zu entdecken, die die Konstruktion von Texten steuern." (Schmitz 2000, S. 196) Um ein solches Gesetz geht es im Folgenden. Die Fragestellung lautet: Ist (oder inwiefern ist) die Konstruktion ansonsten vergleichbarer Texte davon abhängig, ob sie als einer Standard-Varietät oder einer Nicht-Standard-Varietät zugehörige sprachliche Einheiten produziert worden sind?
Unter einem elektronischen Wörterbuch verstehe ich ein elektronisches Wortfamilienwörterbuch. Das bedarf zunächst einer Erläuterung und Begründung. Denn spätestens seit Jacob Grimm versteht man unter einem Wörterbuch „die alphabetische Verzeichnung der wörter einer sprache“ (Deutsches Wörterbuch, Bd. I, Vorwort, Sp. IX), und er fügt hinzu, „wer sie [= „die alphabetfolge“] heute nicht handhabt, sondern aufhebt und stört, hat sich an der philologie versündigt“ (Sp. XI). Ein solcher armer Sünder ist der Autor dieses Beitrags. Vorab muss allerdings angemerkt werden, dass religiöser Sprachgebrauch im Rahmen eines sprachwissenschaftlichen Diskurses zu besonders kritischem Verhalten anregen und eine Hinterfragung der Gründe herausfordern muss. Dies umso mehr, wenn Grimm als Grund „sicherheit und schnelle des gebrauchs“ (ebd.) anführt. Dies kann auch ein entsprechendes Register leisten, erst recht heutzutage im Zeitalter des elektronischen Wörterbuchs. Der Grund ist aber nicht ein äußerlicher, rein formaler. Im Rahmen des neuen Paradigmas eines historischen Wörterbuchs und im Blick auf Grimms organische Auffassung von Sprache ist für ihn das Wort einer Pflanze vergleichbar, die aufkeimt, sich entfaltet, blüht und verwelkt. Das geschichtliche Moment liegt für ihn im Einzelwort und entsprechend ist die Isolierung des Einzelwortes vermittels einer alphabetischen Auflistung von Einzelwortgeschichten für diesen Wörterbuchtyp zentral.