Refine
Year of publication
- 2013 (15) (remove)
Document Type
- Part of a Book (10)
- Article (2)
- Book (2)
- Conference Proceeding (1)
Has Fulltext
- yes (15)
Keywords
- Lexikographie (15) (remove)
Publicationstate
Reviewstate
- (Verlags)-Lektorat (6)
- Verlags-Lektorat (1)
Publisher
- Institut für Deutsche Sprache (3)
- Lang (3)
- Narr (2)
- Olms (2)
- Pfälzerbund (1)
- Stutz (1)
- de Gruyter (1)
Thoughts on what kind of dictionaries and why they are necessary for journalists lead to the conclusion: first of all, dictionaries of pronunciation are interesting for them. Radio and television journalists need pronouncing dictionaries. In this regard, there are such modern dictionaries as “The Dictionary of Russian Pronunciation Difficulties” (Kalenchuk/Kasatkina 2006), “The Dictionary of Emphasis for Radio and TV announcers” (Vvedenskaja 2004) and “The Dictionary of Perfect Russian Emphasis” (Shtudiner 2007). Dictionary reference books that help to avoid some spelling mistakes are necessary in the newspaper practice. This type of publication includes “The Abridged Dictionary of Russian Language Difficulties for the Workers of the Press” (1968) that contains about 400 words, and reference books such as: “Word Usage Difficulties in TV and Broadcasting” (Gajmakova/Menkevich 1998) and “Russian Language Difficulties” by Rakhmanova (ed.) (1994).
Vor allem in älteren Wörterbüchern mit philologischer Ausrichtung ist die Mikrostruktur der Artikel häufig diskursiv und unsystematisch. Eine automatisierte Digitalisierung solcher Wörterbücher mit dem Ziel, ihre logische Struktur zu kodieren, ist nicht möglich; in vielen Fällen ist schon ein Parser für ein manuell nachzubearbeitendes Rohdigitalisat kein realistisches Ziel, weil die Angabetypen des Wörterbuchs nicht klar voneinander abgrenzbar und in den Einzelartikeln nicht eindeutig identifizierbar sind. In solchen Fällen wirft auch eine nachträgliche manuelle Formalisierung der Mikrostruktur große lexikografische Probleme auf. Für komplexere Anwendungsszenarien wie etwa Abfragen in Webanwendungen kann es dennoch unumgänglich sein, wenigstens sämtliche relevanten in den Artikeln diskutierten Wortformen mit grundsätzlichen diasystematischen und morphologischen Informationen sowie ihren Relationen zueinander in einem maschinell lesbaren Format strukturiert zu repräsentieren, etwa durch datenzentrierte XML-Dokumente. Der Vortrag versucht, die lexikografischen und technischen Möglichkeiten und Grenzen einer solchen teilweisen und manuellen Retrodigitalisierung am Beispiel von Erfahrungen mit einem älteren Wörterbuch deutscher Lehnwörter im Slovenischen (Striedter-Temps 1963) auszuloten. Das Wörterbuch soll in ein Portal von Lehnwörterbüchern mit Deutsch als gemeinsamer Gebersprache eingebunden werden. Die Einzelartikel werden dem Benutzer als Bilddigitalisate zur Verfügung gestellt; die zusätzliche textuelle Retrodigitalisierung ist jedoch für komplexere, insbesondere auch für wörterbuchübergreifende und portalweite, Suchabfragen erforderlich.
Dieser Beitrag behandelt primäre, sekundäre und tertiäre Quellen in der Lexikographie und beschreibt insbesondere ihre Nutzung für die Erarbeitung des deutschsprachigen Online-Wörterbuches elexiko. Anhand verschiedener Beispiele wird die lexikographische Praxis im Umgang mit sehr unterschiedlichen Quellen in diesem Projekt deutlich. Zugleich wird über die unterschiedlichen Definitionen von ‘Quelle’ in der Sprachwissenschaft wie in den Geschichtswissenschaften nachgedacht.
Introduction
(2013)
Jedes sprachwissenschaftliche Projekt braucht sprachliche Daten – dies dürfte unstrittig sein. Die entscheidende Frage aber ist, wie man zu sprachlichen Daten kommt. Im Gegensatz etwa zur Geschichtswissenschaft hat die Sprachwissenschaft ihre Quellen für die zu interpretierenden Daten bislang nur ansatzweise reflektiert; eine sprachwissenschaftliche Quellenkunde steckt allenfalls in den Kinderschuhen.
Im Oktober 2011 sind deutsche und tschechische Sprachwissenschaftler/innen zur II. Internationalen Konferenz "Korpuslinguistik Deutsch-Tschechisch kontrastiv" zusammengekommen, um genau diese Fragen zu diskutieren. Das Ergebnis ist ein neues Kompendium, das die unterschiedlichen Möglichkeiten der Datengewinnung darstellt und ausprobiert. Dabei werden theoretische, technische, praktische Fragen der Datenanalyse erörtert und Lösungswege gezeigt. Im Zentrum nahezu aller Beiträge stehen authentische Texte sowie Analyse und Interpretation der aus den Texten gewonnenen Daten.
Die Autorinnen stellen in ihrem Beitrag den Umgang mit Funktionswörtem in elexiko vor und zeigen an Beispielen, welche Probleme sich bei der Beschreibung von Synsemantika ergeben können. Ein Ausblick auf die erweiterten Suchmöglichkeiten und die Verlinkung mit grammatischen Informationssystemen in elexiko rundet den Beitrag ab.