Refine
Year of publication
Document Type
- Article (19)
- Part of a Book (18)
- Conference Proceeding (8)
- Book (3)
- Other (1)
- Review (1)
Keywords
- Deutsch (50) (remove)
Publicationstate
- Veröffentlichungsversion (28)
- Zweitveröffentlichung (9)
- Postprint (3)
Reviewstate
- (Verlags)-Lektorat (23)
- Peer-Review (12)
- Peer-review (1)
Publisher
- de Gruyter (8)
- Institut für Deutsche Sprache (4)
- Leibniz-Institut für Deutsche Sprache (IDS) (3)
- Blackwells (2)
- Erich Schmidt (2)
- Hempen (2)
- IDS-Verlag (2)
- Lexical Computing CZ s.r.o. (2)
- Narr (2)
- Winter (2)
Sprachliche Zweifelsfälle kommen auf allen linguistischen Ebenen vor. Ihre Einordnung erfolgt zumeist nach Systemebene, nach Entstehungsursache oder nach lexematischer Struktur. Sprachlicher Zweifel kann auch nach intra- und interlingualen Aspekten unterschieden werden. Stehen zwei oder mehrere lexikalische Varianten zur Verfügung, kann es zu Unsicherheiten bezüglich des angemessenen Gebrauchs kommen. Nicht nur Muttersprachler*innen sind mit Schwierigkeiten konfrontiert, Zweifelsfälle stellen auch ein Problem bei der Fremdsprachenproduktion dar.
Dieser Band beschränkt sich auf lexikalisch-semantische, flexivische und wortbildungsbedingte Zweifelsfälle und führt interessierte Leser*innen in Fachliteratur und Nachschlagewerke ein. Er streift Fragen der Sprachdidaktik, der Fehler- und Variationslinguistik, denn die Auseinandersetzung mit typischen Zweifelsfällen zeigt auch das Spannungsfeld zwischen allgemeinem Usus und kodifizierter Norm, zwischen Gegenwart und Wandel, zwischen Dynamik, sprachlichem Reichtum und erlernter Bildungstradition.
Unter Neologismen finden sich bedeutungsgleiche Ausdrücke (im weitesten Sinne Synonyme), die unter bestimmten Bedingungen sprachliche Unsicherheiten hervorrufen. Das liegt u. a. an ihrer semantisch-konzeptuellen Ähnlichkeit, an nicht abgeschlossenen Lexikalisierungsprozessen, aber es treten auch Zweifel auf, weil es Unterschiede zwischen der Allgemein- und der Fachsprache gibt. Für einige Neologismen ist es auch charakteristisch, dass mehrere morphologische Varianten gleichzeitig in den Wortschatz eintreten, sodass nicht immer klar ist, wann welche präferiert werden. Dass all diese Ausdrücke lexikalischem Wettbewerb und situationsgebundenen Gebrauchsbedingungen ausgesetzt sind und dass sie zu Zweifel führen können, wird in Onlineforen sichtbar. Dieser Beitrag beschäftigt sich mit der Frage, wie solche Paare/Gruppen korpusgestützt semantisch analysiert und wie sie in deskriptiven Wörterbüchern angemessen beschrieben werden können, um sowohl Gemeinsamkeiten als auch Unterschiede für Nachschlagende sichtbar zu machen. Dazu werden konkrete Beispiele und ein gegenüberstellendes Wörterbuchdarstellungsformat für neologistische Synonyme vorgeschlagen.
This article sketches the development of paronym dictionaries in German. These dictionaries document and describe commonly confused words which cause uncertainties because they are similar in sound, spelling and/or meaning (e.g. effektiv/effizient, sportlich/sportiv). First, an overview of existing reference guides is provided, covering different traditions. Numerous lemma lists have been collected for pedagogical purposes and there has always been an interest in the lexicological treatment of paronyms. However, only a handful of dictionaries covering commonly confused pairs and a small number of genuine paronym dictionaries have ever been compiled. I will focus on lexicographic endeavours, including Wustmann (1891), Müller (1973) and Pollmann and Wolk (2001). Secondly, I will shed light on the differences in descriptions in these dictionaries. This includes how prescriptive approaches have been replaced over time by empirical descriptive accounts and how dictionaries have moved away from restricted, static hardback editions towards dynamic e-dictionaries. Finally, an e-dictionary, “Paronyme — Dynamisch im Kontrast”, is presented with contrastive and flexible two-level consultation views. Its three key elements are its corpus-based foundation, the implementation of meta-lexicographic requirements and a consideration of users’ interests. This dictionary has implemented a user-friendly and dynamic interface and it records conventionalized patterns and preferences in authentic communication.
Since the beginning of the Covid-19 pandemic, about 2000 new lexical units have entered the German lexicon. These concern a multitude of coinings and word formations (Kuschelkontakt, rumaerosolen, pandemüde) as well as lexical borrowings mainly from English (Lockdown, Hotspot, Superspreader). In a special way, these neologisms function as keywords and lexical indicators sketching the development of the multifaceted corona discourse in Germany. They can be detected systematically by corpus-linguistic investigations of reports and debates in contemporary public communication. Keyword analyses not only exhibit new vocabulary, they also reveal discursive foci, patterns of argumentation and topicalisations within the diverse narratives of the discourse. With the help of quickly established and dominant neologisms, this paper will outline typical contexts and thematic references, but it will also identify speakers' attitudes and evaluations.
The public as linguistic authority: Why users turn to internet forums to differentiate between words
(2022)
This paper addresses the question of why we face unsatisfactory German dictionary entries when looking up and comparing two similar lexical terms that are loan words, new words, (near) synonyms, or confusables. It explains how users are aware of existing reference works but still search or post on language forums, often after consulting a dictionary and experiencing a range of dictionary based problems. Firstly, these dictionary based difficulties will be scrutinised in more detail with respect to content, function, presentation, and the language of definitions. Entries documenting loan words and commonly confused pairs from different lexical reference resources serve as examples to show the short comings. Secondly, I will explain why learning about your target group involves studying discussion forums. Forums are a valuable source for detailed user studies, enabling the examination of different communicative needs, concrete linguistic questions, speakers’ intuitions, and people’s reactions to posts and comments. Thirdly, with the help of two examples I will describe how the study of chats and forums had a major impact on the development of a recently compiled German dictionary of confusables. Finally, that same problem solving approach is applied to the idea of a future dictionary of neologisms and their synonyms.
The public as linguistic authority: Why users turn to internet forums to differentiate between words
(2022)
This paper addresses the question of why we face unsatisfactory German dictionary entries when looking up and comparing two similar lexical terms that are loan words, new words, (near)-synonyms, or confusables. It explains how users are aware of existing reference works but still search or post on language forums, often after consulting a dictionary and experiencing a range of dictionary-based problems. Firstly, these dictionary-based difficulties will be scrutinised in more detail with respect to content, function, presentation, and the language of definitions. Entries documenting loan words and commonly confused pairs from different lexical reference resources serve as examples to show the shortcomings. Secondly, I will explain why learning about your target group involves studying discussion forums. Forums are a valuable source for detailed user studies, enabling the examination of different communicative needs, concrete linguistic questions, speakers’ intuitions, and people’s reactions to posts and comments. Thirdly, with the help of two examples I will describe how the study of chats and forums had a major impact on the development of a recently compiled German dictionary of confusables. Finally, that same problem-solving approach is applied to the idea of a future dictionary of neologisms and their synonyms.
„Paronyme – Dynamisch im Kontrast“ ist ein neues und neuartiges Nachschlagewerk für sprachliche Zweifelsfälle und Unsicherheiten. Erstmals werden lautlich, orthografisch und/oder semantisch ähnliche Wörter (z. B. farbig-farblich, kindlich-kindisch, universal-universell, Mehrheit-Mehrzahl) korpusbasiert in ihrem aktuellen Gebrauch untersucht und dokumentiert. Nutzer*innen können sich über die Bedeutung jedes Ausdrucks in zahlreichen Angaben und Verwendungsbeispielen informieren. Dies erfolgt kontrastiv und dynamisch in selbst wählbaren Ausschnitts- oder Vergleichsansichten, im Überblick oder im Detail.
The project “Paronymwörterbuch” investigates and documents easily confused words (so-called paronyms) in German with respect to their use in public discourse as documented in a large corpus. These are, for example, antik/antiquiert/antiquarisch (antique/antiquated/antiquarian) or sportlich/sportiv (sporty/athletic). The results of this work are explanatory, contrastive entries in a new dynamic e-dictionary called “Paronyme − Dynamisch im Kontrast”. The objective of this paper is twofold. Firstly, essential new usage modalities of the new dictionary will be illustrated. As it is designed for contrastive consultation processes, the comparative structure of the entries will be elucidated and we will show how this dictionary has moved away from static to dynamic presentation by incorporating flexible consultation options. Secondly, as entries contain linguistic details which are consistently paired up with conceptual-encyclopaedic information, it is shown how this reference guide combines corpus-based methods with cognitive semantics. In this way, linguistic findings correlate better with how users conceptualise language by adequately reflecting ideas such as conceptual structure, categorisation and knowledge. Consequently, appropriate contrastive corpus tools and methods are employed. This paper also emphasises the need of semiotic approaches to the analysis of linguistic data in order to provide ostensive and cognitive-oriented lexical explanations. Such approaches are also necessary to guarantee an efficient pairwise investigation of paronyms. Advantages and disadvantages of explorative self-organising feature maps will be explained in more detail.
The German e-dictionary documenting confusables Paronyme – Dynamisch im Kontrast contains lexemes which are similar in sound, spelling and/or meaning, e.g. autoritär/autoritativ, innovativ/innovatorisch. These can cause uncertainty as to their appropriate use. The monolingual guide could be easily expanded to become a multilingual platform for commonly confused items by incorporating language modules. The value of this visionary resource is manifold. Firstly, e-dictionaries of confusables have not yet been compiled for most European languages; consequently, the German resource could serve as a model of practice. Secondly, it would be able to explain the usage of false friends. Thirdly, cognates and loan word equivalents would be offered for simultaneous consultation. Fourthly, users could find out whether, for example, a German pair is semantically equivalent to a pair in another language. Finally, it would inform users about cases where a pair of semantically similar words in one language has only one lexical counterpart in another language. This paper is an appeal for visionary projects and collaborative enterprises. I will outline the dictionary’s layout and contents as shown by its contrastive entries. I will demonstrate potential additions, which would make it possible to build up a large platform for easily misused words in different languages.
In gängigen deutschen Wörterbüchern liegen für diskursrelevante Ausdrücke keine angemessenen Beschreibungsformen vor. Darauf haben bereits Strauß, Haß und Harras (1989: 10) in Brisante Wörter von Agitation bis Zeitgeist hingewiesen. Hierfür gibt es unterschiedliche Ursachen, wie beispielsweise zu sehr in der Tradition verhaftete lexikografische Methoden und Datengrundlagen; es liegt aber auch daran, dass nach wie vor häufig in der deutschen Lexikografie Aspekte des Diskurses für die Bedeutungskonstituierung bei gesellschaftspolitischen Schlüsselwörtern unberücksichtigt bleiben. Die Bedeutung konfliktträchtigen Vokabulars (z. B. Ausdrücke wie Globalisierung, Humankapital, Kollateralschaden) kann aber nicht ohne diskurssemantische Erklärungen beschrieben werden, da es in seinem Gebrauch Zeit-, Kultur und Mentalitätsgeschichte reflektiert und die Sprechergemeinschaft bezüglich ihrer Einstellung zu solchen Ausdrücken spaltet. In diesem Beitrag soll dargestellt werden, welche Rolle die sprachwissenschaftliche Diskursanalyse bei der Bedeutungserfassung spielen kann, und wie unterschiedliche Bewertungen und inhaltliche Thematisierungen seitens der Sprechergemeinschaft beim Gebrauch brisanter Begriffe in der öffentlichen Kommunikation zum Ausdruck kommen. Mithilfe einer konkreten linguistisch-diskursorientierten Untersuchung des Ausdrucks Globalisierung soll die enge Verflechtung von Sprachanalyse mit Zeit- und Kulturgeschichte verdeutlicht werden.
Die Ordnung des öffentlichen Diskurses der Wirtschaftskrise und die (Un-)Ordnung des Ausgeblendeten
(2011)
This paper focuses on easily confused items (so-called paronyms) in German in terms of their general, technical or academic contextual uses. It outlines the semantic discrepancies between contextual usages of pairs such as Methode/Methodologie/Methodik and unehelich/nichtehelich/außerehelich depending on their linguistic registers and varieties. While previous studies lack empirical evidence and primarily operate with morphological criteria (cf. Lăzărescu 1999) the descriptions here derive from corpus-based examinations of general written and of technical discourse. It is shown that causes of lexical confusion arise from formal, phonetic resemblances or semantic similarities, regular co-occurrence, incorrect morphological analogies and political governance of language. Context, knowledge, associations and experience determine the choice of lexical terms. Speakers need to apply linguistic and extra-linguistic principles in order to create adequate contexts. With the help of paronym examples and corpus data, these will be elucidated in more detail.
Dieser Beitrag zeigt, inwieweit im Projekt „Paronymwörterbuch“ korpuslinguistische und kognitiv-semantische Elemente bei der Entwicklung einer neuen Online-Ressource berücksichtigt wurden. Damit sollen lexikologische und lexikografische Aspekte miteinander erfolgreich verbunden und die Kluft zwischen linguistischer Theorie und redaktioneller Praxis etwas geschlossen werden. Konzeptuell ausgerichtete Angaben, die linguistische und enzyklopädische Informationen eng miteinander verknüpfen, werden in Korpusdaten ermittelt, interpretiert und z. T. abstrahiert. Sprachliches und außersprachliches Wissen lassen sich gemeinsam abspeichern. Dadurch ist es möglich, kontextuell abhängige sprachliche Informationen mit konzeptuellen Realisierungen und mit diskursiv-thematischen Besonderheiten zusammen nachzuschlagen. Darüber hinaus werden in diesem Beitrag anhand eines Beispiels wichtige dynamische Funktionalitäten des neuen Nachschlagewerkes „Paronyme – Dynamisch im Kontrast“ vorgestellt. So wird gezeigt, wie Artikelanordnungen variieren und verschiedene Perspektiven auf linguistische Phänomene eingenommen werden können. Um Informationen bedarfsgerecht und interessenspezifisch abrufen zu können, wurde eine multifunktionale Ressource geschaffen, die sehr flexibel auf verschiedene Nachschlagesituationen reagieren kann und den Bedürfnissen der Nutzer/innen gerechter wird.
Der Beitrag führt in das Sonderheft „Paronymie im deutschen Sprachgebrauch“ ein und bündelt gewonnene Einblicke in die lexikologische, korpusanalytische sowie lexikografische Arbeit des Projektes „Paronymwörterbuch“. Er stellt wichtige Erkenntnisse zu Paronymen, ihrem Vorkommen, ihrer Ermittlung und Darstellung, aber auch zu den Methoden der Bedeutungsanalyse, ihren diskursiven Funktionen und dem Umgang mit Verwechslungspotenzial zusammenfassend dar. Vorgestellt werden Forschungsergebnisse, die sich vor allem auf die Verwendung von Paronymen in der öffentlichen Gebrauchssprache beziehen. Aber auch explorative Korpusverfahren werden erläutert sowie innovative, dynamische e-lexikografische Darstellungen präsentiert. Ausgewählte Probleme, die sowohl im Kontext der theoretischen Auseinandersetzung als auch mit der redaktionellen Erfassung von Paronymen auftreten, werden hier diskutiert. Das Sonderheft verbindet dabei theoretische und praktische lexikografische Herangehensweisen an ein bisher linguistisch wenig dokumentiertes Phänomen, das Muttersprachler/innen und Fremdsprachenlernende gleichermaßen verunsichert. Neben den Rückblicken werden ebenso die Ausblicke auf die kommenden Jahre und die damit verbundenen Fragestellungen des Projektes skizziert.
This paper discusses changes of lexicographic traditions with respect to approaches to meaning descriptions towards more cognitive perspectives. I will uncover how cognitive aspects can be incorporated into meaning descriptions based on corpus-driven analysis. The new German Online dictionary “Paronyme − Dynamisch im Kontrast” (Storjohann 2014; 2016) is concerned with easily confused words such as effektiv/effizient, sensibel/sensitiv. It is currently in the process of being developed and it aims at adopting a more conceptual and encyclopaedic approach to meaning by incorporating cognitive features. As a corpus-guided reference work it strives to adequately reflect ideas such as conceptual structure, categorisation and knowledge. Contrastive entries emphasise aspects of usage, comparing conceptual categories and indicate the (metonymic) mapping of knowledge. Adaptable access to lexicographic details and variable search options offer different foci and perspectives on linguistic information, and authentic examples reflect prototypical structures. Some of the cognitive features are demonstrated with the help of examples. Firstly, I will outline how patterns of usage imply conceptual categories as central ideas instead of sufficiently logical criteria of semantic distinction. In this way, linguistic findings correlate better with how users conceptualise language. Secondly, it is pointed out how collocates are treated as family members and fillers in contexts. Thirdly, I will demonstrate how contextual structure and functions are included summarising referential information. Details are drawn from corpus data, they are usage-based linguistic patterns illustrating conversational interaction and semantic negotiations in contemporary public discourse. Finally, I will outline consultation routines which activate different facets of structural knowledge, e.g. through changes of the ordering of information or through the visualisation of semantic networks.
In this paper, we will present a first attempt to classify commonly confused words in German by consulting their communicative functions in corpora. Although the use of so-called paronyms causes frequent uncertainties due to similarities in spelling, sound and semantics, up until now the phenomenon has attracted little attention either from the perspective of corpus linguistics or from cognitive linguistics. Existing investigations rely on structuralist models, which do not account for empirical evidence. Still, they have developed an elaborate model based on formal criteria, primarily on word formation (cf. Lăzărescu 1999). Looking from a corpus perspective, such classifications are incompatible with language in use and cognitive elements of misuse.
This article sketches first lexicological insights into a classification model as derived from semantic analyses of written communication. Firstly, a brief description of the project will be provided. Secondly, corpus-assisted paronym detection will be focused. Thirdly, in the main section the paper concerns the description of the datasets for paronym classification and the classification procedures. As a work in progress, new insights will continually be extended once spoken and CMC data are added to the investigations.
In diesem Beitrag soll der Frage nachgegangen werden, ob sich feministische Indefinitpronomen, insbesondere die Neuschöpfung frau, in ihrem Gebrauch außerhalb der feministischen Sprachbetrachtung und außerhalb frauenspezifischer Diskurse etabliert haben. Auf der Basis der IDS-Korpora wird der öffentliche Sprachgebrauch neuer Pronomen hinsichtlich ihres Vorkommens sowohl quantitativ als auch qualitativ ausgewertet, um Aussagen zur Gebrauchsentwicklung treffen zu können. Mithilfe eines korpusanalytischen Werkzeugs werden linguistische Strukturen aufgedeckt, die Verwendungstypisches im Gebrauch des Lexems frau illustrieren. Besonderes Augenmerk erhält die diachrone Untersuchung der kontextuellen Einbettungen des Lexems frau. Dabei spielt sowohl die Extrahierung syntagmatischer Mitspieler mithilfe der softwaregestützten Kollokationsanalyse als auch die linguistische Analyse der Relationen zwischen Begleitwort und Suchwort eine besondere Rolle. Darüber hinaus sollen auch pragmatische und syntaktische Aspekte eruiert sowie Fragestellungen der allgemeinsprachlichen Bewertung feministischer Indefinitpronomen nachgegangen werden.
Lexicographic meaning descriptions of German lexical items which are formally and semantically similar and therefore easily confused (so-called paronyms) often do not reflect their current usage of lexical items. They can even contradict one’s personal intuition or disagree with lexical usage as observed in public discourse. The reasons are manifold. Language data used for compiling dictionaries is either outdated, or lexicographic practice is rather conventional and does not take advantage of corpus-assisted approaches to semantic analysis. Despite of various modern electronic or online reference works speakers face uncertainties when dealing with easily confusable words. These are for example sensibel/sensitiv (sensitive) or kindisch/kindlich (childish/childlike). Existing dictionaries often do not provide satisfactory answers as to how to use these sets correctly. Numerous questions addressed in online forums show where uncertainties with paronyms are and why users demand further assistance concerning proper contextual usage (cf. Storjohann 2015). There are different reasons why users misuse certain items or mix up words which are similar in form and meaning. As data from written and more spontaneous language resources suggest, some confusions arise due to ongoing semantic change in the current use of some paronyms. This paper identifies shortcomings of contemporary German Dictionaries and discusses innovative ways of empirical lexicographic work that might pave the way for a new data-driven, descriptive reference work of confusable German terms. Currently, such a guide is being developed at the Institute for German Language in Mannheim implementing corpora and diverse corpus-analytical methods. Its objective is to compile a dictionary with contrastive entries which is a useful reference tool in situation of language doubt. At the same time, it aims at sensitizing users of context dependency and language change.
Der Beitrag fasst die Schritte einer Projektvorstellung und aktuelle Reflexionen über ein am Institut für Deutsche Sprache in Mannheim neues, korpusgestütztes Paronymwörterbuch zusammen. Zunächst wird der Begriff der Paronymie in einer Arbeitsdefinition eingegrenzt und es wird gezeigt, welche Lücke mit dem neuen Werk in der Wörterbuchlandschaft geschlossen wird. Im Anschluss werden ausgewählte methodische Aspekte sowie Fragen der Wortartikelinhalte und -präsentation skizziert.
Typische Verwendungen
(2005)
This paper shows how corpora and related tools can be used to analyse and present significant colligational patterns lexicographically. In German, patterns such as das nötige Wissen vermitteln and sein Wissen unter Beweis stellen play a vital role when learning the language, as they exhibit relevant idiomatic usage and lexical and syntactic rules of combination. Each item has specific semantic and grammatical functions and particular preferences with respect to position and distribution. An analysis of adjectives, for example, identifies preferences in adverbial, attributive, or predicative functions.
Traditionally, corpus analyses of syntagmatic constructions have not been conducted for lexicographic purposes. This paper shows how to utilise corpora to extract and examine typical syntagms and how the results of such an analysis are documented systematically in ELEXIKO, a large-scale corpus-based Internet reference work of German. It also demonstrates how this dictionary accounts for the lexical and grammatical interplay between units in a syntagm and how authentic corpus material and complementary prose-style usage notes are a useful guide to text production or reception.
Paradigmatische Relationen
(2005)
Diachrone Angaben
(2005)
This article provides an introduction to elexiko, the first German hypertext dictionary to be compiled on a corpus basis, which is currently being developed at the Institut für Deutsche Sprache Mannheim (IDS). First, a brief account of the design is given, followed by a demonstration of the methods and tools that are being employed to compile it. elexiko will provide not only an improved quantity of lexical information, but also a new quality of information which will be explained and illustrated at different levels of the microstructure of the dictionary. The description of word meaning and use in elexiko will be presented in detail, with a particular focus on the treatment of collocations, ambiguity, vagueness, and the presentation of senses. The development of a theoretically grounded procedure for lexicographic disambiguation is also described. This is then followed by a brief account of the treatment of grammatical details. Finally, issues of usability, the progress of the project and its future perspectives will be considered.
Incompatibility (or co-hyponymy) is the most general type of semantic relation between lexical items, the meaning of which entails exclusion. Such items fall under a superordinate term or concept and denote sets which have no members in common (e.g. animal: dog-cat-mouse-lion-sheep; example from Cruse 2004). Traditionally, these have been of interest to lexical semanticists for the description of the structure of the lexicon. However, incompatibility is not just a relation that signifies a difference of meaning. This paper is a critical corpus-assisted re-evaluation of the phenomenon of incompatibility which argues that the relation in question sometimes also functions as a discourse marker. Incompatibles indicate recurrent intertextual patterns. This holds particularly true for socially or politically controversial lexical items such as Flexibilität (flexibility), Mobilität (mobility) or Globalisierung (globalisation). Corpus investigations of such words have revealed that among other semantically related terms, incompatibles have a crucial discourse focussing function. For the German lexical item Globalisierung, I will show how its lexical usage can be studied through a corpus-driven analysis of corresponding incompatibles. Incompatible terms are not contingent co-words but often occur in close contextual proximity and participate in regular syntagmatic structures (e.g. Globalisierung und Rationalisierung; Globalisierung und Modernisierung; Neoliberalismus, Globalisierung und Kapitalismus). Hence, these are easily extracted by conducting a computational collocation analysis. Such significant collocates provide a good insight into the discursive and thematic contexts of the search word. Following Teubert (2004), I will demonstrate how the meaning of such lexical items is constituted in discourse and how the examination of these particular collocates reveals their sense-constructing function and their pragmatic-discursive force. I will provide a brief discussion of the methodology used for such analyses, and I will explain why the complex semantic-pragmatic and thematic-communicative patterns implied in sets of incompatibles should be given a stronger emphasis in lexicography.
Mit diesem Papier sollen LexikografInnen an ein Automatisierungstool der Textanalyse innerhalb der Korpuslinguistik herangeführt werden. Das am IDS entwickelte statistische Recherche- und Analysewerkzeug Cosmas bietet neue Zugänge zur Gewinnung semantischer Informationen über Wörter. Die Nutzungsmöglichkeiten dieses Instrumentariums für die Lesartendisambiguierung von Lexemen und deren Verifizierung mittels Kollokations- und Kontextanalyse werden erläutert, und anhand des Beispiels cool wird gezeigt, inwieweit sich semantische Informationen durch automatische Statistik extrahieren lassen. Dabei wird auf die Vor- und Nachteile der computerbasierten Analyse eingegangen. Darüber hinaus wird dargestellt, wie empirische lexikografische Disambiguierung modellgeleitet validiert werden kann. Um die Unterschiede zwischen herkömmlichen Beschreibungsmöglichkeiten und neuen statistischen Verfahren zu verdeutlichen, werden die Lesarten zu cool, wie sie im Duden GWDS (2000) dargestellt sind, mit den identifizierten Lesarten der Analyse mit Cosmas verglichen.
In this paper, general problems with easily confused words among a language community are addressed. Serving as an example, the difficulties of semantic differentiation between the use of German sensibel and sensitiv are discussed. One the one hand, the question is raised as to how a speech community faces challenges of semantic shifts and how monolingual dictionaries document lexical items with similar semantic aspects. On the other hand, I will demonstrate the discrepancies of information on meaning as retrieved and interpreted from large corpus data. It will be shown how the semantics of words change and hence cause confusion among speakers. As a result, empirical evidence opens up several questions concerning the prescriptive vs. descriptive treatment of paronymic items such as sensibel/sensitiv and it demands different approaches to the lexicographic description of such words in future reference works.
Kontextuelle lexikalische Relationen, insbesondere Sinnrelationen, sind für Sprachinteressierte bei der Textproduktion von besonderem Interesse. Dennoch sind Informationen über diese Wortschatzstrukturen in vielen einsprachigen Wörterbüchern häufig auf Angaben der Synonymie oder Antonymie beschränkt und ihre Beschreibung bzw. Darstellung nur bedingt nutzbar. ELEXIKO, das erste Internetwörterbuch und Informationssystem der deutschen Gegenwartssprache, das ausschließlich korpusgestützt erarbeitet wird, bietet eine differenziertere Präsentation und Beschreibung paradigmatischer Relationen und nutzt unterschiedliche korpusgestützte Verfahren, um sprachliche Daten aus dem zugrunde liegenden Korpus zu extrahieren. Diese Verfahren bringen z. T. neue Erkenntnisse über Wortschatzstrukturen, für die in der Lexikografie nach neuen Beschreibungs- und Darstellungsformen gesucht werden muss. Dieser Beitrag beschäftigt sich mit folgenden Fragen: Welche Vorteile bietet die korpusgestützte Lexikografie hinsichtlich der Untersuchung paradigmatischer Sinnrelationen und wie setzt ELEXIKO Erkenntnisse korpusgestützter Studien lexikografisch um? Welche wesentlichen Unterschiede gibt es zu anderen Wörterbüchern, die Wortschatzstrukturen beschreiben? Kritisch werden vor allem folgende Aspekte untersucht: Wie bedeutungsgleich sind Synonyme und wie gegensätzlich sind die in Antonymiewörterbüchern gebuchten Gegensatzwörter wirklich?
The presentation and description of paradigmatic sense relations in German dictionaries is often limited to types such as synonymy and antonymy. Their information is neither well presented nor helpful for users. Although corpora offer fundamental methodological advantages, various corpus-guided approaches have not played an important role in extracting and describing paradigmatic relations in German lexicography so far. elexiko is a hypertext dictionary that explores a corpus to extract language data for the description of paradigmatic lexical relations. 1 will show how sense relations can be extracted systematically by employing both a corpus-driven and a complementary corpus-based approach. I will demonstrate how corpus data validates or challenges information in existing dictionaries and that in some cases lexicographic categories are not appropriate to capture specific linguistic phenomena with respect to sense-related items. Subsequently, an alternative method of extracting, describing, and presenting sense relations will be presented.
German lexical items with similar or related morphological roots and similar meaning potential are easily confused by native speakers and language learners. These include so-called paronyms such as effektiv/effizient , sensitive/sensibel, formell/formal/förmlich . Although these are generally not regarded as synonyms, empirical studies suggest that in some cases items of a paronym set have undergone meaning change and developed synonymous notions. In other cases, they remain similar in meaning, but show subtle differences in definition and restrictions of usage. Whereas the treatment of synonyms has received attention from corpus-linguists (cf. Partington 1998; Taylor 2003), the subject of paronyms has not been revisited with empirical, data-driven methods neither in terms of semantic theory nor in terms of practical lexicography. As a consequence, we also need to search for suitable corpus methods for detailed semantic investigation. Lexicographically, some German paronyms have been documented in printed dictionaries (e.g. Müller 1973; Pollmann & Wolk 2010). However, there is no corpus-assisted reference guide describing paronyms empirically and enabling readers to find the correct contemporary usage. Therefore, solutions to some lexicographic challenges are required.
Dieser Beitrag beleuchtet die Vor- und Nachteile korpusgestützter lexikografischer Methoden zur Ermittlung und Dokumentation sinnrelationaler Ausdrücke eines Stichwortes. Konkrete Beispiele aus der Praxis des elexiko-Wörterbuchs dienen der Veranschaulichung von Chancen als auch von konkreten Problemen, die die eingesetzten Methoden mit sich bringen. Für die Gewinnung potentieller Synonyme und Antonyme nutzt elexiko zwei unterschiedliche Verfahren, die mit verschiedenen Prämissen an ein Korpus als Datengrundlage herantreten (cf. Tognini-Bonelli 2001). Das korpusgesteuerte / korpusgeleitete Verfahren der Kollokationsanalyse und die zugrunde liegende Ermittlung von Ausdrücken mit verwandten Kollokationsprofi len (related profiles) (cf. Belica 2011) dienen der empirischen und statistischen Absicherung von sprachlichen Phänomenen. Sie erweisen sich aber als lückenhaft in Bezug auf einige Kontexte, in denen semantisch-konzeptuelle Beziehungen der Ähnlichkeit oder des Gegensatzes realisiert, aber nicht mit Korpustools erfasst werden. Mit der Anwendung der in elexiko komplementär genutzten korpusbasierten Vorgehensweise können diese Lücken teilweise gefüllt werden. Das Zusammenspiel beider Korpusansätze hat sich in der lexikografischen Praxis prinzipiell als vorteilhaft erwiesen, bringt jedoch auch Erkenntnisse zum Vorschein, die bisher weder linguistisch erfasst noch lexikografisch dokumentiert wurden und löst nicht, wie teilweise angenommen, das Problem inhaltlicher Inkonsistenzen (cf. Paradis/Willners 2007). Diese Aspekte werden anhand von konkreten Korpusbeispielen und Wörterbucheinträgen illustriert. Als Online-Wörterbuch profitiert elexiko von seinen schnellen Navigationsmöglichkeiten über Verlinkungen. Diese werden auch für sinnrelationale Partnerwörter wie Synonyme und Antonyme angelegt, um diverse Vernetzungsstrukturen nachvollziehbar zu machen. Die Arbeit mit einem Korpus kann bis zu einem gewissen Grad die Konsistenz der bidirektionalen Vernetzungen gewährleisten, sie aber nicht vollständig absichern. In diesem Beitrag wird auch die Frage beantwortet, inwieweit die erwähnten Korpusmethoden dazu beitragen, das gegenseitige Dokumentieren zwischen Synonym- oder Antonympaaren sicherzustellen. Anhand des für diese Zwecke entwickelten Tools vernetziko, einem Vernetzungsmanager, wird gezeigt, warum die Unterstützung zusätzlicher Software für eine konsistente Verlinkung zwischen paradigmatisch miteinander verbundenen Stichwörtern unerlässlich ist(Storjohann/Meyer 2012).
In this paper, we address issues of inconsistencies of dictionary information and how different corpus methods and computer tools can assist in providing systematic cross-referencing. The question is raised how hyperlinking in an electronic reference work can be approached systematically in order to warrant consistent symmetrical links between synonyms or antonyms. Firstly, it is argued that working with a comprehensive corpus does not account for consistent cross-referencing. It is shown that a top-down corpus-driven linguistic analysis also does not guarantee the lexicographic documentation of binary lexico-semantic relations covered by corpus data, as proposed by Paradis/Willners (2006a, b). Secondly, with the help of dictionary examples taken from elexiko (an online dictionary of contemporary German) we demonstrate how a combination of both corpus-driven and corpus-based procedures enables lexicographers to systematically exploit corpus material in more depth than by using only one of these methods. It is also discussed where and why lexicographers are still prone to inconsistencies in the editing processes, irrespective of their underlying corpus methodologies. Finally, we introduce a cross-reference management tool that has been developed for elexiko and we explain its technological prerequisites and implications. This software supports lexicographers in detecting existing and missing references from and to a specific headword. It also offers options to automatically and comfortably correct discrepancies. Overall, we suggest a method that includes linguistic competence, complementary corpus approaches and additional software in order to ensure that links or references between synonymic and antonymic pairings are given in both directions.
Dieser Beitrag beleuchtet lexikalische Ausdrücke näher, die in einer Lesart durch eine synonyme Relation verbunden sind. Im Vordergrund steht die korpusgestützte Untersuchung paradigmatischer Kontextanpassung dieser Relationspaare. Es wird gezeigt, wie diese Sinnrelation insbesondere innerhalb einer Lesart kontextuell variieren kann oder spezifiziert wird und wie anhand von Korpusdaten diese variierenden Strukturen lexikologisch erfasst und lexikografisch beschrieben werden können. Diese Beobachtungen entstanden auf der Basis der Wörterbucharbeit im Projekt elexiko und stellen erste Ergebnisse hinsichtlich variabler paradigmatischer Strukturen dar, die auf der Basis eines umfangreichen Korpus, des für lexikografische Zwecke zusammengestellten elexiko Korpus,gewonnen wurden Es wird dargestellt, wie Korpusbeobachtungen hinsichtlich synonymer Variabilität im Projekt elexiko lexikografisch umgesetzt werden. Dabei soll verdeutlicht werden, wie man ein Synonymwörterbuch gebrauchsorientierter gestalten kann, wie sich neu gewonnene Korpuserkenntnisse lexikografisch einarbeiten lassen und wie dabei gleichzeitig nach angemessenen Präsentationsformen gesucht werden muss.
In diesem Beitrag werden wichtige Neukonzeptionen und umfangreiche Nachbearbeitungen einzelner
Angabebereiche in elexiko erläutert. Die linguistische Konzeption dieser Angaben stellt eine Weiterentwicklung gegenüber der Konzeption dar, wie sie im Band „Grundfragen der elektronischen Lexikographie. elexiko – das Online-Informationssystem zum deutschen Wortschatz“ (2005) vorgelegt wurde. Betroffen sind z.B. die Angabebereiche der typischen Verwendungen, der sinn- und sachverwandten Wörter und der Besonderheiten des Gebrauchs.