Refine
Year of publication
Document Type
- Part of a Book (4500)
- Article (2966)
- Book (996)
- Conference Proceeding (688)
- Part of Periodical (308)
- Review (257)
- Other (151)
- Working Paper (83)
- Doctoral Thesis (68)
- Report (35)
Language
- German (8078)
- English (1765)
- Russian (145)
- French (38)
- Multiple languages (22)
- Spanish (16)
- Portuguese (14)
- Italian (9)
- Polish (7)
- Ukrainian (5)
Keywords
- Deutsch (5140)
- Korpus <Linguistik> (940)
- Wörterbuch (605)
- Konversationsanalyse (451)
- Rezension (423)
- Grammatik (405)
- Rechtschreibung (374)
- Gesprochene Sprache (361)
- Sprachgebrauch (356)
- Interaktion (339)
Publicationstate
- Veröffentlichungsversion (3883)
- Zweitveröffentlichung (1642)
- Postprint (395)
- Preprint (10)
- Erstveröffentlichung (8)
- Ahead of Print (7)
- (Verlags)-Lektorat (4)
- Hybrides Open Access (2)
- Verlags-Lektorat (1)
- Verlagsveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (3836)
- Peer-Review (1596)
- Verlags-Lektorat (94)
- Peer-review (56)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (44)
- Review-Status-unbekannt (14)
- Peer-Revied (12)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (10)
- (Verlags-)Lektorat (9)
- Verlagslektorat (5)
Publisher
- de Gruyter (1334)
- Institut für Deutsche Sprache (1091)
- Schwann (638)
- Narr (484)
- Leibniz-Institut für Deutsche Sprache (IDS) (263)
- De Gruyter (245)
- Niemeyer (200)
- Lang (184)
- Narr Francke Attempto (170)
- IDS-Verlag (144)
Die sprachlichen Auffälligkeiten, die in Gedichten zu beobachten sind, haben immer wieder Anlass zu verschiedenen Versionen der Abweichungstheorie gegeben, derzufolge die in Gedichten verwendete Sprache von nicht-lyrischer Sprache abweicht. Expressionistische Lyrik ist insbesondere für ihre argumentstrukturellen Innovationen bekannt. Auf der Basis eines Korpus expressionistischer Gedichte wird eine Übersicht über diese Auffälligkeiten gegeben, die die Grundlage für weitere Studien darstellen soll, in denen zu zeigen sein wird, inwieweit unter bestimmten grammatiktheoretischen Annahmen die Abweichungstheorie zurückgewiesen werden kann.
У дисертації розроблено нову теоретико-методологічну концепцію для виконання когнітивно-дискурсивної реконструкції комунікативних девіацій в українсько- і німецькомовних відеоінтерв’ю. Обґрунтовано статус відеоінтерв’ю як інтегрованого мовленнєвого жанру, який включає теле- і спеціальні інтерв’ю, збережені на відеохостингу YouTube в мережі Інтернет. Уточнено визначення поняття “комунікативної девіації” на тлі суміжних термінів як динамічного й складного когнітивно-дискурсивного явища. Реконструйовано причини виникнення комунікативних девіацій і побудовано їхню модель, характерну для українсько- та німецькомовних відеоінтерв’ю. Результати дисертації можна застосовувати у зіставно-типологічних дослідженнях, у дослідженнях із теорії мови, психо- і соціолінгвістики, лінгвопрагматики, когнітивної і комунікативної лінгвістик, методології мовознавства, у курсах зіставного мовознавства, загального мовознавства, теоретичної граматики німецької мови, сучасної української літературної мови, а також у викладанні відповідних навчальних дисциплін. Підсумки дослідження можуть бути також корисними для представників мас-медійної сфери, фахівців, які спеціалізуються у галузі теорії комунікації, а також представників сфери соціальних комунікацій, дипломатичних служб, державних і приватних інституцій різного профілю з метою запобігання конфліктним ситуаціям і покращення соціальної та міжкультурної комунікації.
Following the successes of the ninth conference in 2022 held in the wonderful Santiago de Compostela, Spain, we are pleased to present the proceedings of the 10th edition of International Conference on CMC and Social Media Corpora for the Humanities (CMC-2023). The focal point of
the conference is to investigate the collection, annotation, processing, and analysis of corpora of computer-mediated communication (CMC) and social media.
Our goal is to serve as the meeting place for a wide variety of language-oriented investigations into CMC and social media from the fields of linguistics, philology, communication sciences, media
studies, and social sciences, as well as corpus and computational linguistics, language technology, textual technology, and machine learning.
This year’s event is the largest so far with 45 accepted submissions: 32 papers and 13 poster presentations, each of which were reviewed by members of our ever-growing scientific committee. The contributions were presented in five sessions of two or three streams, and a single poster session. The talks in these proceedings cover a wide range of topics, including the corpora construction, digital identities, digital knowledge-building, digitally-mediated interaction, features
of digitally-mediated communication, and multimodality in digital spaces.
As part of the conference, we were delighted to include two invited talks: an international keynote speech by Unn Røyneland from the University of Oslo, Norway, on the practices and perceptions of
researching dialect writing in social media, and a national keynote speech by Tatjana Scheffler from the Ruhr-University of Bochum on analysing individual linguistic variability in social media and
constructing corpora from this data. Additionally, participants could take part in a workshop on processing audio data for corpus linguistic analysis. This volume contains abstracts of the invited talks, short papers of oral presentations, and abstracts of posters presented at the conference.
Funktionsverbgefüge stehen seit jeher in der Sprachkritik, die sich nun auch auf digitale Räume ausbreitet. Vertreten wird dort die These, Funktionsverbgefüge und ihre entsprechenden Basisverben seien äquivalent und könnten in allen Kontexten durch die verbalen Entsprechungen ersetzt werden. Dies kann durch die vorliegende korpusbasierte und textlinguistische Studie am Beispiel des Gefüges Frage stellen widerlegt werden. Anhand eines extensiven Datenmaterials aus den Wikipedia-Artikel-Korpora des IDS zeige ich die semantischen, grammatischen und textlinguistischen Unterschiede zwischen dem Basisverb und dem Funktionsverbgefüge im Gebrauch auf, die sich in der Anreicherung, Verdichtung, Perspektivierung, Gewichtung und Wiederaufnahme von Informationen im Text manifestieren.
Tense, aspect, and mood are grammatical categories concerned with different notional facets of the event or situation conveyed by a given clause. They are prototypically expressed by the verbal system. Tense can be defined as a category that relates points or intervals in time to one another; in a most basic model, those include the time of the event or situation referred to and the speech time. The former may precede the latter (“past”), follow it (“future”), or be simultaneous with it (or at least overlap with it; “present”). Aspect is concerned with the internal temporal constituency of the event or situation, which may be viewed as a single whole (“perfective”) or with particular reference to its internal structure (“imperfective”), including its being ongoing at a certain point in time (“progressive”). Mood, in a narrow, morphological sense, refers to the inflectional realization of modality, with modality encompassing a large and varying set of sub-concepts such as possibility, necessity, probability, obligation, permission, ability, and volition. In the domain of tense, all Germanic languages make a distinction between non-past and past. In most languages, the opposition can be expressed inflectionally, namely, by the present and preterite (indicative). All modern languages also have a periphrastic perfect as well as periphrastic forms that can be used to refer to future events. Aspect is characteristically absent as a morphological category across the entire family, but most, if not all, modern languages have periphrastic forms for the expression of aspectual categories such as progressiveness. Regarding mood, Germanic languages are commonly described as distinguishing up to three such form paradigms, namely, indicative, imperative, and a third one referred to here as subjunctive. Morphologically distinct subjunctive forms are, however, more typical of earlier stages of Germanic than they are of most present-day languages.
Vorwort
(2023)
In this article, we provide an insight into the development and application of a corpus-lexicographic tool for finding neologisms that are not yet listed in German dictionaries. As a starting point, we used the words listed in a glossary of German neologisms surrounding the COVID-19 pandemic. These words are lemma candidates for a new dictionary on COVID-19 discourse in German. They also provided the database used to develop and test the NeoRate tool. We report on the lexicographic work in our dictionary project, the design and functionalities of NeoRate, and describe the first test results with the tool, in particular with regard to previously unregistered words. Finally, we discuss further development of the tool and its possible applications.
Die explorative Studie untersucht anhand von Korpusbelegen, in welchen Fällen satzförmige oder infinitivische propositionale Strukturen bedeutungserhaltend durch Nominalisierungen ersetzbar sind. Auf indirekte Weise soll so ein Zugang auch zur Bedeutung von propositionalen Strukturen selbst eröffnet werden. Die in der Literatur gängige These, dass nur bei einem Teil der Denotatsorten propositionaler Strukturen (von Ereignissen über Tatsachen bis zu ,rein abstrakten Objekten‘) Nominalisierung möglich sei, wird durch die Studie widerlegt. Damit stellt sich auch die Frage nach der Haltbarkeit der gängigen Fassung des Begriffs Proposition selbst. Die von Friederike Moltmann vertretene neue Sichtweise auf Propositionen scheint hingegen auch für Nominalisierungen eine Analyse ohne die bisher auftretenden Widersprüche zu ermöglichen.
This paper has two distinct but interdependent goals. The empirical and analytical primary goal is to present a detailed overview of the patterns of (syntactico-semantic) argument structure and (morpho-syntactic) argument realization found with clause-embedding predicates in German. In particular, it will elucidate the observable relationships and dependencies between them, with a special focus on prepositional object clauses. The methodological secondary goal is to demonstrate the recently published ZAS Database of Clause-Embedding Predicates and illustrate its usefulness in approaching a concrete research agenda. The goals are aligned with each other because the data on patterns of argument structure and realization were collected using the database, and indeed the relevant questions could not have been investigated in such a thorough and efficient way without it. We will begin in Part 1 with an introduction to the database, its structure, and why and how it was created, before moving in Part 2 to the presentation of the data and analysis of argument structure and argument realization.
Reduzierte Parenthesen stehen in einer zweifachen Beziehung zur einschließenden Trägerstruktur. Die Trägerstruktur liefert den propositionalen Gehalt eines internen Arguments, das durch das Prädikat der Parenthese selegiert wird, während die Parenthese wie ein Modifikator in Bezug auf die Trägerstruktur fungiert. Die erstere Relation ist anaphorischer Natur, was durch ein pronominales Leerelement im parenthetischen Satz angemessen modelliert wird. Die letztere Relation lässt sich am besten durch die Sättigung eines externen (referenziellen) Arguments des parenthetischen Satzes durch die Trägerstruktur modellieren – analog zu gewöhnlichen Adverbialsätzen. Die strukturelle Bedingung dieser Relation resümiert dann darin, dass die Parenthese in die terminale Zeichenkette der Trägerstruktur eingeschlossen ist. Die Funktion der Parenthese als Modifikator wiederum ist eine Bedingung für die Lizenzierung des Leerelements innerhalb dieser Parenthese. Diese Erklärung wird durch Parallelen zu Phänomenen in Relativ- und in Vergleichsätzen untermauert.
Vorwort der Herausgeberinnen
(2023)
Die Beiträge in diesem Sammelband sind im Nachgang zur Ars Grammatica Tagung 2018 entstanden, die am 21./22. Juni 2018 mit dem Titel „Theorie und Empirie im Sprachvergleich zum Schwerpunktthema Sachverhalts-/propositionale Argumente“ am Leibniz-Institut für Deutsche Sprache in Mannheim stattfand. Die Konferenz befasste sich mit der übereinzelsprachlichen Variation bei der Realisierung von propositionalen Argumenten bzw. Sachverhaltsargumenten. Dies sind im weitesten Sinne Argumente, die Ereignisse, Propositionen oder Situationen beschreiben und in der Regel als Komplementsätze, Infinitivkomplemente, Gerundivkomplemente oder nominale/nominalisierte Komplemente realisiert werden.
Als Band 12 der Reihe „Studien Deutsch als Fremd- und Zweitsprache“ des Erich Schmidt Verlags ist 2021 Junhong Lis Dissertation mit dem Haupttitel „Aber-Relationen“ erschienen. Wie der Untertitel „Vorkommen und Funktion in DaF-Lehrwerken für Fortgeschrittene und in wissenschaftlichen Texten“ verrät, geht es in dieser Arbeit um eine gewinnbringende Untersuchung der Distribution des Konnektors aber mit Hinblick auf die Optimierung des DaF-Unterrichts. Für die Zwecke der Arbeit werden zwei Korpora aufgebaut: Das erste Korpus (Korpus 1) enthält 551 Belege aus wissenschaftlicher Literatur zum Fach Deutsch als Fremdsprache (161 f.). Das zweite Korpus (Korpus 2) besteht aus 849 Belegen aus 11 DaF-Lehrwerken für erwachsene, fortgeschrittene Deutschlernende (162 ff.).
Lexikalische Diskurspartikeln wie ‚gut‘, ‚schön‘, ‚genau‘, ‚richtig‘, ‚klar‘ etc. mit Äquivalenten in anderen Wortklassen (z.B. als Adjektive) und einem inhärenten semantischen Gehalt sind ein häufiges Phänomen in der gesprochenen Sprache. In ihrem vielfältigen, feinnuancierten Gebrauch tragen sie maßgeblich zur Organisation von Gesprächen bei. Der Fokus dieser empirischen interaktionslinguistischen Untersuchung liegt auf der detaillierten Beschreibung des Formen- und Funktionsspektrums sowie der Verwendungspraktiken von ‚gut‘ und ‚schön‘. Dabei werden funktionale, sequenzielle, prosodische und kombinatorische Regelhaftigkeiten aufgezeigt sowie das Verhältnis zwischen ‚gut/schön‘ und ihren Pendants als Adjektiven diskutiert. Die Verwendungsmerkmale und -bereiche der Diskurspartikeln werden zudem mit prädikativen Formen mit ‚gut/schön‘ verglichen, um die Spezifika und Leistungsfähigkeit von lexikalischen Diskurspartikeln aufzuzeigen und die Formate im Hinblick auf Pragmatikalisierung zu diskutieren.
The landscape of digital lexical resources is often characterized by dedicated local portals and proprietary interfaces as primary access points for scholars and the interested public. In addition, legal and technical restrictions are potential issues that can make it difficult to efficiently query and use these valuable resources. As part of the research data consortium Text+, solutions for the storage and provision of digital language resources are being developed and provided in the context of the unified cross-domain German research data infrastructure NFDI. The specific topic of accessing lexical resources in a diverse and heterogenous landscape with a variety of participating institutions and established technical solutions is met with the development of the federated search and query framework LexFCS. The LexFCS extends the established CLARIN Federated Content Search that already allows accessing spatially distributed text corpora using a common specification of technical interfaces, data formats, and query languages. This paper describes the current state of development of the LexFCS, gives an insight into its technical details, and provides an outlook on its future development.
Komposition als Element nominaler Integration passt zum Sprachtyp des Deutschen. Diese Technik wird in verschiedenen Texttypen in unterschiedlicher Weise genutzt und funktional ausdifferenziert. Zweigliedrige Komposita prägen den alltäglichen Wortschatz. Die Erfahrung damit und ihre formale Offenheit bilden den Grund für spezifische Ausweitungen des Gebrauchs. Das wird gezeigt an der die Öffnung der Muster im literarischen Bereich, dann an der Interaktion von Kompositionstypen im Hinblick auf größtmögliche Explizitheit in juristischen Texten und letztlich an der Mischung von alltäglicher Klassifikation in gängigen Komposita und textfunktionaler Kondensierung in einem Sachtext.
Die in diesem Band versammelten Beiträge zur Jahrestagung 2022 des Instituts für Deutsche Sprache geben einen Überblick zu aktuellen Entwicklungen der Erschließung und Nutzung von Korpora in der germanistischen Linguistik und darüber hinaus. Dabei steht im Vordergrund, wie bekannte und neue Korpora für die Untersuchung verschiedenster linguistischer Fragestellungen, z.B. der Lexikografie, der Gesprächsforschung, des Spracherwerbs oder der historischen Sprachwissenschaft, genutzt werden können.
Im Einzelnen geht es um:
- Korpusangebote und Korpusdesign
- Software für die Arbeit mit Korpora
- Korpusaufbereitung
- den Zusammenhang von Korpusaufbereitung und Forschungsfragestellungen
- ethisch-rechtliche Aspekte der Arbeit mit Korpora
- Anwendungs- und Nutzungsmöglichkeiten von Korpora
Diese Fragen werden im Kontext wissenschaftstheoretischer Überlegungen zur Frage des Nutzens von Korpora für die linguistische Erkenntnisbildung behandelt. Es werden dabei sowohl klassische Schrift- und Tonkorpora, als auch Korpora mit Daten aus anderen Medialitäten (Video und Social Media) vorgestellt. Eine weitere Dimension sind Vergleichskorpora mehrerer Sprachen oder Medialitäten (mündlich vs. schriftlich) sowie diachrone (Vergleichs-)Korpora und der Blick auf nicht-deutschsprachige Korpusangebote.
Die meisten, wenn nicht alle natürlichen Sprachen kennen unterschiedliche Satzarten, die in ihrer grammatischen Form – z. B. Konstituentenfolge, verbale Modi, Vorkommen von Interrogativa, spezifischen Partikeln usw. – und/oder ihrer syntaktischen bzw. pragmatischen Funktion – Satzgliedwert; Aussage-, Frage-, Aufforderungsfunktion usw. – besondere Eigenschaften aufweisen. Eine weit verbreitete Intuition besagt, dass allen Satzarten über formale und funktionale Unterschiede hinweg etwas gemeinsam sein muss, das als satzartunabhängiger Bedeutungskern bestimmt werden kann. Dafür sind unterschiedliche Termini in Umlauf, unter denen der Propositionsbegriff eine prominente Rolle spielt. Der vorliegende Aufsatz betrachtet die Satzarten des Gegenwartsdeutschen. Im Anschluss an Wittgenstein, Frege und Lyons entwickelt er eine Begrifflichkeit, mit der die Bedeutungspotenziale von Satzarten beschrieben und verglichen werden können. Der Propositionsbegriff wird in Anlehnung an Lyons über die Möglichkeit einer Auswertung vor Wissenshintergründen und der darauf fußenden Bewertbarkeit hinsichtlich Wahrheit definiert. Es wird detailliert untersucht, welche Satzarten des Deutschen Propositionen in diesem Sinne ausdrücken müssen oder können und welche dies nicht können. Ferner werden formale Ausdrucksmittel identifiziert, die propositionale Lesarten von Sätzen erzwingen, nahelegen oder ausschließen. Es wird deutlich, dass der gewählte Propositionsbegriff nicht den gemeinsamen Bedeutungskern aller Satzarten erfassen kann. Als solcher wird eine weniger komplexe semantische Einheit bestimmt: die Beschreibung eines Sachverhalts.
The present article proposes a syntactic and semantic analysis of assertive clauses that comprises their truth-conditional aspects and their speech act potential in communication. What is commonly called “illocutionary force” is differentiated into three structurally and functionally distinct layers: a judgement phrase, representing subjective epistemic and evidential attitudes; a commitment phrase, representing the social commitment related to assertions; and an act phrase, representing the relation to the common ground of the conversation. The article provides several pieces of evidence for this structure: from the interpretation and syntactic position of various classes of epistemic, evidential, affirmative and speech act-related operators, from clausal complements embedded by different types of predicates, from embedded root clauses, and from anaphora referring to different clausal projections. The syntactic assumptions are phrased within X-bar theory, and the semantic interpretation makes use of dynamic update of common ground, differentiating between informative and performative updates. The object language is German, with particular reference to verb final and verb second structure.
In diesem Beitrag beschäftigen wir uns mit moralisierenden Sprachhandlungen, worunter wir diskursstrategische Verfahren verstehen, in denen die Beschreibung von Streitfragen und erforderlichen Handlungen mit moralischen Begriffen enggeführt werden. Auf moralische Werte verweisendes Vokabular (wie beispielsweise „Freiheit“, „Sicherheit“ oder „Glaubwürdigkeit“) wird dabei verwendet, um eine Forderung durchzusetzen, die auf diese Weise unhintergehbar erscheint und keiner weiteren Begründung oder Rechtfertigung bedarf. Im Fokus unserer Betrachtungen steht dementsprechend das aus pragma-linguistischer Sicht auffällige Phänomen einer spezifischen Redepraxis der Letztbegründung oder Unhintergehbarkeit, die wir als Pragmem auffassen und beschreiben. Hierfür skizzieren wir zunächst den in der linguistischen Pragmatik verorteten Zugang zu Praktiken der Moralisierung, betrachten sprachliche Formen des Moralisierens und deren kotextuellen und insbesondere pragma-syntaktischen Struktureinbettungen, um anschließend Hypothesen zu kontextuellen Wirkungsfunktionen aufzustellen. Darauf basierend leiten wir schließlich anhand von exemplarischen Korpusbelegen Strukturmuster des Moralisierens ab, die wir in dem Terminus „Pragmem“ verdichten und mittels qualitativer und quantitativer Analysen operationalisieren.
This paper first argues that the distinction between Propositions and States-of-Affairs is significant for understanding a number of linguistic contrasts, including contrasts between nominalizations, complement clauses, readings of modal infinitives, raising constructions, illocutions and moods, relative clauses, and nouns. Subsequently, the paper outlines a cognitive linguistic model of the distinction, according to which Propositions and States-of-Affairs differ in terms of construal. Both prompt Langackerian “processes”, but only Propositions prompt a construal of these processes as referential. The paper argues that this model has a number of advantages over a traditional, denotational understanding of the distinction.
Der vorliegende Aufsatz widmet sich zwei Kategorien der traditionellen (deutschen) Grammatik: dem Aufforderungssatz, einer der fünf klassischen Satzarten, und dem Imperativ, einer Verbform, die als typisch für Aufforderungssätze gilt. Er greift Beobachtungen aus der jüngeren Fachliteratur auf, die ein zunehmendes Unbehagen mit beiden Kategorien erkennen lassen. In morphologischer Hinsicht zeigt sich, dass nur wenige deutsche Verben eine eindeutige Imperativform besitzen. Manche Verben besitzen keine Imperativform. Bei der Mehrzahl der Verben besteht Homonymie zwischen Imperativformen und Konjunktivformen der 3. Person Singular. Imperativformen werden durch Konjunktivformen verdrängt. In syntaktischer Hinsicht wird argumentiert, dass Imperativsyntagmen keine Satzform haben. Satzförmige Ausdrücke mit Konjunktivformen, die für auffordernde Handlungen stehen, können als Wunschsätze kategorisiert werden. Als Aufforderungssätze bleiben zwei Klassen von Syntagmen im Grenzbereich zwischen nicht-satzförmigen und satzförmigen Ausdrücken übrig, die besondere Eigenschaften hinsichtlich Subjektbesetzung und Subjekt-Verb-Kongruenz zeigen.
Orthographie ist ein Thema, das spätestens seit der Rechtschreibreform 1996 nicht nur die wissenschaftliche Forschung, sondern auch den öffentlichen Diskurs entscheidend geprägt hat. Aus Anlass von „20 Jahren Rat für deutsche Rechtschreibung“ war dieses Thema auch Gegenstand der 59. Jahrestagung des Leibniz-Instituts für Deutsche Sprache.
Die Ars Grammatica-Tagungen am Leibniz-Institut für Deutsche Sprache befassen sich mit aktuellen Themen der linguistischen Forschung, denen sich die Abteilung Grammatik in Einzelprojekten widmet. Dieser Band ist aus der Tagung „Theorie und Empirie im Sprachvergleich“ hervorgegangen und thematisiert die übereinzelsprachliche Variation bei der Realisierung von propositionalen (Sachverhalts-)Argumenten. Es handelt sich dabei im weitesten Sinne um Argumente, die Ereignisse, Propositionen oder Situationen beschreiben und in der Regel als Komplementsätze, Infinitivkomplemente, Gerundivkomplemente oder nominale/nominalisierte Komplemente realisiert werden. Detailarbeiten hierzu befassen sich mit Phänomenen in Einzelsprachen oder Sprachpaaren, doch bei detaillierten Analysen eines Phänomens gerät die Überprüfung der Implikationen für den Sprachvergleich und das Sprachprofil leicht aus dem Blick. Ein Desiderat der Forschung insbesondere im Bereich der Sachverhalts-Argumente ist es daher, Wege zu finden, die Variation detailliert zu analysieren und die Komplexität in der Variation kontrastiv und theoretisch adäquat zu beschreiben.
Äußerungen wie „Ich geh Schule“ oder Ausdrücke wie „lan“ scheinen im Repertoire vieler deutscher Jugendlicher mittlerweile ihren festen Platz zu haben. Zuweilen ist die Aufregung über diese durch Migration ausgelösten Neuerungen groß, da befürchtet wird, dass das kein (richtiges) Deutsch sei. Doch wie jede andere Sprache verändert sich auch das Deutsche ständig. Gesellschaftliche Veränderung, ausgelöst durch Migration, stellt nur eine Ursache dar, die für Sprachwandel verantwortlich ist. Andere Wandlungsprozesse werden etwa aufgrund einer Überlagerung durch eine prestigeträchtigere Sprache, durch friedliche Nachbarschaft über längere Zeiträume oder durch Eroberungen und Besatzungszeiten ausgelöst. Im Zuge der Globalisierung kommen auch verstärkt Prozesse zum Vorschein, die durch gesteigerte Mobilität, Mehrsprachigkeit und neue Kommunikationsmöglichkeiten gekennzeichnet sind.
Diese Monografie setzt sich neu mit Sprachanfragen auseinander. Mit einem kleinen, aber aussagekräftigen Korpus von rund 300 schriftlichen Anfragen zwischen 1997 und 2022 fokussiert sie sich durch viele Detailanalysen auf den Charakter der Anfragenden und die Charakteristik der Anfragen: Wer sind die Anfragenden? Wen fragen sie? Wie fragen sie? Was fragen sie? Warum fragen sie? Und wie hängt all das zusammen?
Die Monografie versteht sich als Anregung vor allem für größer angelegte Studien mit einem größeren, repräsentativen Korpus. Darüber hinaus kann sie Ideengeber sein etwa für soziolinguistische Studien zur Persönlichkeit von Sprachanfragenden, für Studien zum Laiendiskurs über Sprache, zu muttersprachlichen versus nichtmuttersprachlichen Interessen oder zu angefragten Themen: Welche Aspekte der Themen werden erfragt; welche sind relevant, welche sind brisant?
Das Duden-Aussprachewörterbuch ist das Standardwerk zu Fragen der Aussprache und Betonung des Deutschen. Die 8. Auflage wurde um über 4000 Stichwörter erweitert und enthält 144.000 Aussprachen zu Wörtern und Namen, inklusive im Deutschen gebräuchlicher Fremdwörter und fremdsprachlicher Namen. Alle Stichwörter wurden vertont und die Audios sind als Download verfügbar. Ein ausführliches Kapitel beschreibt die Regeln der Lautung und in zahlreichen Infokästen finden sich Informationen zu Aussprachephänomenen wie der Sprechpause beim Gendern. Das Wörterbuch entstand in Zusammenarbeit mit dem Leibniz-Institut für Deutsche Sprache in Mannheim.
Der Beitrag betrachtet movierbare Personenbezeichnungen, die in einem Prädikativum mit Bezug auf ein weibliches Subjekt gebraucht werden (Typ sie ist Käufer/Käuferin). In solchen Fällen ist neben der Verwendung der movierten Personenbezeichnung auch die ihrer maskulinen Basis möglich, wobei zum tatsächlichen Gebrauch der beiden Varianten bisher widersprüchliche Angaben und kaum Daten vorlagen. Diese Untersuchung ergibt, dass die Movierung in der Prädikativkonstruktion seit dem Ahd. der Normalfall war und ist. Allerdings lassen sich einige Nischen ausmachen, in denen unmovierte Bezeichnungen etwas frequenter sind: Der mit Abstand höchste Wert findet sich bei weiblicher Selbstreferenz, während Maskulina bei weiblichen Subjekten der dritten Person Singular mit einer Ausnahme weitgehend unüblich sind. Diese Ausnahme ist der offizielle Sprachgebrauch der damaligen DDR. Öffentlichkeitsgerichtete Texte des 20./21. Jh., die nicht aus der DDR stammen, zeigen einen vermutlich gesellschaftlich bedingten Rückgang der sowieso schon seltenen unmovierten Formen ab Mitte der 1970er-Jahre.
A constructicon, i.e., a structured inventory of constructions, essentially aims at documenting functions of lexical and grammatical constructions. Among other parameters, so-called constructional collo-profiles, as introduced by Herbst (2018, 2020), are conclusive for determining constructional meanings. They provide information on how relevant individual words are for construction slots, they hint at usage preferences of constructions and serve as a helpful indicator for semantic peculiarities of constructions. However, even though collo-profiles constitute an indispensable component of constructicon entries, they pose major challengers for constructicographers: For a constructicographic enterprise it is not feasible to conduct collostructional analyses for hundreds or even thousands of constructions. In this article, we introduce a procedure based on the large language model BERT that allows to predict collo-profiles without having to extensively annotate instances of constructions in a given corpus. Specifically, by discussing the constructions X macht Y ADJP (‘x makes Y ADJ’, e.g. he drives him crazy) and N1 PREP N1 (e.g., bumper to bumper, constructions over constructions), we show how the developed automated system generates collo-profiles based on a limited number of annotated instances. Finally, we place collo-profiles alongside other dimensions of constructional meanings included in the German Constructicon.
Manual für die Kodierung von Fragetypen und Fragesequenztypen im Coaching. Version 1.0 (Mai 2023)
(2023)
Das vorliegende Manual dient der Beschreibung und Bewertung einer coachingspezifischen Typologie von Fragen und, darauf aufbauend, der durch diese Fragen kontextualisierten Fragesequenzen. Mittels eines interdisziplinären psychologischen und linguistisch-gesprächsanalytischen Ansatzes wird ein Rating-Instrument zur qualitativen und quantitativen Erfassung von Fragen und Fragesequenzen im Coachingprozess entwickelt. Ziel ist es, weniger gelingende von besser gelingenden Sequenzen zu unterscheiden. Dabei wird davon ausgegangen, dass gelingende Sequenzen zum Gesamterfolg des Gesprächs beitragen.
Das Gelingen der Fragesequenzen wird mit Hilfe der Responsivität von Coach und Coachee bewertet. Responsivität bezieht sich auf die sprachlichen Handlungen beider Gesprächsteilnehmer*innen (Graf & Dionne 2021) und wird in diesem Manual sowohl auf der Ebene einzelner Sequenzpositionen als auch der Gesamtsequenz verstanden. Die Responsivität der Gesprächsteilnehmer*innen sowie das Gelingen der Fragesequenzen wird in Bezug auf die Organisationsstruktur des Coachinggesprächs betrachtet.
Gegenstand des Manuals sind dyadische Coachinggespräche zwischen Coaches und Coachees aus dem Bereich des berufsbezogenen Coachings. Fragen der Coaches dienen als Ausgangspunkt (target action) (Peräkylä 2019) für die Bildung einer Fragesequenz.
The shortening of linguistic expressions naturally involves some sort of correspondence between short forms and (some portion of) the respective full forms. Based mostly on data from English and Hebrew this article explores the hypothesis that such correspondence concerns necessary sameness of symbolic form, referring either to graphemic or to a specific level of phonological representation. That level indicates a degree of abstractness defined by language-specific contrastiveness (i.e. “phonemic”). Reference to written form can be shown to be highly systematic in certain contexts, including cases where full forms consist of multiple stems. Specific asymmetries pertaining to the targeting of material by correspondence (e.g. initial vs. non-initial position) appear to be alike for both types of representation, a claim supported by a study based on a nomenclature strictly confined to writing (chemical element symbols).
When comparing different tools in the field of natural language processing (NLP), the quality of their results usually has first priority. This is also true for tokenization. In the context of large and diverse corpora for linguistic research purposes, however, other criteria also play a role – not least sufficient speed to process the data in an acceptable amount of time. In this paper we evaluate several state of the art tokenization tools for German – including our own – with regard to theses criteria. We conclude that while not all tools are applicable in this setting, no compromises regarding quality need to be made.
Words and their usages are in many cases closely related to or embedded in social, cultural, technical and ideological contexts. This does not only apply to individual words and specific senses, but to many vocabulary zones as well. Moreover, the development of words is often related to aspects of socio-cultural evolution in a broad sense. In this paper I will have a look at traditional dictionaries and digital lexical systems focussing on the question how they deal with socio-cultural and discourse-related aspects of word usage. I will also propose a number of suggestions how future digital lexical systems might be enriched in this respect.
The public as linguistic authority: Why users turn to internet forums to differentiate between words
(2022)
This paper addresses the question of why we face unsatisfactory German dictionary entries when looking up and comparing two similar lexical terms that are loan words, new words, (near) synonyms, or confusables. It explains how users are aware of existing reference works but still search or post on language forums, often after consulting a dictionary and experiencing a range of dictionary based problems. Firstly, these dictionary based difficulties will be scrutinised in more detail with respect to content, function, presentation, and the language of definitions. Entries documenting loan words and commonly confused pairs from different lexical reference resources serve as examples to show the short comings. Secondly, I will explain why learning about your target group involves studying discussion forums. Forums are a valuable source for detailed user studies, enabling the examination of different communicative needs, concrete linguistic questions, speakers’ intuitions, and people’s reactions to posts and comments. Thirdly, with the help of two examples I will describe how the study of chats and forums had a major impact on the development of a recently compiled German dictionary of confusables. Finally, that same problem solving approach is applied to the idea of a future dictionary of neologisms and their synonyms.
eThis paper first attempts a state-of-the art overview of what is known about women in the history of lexicography up to the early twentieth century. It then focusses more closely on the German and German-English lexicographical traditions to 1900, examining them from three different perspectives (following Russell’s 2018 study of women in English lexicography): women as users and dedicatees of dictionaries; women as contributors to and compilers of lexicographical works; and (in a very preliminary way) women and female sexuality as represented in German/English bilingual dictionaries of the eighteenth and early nineteenth centuries. Russell (2018) was able to identify some 24 dictionaries invoking women as patrons, dedicatees or potential users before 1700, and some 150 works in English lexicography by women between 1500 and 1900, besides the contribution of hundreds of women as supporters and helpers, not least as unpaid readers and sub-editors for the Oxford English Dictionary. Equivalent research in other languages is lacking, but this paper presents some of the known examples of women as lexicographers. The evidence tends to support Russell’s finding for English, that women were more likely to find a place in lexicography outside the mainstream: sometimes in a more private sphere (like Hester Piozzi); often in bilingual lexicography (such as Margrethe Thiele, working on a Danish-French dictionary), including missionary and or colonizing activity (such as Cinie Louw in Africa, Daisy Bates in Australia); and in dialect description (Coronedi Berti in Italy, Luisa Lacal and María Moliner in Spain). Within the German-speaking context, women who participated in lexicographical work themselves are hard to identify before the late nineteenth century, though those few women who did have access to education were often engaged in language learning, including translation activity, and they were likely users of bilingual and multilingual dictionaries. Christian Ludwig’s (1706) English-German dictionary – the first of its kind – was dedicated to the Electoral Princess Sophia of Hanover. Elizabeth Weir may have been the first named female compiler of a German dictionary, with her bilingual New German Dictionary (1888). Rather better known are the cases of Agathe Lasch and Luise Pusch, who, as pioneering women in the field of German linguistics, ultimately led major lexicographical projects documenting German regional varieties in the first half of the twentieth century (Middle Low German and Hamburgish in the case of Lasch; the Hessisch Nassau dialect dictionary in the case of Berthold). In the light of existing research on gender and sexuality in the history of English lexicography (e. g. Iamartino 2010; Turton 2019), I conclude with a preliminary exploration how woman and sexuality have been represented in dictionaries of German and English, taking the words Hure and woman in bilingual German-English dictionaries of the eighteenth and nineteenth centuries as my case studies.
This paper focuses on the treatment of culture bound lexical items in a novel type of online learner’s dictionary model, the Phrase Based Active Dictionary (PAD). A PAD has a strong phraseological orientation: each meaning of a word is exclusively defined in a typical phraseological context. After introducing the relevant theory of realia in translation studies, we develop a broader notion of culture specific lexical items which is more apt to serve the purposes of learner’s lexicography and thus to satisfy the needs of a larger and often undefined target group. We discuss the treatment of such words and expressions in common English learner’s dictionaries and then present various excerpts from PAD entries in English, German, and Italian which display different strategies for coping with cultural contents in the lexicon. Our aim is to demonstrate that the phraseological approach at the core of the PAD model turns out to be extremely important to convey cultural knowledge in a suitable way for users to fully grasp cultural implications in language.
In foreign language teaching the use of dictionaries, especially bilingual, has always been related to the hypotheses concerning the relationship between the native language (L1) and second language acquisition method. If the bilingual dictionary was an obvious tool in the grammar-translation method, it was banned from the classroom in the direct, audiolingual and audiovisual methods. Also in the communicative method, foreign language learners are discouraged from using a dictionary. Its use should not obstruct the goals of communicatively oriented foreign language learning – a view still held by many foreign language teachers. Nevertheless, the reality has been different: Foreign language learners have always used dictionaries, even if they no longer possess a print dictionary and mainly use online resources and applications. Dictionaries and online resources will continue to play an important role in the future. In the Council of Europe’s language policy, with its emphasis on multilingualism and lifelong learning, the adequate use of reference tools as a strategic skill is highlighted. In several European countries, educational guidelines refer to the use of dictionaries in the context of media literacy, both in mother tongue and foreign language teaching. Not only is their adequate use important, but so too is the comparison, assessment and evaluation of the information presented, in order to develop Language Awareness and Language Learning Awareness. This is good news. However, does this mean that dictionaries are actually used in class? What role do dictionaries play in foreign language teaching in schools and universities? Are foreign language learners in the digital era really competent users? And how competent are their teachers? Are they familiar with the current (online) dictionary landscape? Can they support their students? After a more in-depth study of the status quo of dictionary use by foreign language learners and teachers and the gap between their needs and the reality, this contribution discusses the challenges facing lexicographers and meta-lexicographers and what educational policy measures are necessary to make their efforts worthwhile in turning foreign language learners – and their teachers – into competent users in a multilingual and digital world.
The aim of this paper is to show how lexicographical choices reflect ideological thinking, singled out by Eagleton (2007) into the strategies of rationalizing, legitimating, action orienting, unifying, naturalizing and universalizing. It will be carried out by examining two twenty first century editions of each of the five English monolingual learner’s dictionaries published by Cambridge, Collins, Longman, Macmillan, and Oxford. The synchronic and diachronic analyses of the dictionaries and their different editions at the macro structural level (the wordlists) and at the micro structural level (the definitional styles) will show how the reduction and change of data, derived from heterogeneous social and cultural contexts of language use, to abstract essential forms, involves decisions about the central and peripheral aspects of the lexicon and the meaning of words.
Applying terminological methods to lexicography helps lexicographers deal with the terms occurring in general language dictionaries, especially when it comes to writing the definitions of concepts belonging to special fields. In the context of the lexicographic work of the Dicionário da Língua Portuguesa, an updated digital version of the last Academia das Ciências de Lisboa’ dictionary published in 2001, we have assumed that terminology – in its dual dimension, both linguistic and conceptual – and lexicography are complementary in their methodological approaches. Both disciplines deal with lexical items, which can be lexical units or terms. In this paper, we apply terminological methods to improve the treatment of terms in general language dictionaries and to write definitions as a form of achieving more precision and accuracy, and also to specify the domains to which they belong. Additionally, we highlight the consistent modelling of lexicographic components, namely the hierarchy of domain labels, as they are term identification markers instead of a flat list of domains. The need to create and make available structured, organised and interoperable lexicographic resources has led us to follow a path in which the application of standards and best practices of treating and representing specialised lexicographic content are fundamental requirements.
In a multilingual and multicultural society, dictionaries play an important role to enhance interlingual communication. A diversity of languages and different levels of dictionary culture demand innovative lexicographic approaches to establish a dictionary landscape that responds to the needs of the various speech communities. Focusing on the South African situation this paper discusses some aspects of a few dictionaries that contributed to an improvement of the local dictionary landscape. Using the metaphors of bridges, dykes and sluice gates it is shown how lexicographers need a balanced approach in their lemma selection and treatment. Whilst a too strong prescriptive approach can be to the detriment of the macrostructural selection, a lack of regulatory criteria could easily lead to a data overload. The lexicographer should strive to give a reflection of the actual language use and enable the users to retrieve the information that can satisfy their specific communication and cognitive needs. Such lexicographic products will enrich and improve the dictionary landscape.
Phonesthemes (Firth 1930) are sublexical constructions that have an effect on the lexico-grammatical continuum: they are recurring form-meaning associations that occur more often than by chance but not systematically (Abramova/Fernandez/Sangati 2013). Phonesthemes have been shown (Bergen 2004) to affect psycholinguistic language processing; they organise the mental lexicon. Phonesthemes appear over time to emerge as driven by language use as indexical rather than purely iconic constructions in the lexicon (Smith 2016; Bergen 2004; Flaksman 2020). Phonesthemes are acknowledged in construction morphology (Audring/Booij/Jackendoff 2017) as motivational schemas. Some phonesthemes also tend to have lexicographic acknowledgment, as shown by etymologist Liberman (2010), although this relevance and cohesion appears to be highly variable as we will show in this paper.
This paper describes a method for extracting collocation data from text corpora based on a formal definition of syntactic structures, which takes into account not only the POS-tagging level of annotation but also syntactic parsing (syntactic treebank model) and introduces the possibility of controlling the canonical form of extracted collocations based on statistical data on forms with different properties in the corpus. Specifically, we describe the results of extraction from the syntactically tagged Gigafida 2.1 corpus. Using the new method, 4,002,918 collocation candidates in 81 syntactic structures were extracted. We evaluate the extracted data sample in more detail, mainly in relation to properties that affect the extraction of canonical forms: definiteness in adjectival collocations, grammatical number in noun collocations, comparison in adjectival and adverbial collocations, and letter case (uppercase and lowercase) in canonical forms. The conclusion highlights the potential of the methodology used for the grammatical description of collocation and phrasal syntax and the possibilities for improving the model in the process of compilation of a digital dictionary database for Slovene.
Recent years have seen a growing interest in linguistic phenomena that challenge the received division of labour between lexicon and grammar, and hence often fall through the cracks of traditional dictionaries and grammars. Such phenomena call for novel, pattern based types of linguistic reference works (see various papers in Herbst 2019). The present paper introduces one such resource: MAP (“Musterbank argumentmarkierender Präpositionen”), a web based corpus linguistic patternbank of prepositional argument structure constructions in German. The paper gives an overview of the design and functionality of the MAP prototype currently developed at the Leibniz Institute for the German Language in Mannheim. We give a brief account of the data and our analytic workflow, illustrate the descriptions that make up the resource and sketch available options for querying it for specific lexical, semantic and structural properties of the data.
In this paper, we present LexMeta, a metadata model for the description of human-readable and computational lexical resources in catalogues. Our initial motivation is the extension of the LexBib knowledge graph with the addition of metadata for dictionaries, making it a catalogue of and about lexicographical works. The scope of the proposed model, however, is broader, aiming at the exchange of metadata with catalogues of Language Resources and Technologies and addressing a wider community of researchers besides lexicographers. For the definition of the LexMeta core classes and properties, we deploy widely used RDF vocabularies, mainly Meta-Share, a metadata model for Language Resources and Technologies, and FRBR, a model for bibliographic records.
This paper presents a multilingual dictionary project of discourse markers. During its first stage, consisting of collecting the list of headwords, we used a parallel corpus to automatically extract units from texts written in Spanish, Catalan, English, French and German. We also applied a method to create a taxonomy structure for automatically organising the markers in clusters. As a result, we obtain an extensive, corpus-driven list of headwords. We present a prototype of the microstructure of the dictionary in the form of a standard XML database and describe the procedure to automatically fill in most of its fields (e.g., the type of DM, the equivalents in other languages, etc.), before human intervention.
In the course of the last years, digital lexicography has opened up a variety of avenues fostering the conceptualisation, application and use of constructicons, a type of lexicographical reference work which has revealed itself highly promising in terms of connectivity and flexibility, at the same time, however, also challenging as to its technical implementation. The present paper takes up the ambitious aim to propose some reflections as well as a first draft for a possible model of a multilingual ‘periphrasticon’ as a subtype of a bigger constructicon focusing on a specific typology-related structural feature, i. e. periphrasticity. Taking periphrastic verbal constructions in French, Italian and Spanish as a starting point, it tries to sketch out a unified constructional network including not only equivalent (or corresponding) constructions within Romance, but also establishing (formal and functional) cross-linguistic connections to German and English. Comprising the major languages available to most language learners in (at least) German-speaking environments, the model is also supposed to pave the way for multilingual constructicography which, on the one hand, is able to account for intra- and cross-linguistic relations and, on the other hand, can also prove a valuable tool for language learning and use.
In this paper we present Trendi, a monitor corpus of written Slovene, which has been compiled recently as part of the SLED (Monitor corpus and related resources) project. The methodology and the contents of the corpus are presented, as well as the findings of the survey that aimed to identify the needs of potential users related to topical language use. The Trendi corpus currently contains news articles and other web content from 110 different sources, with the texts being collected and linguistically annotated on a daily basis. The corpus complements Gigafida 2.0, a 1.13-billion-word reference corpus of standard written Slovene. Also discussed are the ways in which the corpus will be integrated into various lexicographic projects, helping not only in the identification of neologisms but also in monitoring changes in already identified language phenomena.
In this paper, we propose a controlled language for authoring technical documents and report the status of its development, while maintaining a specific focus on the Japanese automotive domain. To reduce writing variations, our controlled language not only defines approved and unapproved lexical elements but also prescribes their preferred location in a sentence. It consists of components of a) case frames, b) case elements, c) adverbial modifiers, d) sentence-ending functions, and e) connectives, which have been developed based on the thorough analyses of a large-scale text corpus of automobile repair manuals. We also present our prototype of a writing assistant tool that implements word substitution and reordering functions, incorporating the constructed controlled language.
Many European languages have undergone considerable changes in orthography over the last 150 years. This hampers the application of modern computer-based analysers to older text, and hence computer-based annotation and studies of text collections spanning a long period. As a step towards a functional analyser for Norwegian texts (Nynorsk standard) from the 19th century, funding was granted in 2020 for creating a full form generator for all inflected forms of headwords found in Ivar Aasen’s dictionary published in 1873 (Aasen 1873) and his grammar from 1864 (Aasen 1864). Creating this word bank led to new insight in Aasen (1873), its structure, internal organisation, and ambition level as well as its link to Aasen (1864). As a test, the full form list generated from this new word bank was used to analyse the word inventory of texts by Aa. O. Vinje, written in the period 1850–1870. The Vinje texts were also analysed using a full form list of modern standard Norwegian, to study the differences in applicability and see how Vinje’s language relates to the written standard of modern Norwegian.
The paper presents the process of developing the AirFrame database, a specialized lexical resource in which aviation terminology is defined in the form of semantic frames, following the methodology of the Berkeley FrameNet (FN). First, the structure of the database is presented, and then the methodology applied in developing and populating the database is described. The link between specialized aviation frames and general language semantic frames, of which frames defining entities, processes, attributes and events are particularly relevant, is discussed on the example of the semantic frame of Flight and its related frames. The paper ends with discussing possibilities of using AirFrame as a model for further developing resources in which general and specialized knowledge are linked.
In the currently ongoing process of retro-digitization of Serbian dialectal dictionaries, the biggest obstacle is the lack of machine readable versions of paper editions. Therefore, one essential step is needed before venturing into the dictionary-making process in the digital environment – OCRing the pages with the highest possible accuracy. Successful retro-digitization of Serbian dialectal dictionaries, currently in progress, has shown a dire need for one basic yet necessary step, lacking until now – OCRing the pages with the highest possible accuracy. OCR processing is not a new technology, as many opensource and commercial software solutions can reliably convert scanned images of paper documents into digital documents. Available software solutions are usually efficient enough to process scanned contracts, invoices, financial statements, newspapers, and books. In cases where it is necessary to process documents that contain accented text and precisely extract each character with diacritics, such software solutions are not efficient enough. This paper presents the OCR software called “SCyDia”, developed to overcome this issue. We demonstrate the organizational structure of the OCR software “SCyDia” and the first results. The “SCyDia” is a web-based software solution that relies on the open-source software “Tesseract” in the background. “SCyDia” also contains a module for semi-automatic text correction. We have already processed over 15,000 pages, 13 dialectal dictionaries, and five dialectal monographs. At this point in our project, we have analyzed the accuracy of the “SCyDia” by processing 13 dialectal dictionaries. The results were analyzed manually by an expert who examined a number of randomly selected pages from each dictionary. The preliminary results show great promise, spanning from 97.19% to 99.87%.
Wortgeschichte digital (Digital Word History) is an emerging historical dictionary of the German language that focuses on describing semantic shifts from about 1600 through today. This article provides deeper insight into the dictionary’s “cross-reference clusters,” one of its software tools that performs visualization of its reference network. Hence, the clusters are a part of the project’s macrostructure. They serve as both a means for users to find entries of interest and a tool to elucidate relations among dictionary entries. Rather than delve into technical aspects, this article focuses on the applied logics of the software and discusses the approach in light of the dictionary’s microstructure. The article concludes with some considerations about the clusters’ advantages and limitations.
Mensch-Maschine-Interaktion im lexikographischen Prozess zu lexikalischen Informationssystemen
(2022)
Dictionaries of today and tomorrow are rather digital products than print dictionaries. From the user’s perspective, electronic dictionary applications and in particular „lexical information systems“, also referred to as „digital word information systems“ are coming to the fore alongside Google searches. Given the rapid developments in the area of the automated provision of lexicographic information, more precisely the automatic creation of online dictionaries, the new role of the lexicographer in the modern lexicographic process is questionable. This article addresses this issue.
While there was arguably a need for multi authored, multi volume, metalexicographic handbooks three decades ago – when the field of metalexicography was still ‘young’ – it is a bit puzzling to make sense of the current output flurry in this field. Is it simply a matter of ‘every publisher trying to fill its shelves’? or is there really a need in the scientific community for more and (continuously) updated reference works? And once available, are such works also consulted? Which parts? By whom? How often? For what purposes? In this paper we look at an ongoing, real world metalexicographic handbook project to answer these questions.
This paper presents the project “The first Romanian bilingual dictionaries (17th century). Digitally annotated and aligned corpus” (eRomLex) which deals with the editing of the first bilingual Romanian dictionaries. The aim of the project is to compile an electronic corpus comprising six Slavonic-Romanian lexicons dating from the 17th century, based on their relatedness and the fact that they follow a common model in order to highlight the characteristics of this lexicographical network (the affiliations between the lexicons, the way they relate to the source, the innovations towards it, their potential uses) and to facilitate the access to their content. A digital edition allows exhaustive data extraction and comparison and link with other digitized resources for old Romanian or Church Slavonic, including dictionaries. After presenting the corpus, we point to the necessary stages in achieving this project, the techniques used to access the material and the challenges and obstacles we encountered along the way. We describe how the corpus was created, stored, indexed and can be searched over; we will also present and discuss some statistical analyses highlighting relations between the Romanian lexicons and their Slavonic-Ruthenian source.
This think-aloud study charts the use of online resources by five final-year MA students in Nordic and Literacy Studies based on the analysis of screen and audio recordings of an error-correction task. The article briefly presents some linguistic features of Norwegian Nynorsk that are not common in the context of other European languages, that is, norm optionality with regards to inflection and spelling. While performing the task, the participants were allowed to use all digital aids. This article examines their resource consultation behavior, and it makes use of Laporte/Gilquin’s (2018) annotation protocol. The following research questions are posed: What online resources are used by the students? What characterizes the use? Are online resources helpful? This study provides new insights into an as yet little explored topic within the Norwegian context. The findings demonstrate that the participants relied heavily on the official monolingual dictionary Nynorskordboka. Indeed, the dictionary was helpful in the vast majority of the searches, either resulting in error improvement or the validation of a word; that is, many of the searches considered correct words. The findings suggest severe norm insecurity and emphasize the need to improve norm knowledge and metalinguistic knowledge as prerequisites for better utilization of aids. It is also suggested to include necessary information on norm optionality and other commonly queried issues in the dictionary architecture.
This paper describes a method for automatic identification of sentences in the Gigafida corpus containing multi-word expressions (MWEs) from the list of 5,242 phraseological units, which was developed on the basis of several existing open-access lexical resources for Slovene. The method is based on a definition of MWEs, which includes information on two levels of corpus annotation: syntax (dependency parsing) and morphology (POS tagging), together with some additional statistical parameters. The resulting lexicon contains 12,358 sentences containing MWEs extracted from the corpus. The extracted sentences were analysed from the lexicographic point of view with the aim of establishing canonical forms of MWEs and semantic relations between them in terms of variation, synonymy, and antonymy.
The paper presents the results of a survey on lexicographic practices and lexicographers’ needs across Europe that was conducted in the context of the Horizon 2020 project European Lexicographic Infrastructure (ELEXIS) among the observer institutions of the project. The survey is a revised and upgraded version of the survey which was originally conducted among ELEXIS lexicographic partner institutions in 2018 (Kallas et al. 2019a). The main goal of this new survey was to complement the data from the ELEXIS lexicographic partner institutions in order to get a more complete picture of lexicographic practices both for born-digital and retro-digitised resources in Europe. The results offer a detailed insight into many aspects of the lexicographic process at European institutions, such as funding, training, staff, lexicographic expertise, software and tools. In addition, the survey reflects on current trends in lexicography and reveals what institutions see as the most important emerging trends that will affect lexicography in the short-term and long-term future. Overall, the results provide valuable input informing the development of tools, resources, guidelines and training materials within ELEXIS.
The focus of this paper will be on lexical information systems and the framework guidelines for the definition of the curricula within the educational system of the Autonomous Province of Bolzano/ Bozen (Italy). In Italy, the competences to be achieved at different school levels are published in the form of general guidelines. On this basis each school has to specify the general competency goals and to spell them out in a concrete curriculum. In this paper I will examine to what extent lexical information systems are represented in the framework guidelines within the German and the Italian educational system of the Autonomous Province, these being separate systems. In a second step, I will check the representations of the resources against the “Villa Vigoni Theses on Lexicography“. Finally, I will discuss the results and give an outlook for further research.
Given the relevance of interoperability, born-digital lexicographic resources as well as legacy retro-digitised dictionaries have been using structured formats to encode their data, following guidelines such as the Text Encoding Initiative or the newest TEI Lex-0. While this new standard is being defined in a stricter approach than the original TEI dictionary schema, its reuse of element names for several types of annotation as well as the highly detailed structure makes it difficult for lexicographers to efficiently edit resources and focus on the real content. In this paper, we present the approach designed within LeXmart to facilitate the editing of TEI Lex-0 encoded resources, guaranteeing consistency through all editing processes.
The long road to a historical dictionary of Lower Sorbian. Towards a lexical information system
(2022)
The Sorbian Institute has been taking preparatory steps for a historical-documentary vocabulary information system for Lower Sorbian for about 10 years. To this end, the entire extant written material (16th–21st centuries) of this strongly endangered European minority language is to be systematically evaluated. An attempt made a few years ago to organise and finance the project as a long-term scientific project was not successful in the end. Therefore, it can only be advanced step by step and via some detours. The article informs about the interim status of the project, especially with respect to the creation of a reliable database.
This paper reports on the restructuring of a bilingual (Greek Sign Language, GSL – Modern Greek) lexicographic database with the use of the WordNet semantic and lexical database. The relevant research was carried out by the Institute for Language and Speech Processing (ILSP) / Athena R.C. team within the framework of the European project Easier. The project will produce a framework for intelligent machine translation to bring down language barriers among several spoken/written and sign languages. This paper describes the experience of the ILSP team to contribute to a multilingual repository of signs and their corresponding translations and to organize and enhance a bilingual dictionary (GSL – Modern Greek) as a result of this mapping; this will be the main focus of this paper. The methodology followed relies on the use of WordNet and, more specifically, the Open Multilingual WordNet (OMW) tool to map content in GSL to WordNet synsets.
Der vorliegende Beitrag untersucht aus interaktionslinguistischer Perspektive, wie Prinzipien deliberativer Demokratie in den Schlichtungsgesprächen zu Stuttgart 21 umgesetzt wurden. Wir konzentrieren uns dabei auf Interventionen, in denen der Schlichter Heiner Geißler die Wahrung von Verständlichkeit und Interessen der Bürger/-innen anmahnt, sowie Verletzungen der Wahrheitsnorm sanktioniert. Wir zeigen, wie Bürger/-innen sowie Normen und Werte rhetorisch als Ressource für das Einhalten von Verfahrensregeln genutzt werden, aber auch den Interessen des Schlichters selbst dienen. Dabei werden die Verfahrenswerte nicht immer einheitlich priorisiert. Die zugrunde liegende politische Diskussion wird zu Gunsten der Durchsetzung des Konstrukts ‚Faktenschlichtung‘ ausgeklammert.
Das Vokabular von Songtexten im gesellschaftlichen Kontext – ein diachron-empirischer Beitrag
(2022)
Der Beitrag untersucht den Stellenwert gesellschaftlich relevanter Thematiken in deutschsprachigen Songtexten der zurückliegenden fünf Jahrzehnte. Dabei zeigt sich, dass neben individuellen Befindlichkeiten auch politische, sozialkritische oder umweltbezogene Themen signifikant angesprochen werden. Wir kontrastieren Songtexte mit anderen Testsorten und wenden dabei quantitative Methoden auf umfangreiche, breit stratifizierte Datensamples an, um die Phänomenbeschreibungen präzisierbar, generalisierbar und reproduzierbar zu machen. Das longitudinale Korpusdesign bietet Potenzial für diachrone Vergleiche. Im Sinne eines erweiterten „Mixed Methods“-Ansatzes exploriert die Studie zudem ausgewählte Aspekte qualitativ und bettet sie in den zeitlichen Kontext ein.
This paper investigates the long-term diachronic development of the perfect and preterite tenses in German and provides a novel analysis by supplementing Reichenbach’s (1947) classical theory of tense by the notion of underspecification. Based on a newly compiled parallel corpus spanning the entire documented history of German, we show that the development in question is cyclic: It starts out with only one tense form (preterite) compatible with both current relevance and narrative past readings in (early) Old High German and, via three intermediate stages, arrives at only one tense form again (perfect) compatible with the same readings in modern Upper German dialects. We propose that in order to capture all attested stages we must allow tenses to be unspecified for R (reference time), with R merely being inferred pragmatically. We then propose that the transitions between the different stages can be explained by the interplay between semantics and pragmatics.
Das Ziel des Beitrags ist es, die Merkmale von Kommunikationsstörungen in Sport-Interviews aus Sicht der Interviewten festzustellen und zu analysieren. Die empirische Forschungsbasis besteht aus ukrainisch- und deutschsprachigen Videointerviews aus den Jahren 2010 bis 2019, die entweder im Fernsehen gesendet oder für YouTube produziert wurden. Die Ergebnisse der Studie ermöglichten es, die charakteristischen Merkmale von Abweichungen als Kommunikationsstörungen in Sport-Interviews auf drei Ebenen der kommunikativen Gattung zu identifizieren: auf der außenstrukturellen, binnenstrukturellen und situativen Ebene. Sowohl gemeinsame Merkmale von Kommunikationsstörungen als auch Unterschiede in den ukrainisch- und deutschsprachigen Sport-Interviews wurden bestimmt. Die Ergebnisse der Studie zeigen, dass die Arten von Kommunikationsstörungen in Sport-Interviews im Ukrainischen und Deutschen universell sind, sie spiegeln jedoch die nationalen und kulturellen Besonderheiten angesichts der Merkmale beider Sprachen und jeder Sprachkultur wider.
There is a growing interest in pedagogical lexicography, and more specifically in the study of dictionary users’ abilities and strategies (Prichard 2008; Gavriilidou 2010, 2011; Gavriilidou/Mavrommatidou/Markos 2020; Gavriilidou/Konstantinidou 2021; Chatjipapa et al. 2020). Τhe purpose of this presentation is to investigate dictionary use strategy and the effect of an explicit and integrated dictionary awareness intervention program on upper elementary pupils’ dictionary use strategies according to gender and type of school. A total of 150 students from mainstream and intercultural schools, aged 10–12 years old, participated in the study. Data were collected before and after the intervention through the Strategy Inventory for Dictionary Use (SIDU) (Gavriilidou 2013). The results showed a significant effect of the intervention program on Dictionary Use Strategies employed by the experimental group and support the claim that increased dictionary use can be the outcome of explicit strategy instruction. In addition, the effective application of the program suggests that a direct and clear presentation of DUS is likely to be more successful than an implicit presentation. The present study contributes to the discussion concerning both the ‘teachability’ of dictionary use strategies and skills and the effective forms of intervention programs raising dictionary use awareness and culture.
Wortgeschichte digital (‘digital word history’) is a new historical dictionary of New High German, the most recent period of German reaching from approximately 1600 AD up to the present. By contrast to many historical dictionaries, Wortgeschichte digital has a narrated text – a “word history” – at the core of its entries. The motivation for choosing this format rather than traditional microstructures is
briefly outlined. Special emphasis it put on the way these word histories interact with other components of the dictionary, notably with the quotation section. As Wortgeschichte digital is an online only project, visualizations play an important role for the design of the dictionary. Two examples are presented: first, the “quotation navigator” which is relevant for the microstructure of the entries, and, second, a timeline (“Zeitstrahl”) which is part of the macrostructure as it gives access to the lemma inventory from a diachronic point of view.
One central goal of the project ‘Zentrum für digitale Lexikographie der deutschen Sprache’ (Center for digital lexicography for the German Language, www.zdl.org) is to provide a corpus-based lexicographic component of common German multi-word expressions (MWE), including idioms, for DWDS (www.dwds.de), a general language dictionary of contemporary German. As a central challenge of this task, we have identified an adequate lexicographic representation of such common properties of MWE as variation and modification. To document the variation, we have developed a special entry-clustering model, which we call hub-node entry. This model comprises a core hub entry headed by a short nuclear form of the MWE and several node entries, which represent the most common variants in their full lexical forms.
Inspired by GWLN 3, we take a look at the new words, meanings, and expressions that have been created during or promoted by the COVID-19 pandemic. The pandemic provides a rare opportunity to follow the rise, spread, and integration of words and expressions in a language that may serve as an illustration of how linguistic innovation in general works. Relevant words were selected from various lists, notably monthly and annual lists of prominent words attested in the corpus of The Danish Dictionary. Analysis of these lists gives an insight into the number of words that stand out month by month and what kinds of words are involved, both in terms of morphological type and of semantic category, with special attention given to neologisms. Finally, we discuss the criteria for selecting which words to include in the dictionary. With this study, Danish is added to the list of languages covered in the GWLN series on
COVID-19 neologisms.
This paper discusses an investigation of how senses are ordered across eight dictionaries. A dataset of 75 words was used for this purpose, and two senses were examined for each word. The words are divided into three groups of 25 words each according to the relationship between the senses: Homonymy, Metaphor, and Systematic Polysemy. The primary finding is that WordNet differs from the other dictionaries in terms of Metaphor. The order of the senses was more often figurative/literal, and it had the highest percentage of figurative senses that were not found. We discuss leveraging another dictionary, COBUILD, to re-order the senses according to frequency.
Der Beitrag behandelt methodische Fragen der Korpuspragmatik im Bereich der politischen Sprache am Beispiel sprachlicher Praktiken der Moralisierung im Deutschen Bundestag. Wir stellen einen Ansatz zur Erarbeitung pragmatischer Strukturmuster – ,Pragmeme‘ – des Moralisierens vor, der auf kollaborativer Annotation basiert. Den Datensatz bildet das linguistisch aufbereitete Korpus der Plenarprotokolle des Deutschen Bundestags 1949–2017. Zur Eruierung geeigneter Beobachtungspassagen wurde ein Thesaurus von Moralwörtern erarbeitet und deren Verteilung gemessen. Dadurch haben sich drei Beobachtungsperioden für Pilotkorpora ergeben: 1949, 1983 und 2015. In diesen Beobachtungsperioden wurden Zufallsstichproben von Sätzen mit Moralwörtern gezogen und annotiert. Im Beitrag stellen wir die einzelnen Schritte und vorläufigen Ergebnisse des Projekts vor und diskutieren Möglichkeiten und Grenzen des Verfahrens.
Faltungen: Die Schließung des rechten Kommunikationssystems aus korpuspragmatischer Perspektive
(2022)
Der Beitrag untersucht linguistische Prozesse, die bei der operativen Schließung politischer Kommunikationssysteme wirksam sind. Am Beispiel rechter Online-Medien während der sogenannten europäischen Flüchtlingskrise werden Praktiken der Umsemantisierung identifiziert und daraufhin befragt, wie sie an der rekursiven Organisation des rechten Kommunikationssystems mitwirken. Anhand von Aggregationen und Subjektprädikativen werden Prozesse der Umkonfigurierung konventioneller begrifflicher Relationen illustriert. Für (Um-)Semantisierungen, die zur operativen Schließung von Kommunikationssystemen beitragen, wird der Begriff der Faltung entwickelt.
Im Corona-Diskurs prallen völlig unterschiedliche Meinungen und Positionen zur Rolle des Staates aufeinander. Die Studie untersucht diese Positionen mit korpuslinguistischen Methoden anhand der Berichterstattung von Medien und Kommentaren von Leserinnen und Lesern in der Deutschschweiz. Dabei werden auch rechte und Corona-skeptische Plattformen in die Analyse einbezogen. Grundlage des korpuspragmatischen Zugangs ist die Berechnung und Interpretation von Word Embeddings, einer Methode zur Modellierung von semantischen Räumen. Es zeigt sich, wie sich im Diskurs inkommensurable Semantiken entwickeln.
Heranwachsen in einem noch fremden Land: Die Studie beruht auf einer mehr als 20 Jahre umfassenden Langzeiterhebung in russlanddeutschen Familien mit insgesamt 16 Kindern. Schwerpunkt der Beobachtungen und Interviews war die jeweilige Situation der Kinder innerhalb und außerhalb der Familie. Wie veränderte sie sich aus der Sicht der Kinder und ihrer Angehörigen über die Jahre ab der Ankunft in Deutschland bis zum Übergang ins Berufsleben? Welche Bilanz ziehen die nunmehr jungen Erwachsenen ein Vierteljahrhundert nach ihrer Ankunft?
Die Autorinnen ordnen die individuellen Bilanzen in die internationale Migrations- und Integrationsforschung ein. Die deutsch-russische Zweisprachigkeit als Kern der Mehrsprachigkeit der StudienteilnehmerInnen wird in ihrer Beschaffenheit durch Diskursanalysen und deutschsprachige C-Tests beschrieben und zu den Deutschqualifikationen junger Erwachsener ohne Migrationshintergrund ins Verhältnis gesetzt. Die sprachlichen Qualifikationen erfahren so die ihnen gebührende Aufmerksamkeit. Sie sind Bedingung und Folge gesellschaftlicher Zugehörigkeit.
IDS aktuell. Neues aus dem Leibniz-Institut für Deutsche Sprache in Mannheim. Jg. 2022, Heft 4
(2022)
IDS aktuell. Neues aus dem Leibniz-Institut für Deutsche Sprache in Mannheim. Jg. 2022, Heft 1
(2022)
IDS aktuell. Neues aus dem Leibniz-Institut für Deutsche Sprache in Mannheim. Jg. 2022, Heft 2
(2022)
Schreibdidaktik
(2022)
Eine gut entwickelte Schreibkompetenz bildet eine wesentliche Schlüsselqualifikation für die gesellschaftliche Teilhabe in literalisierten Gesellschaften. Aus diesem Grund kommt auch der Schreibdidaktik als Teildisziplin der Sprachdidaktik, die sich mit der Konzeption, Diagnostik und Förderung von Schreibkompetenz auseinandersetzt, eine wichtige Bedeutung zu. Ihr Erkenntnisinteresse besteht vorrangig in der Frage, wie die Aneignung von Schreibkompetenz in Abhängigkeit von den individuellen Lernvoraussetzungen durch unterrichtliche Förderung gelingen kann.
Die Bibliografie verfolgt das Ziel, einen Überblick über zentrale Themengebiete und Konzepte der Schreibdidaktik, wie z. B. Schreibkompetenz, Schreibentwicklung, Schreibaufgaben und Schreibunterricht, zu geben. Dafür systematisiert sie einschlägige, aktuelle Literatur und führt neben Internetressourcen zentrale (Beiträge in) Zeitschriften, Sammelbände und Handbücher sowie Einführungen auf.
Soziolinguistik
(2022)
Soziolinguistik ist jene Teildisziplin der Linguistik, die sich mit den Interdependenzen von Sprache, Kultur und Gesellschaft befasst. Dieser Band präsentiert zu Sprache(n) in Verbindung mit Raum, Geschlecht, Medien, Institutionen und als Fachsprache(n) aktuelle Publikationen, die für Studierende und Forschende von Interesse sind. Ergänzt werden diese durch Literatur zu Methoden sowie zu grundlegenden Anwendungsfeldern und Konzepten: Migration, Jugendsprachen, Mehrsprachigkeit, Sprachideologien und Sprachenpolitik.
Die Autorinnen stellen zu den einzelnen Bereichen Handbücher, Zeitschriften, Monographien und ausgewählte Buch- und Zeitschriftenbeiträge vor. Angesichts der zunehmenden Digitalisierung von Forschungsdaten sowie -werkzeugen wurde auch eine Sammlung von (digitalen) Ressourcen in den Band integriert, um Nutzer*innen den empirischen Zugang zu soziolinguistisch interessanten Sprachdaten und Werkzeugen zu erleichtern.
FAIR-Prinzipien und Qualitätskriterien für Transkriptionsdaten. Empfehlungen und offene Fragen
(2022)
Dieser Beitrag behandelt die mittlerweile als Bestandteil guter wissenschaftlicher Praxis anerkannten FAIR-Prinzipien in Bezug auf die Transkription und Annotation gesprochener Sprache und multimodaler Interaktion. Forschungsdaten - und somit Transkriptionsdaten - sollen heute Findable, Accessible, Interoperable und Reusable sein. Der Beitrag versucht dementsprechend, empirische Methoden im Prozess der Digitalisierung und generische Prinzipien des digitalen Forschungsdatenmanagements zusammenzubringen, um für diesen Kontext einem operationalisierten Begriff der „FAIRness“ näher zu kommen und möglichst konkrete Empfehlungen aufzustellen. Der Beitrag sollte aber gleichzeitig zur Diskussion anregen, denn konkrete Anforderungen in Bezug auf das Forschungsdatenmanagement und die Datenqualität müssen auch im Rahmen der FAIR-Prinzipien von den Fachgemeinschaften selbst herausgearbeitet werden.