Refine
Year of publication
Document Type
- Part of a Book (442)
- Article (188)
- Book (38)
- Review (31)
- Conference Proceeding (11)
- Course Material (1)
- Master's Thesis (1)
- Part of Periodical (1)
- Report (1)
Has Fulltext
- yes (714) (remove)
Keywords
- Deutsch (714) (remove)
Publicationstate
- Zweitveröffentlichung (714) (remove)
Reviewstate
Publisher
- de Gruyter (256)
- Narr Francke Attempto (63)
- Narr (40)
- Erich Schmidt (38)
- Niemeyer (14)
- Stauffenburg (14)
- Steiner (14)
- Buske (9)
- Winter (9)
- De Gruyter (7)
Thema der 59. Jahrestagung des Leibniz-Instituts für Deutsche Sprache war vom 14. bis zum 16. März 2023 erstmals nach mehreren Jahrzehnten wieder die Orthografie des Deutschen, und zwar „in Wissenschaft und Gesellschaft“. Einen unmittelbaren Anlass dafür bildete der bevorstehende Abschluss der siebenjährigen Arbeitsphase des Rats für deutsche Rechtschreibung Ende 2023, dessen Tätigkeit das IDS seit seiner Gründung wissenschaftlich begleitet. Aber auch die Orthografieforschung selbst hat sich seit der Rechtschreibreform im Jahr 1996 in einer Weise entwickelt, dass die Wahl dieses schriftlinguistischen Querschnittsthemas angezeigt erschien.
Seit 1996 ist das Amtliche Regelwerk zur deutschen Rechtschreibung (einschließlich Amtlichem Wörterverzeichnis) gültig. Es regelt die Orthografie für Behörden und Schulen in Deutschland sowie in den sechs weiteren Mitgliedsländern des Rats für deutsche Rechtschreibung. Für die Wörterbuchverlage bzw. alle Wörterbuchprojekte gilt es, dieses hoch abstrakte Regelwerk einerseits auf alle Einträge in den A–Z-Teilen der Wörterbücher anzuwenden und andererseits ggf. das Regelwerk selbst zu „übersetzen“ und es damit einer breiten Öffentlichkeit zugänglich zu machen.
Vorwort
(2024)
Thema der 59. Jahrestagung des Leibniz-Instituts für Deutsche Sprache war vom 14. bis zum 16. März 2023 erstmals nach mehreren Jahrzehnten wieder die Orthografie des Deutschen, und zwar „in Wissenschaft und Gesellschaft“. Einen unmittelbaren Anlass dafür bildete der bevorstehende Abschluss der siebenjährigen Arbeitsphase des Rats für deutsche Rechtschreibung Ende 2023, dessen Tätigkeit das IDS seit seiner Gründung wissenschaftlich begleitet. Aber auch die Orthografieforschung selbst hat sich seit der Rechtschreibreform im Jahr 1996 in einer Weise entwickelt, dass die Wahl dieses schriftlinguistischen Querschnittsthemas angezeigt erschien.
Das Ziel des Beitrages ist es, die Orthografiereform 1996–2006 in den Entwicklungsprozess der deutschen Rechtschreibung seit der Herausbildung der Einheitsorthografie einzuordnen, ihre Stellung in diesem Prozess zu kennzeichnen und ihre Ergebnisse zu benennen. Ausgehend von einer Charakterisierung der besonderen Merkmale der Orthografie als Norm der Schreibung sowie des Begriffes Orthografiereform, werden zunächst die Endphase der Herausbildung der deutschen Einheitsorthografie und ihr Abschluss durch die Orthografiereform von 1901 beschrieben. Dem folgt die Darstellung der Besonderheiten der deutschen Orthografieentwicklung im 20. Jahrhundert bis zum Jahr 1996. Ein wichtiger Bestandteil des Beitrages ist dann die Herausarbeitung der Grundlagen und Bestimmungsfaktoren einer Orthografiereform unter heutigen Bedingungen und die Anwendung dieser Grundsätze auf den Prozess der Entstehung und Umsetzung der Orthografiereform 1996–2006. Abschließend werden die Ergebnisse dieses Prozesses in vier Punkten zusammengefasst die auch gleichzeitig die Bedeutung dieser Sprachlenkungsmaßnahme in der deutschen Orthografiegeschichte kennzeichnen.
Das Amtliche Wörterverzeichnis ist ein wesentlicher Teil des für Schulen und Behörden verbindlichen Amtlichen Regelwerks, dem wissenschaftlichen Referenzwerk für die deutsche Orthografie. Dem Wörterverzeichnis kommt eine entscheidende Funktion zu: Es exemplifiziert anhand einzelner Lemmata die Anwendung der Regeln und kodifiziert darüber hinaus Einzelfälle, die aus dem Regelteil nicht eindeutig ableitbar sind. Im vorliegenden Beitrag wird die auf der Basis empirischer Schreibbeobachtung erarbeitete Neukonzeption vorgestellt, die mit der Konzentration auf prototypische Fallbeispiele repräsentative orthografische Zweifelsfälle im gegenwärtigen Wortschatz des Deutschen aufgreift, sie mit Bezug auf die geltende Norm und den Schreibgebrauch klärt, in der neuen digitalen Fassung auch visualisierend veranschaulicht und auf diese Weise aktuellem Nutzungsverhalten Rechnung trägt.
Für die spezifischen Bedürfnisse der Schreibbeobachtung wurde das Orthografische Kernkorpus (OKK) als virtuelles Korpus in DeReKo entwickelt. Mit derzeit rund 14 Mrd. Token deckt es den Schriftsprachgebrauch in den deutschsprachigen Ländern im Zeitraum von 1995 bis in die Gegenwart ab. Der Zugriff über die Korpusanalyseplattform KorAP erlaubt nicht nur die Nutzung verschiedener Annotationen, sondern über die API-Schnittstellen auch die Einbindung in diverse Auswertungsumgebungen wie RStudio über den RKorAPClient und macht es so für zahlreiche Analyse- und Visualisierungsmöglichkeiten zugänglich.
grammis ist ein wissenschaftlich basiertes Online-Informationssystem zur deutschen Grammatik und Orthografie, das Erklärungen und Hintergrundwissen für Sprachinteressierte und Deutschlernende weltweit bietet. Neben genuin grammatischen Themen enthält es auch für das Rechtschreiblernen gewinnbringende Inhalte. Im vorliegenden Beitrag werden seine orthografischen Komponenten veranschaulicht und aktuelle Neuerungen im Zusammenhang mit seiner Integration in eine im Entstehen befindliche digitale Vernetzungsinfrastruktur für die Bildung erläutert.
Mehrsprachigkeit gehört zu den Themen, zu denen wohl viele Menschen eine Meinung haben. Der Wert traditioneller schulischer Fremdsprachen wird dabei häufig hervorgehoben, während Wert und Erhalt von Herkunftssprachen Zugewanderter hinterfragt werden. Einstellungen gegenüber Sprachen sind demnach abhängig vom Prestige der jeweiligen Sprachen und ihrer Sprecher:innen. Dies geschieht vor dem Hintergrund, dass Deutschland überwiegend als ein einsprachiges Land mit einer einsprachigen Gesellschaft angesehen wird. Ähnliches gilt im Übrigen auch für Österreich. So schreibt beispielsweise der Sprachwissenschaftler Heiko Marten, „dass in der Wahrnehmung großer Teile der österreichischen Gesellschaft Monolingualismus nach wie vor die Norm ist“ (Marten 2016, S. 165). Diese Annahme gilt auch für den schulischen Kontext, wie die Erziehungswissenschaftlerin Ingrid Gogolin mit dem Begriff des „monolingualen Habitus“ herausgearbeitet hat (vgl. Gogolin 2008). Gründe für einen monolingualen Habitus könnten darin liegen, dass „von Teilen der Allgemeinheit oft übersehen [wird], dass in Deutschland auch zahlreiche weitere Sprachen gesprochen werden“ (Marten 2016, S. 148). Doch was passiert nun, wenn eine Sprache einen Statuswechsel von Landessprache zu Herkunftssprache durchläuft? Was lässt sich beobachten, wenn beispielsweise das Deutsche zu einer Minderheitensprache wird?
У статті досліджено салієнтні політичні речення та їхні функції в україн¬ському і німецькому медійному дискурсі, які використовуються у контексті російсько-української війни та закріплюються в системі актуальних полі¬тичних знань. Teрмін «салієнтні політичні речення» вжито відповідно до наукових праць Й. Кляйна. В українському дискурсі аналізуються відомі речення із відеозвернень та політичних промов В. Зеленського. Також про¬аналізовано гасла та лозунги, які поширюються через соціальні мережі або на прогестних демонстраціях і, відповідно, утверджуються як салієнтні по¬літичні речення. У німецькому дискурсі розглянуто значущі речення у про¬мовах провідних політичних діячів у контексті переосмислення німецької зовнішньої та внутрішньої політики після повномасштабного вторгнення Росії в Україну та після промови О. Шольца «Zeitenwende».
OWID und OWIDplus – lexikographisch-lexikologische Online-Informationssysteme des IDS Mannheim
(2023)
Lexikographische und lexikalische Ressourcen zum Deutschen werden an vielen unterschiedlichen Institutionen erarbeitet, z. B. an Akademien der Wissenschaften oder in privatwirtschaftlichen Verlagen. Auch am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim werden solche Materialien erstellt und der (Fach-)Öffentlichkeit unter dem Dach von OWID, dem „Online-Wortschatz-Informationssystem Deutsch“ (owid.de), präsentiert.
In unserem Beitrag widmen wir uns dem Einsatz von Sprachkorpora für den Kontext
Deutsch als Fremdsprache (DaF), wobei wir unterschiedliche Ressourcen und Anwendungsbereiche beleuchten. Ziel des Beitrags ist es, exemplarisch Korpora für den DaF-Kontext vorzustellen, sowie deren Potenziale beispielhaft herauszustellen. Zu den vorgestellten Ressourcen zählen Lernerkorpora für Deutsch als Zielsprache, Spezial- und Fachkorpora, Vergleichskorpora sowie Korpora der gesprochenen Sprache und Wörterbuchressourcen. Mit Blick auf die unterschiedlichen Korpora und deren Spezifika loten wir lohnende Perspektiven und Anknüpfungspunkte für Forschung und Didaktik aus und geben Hinweise zur vertiefenden Auseinandersetzung.
This paper discusses contemporary societal roles of German in the Baltic states (Latvia, Estonia, Lithuania). Speaker and learner statistics and a summary of sociolinguistic research (Linguistic Landscapes, language learning motivation, language policies, international roles of languages) suggest that German has by far fewer speakers and functions than the national languages, English, and Russian, and it is not a dominant language in the contemporary Baltics anymore. However, German is ahead of ‘any other language’ in terms of users and societal roles as a frequent language in education, of economic relations, as a historical lingua franca, and a language of traditional and new minorities. Highly diverse groups of users and language policy actors form a ‘coalition of interested parties’ which creates niches which guarantee German a frequent use. In the light of the abundance of its functions, the paper suggests the concept ‘additional language of society’ for a variety such as German in the Baltics – since there seems to be no adequate alternative labelling which would do justice to all societal roles. The paper argues that this concept may also be used for languages in similar societal situations and, not least, be useful in language marketing and the promotion of multilingualism.
We argue that properties with a nominal origin get transferred regularly in certain Gentian particle verb constructions to properties that are propositional insofar as they characterize the temporal structure of eventualities, understood to be described by propositional (= truth-assessable) representations of state changes. Accordingly, the oft-noted perfectivizing function of certain verbal particles like ein- in einfahren ('pull in', cf. Kühnhold 1972) is the effect of redressing a conflict at the syntax-semantics interface: On the one hand, constructions like in [die Grube]acc einfahren ('pull into the mine’) exhibit transitive syntax (Gehrke 2008), requiring that the syntactic arguments be mapped onto well-distinguished or DIFFERENT referents in the semantics (Kemmer 1993). On the other hand, in/ein codes a spatio-temporal inclusion relation between its relata, contradicting the requirement imposed by the transitive syntax. Following Brandt (2019), we submit that the interface executes a manoeuvre that delays the interpretation of part of the contradiction-inducing DIFFERENCE feature. It is not locally interpreted (semantically represented) in toto but in part passed on to the next syntactic-semantic computational cycle. Here, the passed-on meaning is interpreted in the locally customary terms, in the case at hand, as a temporal index where the post-state of the depicted eventuality does not hold.
Im Zentrum der Betrachtungen stehen Sprachkontaktsituationen sowie Sprachkontaktphänomene der Kaukasiendeutschen. Sie sind Nachfahren deutschstämmiger Einwohner des Russischen Reichs und der Sowjetunion, die ab Ende des 18. Jahrhunderts in mehreren Phasen in Gebiete Transkaukasiens ausgewandert sind. Bei der untersuchten Gruppe handelt es sich um diejenigen, die aufgrund von interethnischen Ehen von den Deportationen 1941 aus den deutschen Siedlungsgebieten ausgenommen waren und bis heute im Südkaukasus leben. Mithilfe soziolinguistischer Methoden wurden von der Autorin erstmalig 2017 formelle, leitfadengestützte Interviews im Südkaukasus mit der noch lebenden Erlebnisgeneration sowie einer Nachkommengeneration aufgenommen, transkribiert und ausgewertet. Im Beitrag werden Sprachkontaktkonstellationen deutscher Varietäten (Schwäbisch sowie standardnahes Deutsch) mit dem Russischen (und Georgischen) sowie Sprachkontaktphänomene vorgestellt.
Ziel dieses Projekts ist es, Sprachdaten so nah wie möglich am Jetzt zu erheben und analysierbar zu machen. Wir möchten, dass möglichst viele Menschen, nicht nur Sprachwissenschaftlerinnen und Sprachwissenschaftler, in die Lage versetzt werden, Sprachdaten zu explorieren und zu nutzen. Hierzu erheben wir ein Korpus, d. h. eine aufbereitete Sammlung von Sprachdaten von RSS-Feeds deutschsprachiger Onlinequellen. Wir zeichnen die Entwicklung der Analysewerkzeuge von einem Prototyp hin zur aktuellen Form der Anwendung nach, die eine komplette Reimplementierung darstellt. Dabei gehen wir auf die Architektur, einige Analysebeispiele sowie Erweiterungsmöglichkeiten ein. Fragen der Skalierbarkeit und Performanz stehen dabei im Mittelpunkt. Unsere Darstellungen lassen sich daher auf andere Data-Science-Projekte verallgemeinern.
This replication study aims to investigate a potential bias toward addition in the German language, building upon previous findings of Winter and colleagues who identified a similar bias in English. Our results confirm a bias in word frequencies and binomial expressions, aligning with these previous findings. However, the analysis of distributional semantics based on word vectors did not yield consistent results for German. Furthermore, our study emphasizes the crucial role of selecting appropriate translational equivalents, highlighting the significance of considering language-specific factors when testing for such biases for languages other than English.
What is the subject of German linguistics? This seemingly simple question has no obvious answer. In the ZGL’s first issue, the editors required contributions to cover the whole of the German language and to be theoretically sound but application-orientated, whereas the current ZGL-homepage defines the German language of present and history in all its differentiations as its subject matter.
Looking through the fifty volumes of ZGL, three relationships can be identified as presumably enlightening the role of language, in particular the German language: language and mind; language and language use; language and culture. Though of a different systematic type, language and data should be added as an increasingly important pairing for conceptualizing language. On this basis, I also discuss the position of linguistic studies of the German language, mirrored in the ZGL-volumes, between social, cultural and natural sciences, as well as the corresponding epistemic approaches – like explaining vs. understanding.
This article details the process of creating the Nottinghamer Korpus deutscher YouTube-Sprache ('The Nottingham German YouTube Language Corpus' - or NottDeuYTSch corpus) and outlines potential research opportunities. The corpus was compiled to analyse the online language produced by young German-speakers and offers significant opportunity for in-depth research across several linguistic fields including lexis, morphology, syntax, orthography, and conversational and discursive analysis. The NottDeuYTSch corpus contains over 33 million words taken from approximately 3 million YouTube comments from videos published between 2008 to 2018 targeted at a young, German-speaking demographic and represent an authentic language snapshot of young German speakers. The corpus was proportionally sampled based on video category and year from a database of 112 popular German-speaking YouTube channels in the DACH region for optimal representativeness and balance and contains a considerable amount of associated metadata for each comment that enable further longitudinal cross-sectional analyses. The NottDeuYTSch corpus is available for analysis as part of the German Reference Corpus (DeReKo).
Im Mittelpunkt des Beitrags steht die Frage nach Ursprung und Genese der im geltenden amtlichen Regelwerk niedergelegten Regel, die eine Zusammenschreibung von Adjektiv-Verb-Verbindungen bei Vorliegen einer nicht literalen Bedeutung vorsieht. Ausgangspunkt bilden dabei Sprachtheoretiker und Akteure wie Johann Christoph Adelung, Wilhelm Wilmanns und Konrad Duden, die die Diskussion beherrscht und (dadurch) maßgeblich die erste gesamtdeutsche Rechtschreibregelung im Jahre 1902 mitgestaltet haben. Ein weiterer Schwerpunkt liegt auf der Umsetzung der Rechtschreibregelung in den orthographischen Wörterbüchern. Erst in dieser zeigt sich, inwiefern der gefundene Kompromiss trägt und inwieweit sich die Beteiligten daran gebunden fühlen, in Sonderheit Duden, der mit seinen Wörterbüchern alsbald eine marktführende Position einnahm und über dessen Duden-Rechtschreibung die Regel einer bedeutungsunterscheidenden Zusammenschreibung bei Adjektiv-Verb-Verbindungen letztlich für alle verbindlich wurde.
Unter Neologismen finden sich bedeutungsgleiche Ausdrücke (im weitesten Sinne Synonyme), die unter bestimmten Bedingungen sprachliche Unsicherheiten hervorrufen. Das liegt u. a. an ihrer semantisch-konzeptuellen Ähnlichkeit, an nicht abgeschlossenen Lexikalisierungsprozessen, aber es treten auch Zweifel auf, weil es Unterschiede zwischen der Allgemein- und der Fachsprache gibt. Für einige Neologismen ist es auch charakteristisch, dass mehrere morphologische Varianten gleichzeitig in den Wortschatz eintreten, sodass nicht immer klar ist, wann welche präferiert werden. Dass all diese Ausdrücke lexikalischem Wettbewerb und situationsgebundenen Gebrauchsbedingungen ausgesetzt sind und dass sie zu Zweifel führen können, wird in Onlineforen sichtbar. Dieser Beitrag beschäftigt sich mit der Frage, wie solche Paare/Gruppen korpusgestützt semantisch analysiert und wie sie in deskriptiven Wörterbüchern angemessen beschrieben werden können, um sowohl Gemeinsamkeiten als auch Unterschiede für Nachschlagende sichtbar zu machen. Dazu werden konkrete Beispiele und ein gegenüberstellendes Wörterbuchdarstellungsformat für neologistische Synonyme vorgeschlagen.
Der Beitrag illustriert die Nutzung des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für interaktionslinguistische Fragestellungen anhand einer exemplarischen Studie. Zunächst werden die Stratifikation (Datenkomposition) des Korpus, das zugrundeliegende Datenmodell und dessen Annotationsebenen sowie Typen von Untersuchungsinteressen vorgestellt, für die das Korpus nutzbar ist. Im Hauptteil wird Schritt für Schritt anhand einer Studie zur Verwendung des Formats was heißt X in der sozialen Interaktion gezeigt, wie mit FOLK relevante Daten gefunden und analysiert werden können. Abschließend weisen wir auf einige Vorsichtsmaßnahmen bei der Benutzung des Korpus hin.
Der vorliegende Beitrag erörtert am Beispiel des aktuell im Aufbau befindlichen Korpus GiesKaNe (= Gie[ßen]Ka[ssel]Ne[uhochdeutsch]) grundlegende Fragen nach dem Verhältnis von Standard und Innovation bei der Erweiterung der Korpuslandschaft durch neue Korpora. Bei jedem neu zu erstellenden Korpus stellt sich die Frage, inwieweit man den bereits etablierten Standards folgt, oder ob es legitim oder vielleicht sogar notwendig ist, neue Modelle der Annotation linguistischer Kategorien zu entwickeln. In diesem Sinne bespricht der Beitrag die Grenzen einer reinen Modellübernahme mit Bezug auf das POS-Tagging in anderen historischen Referenzkorpora und mit Bezug auf TIGER als Baumbank für das Gegenwartsdeutsche. Um trotz der Arbeit mit einer innovativen Alternative dem Prinzip der Interoperabilität gerecht zu werden, wird im Beitrag die Arbeit mit maschinellem Lernen ins Spiel gebracht. Dieses ermöglicht es, aus den vorhandenen Textoberflächenmerkmalen und den vorliegenden Annotationen auch alternative Annotationsmodelle abzuleiten und mittels einer Mehrebenenannotation anzubieten, sodass ein Korpus den Anforderungen an interoperable Nutzbarkeit und wissenschaftlichen Erkenntnisfortschritt gleichermaßen gerecht werden kann.
„Actual words are of theoretical interest” (Audring 2021: 3). Unter Zugrundelegung dieser gebrauchsbasierten Prämisse geht der vorliegende Beitrag der Frage nach, wie sich die Nominalkomposition im Deutschen auf der Basis sprachlicher Massendaten als Konstruktionsfamilie, d.h. als ein hierarchisches Netzwerk von Konstruktionen unterschiedlichen Abstraktionsgrads, beschreiben lässt. Der Beitrag knüpft in theoretischer Hinsicht an Booijs (2010) „Construction Morphology” an, geht jedoch insofern über diese hinaus, als versucht wird, deren Grundannahmen auch auf automatisch erhobene sprachliche Massendaten anzuwenden. Konkret wird mit einem Inventar von rund 185.000 Zusammensetzungen aus zwei simplizischen Nomen gearbeitet, die systematisch aus dem Deutschen Referenzkorpus (DeReKo) (vgl. Leibniz-Institut für Deutsche Sprache 2007) extrahiert und im Anschluss (semi)automatisch weiterverarbeitet wurden.
Dieser Beitrag beschreibt die Prozesse der Datenerhebung, -aufbereitung und geplanten Veröffentlichung eines Teilkorpus des vom österreichischen Wissenschaftsfonds (FWF) finanzierten Spezialforschungsbereichs (SFB) „Deutsch in Österreich. Variation – Kontakt – Perzeption“ (FWF F060). Die Daten werden v. a. aus variationslinguistischer, kontaktlinguistischer wie auch perzeptionslinguistischer Perspektive analysiert, wofür eigene Tools entwickelt wurden, die – ebenso wie das Korpus selbst – mittelfristig der interessierten Öffentlichkeit zur Verfügung gestellt werden.
Seit 1977 wird in Deutschland jedes Jahr ein Wort bzw. eine Wortsequenz zum „Wort des Jahres“ gekürt. Vorgenommen wird die Wahl von einer Jury, die sich aus Mitgliedern der Gesellschaft für deutsche Sprache (GfdS) zusammensetzt. In der deutschsprachigen Schweiz gibt es eine solche Aktion ebenfalls (seit 2003); inzwischen wird das Wort des Jahres aber nicht mehr nur auf Deutsch, sondern auch auf Französisch, Italienisch und Rätoromanisch gewählt. Wenn im Folgenden vom „Schweizer Wort des Jahres“ die Rede ist, ist damit aber immer nur das Deutschschweizer Jahreswort gemeint. Durchgeführt wird die Aktion von einem Forschungsteam, das an der Zürcher Hochschule für Angewandte Linguistik (ZHAW) tätig ist.
Jeden Tag finden weltweit über 40 innerstaatliche Konflikte und Kriege statt. Nach dem letzten Stand (14.11.2022) werden in Subsahara-Afrika 13, im Nahen Osten und in Nordafrika zehn und in Asien ebenfalls zehn Konflikte erwähnt. Aus Europa und Lateinamerika wird jeweils über fünf Konflikte berichtet. 2023 kam es zu neuen Konflikten und Kriegen in der Welt, über die jedoch noch keine Statistik vorhanden ist. Der russische Angriffskrieg gegen die Ukraine ist aber seit Anfang 2022 in den Weltmedien omnipräsent geworden. Somit wurde der Begriff Krieg auf verschiedene Weise in vielen internationalen Kontexten und Textquellen interpretiert und umschrieben, dann aber deutlich zum Ausdruck gebracht.
Der Beitrag thematisiert die Märchenformel es war einmal unter konstruktionsgrammatischem Gesichtspunkt. Im Mittelpunkt der Überlegungen stehen zwei Fragen: a) Wie kann man es war einmal im Kontext seines Gebrauchs in Märchen beschreiben? b) Wie Lässt sich diese Märchenformel im Kontext anderer, mit ihr formal und/oder semantisch verwandter Konstruktionen mit es erfassen? Um die erste Frage zu beantworten, wird auf Merkmale der Textsorte ‚Märchen' sowie auf den Begriff des Erzählens zurückgegriffen. Damit im Zusammenhang wird in Anlehnung an die Terminologie in Feilke (1996) von textuell-pragmatischer Prägung gesprochen. Zur Klärung der zweiten Frage sollen vor dem Hintergrund syntaktischer Prägung abstraktere Konstruktionen mit es (Rhematisierungskonstruktionen, Präsentativkonstruktionen und das es impersonate) herangezogen und in Beziehung zu es war einmal gesetzt werden. Die Überlegungen von a) über b) führen zu der Annahme einer auf Ähnlichkeiten basierenden Konstruktionsfamilie mit es als Thetizitätsmarker.
Das Korpus GeWiss (Gesprochene Wissenschaftssprache kontrastiv: Deutsch im Vergleich zum Englischen und Polnischen) bietet vielfältige Möglichkeiten zur Erforschung und Vermittlung der mündlichen Hochschulkommunikation. Mit den im Projekt ZuMult entwickelten Zugangswegen zu Korpora der gesprochenen Sprache eröffnen sich für einen deutlich größeren Personenkreis umfassende Nutzungsmöglichkeiten, die sowohl für sprachdidaktische Kontexte als auch für Forschungszwecke relevant sind. In diesem Beitrag wird eine Auswahl der in ZuMult geschaffenen Werkzeuge im Hinblick auf ihr Potenzial zur Arbeit mit den GeWiss-Daten vorgestellt. Im Anschluss wird anhand von expliziten sprachlichen Positionierungsmustern aufgezeigt, wie diese Korpustools für eine sprachdidaktisch orientierte empirische Untersuchung zu den Spezifika mündlicher Wissenschaftskommunikation genutzt werden können.
Die erfolgreiche Wiederverwendung gesprochener Korpora muss fachspezifischen Evaluationskritierien genügen und erfordert daher eine flexible Korpusarchitektur, die durch multirepräsentationale (Verfügbarkeit eines akustischen Signals und einer Transliteration) und multisituationale Daten (Variabilität von Situationen bzw. Aufgaben) gekennzeichnet ist. Diese Kriterien werden in einer Fallstudie zur /eː/-Diphthongisierung polnischer Deutschlerner/-innen angewendet und diskutiert. Die Fallstudie repliziert die Ergebnisse der /eː/-Diphthongisierung bei Bildbenennungen von Nimz (2016). Vor der Wiederverwendung werden weitere fachspezifische Evaluationskriterien überprüft, wie Multisituationalität, Aufnahmequalitäten, Erweiterbarkeit, vorhandene Metadaten und vorhandene Dokumentation. Nach der Replikationsstudie werden die Herausforderungen für eine Umsetzung der Wiederverwendung bezüglich Datenmanagement, Workflows und Data Literacy in Forschungs- und Lehrkontexten diskutiert.
Der Beitrag liefert einen Einblick in korpuslinguistische Projekte und Aktivitäten aus dem österreichischen Sprachraum. Der Fokus liegt auf zwei primär auf die Analyse gesprochener Sprache ausgerichteten Korpora (DiÖ-Korpus und WBÖ-Korpus) sowie auf dem medial wie konzeptionell schriftlich angelegten Austrian Media Corpus. Institutionell eingebettet sind die Korpora in den Spezialforschungsbereich „Deutsch in Österreich (DiÖ)“ sowie in die Aktivitäten des Austrian Centre for Digital Humanities and Cultural Heritage (ACDH-CH) an der Österreichischen Akademie der Wissenschaften. Die theoretisch-methodologische Perspektive der Diskussion ist eine variationslinguistische, wobei sozio- und systemlinguistische Aspekte im Beitrag Berücksichtigung finden.
Dieser Beitrag stellt zwei Korpora vor, die als Datengrundlage für die Bestimmung der Regionalangaben im Digitalen Wörterbuch der deutschen Sprache (DWDS) fungieren: das ZDL-Regionalkorpus und das Webmonitor-Korpus. Diese Korpora wurden am Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) erstellt und stehen allen registrierten Nutzern der DWDS-Plattform für Recherchen zur Verfügung. Das ZDL-Regionalkorpus enthält Artikel aus Lokal- und Regionalressorts deutscher Tageszeitungen, die mit arealen Metadaten versehen sind. Es wird ergänzt durch regionale Internet-Quellen im Webmonitor-Korpus, die zusätzliche Areale und Ortspunkte aus dem deutschen Sprachraum einbeziehen. Die Benutzerschnittstelle der linguistisch annotierten Korpora erlaubt nicht nur komplexe sprachliche Abfragen, sondern bietet auch statistische Recherchewerkzeuge zur Bestimmung arealer Verteilungen.
In this article, we provide an insight into the development and application of a corpus-lexicographic tool for finding neologisms that are not yet listed in German dictionaries. As a starting point, we used the words listed in a glossary of German neologisms surrounding the COVID-19 pandemic. These words are lemma candidates for a new dictionary on COVID-19 discourse in German. They also provided the database used to develop and test the NeoRate tool. We report on the lexicographic work in our dictionary project, the design and functionalities of NeoRate, and describe the first test results with the tool, in particular with regard to previously unregistered words. Finally, we discuss further development of the tool and its possible applications.
This paper has two distinct but interdependent goals. The empirical and analytical primary goal is to present a detailed overview of the patterns of (syntactico-semantic) argument structure and (morpho-syntactic) argument realization found with clause-embedding predicates in German. In particular, it will elucidate the observable relationships and dependencies between them, with a special focus on prepositional object clauses. The methodological secondary goal is to demonstrate the recently published ZAS Database of Clause-Embedding Predicates and illustrate its usefulness in approaching a concrete research agenda. The goals are aligned with each other because the data on patterns of argument structure and realization were collected using the database, and indeed the relevant questions could not have been investigated in such a thorough and efficient way without it. We will begin in Part 1 with an introduction to the database, its structure, and why and how it was created, before moving in Part 2 to the presentation of the data and analysis of argument structure and argument realization.
Reduzierte Parenthesen stehen in einer zweifachen Beziehung zur einschließenden Trägerstruktur. Die Trägerstruktur liefert den propositionalen Gehalt eines internen Arguments, das durch das Prädikat der Parenthese selegiert wird, während die Parenthese wie ein Modifikator in Bezug auf die Trägerstruktur fungiert. Die erstere Relation ist anaphorischer Natur, was durch ein pronominales Leerelement im parenthetischen Satz angemessen modelliert wird. Die letztere Relation lässt sich am besten durch die Sättigung eines externen (referenziellen) Arguments des parenthetischen Satzes durch die Trägerstruktur modellieren – analog zu gewöhnlichen Adverbialsätzen. Die strukturelle Bedingung dieser Relation resümiert dann darin, dass die Parenthese in die terminale Zeichenkette der Trägerstruktur eingeschlossen ist. Die Funktion der Parenthese als Modifikator wiederum ist eine Bedingung für die Lizenzierung des Leerelements innerhalb dieser Parenthese. Diese Erklärung wird durch Parallelen zu Phänomenen in Relativ- und in Vergleichsätzen untermauert.
Als Band 12 der Reihe „Studien Deutsch als Fremd- und Zweitsprache“ des Erich Schmidt Verlags ist 2021 Junhong Lis Dissertation mit dem Haupttitel „Aber-Relationen“ erschienen. Wie der Untertitel „Vorkommen und Funktion in DaF-Lehrwerken für Fortgeschrittene und in wissenschaftlichen Texten“ verrät, geht es in dieser Arbeit um eine gewinnbringende Untersuchung der Distribution des Konnektors aber mit Hinblick auf die Optimierung des DaF-Unterrichts. Für die Zwecke der Arbeit werden zwei Korpora aufgebaut: Das erste Korpus (Korpus 1) enthält 551 Belege aus wissenschaftlicher Literatur zum Fach Deutsch als Fremdsprache (161 f.). Das zweite Korpus (Korpus 2) besteht aus 849 Belegen aus 11 DaF-Lehrwerken für erwachsene, fortgeschrittene Deutschlernende (162 ff.).
Die in diesem Band versammelten Beiträge zur Jahrestagung 2022 des Instituts für Deutsche Sprache geben einen Überblick zu aktuellen Entwicklungen der Erschließung und Nutzung von Korpora in der germanistischen Linguistik und darüber hinaus. Dabei steht im Vordergrund, wie bekannte und neue Korpora für die Untersuchung verschiedenster linguistischer Fragestellungen, z.B. der Lexikografie, der Gesprächsforschung, des Spracherwerbs oder der historischen Sprachwissenschaft, genutzt werden können.
Im Einzelnen geht es um:
- Korpusangebote und Korpusdesign
- Software für die Arbeit mit Korpora
- Korpusaufbereitung
- den Zusammenhang von Korpusaufbereitung und Forschungsfragestellungen
- ethisch-rechtliche Aspekte der Arbeit mit Korpora
- Anwendungs- und Nutzungsmöglichkeiten von Korpora
Diese Fragen werden im Kontext wissenschaftstheoretischer Überlegungen zur Frage des Nutzens von Korpora für die linguistische Erkenntnisbildung behandelt. Es werden dabei sowohl klassische Schrift- und Tonkorpora, als auch Korpora mit Daten aus anderen Medialitäten (Video und Social Media) vorgestellt. Eine weitere Dimension sind Vergleichskorpora mehrerer Sprachen oder Medialitäten (mündlich vs. schriftlich) sowie diachrone (Vergleichs-)Korpora und der Blick auf nicht-deutschsprachige Korpusangebote.
Die meisten, wenn nicht alle natürlichen Sprachen kennen unterschiedliche Satzarten, die in ihrer grammatischen Form – z. B. Konstituentenfolge, verbale Modi, Vorkommen von Interrogativa, spezifischen Partikeln usw. – und/oder ihrer syntaktischen bzw. pragmatischen Funktion – Satzgliedwert; Aussage-, Frage-, Aufforderungsfunktion usw. – besondere Eigenschaften aufweisen. Eine weit verbreitete Intuition besagt, dass allen Satzarten über formale und funktionale Unterschiede hinweg etwas gemeinsam sein muss, das als satzartunabhängiger Bedeutungskern bestimmt werden kann. Dafür sind unterschiedliche Termini in Umlauf, unter denen der Propositionsbegriff eine prominente Rolle spielt. Der vorliegende Aufsatz betrachtet die Satzarten des Gegenwartsdeutschen. Im Anschluss an Wittgenstein, Frege und Lyons entwickelt er eine Begrifflichkeit, mit der die Bedeutungspotenziale von Satzarten beschrieben und verglichen werden können. Der Propositionsbegriff wird in Anlehnung an Lyons über die Möglichkeit einer Auswertung vor Wissenshintergründen und der darauf fußenden Bewertbarkeit hinsichtlich Wahrheit definiert. Es wird detailliert untersucht, welche Satzarten des Deutschen Propositionen in diesem Sinne ausdrücken müssen oder können und welche dies nicht können. Ferner werden formale Ausdrucksmittel identifiziert, die propositionale Lesarten von Sätzen erzwingen, nahelegen oder ausschließen. Es wird deutlich, dass der gewählte Propositionsbegriff nicht den gemeinsamen Bedeutungskern aller Satzarten erfassen kann. Als solcher wird eine weniger komplexe semantische Einheit bestimmt: die Beschreibung eines Sachverhalts.
Der vorliegende Aufsatz widmet sich zwei Kategorien der traditionellen (deutschen) Grammatik: dem Aufforderungssatz, einer der fünf klassischen Satzarten, und dem Imperativ, einer Verbform, die als typisch für Aufforderungssätze gilt. Er greift Beobachtungen aus der jüngeren Fachliteratur auf, die ein zunehmendes Unbehagen mit beiden Kategorien erkennen lassen. In morphologischer Hinsicht zeigt sich, dass nur wenige deutsche Verben eine eindeutige Imperativform besitzen. Manche Verben besitzen keine Imperativform. Bei der Mehrzahl der Verben besteht Homonymie zwischen Imperativformen und Konjunktivformen der 3. Person Singular. Imperativformen werden durch Konjunktivformen verdrängt. In syntaktischer Hinsicht wird argumentiert, dass Imperativsyntagmen keine Satzform haben. Satzförmige Ausdrücke mit Konjunktivformen, die für auffordernde Handlungen stehen, können als Wunschsätze kategorisiert werden. Als Aufforderungssätze bleiben zwei Klassen von Syntagmen im Grenzbereich zwischen nicht-satzförmigen und satzförmigen Ausdrücken übrig, die besondere Eigenschaften hinsichtlich Subjektbesetzung und Subjekt-Verb-Kongruenz zeigen.
Orthographie ist ein Thema, das spätestens seit der Rechtschreibreform 1996 nicht nur die wissenschaftliche Forschung, sondern auch den öffentlichen Diskurs entscheidend geprägt hat. Aus Anlass von „20 Jahren Rat für deutsche Rechtschreibung“ war dieses Thema auch Gegenstand der 59. Jahrestagung des Leibniz-Instituts für Deutsche Sprache.
Der Beitrag betrachtet movierbare Personenbezeichnungen, die in einem Prädikativum mit Bezug auf ein weibliches Subjekt gebraucht werden (Typ sie ist Käufer/Käuferin). In solchen Fällen ist neben der Verwendung der movierten Personenbezeichnung auch die ihrer maskulinen Basis möglich, wobei zum tatsächlichen Gebrauch der beiden Varianten bisher widersprüchliche Angaben und kaum Daten vorlagen. Diese Untersuchung ergibt, dass die Movierung in der Prädikativkonstruktion seit dem Ahd. der Normalfall war und ist. Allerdings lassen sich einige Nischen ausmachen, in denen unmovierte Bezeichnungen etwas frequenter sind: Der mit Abstand höchste Wert findet sich bei weiblicher Selbstreferenz, während Maskulina bei weiblichen Subjekten der dritten Person Singular mit einer Ausnahme weitgehend unüblich sind. Diese Ausnahme ist der offizielle Sprachgebrauch der damaligen DDR. Öffentlichkeitsgerichtete Texte des 20./21. Jh., die nicht aus der DDR stammen, zeigen einen vermutlich gesellschaftlich bedingten Rückgang der sowieso schon seltenen unmovierten Formen ab Mitte der 1970er-Jahre.
A constructicon, i.e., a structured inventory of constructions, essentially aims at documenting functions of lexical and grammatical constructions. Among other parameters, so-called constructional collo-profiles, as introduced by Herbst (2018, 2020), are conclusive for determining constructional meanings. They provide information on how relevant individual words are for construction slots, they hint at usage preferences of constructions and serve as a helpful indicator for semantic peculiarities of constructions. However, even though collo-profiles constitute an indispensable component of constructicon entries, they pose major challengers for constructicographers: For a constructicographic enterprise it is not feasible to conduct collostructional analyses for hundreds or even thousands of constructions. In this article, we introduce a procedure based on the large language model BERT that allows to predict collo-profiles without having to extensively annotate instances of constructions in a given corpus. Specifically, by discussing the constructions X macht Y ADJP (‘x makes Y ADJ’, e.g. he drives him crazy) and N1 PREP N1 (e.g., bumper to bumper, constructions over constructions), we show how the developed automated system generates collo-profiles based on a limited number of annotated instances. Finally, we place collo-profiles alongside other dimensions of constructional meanings included in the German Constructicon.
Der vorliegende Beitrag untersucht aus interaktionslinguistischer Perspektive, wie Prinzipien deliberativer Demokratie in den Schlichtungsgesprächen zu Stuttgart 21 umgesetzt wurden. Wir konzentrieren uns dabei auf Interventionen, in denen der Schlichter Heiner Geißler die Wahrung von Verständlichkeit und Interessen der Bürger/-innen anmahnt, sowie Verletzungen der Wahrheitsnorm sanktioniert. Wir zeigen, wie Bürger/-innen sowie Normen und Werte rhetorisch als Ressource für das Einhalten von Verfahrensregeln genutzt werden, aber auch den Interessen des Schlichters selbst dienen. Dabei werden die Verfahrenswerte nicht immer einheitlich priorisiert. Die zugrunde liegende politische Diskussion wird zu Gunsten der Durchsetzung des Konstrukts ‚Faktenschlichtung‘ ausgeklammert.
Das Vokabular von Songtexten im gesellschaftlichen Kontext – ein diachron-empirischer Beitrag
(2022)
Der Beitrag untersucht den Stellenwert gesellschaftlich relevanter Thematiken in deutschsprachigen Songtexten der zurückliegenden fünf Jahrzehnte. Dabei zeigt sich, dass neben individuellen Befindlichkeiten auch politische, sozialkritische oder umweltbezogene Themen signifikant angesprochen werden. Wir kontrastieren Songtexte mit anderen Testsorten und wenden dabei quantitative Methoden auf umfangreiche, breit stratifizierte Datensamples an, um die Phänomenbeschreibungen präzisierbar, generalisierbar und reproduzierbar zu machen. Das longitudinale Korpusdesign bietet Potenzial für diachrone Vergleiche. Im Sinne eines erweiterten „Mixed Methods“-Ansatzes exploriert die Studie zudem ausgewählte Aspekte qualitativ und bettet sie in den zeitlichen Kontext ein.
This paper investigates the long-term diachronic development of the perfect and preterite tenses in German and provides a novel analysis by supplementing Reichenbach’s (1947) classical theory of tense by the notion of underspecification. Based on a newly compiled parallel corpus spanning the entire documented history of German, we show that the development in question is cyclic: It starts out with only one tense form (preterite) compatible with both current relevance and narrative past readings in (early) Old High German and, via three intermediate stages, arrives at only one tense form again (perfect) compatible with the same readings in modern Upper German dialects. We propose that in order to capture all attested stages we must allow tenses to be unspecified for R (reference time), with R merely being inferred pragmatically. We then propose that the transitions between the different stages can be explained by the interplay between semantics and pragmatics.
Der Beitrag behandelt methodische Fragen der Korpuspragmatik im Bereich der politischen Sprache am Beispiel sprachlicher Praktiken der Moralisierung im Deutschen Bundestag. Wir stellen einen Ansatz zur Erarbeitung pragmatischer Strukturmuster – ,Pragmeme‘ – des Moralisierens vor, der auf kollaborativer Annotation basiert. Den Datensatz bildet das linguistisch aufbereitete Korpus der Plenarprotokolle des Deutschen Bundestags 1949–2017. Zur Eruierung geeigneter Beobachtungspassagen wurde ein Thesaurus von Moralwörtern erarbeitet und deren Verteilung gemessen. Dadurch haben sich drei Beobachtungsperioden für Pilotkorpora ergeben: 1949, 1983 und 2015. In diesen Beobachtungsperioden wurden Zufallsstichproben von Sätzen mit Moralwörtern gezogen und annotiert. Im Beitrag stellen wir die einzelnen Schritte und vorläufigen Ergebnisse des Projekts vor und diskutieren Möglichkeiten und Grenzen des Verfahrens.