Refine
Year of publication
Document Type
- Part of a Book (992)
- Article (429)
- Conference Proceeding (81)
- Book (58)
- Review (54)
- Report (11)
- Other (6)
- Master's Thesis (3)
- Doctoral Thesis (2)
- Part of Periodical (2)
Language
Keywords
- Deutsch (715)
- Korpus <Linguistik> (203)
- Sprachgebrauch (111)
- Rechtschreibung (92)
- Grammatik (87)
- Rezension (84)
- Interaktion (69)
- Gesprochene Sprache (67)
- Linguistik (66)
- Semantik (66)
Publicationstate
- Zweitveröffentlichung (1642) (remove)
Reviewstate
- (Verlags)-Lektorat (1161)
- Peer-Review (411)
- (Verlags-)lektorat (4)
- (Verlags-)Lektorat (3)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (3)
- Peer review (2)
- Peer-reviewed (2)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (2)
- (Verlags-)Lektoriat (1)
- Peer-review (1)
Publisher
- de Gruyter (463)
- Narr Francke Attempto (123)
- Narr (83)
- Erich Schmidt (60)
- IDS-Verlag (36)
- Niemeyer (32)
- Steiner (26)
- De Gruyter (23)
- Stauffenburg (23)
- Erich Schmidt Verlag (20)
Thema der 59. Jahrestagung des Leibniz-Instituts für Deutsche Sprache war vom 14. bis zum 16. März 2023 erstmals nach mehreren Jahrzehnten wieder die Orthografie des Deutschen, und zwar „in Wissenschaft und Gesellschaft“. Einen unmittelbaren Anlass dafür bildete der bevorstehende Abschluss der siebenjährigen Arbeitsphase des Rats für deutsche Rechtschreibung Ende 2023, dessen Tätigkeit das IDS seit seiner Gründung wissenschaftlich begleitet. Aber auch die Orthografieforschung selbst hat sich seit der Rechtschreibreform im Jahr 1996 in einer Weise entwickelt, dass die Wahl dieses schriftlinguistischen Querschnittsthemas angezeigt erschien.
Das Schriftsystem ist ein System und es zeigen sich Folgen, wenn Schreibungen gegen den Schreibusus geändert werden. Exemplarisch wird dies erstens an der Veränderung des Verbsuffixes -iren zu -ieren im Nachgang der Rechtschreibreform von 1876 und zweitens der Veränderung von Gruppen wie im Allgemeinen in der Reform von 1996 gezeigt. Beide verursachen unbeabsichtigte Folgefehler. Wie systematisch manche Variation und damit auch mancher Fehler ist, wird sowohl am Komma vor Vergleichssätzen als auch an Fehlern in der Getrennt- und Zusammenschreibung gezeigt. Das Statut des Rechtschreibrates besagt, dass bei der Weiterentwickung des Amtlichen Regelwerks die ständige Beobachtung der Schreibentwicklung, die Klärung von Zweifelsfällen, die Erarbeitung und die wissenschaftliche Begründung von Vorschlägen zur Anpassung des Regelwerks an den allgemeinen Wandel der Sprache im Vordergrund stehen. Das ist zu begrüßen, weil viele Zweifel bei den Zweifelsfällen grammatische und nicht orthographische Ursachen haben.
Kognitive Pretests oder auch kognitive Interviews sind semi-standardisierte Interviews, die durchgeführt werden, um Einblick in die kognitiven Prozesse zu bekommen, die Befragte beim Beantworten von Fragen durchlaufen, und wie sie zu ihrer Antwort kommen. Innerhalb der sozialwissenschaftlichen Umfrageforschung werden kognitive Interviews insbesondere zu zwei Zwecken eingesetzt: (a) in der Fragebogenentwicklung und (b) in der Übersetzung von Fragebögen. Im Rahmen der Fragebogenentwicklung wird durch Interviews mit Befragten der Zielpopulation versucht, Hinweise auf unterschiedlichste Frageprobleme zu erhalten. So kann man beispielsweise herausfinden, wie Befragte bestimmte Wörter oder Begriffe verstehen, wie schwierig oder einfach sie eine Frage finden oder wie sie ihre Antwort auf eine Frage bilden. In der Übersetzung von Fragebögen kann man beispielsweise untersuchen, ob eine übersetzte Frage so verstanden wird wie die entsprechende Frage in der Ausgangssprache oder welche gewünschten bzw. unerwünschten Konnotationen bestimmte Übersetzungen haben. Innerhalb der Orthographieforschung ließe sich diese Methode auf die Entwicklung von Kriterien zur Festlegung von Rechtschreibregeln oder zur Prüfung ihrer Akzeptanz anwenden: In kognitiven Interviews eingesetzte Techniken wie „Probing“, also gezieltes Nachfragen, oder Lautes Denken könnten genutzt werden, um zu prüfen, wie Rechtschreibregeln angewendet werden oder wie sie zielgruppenspezifisch und nutzungsfreundlich ausgestaltet werden müssten, damit sie größtmögliche Akzeptanz in weiten Teilen der Bevölkerung finden. So könnte man intuitive Entscheidungen bei Worttrennung oder Getrennt- und Zusammenschreibung untersuchen.
Gemäß Lehrplänen scheint der Rechtschreiberwerb nach der Sekundarstufe I weitgehend abgeschlossen. Aber auch auf der Sekundarstufe II, ja sogar an Universitäten verstoßen die Schreibenden gegen die gültigen Regeln. Dabei können Lernende auf diesen Stufen durch die Auseinandersetzung mit dem System der Orthografie ein besseres Verständnis für die Normen entwickeln. Ein explorativer, konstruktivistischer Ansatz eröffnet neue Perspektiven, orthografische Probleme zu untersuchen und zu verstehen. Es wird gezeigt, wie Regeln durch gezielte Aufträge selbstständig entdeckt werden können und mit welchen Strategien sich das Sprachbewusstsein durch und für die Orthografie vertiefen lässt. Ein solcher explorativer Zugang erweitert das Wissen über Rechtschreibung und fördert die korrekte Verwendung der Schriftsprache.
Orthographie
(2024)
Ausgehend von den Ergebnissen des letzten IQB-Bildungstrends (2021) zu den orthographischen Kompetenzen von Grundschüler:innen fragt der Beitrag nach Stellenwert und Funktion der Orthographie vor dem Hintergrund der Anforderungen, die an die sprachliche Bildung von Schüler:innen gestellt sind. Orthographie und orthographische Kompetenzen werden funktional im Bereich des Schreibens und einer zu entwickelnden Schreibkompetenz verortet. Wichtig ist dabei der Blick auf die Schreibflüssigkeit. Sie ist grundlegend für die anforderungsreichen Prozesse des Textschreibens. Ausgehend von Befunden neuerer Studien betrachten wir das Verhältnis von Orthographie und Schreiben und daraus resultierende Anforderungen an den schulischen (Recht-)Schreiberwerb.
Der vorliegende Beitrag beschäftigt sich mit der Rechtschreibung von Maturantinnen und Maturanten in einem österreichischen Deutschmaturatext-Korpus. Es werden Ergebnisse aus einer quantitativen und qualitativen Untersuchung dieses Lernerkorpus präsentiert. Diese haben gezeigt, dass die Rechtschreibleistungen in den untersuchten österreichischen Maturaarbeiten besser sind als in der (medialen) Öffentlichkeit angenommen, dabei jedoch bestimmte Fehlerschwerpunkte hervorstechen. Signifikante Unterschiede in Hinblick auf Leistungen bei Orthographie und Zeichensetzung bestehen zudem zwischen stift- und computergeschriebenen Arbeiten.
Anhand der Rückmeldungen auf eine Umfrage unter den Mitgliedern der Organisation EFNIL (European Federation of National Institutions for Language) wird in diesem Artikel erfasst, wie die orthographische Norm in den Staaten Europas etabliert und vermittelt wird. Es wird unter anderem beleuchtet, welche Prinzipien bei der Erstellung der Norm angewandt werden, in welchen Teilen der Gesellschaft die Regeln gelten, wie sie an die Öffentlichkeit vermittelt werden, inwieweit sie eingehalten werden, ob es alternative Normen gibt, und mit welchen Mitteln Veränderungen im Sprachgebrauch erfasst und berücksichtigt werden.
GraphVar ist ein Korpus aus über 1.600 Abiturarbeiten, die zwischen 1917 und 2018 an einem niedersächsischen Gymnasium geschrieben wurden. Das Hauptinteresse beim Aufbau bestand in der Beschreibung graphematischer Variation und ihrer Entwicklung über die Zeit. Leitend war die Frage, was Schreiberinnen und Schreiber eigentlich tatsächlich machen bzw. gemacht haben – und zwar unbeeinflusst von technischen Hilfsmitteln oder Schluss- und Endredaktion, aber unter vergleichbaren Bedingungen. Das Korpus bietet somit ein Fenster auf den unverfälschten Schreibgebrauch von Abiturientinnen und Abiturienten im Laufe der Zeit. Zum jetzigen Zeitpunkt sind 1.618 Arbeiten transkribiert, linguistisch annotiert und über eine ANNIS-Instanz erreichbar (graphvar.unibonn.de, Stand: 8.8.2023). Im Sommer 2022 konnten weitere 1.600 Arbeiten zwischen 1900 und 2021 an einem Gymnasium in Nordrhein-Westfalen digitalisiert werden. Neben schriftlinguistischen Fragestellungen ist das Korpus prinzipiell auch für syntaktische, morphologische und lexikalische Fragestellungen geeignet; auch didaktische Untersuchungen sind möglich, genau wie kulturwissenschaftliche.
Neographeme wie Genderstern und Doppelpunkt werden zunehmend verwendet, um Personen unabhängig von ihrem Geschlecht einzubeziehen. Der Beitrag beleuchtet diese Sonderzeichen aus semantischer, typographischer und grammatischer Sicht, vergleicht sie mit anderen Typogrammen und diskutiert ihren Morphemstatus. Auch ihre metapragmatische Leistung der sprecherseitigen Verortung kommt in den Blick. In Bezug auf die Rezeption werden aus kognitionslinguistischer Perspektive die Lesbarkeit und die Funktionstüchtigkeit des Sterns betrachtet. Lesenden, die mit der Form vertraut sind, gelingt der Wortzugriff mühelos, und der Genderstern elizitiert inklusive mentale Repräsentationen. Diese Analysen und Befunde sprechen für die grundsätzliche Möglichkeit, Neographeme in die Sprache zu integrieren.
Seit 1996 ist das Amtliche Regelwerk zur deutschen Rechtschreibung (einschließlich Amtlichem Wörterverzeichnis) gültig. Es regelt die Orthografie für Behörden und Schulen in Deutschland sowie in den sechs weiteren Mitgliedsländern des Rats für deutsche Rechtschreibung. Für die Wörterbuchverlage bzw. alle Wörterbuchprojekte gilt es, dieses hoch abstrakte Regelwerk einerseits auf alle Einträge in den A–Z-Teilen der Wörterbücher anzuwenden und andererseits ggf. das Regelwerk selbst zu „übersetzen“ und es damit einer breiten Öffentlichkeit zugänglich zu machen.
Der Beitrag dokumentiert eine Auswahl der wichtigsten Leitlinien, die die Grundlage für die Neukonzeption und -bearbeitung des Kapitels zur Zeichensetzung im Amtlichen Regelwerk bilden. Das wesentliche Ziel der mit der Bearbeitung des Kapitels Zeichensetzung befassten internationalen Arbeitsgruppe im Rat für deutsche Rechtschreibung (RfdR) in seiner aktuellen Amtsperiode (2018–2023) bestand darin, eine für die Nutzerinnen und Nutzer deutlichere und einfachere Darstellung dieses Teils des amtlichen Regelwerks (ARW) vorzulegen ebenso wie eine systematisch an einer semasiologischen Perspektive orientierte Erfassung der Funktion und der Verwendung der Interpunktionszeichen auf der Grundlage wissenschaftlicher Weiterentwicklungen.
Die empirische Untersuchung sprachlicher Variation setzt eine adäquate Datenbasis voraus, um möglichst zutreffende Schlussfolgerungen ziehen zu können. Citizen Science ist als empirischer Erhebungsansatz zunehmend in den Fokus der Sprachwissenschaft gerückt, da damit eine größere und potenziell sprachlich/sozial besser stratifizierte Datenbasis erhoben werden kann. Der vorliegende Aufsatz stellt ein Exponat vor, das 2022 auf dem Museumsschiff „MS Wissenschaft“ durch Deutschland und Österreich tourte und einer jungen Zielgruppe sprachliche Variation und sprachwissenschaftliche Forschungsmethoden näherbringen sollte. Außerdem enthielt es Citizen-Science-basierte Erhebungskomponenten, mit denen unter anderem Daten zu Schreibvarianten von Anglizismen gesammelt wurden. Hier werden erste Datenauswertungen vorgestellt und mit existierenden Forschungsdaten basierend auf Korpusanalysen verglichen.
Vorwort
(2024)
Thema der 59. Jahrestagung des Leibniz-Instituts für Deutsche Sprache war vom 14. bis zum 16. März 2023 erstmals nach mehreren Jahrzehnten wieder die Orthografie des Deutschen, und zwar „in Wissenschaft und Gesellschaft“. Einen unmittelbaren Anlass dafür bildete der bevorstehende Abschluss der siebenjährigen Arbeitsphase des Rats für deutsche Rechtschreibung Ende 2023, dessen Tätigkeit das IDS seit seiner Gründung wissenschaftlich begleitet. Aber auch die Orthografieforschung selbst hat sich seit der Rechtschreibreform im Jahr 1996 in einer Weise entwickelt, dass die Wahl dieses schriftlinguistischen Querschnittsthemas angezeigt erschien.
Die Schrifttypologie beschränkte sich bisher auf eine strukturelle Klassifikation von Schriftsystemen, basierend auf der sprachlichen Korrespondenzebene von Graphemen. Aufgrund dieses engen Fokus haben die resultierenden Typologien relevante Merkmale sowie Gemeinsamkeiten verschiedener Schriftsysteme und ihres Gebrauchs nicht im Blick. Zur Erarbeitung einer umfassenden Schrifttheorie mit erklärendem Anspruch ist aber eine multiperspektivische und damit interdisziplinäre Beschreibung – und in Folge ein Vergleich – unterschiedlicher Schriftsysteme notwendig. Die Erstellung nutzbringender – sowohl struktureller als auch gebrauchsbasierter – Typologien ist hierfür eine geeignete Methode. Ihre einzelnen Schritte werden hier anhand des Beispiels der graphematischen Transparenz charakterisiert.
Exploration und statistisch valide Analysen annotierter Textkorpora helfen bei der induktiven Aufdeckung systematischer Schreibgebrauchsmuster. Umgekehrt lassen sich – deduktiv – Vorgaben der kodifizierten Norm (amtliches Regelwerk) quantitativ überprüfen. Wir präsentieren eine Methodik für die empirisch informierte Beschreibung orthografisch motivierter Phänomene, gehen auf prototypische Fälle ein und werfen ein Schlaglicht auf Fallstricke der Korpusnutzung für die Orthografieforschung. Abschließend skizzieren wir Funktionen und Wirkungsweisen aggregierender Visualisierungen für die Forschungskommunikation am Beispiel des amtlichen Wörterverzeichnisses.
Die normgerechte Kommasetzung ist im Deutschen deklarativ und sehr elegant von Beatrice Primus (1993, 2007) erfasst worden. Sie bindet Kommas primär an syntaktische Konzepte wie ‚Satzgrenze‘ und ‚Subordination‘. Nun gibt es allerdings ein Komma, das sich nicht ins System fügen will, das aber immer häufiger wird: das Vorfeldkomma wie in Gegen so eine starke Übermacht, konnten die deutschen Truppen nichts mehr ausrichten. Dieser Beleg stammt aus einer rezenten Abiturarbeit. Hier wird – entgegen den geltenden Rechtschreibregeln – das Vorfeld der Sätze mit einem Komma abgetrennt; es handelt sich um systematische Abweichungen von der Norm. Wir können die Faktoren, die ihre Verteilung steuern, empirisch gut erfassen. Weit weniger klar ist, ob diese Beobachtungen theoretische Konsequenzen haben sollten, und wenn ja, welche. Das soll in diesem Beitrag diskutiert werden, neben einigen anderen Problemfällen, die die Empirie der Theorie beschert.
Die Anforderungen an gegenwartssprachliche Wörterbücher beinhalten, bei der Aufbereitung der lexikalischen Informationen in Stichwortartikeln die lemmabezogenen Korrektschreibungen adäquat zu berücksichtigen. Die dazugehörigen Arbeitsgänge in der Redaktion des Digitalen Wörterbuchs der deutschen Sprache (DWDS) reichen von der Ansetzung der Nennformen in allen ggf. zulässigen orthographischen Varianten über die Anlage von Verweisen auf die einschlägige Bezugsnorm bis zur Dokumentation ausgewählter Korpusbelege mit gebrauchsfrequenten Abweichungs- und Falschschreibungen. Als besondere Herausforderungen für die lexikographische Praxis erweisen sich regelmäßig Lücken und Interpretationsspielräume in der amtlichen Regelung sowie die bei Belegrecherchen in den DWDS-Textquellen zutage tretenden Diskrepanzen zwischen orthographischer Norm und Schreibusus.
Das Ziel des Beitrages ist es, die Orthografiereform 1996–2006 in den Entwicklungsprozess der deutschen Rechtschreibung seit der Herausbildung der Einheitsorthografie einzuordnen, ihre Stellung in diesem Prozess zu kennzeichnen und ihre Ergebnisse zu benennen. Ausgehend von einer Charakterisierung der besonderen Merkmale der Orthografie als Norm der Schreibung sowie des Begriffes Orthografiereform, werden zunächst die Endphase der Herausbildung der deutschen Einheitsorthografie und ihr Abschluss durch die Orthografiereform von 1901 beschrieben. Dem folgt die Darstellung der Besonderheiten der deutschen Orthografieentwicklung im 20. Jahrhundert bis zum Jahr 1996. Ein wichtiger Bestandteil des Beitrages ist dann die Herausarbeitung der Grundlagen und Bestimmungsfaktoren einer Orthografiereform unter heutigen Bedingungen und die Anwendung dieser Grundsätze auf den Prozess der Entstehung und Umsetzung der Orthografiereform 1996–2006. Abschließend werden die Ergebnisse dieses Prozesses in vier Punkten zusammengefasst die auch gleichzeitig die Bedeutung dieser Sprachlenkungsmaßnahme in der deutschen Orthografiegeschichte kennzeichnen.
Das Amtliche Wörterverzeichnis ist ein wesentlicher Teil des für Schulen und Behörden verbindlichen Amtlichen Regelwerks, dem wissenschaftlichen Referenzwerk für die deutsche Orthografie. Dem Wörterverzeichnis kommt eine entscheidende Funktion zu: Es exemplifiziert anhand einzelner Lemmata die Anwendung der Regeln und kodifiziert darüber hinaus Einzelfälle, die aus dem Regelteil nicht eindeutig ableitbar sind. Im vorliegenden Beitrag wird die auf der Basis empirischer Schreibbeobachtung erarbeitete Neukonzeption vorgestellt, die mit der Konzentration auf prototypische Fallbeispiele repräsentative orthografische Zweifelsfälle im gegenwärtigen Wortschatz des Deutschen aufgreift, sie mit Bezug auf die geltende Norm und den Schreibgebrauch klärt, in der neuen digitalen Fassung auch visualisierend veranschaulicht und auf diese Weise aktuellem Nutzungsverhalten Rechnung trägt.
Für die spezifischen Bedürfnisse der Schreibbeobachtung wurde das Orthografische Kernkorpus (OKK) als virtuelles Korpus in DeReKo entwickelt. Mit derzeit rund 14 Mrd. Token deckt es den Schriftsprachgebrauch in den deutschsprachigen Ländern im Zeitraum von 1995 bis in die Gegenwart ab. Der Zugriff über die Korpusanalyseplattform KorAP erlaubt nicht nur die Nutzung verschiedener Annotationen, sondern über die API-Schnittstellen auch die Einbindung in diverse Auswertungsumgebungen wie RStudio über den RKorAPClient und macht es so für zahlreiche Analyse- und Visualisierungsmöglichkeiten zugänglich.
grammis ist ein wissenschaftlich basiertes Online-Informationssystem zur deutschen Grammatik und Orthografie, das Erklärungen und Hintergrundwissen für Sprachinteressierte und Deutschlernende weltweit bietet. Neben genuin grammatischen Themen enthält es auch für das Rechtschreiblernen gewinnbringende Inhalte. Im vorliegenden Beitrag werden seine orthografischen Komponenten veranschaulicht und aktuelle Neuerungen im Zusammenhang mit seiner Integration in eine im Entstehen befindliche digitale Vernetzungsinfrastruktur für die Bildung erläutert.
In der wissenschaftlichen Auseinandersetzung spielen derzeit Entwicklungen in den theoretischen und empirischen Erkenntnissen zur Orthographie(entwicklung), zum Schrift- und Orthographieerwerb und zur Orthographiedidaktik sowie aktuelle Entwicklungen im Schreibgebrauch eine zentrale Rolle. Globalisierung und Internationalisierung befördern in der gesprochenen und der geschriebenen Sprache die Aufnahme zahlreicher neuer Fremdwörter, vor allem Entlehnungen aus dem anglo-amerikanischen Sprachraum, in den deutschen Fach- und Allgemeinwortschatz und damit Entwicklungen im Schreibgebrauch. Auch neue digitale Medien begünstigen veränderte, nutzungsorientierte Vermittlungsstrategien orthographischer Inhalte. Und nicht zuletzt stellt die intensiv geführte Debatte über gendersensible Schreibung unter Verwendung von Sonderzeichen (wie Asterisk oder Doppelpunkt im Wortinneren) die Schreibgemeinschaft vor Herausforderungen.
Das Verhältnis von Norm und Schreibgebrauch bestimmt die Orthografieforschung und den orthografischen Diskurs nicht erst seit der Rechtschreibreform 1996. Wurde der Normbegriff lange Zeit als relativ statische Größe verortet, so erhielt er durch im 21. Jahrhundert verstärkt zu beobachtende Schreibwandelprozesse signifikante Impulse für Modifikationen, die eine offenere Entwicklung einleiteten. Besonders deutlich ist dies an Fremdwörtern und insbesondere an Fremdwort-Neologismen abzulesen. So belegt die empirische Beobachtung von Anglizismen, wie soziokulturelle Entwicklungen Sprach und Schreibveränderungen bewirken. Mit Bezug auf das Amtliche Regelwerk wird gezeigt, wie ein neu herausgebildeter Usus zur Modifizierung einzelner Regeln und Schreibungen führen kann und damit auch zu einem flexibleren, dynamischeren Normbegriff.
Mehrsprachigkeit gehört zu den Themen, zu denen wohl viele Menschen eine Meinung haben. Der Wert traditioneller schulischer Fremdsprachen wird dabei häufig hervorgehoben, während Wert und Erhalt von Herkunftssprachen Zugewanderter hinterfragt werden. Einstellungen gegenüber Sprachen sind demnach abhängig vom Prestige der jeweiligen Sprachen und ihrer Sprecher:innen. Dies geschieht vor dem Hintergrund, dass Deutschland überwiegend als ein einsprachiges Land mit einer einsprachigen Gesellschaft angesehen wird. Ähnliches gilt im Übrigen auch für Österreich. So schreibt beispielsweise der Sprachwissenschaftler Heiko Marten, „dass in der Wahrnehmung großer Teile der österreichischen Gesellschaft Monolingualismus nach wie vor die Norm ist“ (Marten 2016, S. 165). Diese Annahme gilt auch für den schulischen Kontext, wie die Erziehungswissenschaftlerin Ingrid Gogolin mit dem Begriff des „monolingualen Habitus“ herausgearbeitet hat (vgl. Gogolin 2008). Gründe für einen monolingualen Habitus könnten darin liegen, dass „von Teilen der Allgemeinheit oft übersehen [wird], dass in Deutschland auch zahlreiche weitere Sprachen gesprochen werden“ (Marten 2016, S. 148). Doch was passiert nun, wenn eine Sprache einen Statuswechsel von Landessprache zu Herkunftssprache durchläuft? Was lässt sich beobachten, wenn beispielsweise das Deutsche zu einer Minderheitensprache wird?
Das Rechtschreiben ist digital automatisierbar. Ist der Orthographieerwerb dann noch notwendig für den Aufbau einer bildungssprachlichen literalen Kompetenz? Der Beitrag fragt nach den Zusammenhängen zwischen der Orthographie und den sprachlichen und kognitiven Fähigkeiten, die für das Schreiben und Lesen von Texten gebraucht werden. Argumente und Forschungsergebnisse zu drei konkurrierenden Hypothesen zu diesem Zusammenhang werden vorgestellt und diskutiert: Entlastungsthese, Bewusstheitsthese, Literalisierungsthese. Auf der Grundlage der Literalisierungsthese wertet der Beitrag den Orthographieerwerb als nicht substituierbare Komponente einer Sprachkompetenz, die den Umgang mit Texten ermöglicht.
Der Beitrag behandelt Schreibvarianten der Gegenwartssprache. Es werden auf der Grundlage von vier Fallgruppen (1. Binnenmajuskel, 2. Kompositaschreibung mit Leerzeichen, 3. Kompositaschreibung mit Bindestrich, 4. genderfokussierende Schreibweisen) zwei Typen von Normvarianz unterschieden – ein politischer und ein unpolitischer. Dabei wird der Frage nachgegangen, ob unpolitische Ad-hoc-Bildungen auf dem Weg der Konventionalisierung sich von als politisch wahrgenommenen Normvarianten unterscheiden. Zur Beschreibung des Phänomens wird der Begriff der elastischen Norm eingeführt, um divergierende Schreibkonventionen im Spannungsfeld von Faktizitätsherstellung und kodifizierter Setzung zu modellieren. Zur soziolinguistischen Unterscheidung von Schreib- und Leseperspektiven werden die Schreibvarianten als drei unterschiedliche Gesten kategorisiert – als unmarkierte Nullgeste, als markierte Nullgeste und als indexikalisierte Signalgeste.
Meaning in interaction
(2024)
This editorial to the Special Issue on “Meaning in Interaction” introduces to the approach of Interactional Semantics, which has been developed over the last years within the framework of Interactional Linguistics. It discusses how “meaning” is understood and approached in this framework and lays out that Interactional Semantics is interested in how participants clarify and negotiate the meanings of the expressions that they are using in social interaction. Commonalities and differences of this approach with other approaches to meaning are flagged, and the intellectual origins and precursors of Interactional Semantics are introduced. The contributions to the Special Issue are located in the larger field of research.
У статті досліджено салієнтні політичні речення та їхні функції в україн¬ському і німецькому медійному дискурсі, які використовуються у контексті російсько-української війни та закріплюються в системі актуальних полі¬тичних знань. Teрмін «салієнтні політичні речення» вжито відповідно до наукових праць Й. Кляйна. В українському дискурсі аналізуються відомі речення із відеозвернень та політичних промов В. Зеленського. Також про¬аналізовано гасла та лозунги, які поширюються через соціальні мережі або на прогестних демонстраціях і, відповідно, утверджуються як салієнтні по¬літичні речення. У німецькому дискурсі розглянуто значущі речення у про¬мовах провідних політичних діячів у контексті переосмислення німецької зовнішньої та внутрішньої політики після повномасштабного вторгнення Росії в Україну та після промови О. Шольца «Zeitenwende».
In this contribution we analyse how mobile device users in face-to-face communication jointly negotiate the boundaries and action spaces between digital and non-digital, shared and individual, public and private. Instead of conceptualising digital and face-to-face, i. e., non-digital, communication as separate, more recent research emphasises that social practices relying on mobile devices increasingly connect physical and virtual communicative spaces. Using multimodal conversation analysis, we investigate the situated use of mobile devices and media in social interaction. Excerpts from videotaped everyday conversations illustrate how participants frame their smartphone use in the presence of others, such as when looking at digital pictures, or when recording voice messages. A detailed analysis of verbal and embodied conduct shows how participants negotiate and interpret the connection or separation of digital and non-digital activities and possible forms of participation within these. (Digital) publicness or privacy are therefore to be understood as an interactive accomplishment.
The first International Summer Institute for Interactional Linguistics (henceforth ISIIL) took place from July 18 to 23 at the Leibniz-Institute for the German Language (IDS) in Mannheim, Germany. The local organizers, Arnulf Deppermann and Alexandra Gubina, collaborated with five other facilitators in preparing this Summer Institute: Emma Betz (University of Waterloo), Elwys De Stefani (University of Heidelberg & KU Leuven), Barbara A. Fox (University of Colorado), Chase Raymond (University of Colorado) and Jörg Zinken (Leibniz-Institute for the German Language, Mannheim). The goal of ISIIL was to bring together both early-career researchers and established scholars from the fields of Conversation Analysis (CA) and Interactional Linguistics (IL) in order to foster the development of new skills for doing research using IL. The participants and organizers had diverse backgrounds, both in terms of their research interests (e.g., classroom interaction, second language acquisition, cross-linguistic comparison, particles, grammar-in-interaction) and institutional affiliations, with many participants from institutions from around Europe (i.e., Belgium, Denmark, England, France, Germany, Norway, Sweden, Switzerland) as well as overseas (Canada, U.S.A., South Africa). Because of the compact nature of the Institute, the advanced topics covered, as well as the original research projects the participants would engage in, participation was limited to 24 participants, selected on the basis of their prior training and experience in CA/IL.
OWID und OWIDplus – lexikographisch-lexikologische Online-Informationssysteme des IDS Mannheim
(2023)
Lexikographische und lexikalische Ressourcen zum Deutschen werden an vielen unterschiedlichen Institutionen erarbeitet, z. B. an Akademien der Wissenschaften oder in privatwirtschaftlichen Verlagen. Auch am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim werden solche Materialien erstellt und der (Fach-)Öffentlichkeit unter dem Dach von OWID, dem „Online-Wortschatz-Informationssystem Deutsch“ (owid.de), präsentiert.
Der Beitrag betrachtet das Deutsche Referenzkorpus DeReKo in Bezug auf Strategien für seinen Ausbau, den Zugriff über die Korpusanalyseplattform KorAP und seine Einbettung in Forschungsinfrastrukturen und in die deutschsprachige und europäische Korpuslandschaft. Ausgehend von dieser Bestandsaufnahme werden Perspektiven zu seiner Weiterentwicklung aufgezeigt. Zu den Zukunftsvisionen gehören die Verteilung von Korpussressourcen und die Konstruktion multilingualer vergleichbarer Korpora anhand der Bestände der National- und Referenzkorpora, eine Plattform zur Abgabe und Aufbereitung von Sprachspenden als eine Anwendung von Citizen Science sowie eine Komponente zur automatischen Identifikation von übersetzten bzw. maschinenverfassten Texten.
In unserem Beitrag widmen wir uns dem Einsatz von Sprachkorpora für den Kontext
Deutsch als Fremdsprache (DaF), wobei wir unterschiedliche Ressourcen und Anwendungsbereiche beleuchten. Ziel des Beitrags ist es, exemplarisch Korpora für den DaF-Kontext vorzustellen, sowie deren Potenziale beispielhaft herauszustellen. Zu den vorgestellten Ressourcen zählen Lernerkorpora für Deutsch als Zielsprache, Spezial- und Fachkorpora, Vergleichskorpora sowie Korpora der gesprochenen Sprache und Wörterbuchressourcen. Mit Blick auf die unterschiedlichen Korpora und deren Spezifika loten wir lohnende Perspektiven und Anknüpfungspunkte für Forschung und Didaktik aus und geben Hinweise zur vertiefenden Auseinandersetzung.
This paper presents the IVK-Ler corpus, a longitudinal, annotated learner corpus of weekly writings produced by a group of 18 adolescents in a preparatory class. The corpus consists of 117 student texts collected between 2020 and 2021 and has a structure layered by student and text number. It includes metadata that enables researchers to analyze and track individual student progress in terms of syntactic competence and literacy. The annotation schema, manual and automatic annotation processes, and corpus representation are described in detail. The corpus currently includes target hypotheses and gold standard part-of-speech tags. Future work could include additional annotation layers for topological fields and dependency relations, as well as semantic and discourse annotations to make the corpus usable for tasks beyond syntactic evaluations.
Einleitung
(2023)
Sprachanfragen als authentische Primärdaten bergen Erkenntnispotenziale für eine große Bandbreite linguistischer und transferwissenschaftlicher Forschungsfragen und Methoden. Der Beitrag skizziert diese Potenziale und legt dabei den Fokus auf wissenschaftskommunikative Prozesse im Austausch linguistischer Laien und Experten. Anhand erster Ergebnisse einer empirischen korpusgestützten Untersuchung von ca. 50.000 Sprachanfragen wird skizziert, welche Erkenntnisse aus diesen Daten für die Vermittlung von Sprachwissen in einer zunehmend digitalisierten und vernetzten Gesellschaft gewonnen werden können.
Filtern, Explorieren, Vergleichen: neue Zugriffsstrukturen und instruktive Potenziale von OWIDplus
(2023)
OWIDplus, das Zusatzangebot zur Wörterbuchplattform OWID, vereint verschiedenste lexikalische Datenbanken, Korpustools und visuell aufbereitete Analysen, die mithilfe von Textsuche und Kategorienfiltern so sortiert werden können, dass Benutzer*innen leicht die für sie interessanten Projekte entdecken können. Eine tiefergehende Beschäftigung mit den Einzelprojekten zeigt, wie bei aller oberflächlicher Ähnlichkeit oder gemeinsamen Themenbereichen ganz unterschiedliche methodische Zugänge zu sprachlichen Daten gewählt worden sind und wie Methodik und Forschungsfrage stets aufeinander abgestimmt werden müssen. Die Vielzahl potenzieller Forschungsfragen führt so unweigerlich zu einer Diversität von Projekten und somit einer Heterogenität, die, so hoffen die Autor*innen, in OWIDplus greifbar wird.
Metadaten zu Gesprächen und den beteiligten Sprecher/-innen enthalten Informationen, die für die Beschreibung, Erschließung und Analyse von Korpora wichtig sind. Bisher werden sie jedoch in der Konversationsanalyse und der Interaktionalen Linguistik so gut wie nicht genutzt. Dieser Beitrag zeigt exemplarisch, wie Metadaten des Gesprächskorpus „Forschungs- und Lehrkorpus Gesprochenes Deutsch“ (FOLK) im Rahmen einer interaktionslinguistischen Untersuchung verwendet werden können, um Regularitäten der Verwendung einer untersuchten Gesprächspraktik zu identifizieren und ihren Zusammenhang mit den Eigenschaften von Aktivitäten und Sprecherrollen zu klären. In allgemeinerer Perspektive diskutiert der Beitrag, wie und an welchen Stellen einer interaktionslinguistischen Untersuchung Metadaten von Nutzen sein können und wie ihr Stellenwert im Rahmen dieser Methodologie kritisch reflektiert werden muss.
Wissenschaftskommunikation gehört auch in den Sprachwissenschaften inzwischen zu den regelmäßigen Aufgaben neben Forschung und Lehre. Die Aktivitäten reichen von "kleineren Formaten" wie TikTok-Videos zu linguistischen Themen bis zum Aufbau des "Forum Deutsche Sprache" durch das IDS Mannheim als eine Art "Museum für Sprachwissenschaft". Im Rahmen des Uni.Stadt.Fests 2019, einer ganztägigen Veranstaltung anlässlich des 50jährigen Jubiläums der Universität Bielefeld, haben wir – Gesprächsforschende der Universität – die Gesprächsanalyse an einem Stand als Forschungsmethode erlebbar gemacht: in einem sogenannten "Plauderlabor". Die Idee zu diesem Projekt basiert auf dem "Conversational Rollercoaster" von Albert et al. (2018), einem partizipatorischen Format zur Demonstration der konversationsanalytischen Methode, entwickelt für eine Wissenschaftsmesse in London 2016. Zur Vorbereitung des Plauderlabors organisierte sich in Bielefeld eine interdisziplinäre Gruppe mit den Lehrstuhlinhaberinnen Ruth Ayaß (Methoden der empirischen Sozialforschung mit dem Schwerpunkt qualitative Methoden, Fakultät für Soziologie), Barbara Job (Sprache und Kommunikation, Fakultät für Linguistik und Literaturwissenschaft) und Friederike Kern (Germanistik/Frühe sprachliche Bildung und frühes Lernen, Fakultät für Linguistik und Literaturwissenschaft) sowie ca. 30 wissenschaftlichen Mitarbeiter*innen, Doktorand*innen und studentischen Hilfskräften, teils aus dem Zentrum für Lehren und Lernen (ZLL) und der Bielefeld School of Education (BiSEd). Unsere Erfahrungen mit dem Plauderlabor wollen wir im Folgenden teilen.
There are strict formal requirements for the use of a comma. However, there are none regarding the comma’s actual shape. In printed fonts, it is determined by the font’s specification. In hand-written texts though, the shape of the comma is variable; most writers choose from a set of straight, convex and concave shapes. By using a corpus of 1464 commas written by 99 individuals, we will present three case studies of persons whose comma shapes do somehow correlate with linguistic structures. With that, we might identify a few (possibly subconscious) shaping strategies. Some writers might mark a norm insecurity by a different comma form, others might mark the function of the entity which is segmented by the comma, or the comma type itself (sentence boundary, exposition or coordination).
Morphophonological asymmetries in affixation concern systematic correlations between morphological properties of affixes (e.g. combination with bound versus free stems, position relative to stem (suffixes versus prefixes)) and their phonological properties (e.g. stress behaviour). The arguably most insightful approach to capturing relevant asymmetries invokes a notion of affix coherence, first introduced by Dixon in connection with his work on Yidiɲ, a nearly extinct language spoken in Northern Australia. This notion is based on a categorical division of affixes into ones that integrate into the phonological word of the stem and ones that do not. The integration of affixes is envisioned as being fully determined by phonological and morphological structure in a given language and verifiable by diagnostics relevant to phonological word domains (primarily the syllable and the foot structure). The assumption of two types of prosodic domains characterized by integrated versus non-integrated affixes is manifest in consistent asymmetries that pertain to morphophonological, phonological, and phonetic rules. This consistency constitutes compelling evidence for the structure-based analysis of the impact of various affixes on derived words, as opposed to alternative approaches to capturing these effects by associating affixes with diacritics (morpheme versus word boundary, class 1 versus class 2, stratum 1 versus stratum 2). The present entry aims to demonstrate, mostly on the basis of data from Germanic languages, the breadth of the empirical evidence in support of a fundamental role of affix coherence. Moreover, it aims to draw attention to the various implications of affix coherence for modeling relevant generalizations, in particular the necessary reference to a level of phonological representation characterized by a specific degree of abstractness (‘phonemic’).
Dieser Beitrag stellt den Aufbau eines multimodalen Korpus zur Erforschung des Deutschen als Minderheitssprache in Argentinien vor (DiA). In dem sich im Aufbau befindlichen DiA-Korpus werden die heutige wie auch die historische Situation mit multimodalen (mündlichen, schriftlichen und visuellen) Datensätzen repräsentiert, die mit entsprechenden methodischen Zugängen erfasst wurden und werden. Dazu gehören fragebogengeleitete Interviews (mündliches Medium), Briefe und elizitierte Schriftzeugnisse (geschriebenes Medium) sowie Linguistic-Landscape-Bilddaten (visuelles Medium). In diesem Beitrag wird zunächst ein Überblick über die Forschungssituation zum Deutschen als Minderheitensprache in Argentinien gegeben. Kern des Beitrags ist dann die Vorstellung der Korpusstruktur und des Vorgehens beim Korpusaufbau sowie die Darstellung von Auswertungspotentialen des Datenfundus auf systemischer, soziolinguistischer, sprachideologischer und kontaktlinguistischer Ebene. Eine Methodenreflexion rundet den Beitrag ab.
This paper discusses contemporary societal roles of German in the Baltic states (Latvia, Estonia, Lithuania). Speaker and learner statistics and a summary of sociolinguistic research (Linguistic Landscapes, language learning motivation, language policies, international roles of languages) suggest that German has by far fewer speakers and functions than the national languages, English, and Russian, and it is not a dominant language in the contemporary Baltics anymore. However, German is ahead of ‘any other language’ in terms of users and societal roles as a frequent language in education, of economic relations, as a historical lingua franca, and a language of traditional and new minorities. Highly diverse groups of users and language policy actors form a ‘coalition of interested parties’ which creates niches which guarantee German a frequent use. In the light of the abundance of its functions, the paper suggests the concept ‘additional language of society’ for a variety such as German in the Baltics – since there seems to be no adequate alternative labelling which would do justice to all societal roles. The paper argues that this concept may also be used for languages in similar societal situations and, not least, be useful in language marketing and the promotion of multilingualism.
In this chapter, we will investigate smartphone-based showing sequences in everyday social encounters, that is, moments in which a personal mobile device is used for presenting (audio-)visual content to co-present participants. Despite a growing interest in object-centred sequences and mundane technology use, detailed accounts of the sequential, multimodal, and material dimensions of showing sequences are lacking. Based on video data of social interactions in different languages and on the framework of multimodal interaction analysis, this chapter will explore the link between mobile device use and social practices. We will analyse how smartphone showers and their recipients coordinate the manipulation of a technological object with multiple courses of action, and reflect upon the fundamental complexity of this by-now routine joint activity.
Gerd Hentschel gehört zu den Pionieren der heutigen Computerlexikografie und der IT-gestützten Korpuserschließung. Eine seiner ersten Zeitschriftenpublikationen, mit dem Titel Einsatz von EDV und Mikrocomputer in einem lexikographischen Forschungsprojekt zum deutschen Lehnwort im Polnischen (Hentschel 1983), befasst sich mit der Frage, wie - unter den damaligen technischen Vorzeichen - Forschungs- und Dokumentationsarbeiten zu polnischen Germanismen sinnvoll durch die Verwendung von Computern unterstützt werden können. Die besagten Arbeiten mündeten später in die Online-Publikation des Wörterbuchs der deutschen Lehnwörter in der polnischen Schrift- und Standardsprache (WDLP). Es ist aus heutiger Sicht bemerkenswert, mit welchen Beschränkungen die Arbeit mit dem Computer noch vor 40 Jahren zu kämpfen hatte. Aus gegebenem Anlass sei es gestattet, diesen Punkt etwas ausführlicher zu illustrieren.
Historische Werkzeugnisse. Reflexive Medienpraktiken in Kriegsgefangenenakten des Zweiten Weltkriegs
(2023)
Im US-Kriegsgefangenenlager Fort Hunt wurden während des Zweiten Weltkriegs deutsche Soldaten verhört und abgehört, was in Protokollen dokumentiert wurde. Die praxeologische Herausforderung besteht darin, Praktiken anhand dieses Materials adäquat zu analysieren. Dass wir Spuren in Archivdaten verstehen, ist in ihrer Semiotizität begründet. Dass sie die sie hervorbringenden Situationen überdauern, verdanken wir ihrer Medialität. In einer semiopraxeologischen Analyse, die diese beiden Grundkonstanten zeichenvermittelter Kommunikation in Beziehung zueinander setzt, wird erörtert, wie Praktiken sich aus ihren Spuren erschließen. Es wird gezeigt, wie sich an Dokumenten indexikalische und reflexive Verweise auf die heterogenen, praktischen Verwendungszusammenhänge über die Zeit manifestieren. Entsprechend sind Archivdokumente als historische Werkzeugnisse aufzufassen, die einerseits Vergangenes belegen und die andererseits praktisch gehandhabt werden, was wiederum neue Praxisindizes erzeugt und als Spuren am Material hinterlässt. Die Analyse zeigt, inwiefern Wissen nicht trotz, sondern aufgrund seiner semiotischen und materialen Manifestationen in (Archiv-)Dokumenten vorläufig ist und sich als Gegenstand weiterer Praktiken immer wieder verändern kann.
Einleitung
(2023)
We argue that properties with a nominal origin get transferred regularly in certain Gentian particle verb constructions to properties that are propositional insofar as they characterize the temporal structure of eventualities, understood to be described by propositional (= truth-assessable) representations of state changes. Accordingly, the oft-noted perfectivizing function of certain verbal particles like ein- in einfahren ('pull in', cf. Kühnhold 1972) is the effect of redressing a conflict at the syntax-semantics interface: On the one hand, constructions like in [die Grube]acc einfahren ('pull into the mine’) exhibit transitive syntax (Gehrke 2008), requiring that the syntactic arguments be mapped onto well-distinguished or DIFFERENT referents in the semantics (Kemmer 1993). On the other hand, in/ein codes a spatio-temporal inclusion relation between its relata, contradicting the requirement imposed by the transitive syntax. Following Brandt (2019), we submit that the interface executes a manoeuvre that delays the interpretation of part of the contradiction-inducing DIFFERENCE feature. It is not locally interpreted (semantically represented) in toto but in part passed on to the next syntactic-semantic computational cycle. Here, the passed-on meaning is interpreted in the locally customary terms, in the case at hand, as a temporal index where the post-state of the depicted eventuality does not hold.
Introduction
(2023)
The internationally renowned conference of the European Association for Lexicography (EURALEX) has taken place every two years for the past 39 years. Last year’s conference, held July 12th–16th, 2022, marked EURALEX’s 20th edition, and more than 200 international participants gathered at Mannheim Palace to discuss current developments, learn about new projects, and present their own work — either in lexicography or in one of the many applied or neighboring disciplines such as corpus and computational linguistics.
Anhand einer korpusgestützten Untersuchung komplexer Adjektive mit dem Erstelement {gender-} mit DeReKoVecs wird gezeigt, welche Möglichkeiten zur differenzierten sprachlichen Integration von neuen Diskurselementen die Wortbildung des Adjektivs bietet. Gerade die zwischen den klassischen Typen Komposition und Derivation stehenden Techniken bieten hier eine erhebliche Bandbreite an Möglichkeiten.
Der vorliegende Beitrag beschreibt, wie die Verfügbarkeit digitaler Textkorpora den Wandel von einer systemorientierten hin zu einer gebrauchsorientierten Sprachforschung ermöglicht hat. Doch die korpusbasierte Beschreibung des Sprachgebrauchs kann nur so realistisch sein wie die Korpora, mit denen sie arbeitet. Deshalb ist es von großer Bedeutung, auch besondere Textsorten zu berücksichtigen und Herangehensweisen zu entwickeln, das dafür nötige Vertrauen bei den Datenspendern zu erzeugen. Im Zentrum des Beitrags steht deshalb die Diskussion von einigen derartigen Textsorten und den Herausforderungen, die sich mit ihnen in Hinsicht auf den Korpusaufbau verbinden. Der Beitrag endet mit einem Ausblick auf das Forum Deutsche Sprache, das einen solchen Ort des Vertrauens für Spracherhebungen bieten möchte.
Anders als bei Sonntagspredigten haben die katholischen und evangelischen AutorInnen von Kirche in 1live nur 90 Sekunden zur Verfügung, um ihre christliche Botschaft zu vermitteln. Vorliegender Beitrag untersucht, wie die katholischen und evangelischen AutorInnen dies tun. Welche Inhalte erachten sie für relevant? Welche sprachliche Gestaltung wählen sie? Greifen katholische und evangelische AutorInnen zu den gleichen Inhalten und sprachlichen Mitteln oder zeigen sich konfessionelle Präferenzen und Differenzen? Diesen Fragen soll an einem Korpus aus Kirche in 1live-Radiopredigten aus den Jahren 2012 bis 2021 (= 2.755 Texte mit insgesamt 726.570 Token) mit einem quantitativen und qualitativen Methoden-Mix nachgegangen werden. Die Studie wird im Rahmen des DFG-Projekts „Sprache und Konfession 500 Jahre nach der Reformation“ am Germanistischen Institut der Westfälischen Wilhelms-Universität Münster durchgeführt.
Die Arbeit mit digitalen Daten und empirischen Methoden hat die Möglichkeiten intersubjektiv nachprüfbarer Forschung und Theoriebildung in der Linguistik wie in kaum einer anderen geisteswissenschaftlichen Disziplin verändert. Der Linguistik steht heute eine beeindruckende Anzahl hochwertiger Korpusressourcen zur Verfügung, um Fragestellungen ausgehend vom tatsächlichen Sprachgebrauch in gesprochener und geschriebener Sprache zu bearbeiten und Hypothesen datengestützt zu überprüfen.
Dieser Band bietet Einblicke in Grundlagenfragen, aktuelle Forschungsarbeiten und Entwicklungen im Bereich der korpusgestützten Sprachanalyse – von den theoretischen Grundlagen über die Beschreibung einzelner Korpora und Werkzeuge bis hin zu korpusgestützten Fallstudien und zum Einsatz von Korpora in Lehre und Unterricht. Die 25 Beiträge reflektieren den Stand der gegenwärtigen Forschung und sind nicht nur für Expertinnen und Experten, sondern auch für fortgeschrittene Studierende der Linguistik mit einschlägigem fachlichen Interesse verständlich.
Im Zentrum der Betrachtungen stehen Sprachkontaktsituationen sowie Sprachkontaktphänomene der Kaukasiendeutschen. Sie sind Nachfahren deutschstämmiger Einwohner des Russischen Reichs und der Sowjetunion, die ab Ende des 18. Jahrhunderts in mehreren Phasen in Gebiete Transkaukasiens ausgewandert sind. Bei der untersuchten Gruppe handelt es sich um diejenigen, die aufgrund von interethnischen Ehen von den Deportationen 1941 aus den deutschen Siedlungsgebieten ausgenommen waren und bis heute im Südkaukasus leben. Mithilfe soziolinguistischer Methoden wurden von der Autorin erstmalig 2017 formelle, leitfadengestützte Interviews im Südkaukasus mit der noch lebenden Erlebnisgeneration sowie einer Nachkommengeneration aufgenommen, transkribiert und ausgewertet. Im Beitrag werden Sprachkontaktkonstellationen deutscher Varietäten (Schwäbisch sowie standardnahes Deutsch) mit dem Russischen (und Georgischen) sowie Sprachkontaktphänomene vorgestellt.
Ziel dieses Projekts ist es, Sprachdaten so nah wie möglich am Jetzt zu erheben und analysierbar zu machen. Wir möchten, dass möglichst viele Menschen, nicht nur Sprachwissenschaftlerinnen und Sprachwissenschaftler, in die Lage versetzt werden, Sprachdaten zu explorieren und zu nutzen. Hierzu erheben wir ein Korpus, d. h. eine aufbereitete Sammlung von Sprachdaten von RSS-Feeds deutschsprachiger Onlinequellen. Wir zeichnen die Entwicklung der Analysewerkzeuge von einem Prototyp hin zur aktuellen Form der Anwendung nach, die eine komplette Reimplementierung darstellt. Dabei gehen wir auf die Architektur, einige Analysebeispiele sowie Erweiterungsmöglichkeiten ein. Fragen der Skalierbarkeit und Performanz stehen dabei im Mittelpunkt. Unsere Darstellungen lassen sich daher auf andere Data-Science-Projekte verallgemeinern.
This replication study aims to investigate a potential bias toward addition in the German language, building upon previous findings of Winter and colleagues who identified a similar bias in English. Our results confirm a bias in word frequencies and binomial expressions, aligning with these previous findings. However, the analysis of distributional semantics based on word vectors did not yield consistent results for German. Furthermore, our study emphasizes the crucial role of selecting appropriate translational equivalents, highlighting the significance of considering language-specific factors when testing for such biases for languages other than English.
What is the subject of German linguistics? This seemingly simple question has no obvious answer. In the ZGL’s first issue, the editors required contributions to cover the whole of the German language and to be theoretically sound but application-orientated, whereas the current ZGL-homepage defines the German language of present and history in all its differentiations as its subject matter.
Looking through the fifty volumes of ZGL, three relationships can be identified as presumably enlightening the role of language, in particular the German language: language and mind; language and language use; language and culture. Though of a different systematic type, language and data should be added as an increasingly important pairing for conceptualizing language. On this basis, I also discuss the position of linguistic studies of the German language, mirrored in the ZGL-volumes, between social, cultural and natural sciences, as well as the corresponding epistemic approaches – like explaining vs. understanding.
Neue Entwicklungen in der Korpuslandschaft der Germanistik. Beiträge zur IDS-Methodenmesse 2022
(2023)
Die in diesem Band versammelten Beiträge zur Methodenmesse der Jahrestagung 2022 des Leibniz-Instituts für Deutsche Sprache geben einen Überblick über die aktuelle Korpuslandschaft in der germanistischen Linguistik: von historischen Sammlungen authentischer Sprachdaten über aktuelle Zeitungs- und Social-Media-Korpora, Gesprächskorpora, Korpora aus Texten von Deutschlernenden bis hin zu einem Korpus mit Texten leichter Sprache und einem Gebärdensprachekorpus. Die Beiträge erläutern jeweils die Designkriterien sowie die Methodik der Datenerhebung und geben einen Einblick, wie die Daten sprachwissenschaftlich verwendet werden können.
This article details the process of creating the Nottinghamer Korpus deutscher YouTube-Sprache ('The Nottingham German YouTube Language Corpus' - or NottDeuYTSch corpus) and outlines potential research opportunities. The corpus was compiled to analyse the online language produced by young German-speakers and offers significant opportunity for in-depth research across several linguistic fields including lexis, morphology, syntax, orthography, and conversational and discursive analysis. The NottDeuYTSch corpus contains over 33 million words taken from approximately 3 million YouTube comments from videos published between 2008 to 2018 targeted at a young, German-speaking demographic and represent an authentic language snapshot of young German speakers. The corpus was proportionally sampled based on video category and year from a database of 112 popular German-speaking YouTube channels in the DACH region for optimal representativeness and balance and contains a considerable amount of associated metadata for each comment that enable further longitudinal cross-sectional analyses. The NottDeuYTSch corpus is available for analysis as part of the German Reference Corpus (DeReKo).
Einleitung
(2023)
Quotation marks are substantially used for direct speech and citations. For the ‘modalizing’ use, the Official Rules state that a “different understanding than usual” is indicated; they give very little information on the use of quotation marks beyond literal reference. It therefore seems all the more interesting to investigate the usage of modalizing quotation marks. In the present analysis, we studied the school-leaving examinations of an entire year. School-leaving examinations are texts by persons whose institutional acquisition of written language can be regarded as complete; they are texts written by skilled writers. The investigation takes into account both formal and functional observations. We recognized differences between school subjects that can be interpreted with regard to the concept of educational language. The writers described here showed a high sensitivity (conscious or unconscious) to the use of quotation marks, which we call the “struggle for educational language”. This may be related to the corpus investigated here. However, our study constitutes a solid basis for further corpus studies on quotation marks.
Im Mittelpunkt des Beitrags steht die Frage nach Ursprung und Genese der im geltenden amtlichen Regelwerk niedergelegten Regel, die eine Zusammenschreibung von Adjektiv-Verb-Verbindungen bei Vorliegen einer nicht literalen Bedeutung vorsieht. Ausgangspunkt bilden dabei Sprachtheoretiker und Akteure wie Johann Christoph Adelung, Wilhelm Wilmanns und Konrad Duden, die die Diskussion beherrscht und (dadurch) maßgeblich die erste gesamtdeutsche Rechtschreibregelung im Jahre 1902 mitgestaltet haben. Ein weiterer Schwerpunkt liegt auf der Umsetzung der Rechtschreibregelung in den orthographischen Wörterbüchern. Erst in dieser zeigt sich, inwiefern der gefundene Kompromiss trägt und inwieweit sich die Beteiligten daran gebunden fühlen, in Sonderheit Duden, der mit seinen Wörterbüchern alsbald eine marktführende Position einnahm und über dessen Duden-Rechtschreibung die Regel einer bedeutungsunterscheidenden Zusammenschreibung bei Adjektiv-Verb-Verbindungen letztlich für alle verbindlich wurde.
Unter Neologismen finden sich bedeutungsgleiche Ausdrücke (im weitesten Sinne Synonyme), die unter bestimmten Bedingungen sprachliche Unsicherheiten hervorrufen. Das liegt u. a. an ihrer semantisch-konzeptuellen Ähnlichkeit, an nicht abgeschlossenen Lexikalisierungsprozessen, aber es treten auch Zweifel auf, weil es Unterschiede zwischen der Allgemein- und der Fachsprache gibt. Für einige Neologismen ist es auch charakteristisch, dass mehrere morphologische Varianten gleichzeitig in den Wortschatz eintreten, sodass nicht immer klar ist, wann welche präferiert werden. Dass all diese Ausdrücke lexikalischem Wettbewerb und situationsgebundenen Gebrauchsbedingungen ausgesetzt sind und dass sie zu Zweifel führen können, wird in Onlineforen sichtbar. Dieser Beitrag beschäftigt sich mit der Frage, wie solche Paare/Gruppen korpusgestützt semantisch analysiert und wie sie in deskriptiven Wörterbüchern angemessen beschrieben werden können, um sowohl Gemeinsamkeiten als auch Unterschiede für Nachschlagende sichtbar zu machen. Dazu werden konkrete Beispiele und ein gegenüberstellendes Wörterbuchdarstellungsformat für neologistische Synonyme vorgeschlagen.
Aims and objectives:
Language debates in Latvia often focus on the role of Latvian as official and main societal language. Yet, Latvian society is highly multilingual, and families with home languages other than Latvian have to choose between different educational trajectories for their children. In this context, this paper discusses the results of two studies which addressed the question of why families with Russian as a home language choose (pre)schools with languages other than Russian as medium of instruction (MOI). The first study analyses family narratives which provide insight into attitudes and practices which lead to the decision to send children to Latvian-MOI institutions. The second study investigates language attitudes and practices by families in the international community of Riga German School.
Methodology:
The paper discusses data gathered during two studies: for the first, semi-structed interviews were conducted with Russian-speaking families who choose Latvian-medium schools for their children. For the second study, a survey was carried out in the community of an international school in Riga, sided by ethnographic observations and interviews with teachers and the school leadership.
Data and analysis:
Interviews and ethnographic observations were subjected to a discourse analysis with a focus on critical events and structures of life trajectory narratives. Survey data were processed following simple statistical analysis and qualitative content analysis.
Findings/conclusions:
Our data reveal that families highly embrace multilingualism and see the development of individual plurilingualism as important for integration into Latvian society as well as for educational and professional opportunities in the multilingual societies of Latvia and Europe. At the same time, multilingualism and multiculturalism, including Russian, are seen as a value in itself. In addition, our studies reflect the bidirectionality of family language policies in interplay with practices in educational institutions: family decisions influence children’s language acquisition at school, but the school also has an impact on the families’ language practices at home. In sum, we argue that educational policies should therefore pay justice to the wishes of families in Latvia to incorporate different language aspects into individual educational trajectories.
Originality:
Language policy is a frequent topic of investigation in the Baltic states. However, there has been a lack in research on family language policy and school choices. In this vein, our paper adds to the understanding of educational choices and language policy processes among Russian-speaking families and the international community in Latvia.
The idea of this article is to take the immaterial and somehow ethereal nature of aesthetic concepts seriously by asking how aesthetic concepts are negotiated and thus formed in communication. My examples come from theatrical production where aesthetic decisions naturally play a major role. In the given case, an aesthetic concept is introduced with which only the director, but none of the actors is familiar in the beginning of the rehearsals. The concept, Wabi Sabi, comes from Japanese culture. As the whole rehearsal process was video recorded, it is possible to track the process of how the concept is negotiated and acquired over time. So, instead of defining criteria what Wabi Sabi as an aesthetic concept “consists of,” this article seeks to show how the concept is introduced, explained and “used” within a practical context, in this case a theater rehearsal. In contrast to conventional models of aesthetic experience, I am interested in the ways in which an aesthetic concept is configured in and through socially organized interaction, and — vice versa — how that interaction contributes to the situational accomplishment of the same concept. In short: I am interested in the “doing” of aesthetic concepts, especially in “doing Wabi Sabi.”
Recent typological studies have shown that socio-linguistic factors have a substantial effect on at least certain structures of language. However, we are still far from understanding how such factors should be operationalized and how they interact with other factors in shaping grammar. To address both questions, this study examines the influence of socio-linguistic factors on the number of dedicated conditional constructions in a sample of 374 languages. We test the number of speakers, the degree of multilingualism, the availability of a literature tradition, the use of writing, and the use of the language in the education system. At the same time, we control for genealogical, contact, and bibliographical biases. Our results suggest that the number of speakers is the most informative predictor. However, we find that the association between the number of speakers and the number of dedicated conditional constructions is much weaker than assumed, once genealogical and contact biases are controlled for.
Das Deutsche Referenzkorpus DeReKo dient als eine empirische Grundlage für die germanistische Linguistik. In diesem Beitrag geben wir einen Überblick über Grundlagen und Neuigkeiten zu DeReKo und seine Verwendungsmöglichkeiten sowie einen Einblick in seine strategische Gesamtkonzeption, die zum Ziel hat, DeReKo trotz begrenzter Ressourcen für einerseits möglichst viele und andererseits auch für innovative und anspruchsvolle Anwendungen nutzbar zu machen. Insbesondere erläutern wir dabei Strategien zur Aufbereitung sehr großer Korpora mit notwendigerweise heuristischen Verfahren und Herausforderungen, die sich auf dem Weg zur linguistischen Erschließung solcher Korpora stellen.
Der Beitrag illustriert die Nutzung des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für interaktionslinguistische Fragestellungen anhand einer exemplarischen Studie. Zunächst werden die Stratifikation (Datenkomposition) des Korpus, das zugrundeliegende Datenmodell und dessen Annotationsebenen sowie Typen von Untersuchungsinteressen vorgestellt, für die das Korpus nutzbar ist. Im Hauptteil wird Schritt für Schritt anhand einer Studie zur Verwendung des Formats was heißt X in der sozialen Interaktion gezeigt, wie mit FOLK relevante Daten gefunden und analysiert werden können. Abschließend weisen wir auf einige Vorsichtsmaßnahmen bei der Benutzung des Korpus hin.
Der vorliegende Beitrag diskutiert Implikationen für die grammatiktheoretische Grundunterscheidung von Argumenten und Modifikatoren, die mit der Erweiterung einer wortbasiert-valenzgrammatischen um eine musterbasiert-konstruktionsgrammatische Analyseperspektive einhergehen. Wird Argumenthaftigkeit nicht mehr (oder nicht mehr nur) relativ zum Verb, sondern relativ zur schematischen Argumentstrukturkonstruktion bestimmt, in der ein Verb gebraucht wird, hat sich das Problem einer Unterscheidung von Argumenten und Modifikatoren damit nicht erübrigt. Dem Problem, dass eine umfassende und trennscharfe Unterscheidung von Argumenten und Modifikatoren aus Sicht des Verbs allein nicht zweifelsfrei zu leisten ist, ist damit aber zumindest die grundsätzliche theoretische Sprengkraft genommen, dass der gesamte folgende Strukturaufbau auf einer unsicheren Anfangsunterscheidung aufsetzt. Gleichzeitig stellen sich im Rahmen des konstruktionsgrammatischen Perspektivwechsels aber neue Fragen. Welche Strukturen können Anspruch auf den Status einer eigenständigen Argumentstrukturkonstruktion erheben? Was sind ihre Bedeutungen und konstitutiven Bestandteile? Unter welchen Bedingungen können sie sowohl durch bestimmte lexikalische Füller als auch durch andere ihrerseits schematische Konstruktionen instanziiert werden? Wie können Argumentstrukturkonstruktionen sowohl mit Modifikatoren als auch mit anderen Argumentstrukturkonstruktionen kombiniert werden?
In Dresden entsteht für den Forschungshub Digital Herrnhut der Pilot für ein agiles und multimodales Referenzkorpus der nächsten Generation (Nex-Gen Agile Reference Corpus (NARC)) in Zusammenarbeit mit der Sächsischen Landesbibliothek - Staats- und Universitätsbibliothek Dresden (SLUB). Dieses Korpus (N-ARC1) wird textliche, kartografische und audiovisuelle Quellen sowie weitere Artefakte fassen, die, miteinander vernetzt, als offene Forschungsdaten (teil-)maschinell angereichert werden können und in einer virtuellen Forschungsumgebung öffentlich und nachnutzbar zur Verfügung stehen sollen. Dafür bieten die Dokumente und Spuren der Herrnhuter Brüdergemeine - eine am Beginn des 18. Jahrhundert gegründete und in nur wenigen Jahrzehnten weltumspannende Glaubensgemeinschaft - einen idealen Ausgangspunkt. Im Beitrag werde ich exemplarisch an einigen ausgewählten Beispielen aus den Themenkreisen Datenerschließung, Datenstrukturierung, -erweiterung und -vernetzung zwischen akademischer Lehre, Forschung und bürgerwissenschaftlicher Beteiligung die Herausforderungen illustrieren, vor denen wir derzeit in der Umsetzung in Dresden stehen.
Der vorliegende Beitrag erörtert am Beispiel des aktuell im Aufbau befindlichen Korpus GiesKaNe (= Gie[ßen]Ka[ssel]Ne[uhochdeutsch]) grundlegende Fragen nach dem Verhältnis von Standard und Innovation bei der Erweiterung der Korpuslandschaft durch neue Korpora. Bei jedem neu zu erstellenden Korpus stellt sich die Frage, inwieweit man den bereits etablierten Standards folgt, oder ob es legitim oder vielleicht sogar notwendig ist, neue Modelle der Annotation linguistischer Kategorien zu entwickeln. In diesem Sinne bespricht der Beitrag die Grenzen einer reinen Modellübernahme mit Bezug auf das POS-Tagging in anderen historischen Referenzkorpora und mit Bezug auf TIGER als Baumbank für das Gegenwartsdeutsche. Um trotz der Arbeit mit einer innovativen Alternative dem Prinzip der Interoperabilität gerecht zu werden, wird im Beitrag die Arbeit mit maschinellem Lernen ins Spiel gebracht. Dieses ermöglicht es, aus den vorhandenen Textoberflächenmerkmalen und den vorliegenden Annotationen auch alternative Annotationsmodelle abzuleiten und mittels einer Mehrebenenannotation anzubieten, sodass ein Korpus den Anforderungen an interoperable Nutzbarkeit und wissenschaftlichen Erkenntnisfortschritt gleichermaßen gerecht werden kann.
„Actual words are of theoretical interest” (Audring 2021: 3). Unter Zugrundelegung dieser gebrauchsbasierten Prämisse geht der vorliegende Beitrag der Frage nach, wie sich die Nominalkomposition im Deutschen auf der Basis sprachlicher Massendaten als Konstruktionsfamilie, d.h. als ein hierarchisches Netzwerk von Konstruktionen unterschiedlichen Abstraktionsgrads, beschreiben lässt. Der Beitrag knüpft in theoretischer Hinsicht an Booijs (2010) „Construction Morphology” an, geht jedoch insofern über diese hinaus, als versucht wird, deren Grundannahmen auch auf automatisch erhobene sprachliche Massendaten anzuwenden. Konkret wird mit einem Inventar von rund 185.000 Zusammensetzungen aus zwei simplizischen Nomen gearbeitet, die systematisch aus dem Deutschen Referenzkorpus (DeReKo) (vgl. Leibniz-Institut für Deutsche Sprache 2007) extrahiert und im Anschluss (semi)automatisch weiterverarbeitet wurden.
Der Beitrag skizziert die Genese und Komplexität des Konzepts ‚Usuelle Wortverbindung‘ (UWV) vor dem Hintergrund der korpuslinguistischen Wende. Die Möglichkeit, sprachliche Massendaten untersuchen zu können, erbrachte neue Einsichten in Hinblick auf Status, Form, Funktion, Festigkeit und Variabilität dieser zentralen Wortschatzeinheiten – gleichzeitig aber auch in Hinblick auf ihre Unschärfen und vielfachen Überlappungen. Eine der folgenreichsten Erkenntnisse ist, dass UWVs auf vorgeprägten Schemata und Mustern basieren und in ein komplexes Netz von Ausdrücken ähnlicher Art eingebettet sind. Für die Aneignung sprachlichen Wissens ist das Verstehen solcher primär funktionalen Musterbildungen elementar.
Dieser Beitrag beschreibt die Prozesse der Datenerhebung, -aufbereitung und geplanten Veröffentlichung eines Teilkorpus des vom österreichischen Wissenschaftsfonds (FWF) finanzierten Spezialforschungsbereichs (SFB) „Deutsch in Österreich. Variation – Kontakt – Perzeption“ (FWF F060). Die Daten werden v. a. aus variationslinguistischer, kontaktlinguistischer wie auch perzeptionslinguistischer Perspektive analysiert, wofür eigene Tools entwickelt wurden, die – ebenso wie das Korpus selbst – mittelfristig der interessierten Öffentlichkeit zur Verfügung gestellt werden.
Seit 1977 wird in Deutschland jedes Jahr ein Wort bzw. eine Wortsequenz zum „Wort des Jahres“ gekürt. Vorgenommen wird die Wahl von einer Jury, die sich aus Mitgliedern der Gesellschaft für deutsche Sprache (GfdS) zusammensetzt. In der deutschsprachigen Schweiz gibt es eine solche Aktion ebenfalls (seit 2003); inzwischen wird das Wort des Jahres aber nicht mehr nur auf Deutsch, sondern auch auf Französisch, Italienisch und Rätoromanisch gewählt. Wenn im Folgenden vom „Schweizer Wort des Jahres“ die Rede ist, ist damit aber immer nur das Deutschschweizer Jahreswort gemeint. Durchgeführt wird die Aktion von einem Forschungsteam, das an der Zürcher Hochschule für Angewandte Linguistik (ZHAW) tätig ist.
Jeden Tag finden weltweit über 40 innerstaatliche Konflikte und Kriege statt. Nach dem letzten Stand (14.11.2022) werden in Subsahara-Afrika 13, im Nahen Osten und in Nordafrika zehn und in Asien ebenfalls zehn Konflikte erwähnt. Aus Europa und Lateinamerika wird jeweils über fünf Konflikte berichtet. 2023 kam es zu neuen Konflikten und Kriegen in der Welt, über die jedoch noch keine Statistik vorhanden ist. Der russische Angriffskrieg gegen die Ukraine ist aber seit Anfang 2022 in den Weltmedien omnipräsent geworden. Somit wurde der Begriff Krieg auf verschiedene Weise in vielen internationalen Kontexten und Textquellen interpretiert und umschrieben, dann aber deutlich zum Ausdruck gebracht.
Der vorliegende Text unternimmt den Versuch, einen Beitrag zur grammatischen Analyse von Ellipsen zu leisten, indem kontextkontrollierte Ellipsen und Strukturellipsen konstruktionsgrammatisch verortet und interpretiert werden. In diesem Zusammenhang soll vor allem die Frage nach ihrem eventuellen Konstruktionsstatus im Mittelpunkt stehen. Wie sich zeigen wird, werden die beiden markanten Vertreter der Ellipsenwelt (Analepse und Strukturellipse) diesbezüglich unterschiedlich bewertet. Da der Phänomenbereich in beiden Hauptklassen eine Menge unterschiedlicher Formate und Typen umfasst (zu einem Überblick vgl. Hennig 2013: 447-448), kann die vorgelegte Analyse nur exemplarisch erfolgen und erhebt somit keinen Anspruch auf Vollständigkeit. Dennoch soll sie der Bedingung der Generalisierbarkeit theoretischer Annahmen insofern gerecht werden, als die beiden Hauptklassen (Analepse und Strukturellipse) genauer untersucht werden, die m. E. zwei entgegengesetzte Eckpunkte des Spektrums möglicher Ellipsen darstellen und somit in analytischer Perspektive, so auch in der konstruktionsgrammatischen Theoriebildung aus meiner Sicht besondere Aufmerksamkeit verdienen.
Der Beitrag thematisiert die Märchenformel es war einmal unter konstruktionsgrammatischem Gesichtspunkt. Im Mittelpunkt der Überlegungen stehen zwei Fragen: a) Wie kann man es war einmal im Kontext seines Gebrauchs in Märchen beschreiben? b) Wie Lässt sich diese Märchenformel im Kontext anderer, mit ihr formal und/oder semantisch verwandter Konstruktionen mit es erfassen? Um die erste Frage zu beantworten, wird auf Merkmale der Textsorte ‚Märchen' sowie auf den Begriff des Erzählens zurückgegriffen. Damit im Zusammenhang wird in Anlehnung an die Terminologie in Feilke (1996) von textuell-pragmatischer Prägung gesprochen. Zur Klärung der zweiten Frage sollen vor dem Hintergrund syntaktischer Prägung abstraktere Konstruktionen mit es (Rhematisierungskonstruktionen, Präsentativkonstruktionen und das es impersonate) herangezogen und in Beziehung zu es war einmal gesetzt werden. Die Überlegungen von a) über b) führen zu der Annahme einer auf Ähnlichkeiten basierenden Konstruktionsfamilie mit es als Thetizitätsmarker.
Das Korpus GeWiss (Gesprochene Wissenschaftssprache kontrastiv: Deutsch im Vergleich zum Englischen und Polnischen) bietet vielfältige Möglichkeiten zur Erforschung und Vermittlung der mündlichen Hochschulkommunikation. Mit den im Projekt ZuMult entwickelten Zugangswegen zu Korpora der gesprochenen Sprache eröffnen sich für einen deutlich größeren Personenkreis umfassende Nutzungsmöglichkeiten, die sowohl für sprachdidaktische Kontexte als auch für Forschungszwecke relevant sind. In diesem Beitrag wird eine Auswahl der in ZuMult geschaffenen Werkzeuge im Hinblick auf ihr Potenzial zur Arbeit mit den GeWiss-Daten vorgestellt. Im Anschluss wird anhand von expliziten sprachlichen Positionierungsmustern aufgezeigt, wie diese Korpustools für eine sprachdidaktisch orientierte empirische Untersuchung zu den Spezifika mündlicher Wissenschaftskommunikation genutzt werden können.
Dieser Beitrag stellt ein neues, im Aufbau befindliches Parallelkorpus vor: Das ‚Parallel European Corpus of Informal Interaction‘ (PECII). Zunächst wird der Bedarf nach besser vergleichbaren Daten fur die sprachübergreifende Erforschung natürlichen sprachlichen Handelns in der sozialen Interaktion begründet. Wir diskutieren Fragen der Vergleichbarkeit von Episoden natürlicher sozialer Interaktion, und die methodologischen Herausforderungen, die Ansprüche an ein Korpus natürlicher Sprachdaten mit dem Wunsch nach vergleichbaren Daten in Einklang zu bringen. Schließlich skizzieren wir mögliche Untersuchungsansätze auf der Grundlage von PECII anhand einer laufenden Studie zur Sanktionierung von Fehlverhalten in verschiedenen Aktivitätskontexten. Zukünftig soll PECII der wissenschaftlichen Öffentlichkeit als Ressource fur die sprach- und kulturvergleichende Untersuchung sprachlichen Handelns in der sozialen Interaktion zur Verfügung stehen.
Der Beitrag thematisiert den Zusammenhang von Korpusaufbereitung, Datenanreicherung und Nutzungsszenarien im Kontext des Discourse Lab, das an der TU Darmstadt und der Universität Heidelberg betrieben und in linguistischen und interdisziplinären Forschungs- und Lehrprojekten genutzt wird. Für die Diskursforschung sind Korpora genauso konstitutiv wie die Einbeziehung von Kontexten des Sprachgebrauchs in die Analyse. Daher ist die Frage nach Repräsentationsformaten von Kontexten besonders wichtig. Eine große Rolle bei der korpuslinguistischen Kontextualisierung spielen auch Annotationen. Das wird am Darmstädter-Tagblatt-Korpus, den Plenarprotokollen des Deutschen Bundestags und den Korpora der DFG-Forschungsgruppe Kontroverse Diskurse diskutiert.
Die erfolgreiche Wiederverwendung gesprochener Korpora muss fachspezifischen Evaluationskritierien genügen und erfordert daher eine flexible Korpusarchitektur, die durch multirepräsentationale (Verfügbarkeit eines akustischen Signals und einer Transliteration) und multisituationale Daten (Variabilität von Situationen bzw. Aufgaben) gekennzeichnet ist. Diese Kriterien werden in einer Fallstudie zur /eː/-Diphthongisierung polnischer Deutschlerner/-innen angewendet und diskutiert. Die Fallstudie repliziert die Ergebnisse der /eː/-Diphthongisierung bei Bildbenennungen von Nimz (2016). Vor der Wiederverwendung werden weitere fachspezifische Evaluationskriterien überprüft, wie Multisituationalität, Aufnahmequalitäten, Erweiterbarkeit, vorhandene Metadaten und vorhandene Dokumentation. Nach der Replikationsstudie werden die Herausforderungen für eine Umsetzung der Wiederverwendung bezüglich Datenmanagement, Workflows und Data Literacy in Forschungs- und Lehrkontexten diskutiert.
Der Beitrag liefert einen Einblick in korpuslinguistische Projekte und Aktivitäten aus dem österreichischen Sprachraum. Der Fokus liegt auf zwei primär auf die Analyse gesprochener Sprache ausgerichteten Korpora (DiÖ-Korpus und WBÖ-Korpus) sowie auf dem medial wie konzeptionell schriftlich angelegten Austrian Media Corpus. Institutionell eingebettet sind die Korpora in den Spezialforschungsbereich „Deutsch in Österreich (DiÖ)“ sowie in die Aktivitäten des Austrian Centre for Digital Humanities and Cultural Heritage (ACDH-CH) an der Österreichischen Akademie der Wissenschaften. Die theoretisch-methodologische Perspektive der Diskussion ist eine variationslinguistische, wobei sozio- und systemlinguistische Aspekte im Beitrag Berücksichtigung finden.
Dieser Beitrag stellt zwei Korpora vor, die als Datengrundlage für die Bestimmung der Regionalangaben im Digitalen Wörterbuch der deutschen Sprache (DWDS) fungieren: das ZDL-Regionalkorpus und das Webmonitor-Korpus. Diese Korpora wurden am Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) erstellt und stehen allen registrierten Nutzern der DWDS-Plattform für Recherchen zur Verfügung. Das ZDL-Regionalkorpus enthält Artikel aus Lokal- und Regionalressorts deutscher Tageszeitungen, die mit arealen Metadaten versehen sind. Es wird ergänzt durch regionale Internet-Quellen im Webmonitor-Korpus, die zusätzliche Areale und Ortspunkte aus dem deutschen Sprachraum einbeziehen. Die Benutzerschnittstelle der linguistisch annotierten Korpora erlaubt nicht nur komplexe sprachliche Abfragen, sondern bietet auch statistische Recherchewerkzeuge zur Bestimmung arealer Verteilungen.
Das Austrian Media Corpus (amc) ist mit derzeit rund 11 Mrd. Token eines der größten deutschsprachigen Korpora journalistischer Prosa. Es bietet damit weitreichende Analysemöglichkeiten für eine Vielzahl sprachwissenschaftlicher Aspekte, wie z. B. die Analyse grammatischer, orthographischer und lexikalischer Variation oder die Erforschung diskurslinguistischer wie attitudinal-perzeptiver Fragestellungen. In diesem Beitrag geben wir Einblicke in Beispielanalysen zu Standard(schrift)sprache auf Basis des amc sowie deren Bedeutung für die Erforschung von Sprachvariation in Österreich, um das enorme Potenzial des Korpus für sprachwissenschaftliche Fragestellungen zu illustrieren.
The ubiquity of smartphones has been recognised within conversation analysis as having an impact on conversational structures and on the participants’ interactional involvement. However, most of the previous studies have relied exclusively on video recordings of overall encounters and have not systematically considered what is taking place on the device. Due to the personal nature of smartphones and their small displays, onscreen activities are of limited visibility and are thus potentially opaque for both the co-present participants (“participant opacity”) and the researchers (“analytical opacity”). While opacity can be an inherent feature of smartphones in general, analytical opacity might not be desirable for research purposes. This chapter discusses how a recording set-up consisting of static cameras, wearable cameras and dynamic screen captures allowed us to address the analytical opacity of mobile devices. Excerpts from multi-source video data of everyday encounters will illustrate how the combination of multiple perspectives can increase the visibility of interactional phenomena, reveal new analytical objects and improve analytical granularity. More specifically, these examples will emphasise the analytical advantages and challenges of a combined recording set-up with regard to smartphone use as multiactivity, the role of the affordances of the mobile device, and the prototypicality and “naturalness” of the recorded practices.
Die sprachlichen Auffälligkeiten, die in Gedichten zu beobachten sind, haben immer wieder Anlass zu verschiedenen Versionen der Abweichungstheorie gegeben, derzufolge die in Gedichten verwendete Sprache von nicht-lyrischer Sprache abweicht. Expressionistische Lyrik ist insbesondere für ihre argumentstrukturellen Innovationen bekannt. Auf der Basis eines Korpus expressionistischer Gedichte wird eine Übersicht über diese Auffälligkeiten gegeben, die die Grundlage für weitere Studien darstellen soll, in denen zu zeigen sein wird, inwieweit unter bestimmten grammatiktheoretischen Annahmen die Abweichungstheorie zurückgewiesen werden kann.
Vorwort
(2023)
In this article, we provide an insight into the development and application of a corpus-lexicographic tool for finding neologisms that are not yet listed in German dictionaries. As a starting point, we used the words listed in a glossary of German neologisms surrounding the COVID-19 pandemic. These words are lemma candidates for a new dictionary on COVID-19 discourse in German. They also provided the database used to develop and test the NeoRate tool. We report on the lexicographic work in our dictionary project, the design and functionalities of NeoRate, and describe the first test results with the tool, in particular with regard to previously unregistered words. Finally, we discuss further development of the tool and its possible applications.
Die explorative Studie untersucht anhand von Korpusbelegen, in welchen Fällen satzförmige oder infinitivische propositionale Strukturen bedeutungserhaltend durch Nominalisierungen ersetzbar sind. Auf indirekte Weise soll so ein Zugang auch zur Bedeutung von propositionalen Strukturen selbst eröffnet werden. Die in der Literatur gängige These, dass nur bei einem Teil der Denotatsorten propositionaler Strukturen (von Ereignissen über Tatsachen bis zu ,rein abstrakten Objekten‘) Nominalisierung möglich sei, wird durch die Studie widerlegt. Damit stellt sich auch die Frage nach der Haltbarkeit der gängigen Fassung des Begriffs Proposition selbst. Die von Friederike Moltmann vertretene neue Sichtweise auf Propositionen scheint hingegen auch für Nominalisierungen eine Analyse ohne die bisher auftretenden Widersprüche zu ermöglichen.
This paper has two distinct but interdependent goals. The empirical and analytical primary goal is to present a detailed overview of the patterns of (syntactico-semantic) argument structure and (morpho-syntactic) argument realization found with clause-embedding predicates in German. In particular, it will elucidate the observable relationships and dependencies between them, with a special focus on prepositional object clauses. The methodological secondary goal is to demonstrate the recently published ZAS Database of Clause-Embedding Predicates and illustrate its usefulness in approaching a concrete research agenda. The goals are aligned with each other because the data on patterns of argument structure and realization were collected using the database, and indeed the relevant questions could not have been investigated in such a thorough and efficient way without it. We will begin in Part 1 with an introduction to the database, its structure, and why and how it was created, before moving in Part 2 to the presentation of the data and analysis of argument structure and argument realization.
Reduzierte Parenthesen stehen in einer zweifachen Beziehung zur einschließenden Trägerstruktur. Die Trägerstruktur liefert den propositionalen Gehalt eines internen Arguments, das durch das Prädikat der Parenthese selegiert wird, während die Parenthese wie ein Modifikator in Bezug auf die Trägerstruktur fungiert. Die erstere Relation ist anaphorischer Natur, was durch ein pronominales Leerelement im parenthetischen Satz angemessen modelliert wird. Die letztere Relation lässt sich am besten durch die Sättigung eines externen (referenziellen) Arguments des parenthetischen Satzes durch die Trägerstruktur modellieren – analog zu gewöhnlichen Adverbialsätzen. Die strukturelle Bedingung dieser Relation resümiert dann darin, dass die Parenthese in die terminale Zeichenkette der Trägerstruktur eingeschlossen ist. Die Funktion der Parenthese als Modifikator wiederum ist eine Bedingung für die Lizenzierung des Leerelements innerhalb dieser Parenthese. Diese Erklärung wird durch Parallelen zu Phänomenen in Relativ- und in Vergleichsätzen untermauert.
Vorwort der Herausgeberinnen
(2023)
Die Beiträge in diesem Sammelband sind im Nachgang zur Ars Grammatica Tagung 2018 entstanden, die am 21./22. Juni 2018 mit dem Titel „Theorie und Empirie im Sprachvergleich zum Schwerpunktthema Sachverhalts-/propositionale Argumente“ am Leibniz-Institut für Deutsche Sprache in Mannheim stattfand. Die Konferenz befasste sich mit der übereinzelsprachlichen Variation bei der Realisierung von propositionalen Argumenten bzw. Sachverhaltsargumenten. Dies sind im weitesten Sinne Argumente, die Ereignisse, Propositionen oder Situationen beschreiben und in der Regel als Komplementsätze, Infinitivkomplemente, Gerundivkomplemente oder nominale/nominalisierte Komplemente realisiert werden.