Lexik
Refine
Document Type
- Part of a Book (112)
- Article (93)
- Book (25)
- Conference Proceeding (17)
- Other (7)
- Preprint (5)
- Part of Periodical (3)
- Course Material (1)
- Review (1)
Is part of the Bibliography
- yes (264)
Keywords
- Deutsch (109)
- Korpus <Linguistik> (64)
- Wörterbuch (23)
- Diskursanalyse (21)
- Lexikographie (20)
- Sprachstatistik (19)
- Gesprochene Sprache (16)
- Neologismus (16)
- Online-Wörterbuch (13)
- Wortschatz (13)
Publicationstate
- Veröffentlichungsversion (113)
- Zweitveröffentlichung (94)
- Postprint (18)
Reviewstate
- (Verlags)-Lektorat (98)
- Peer-Review (98)
- (Verlags-)Lektorat (2)
- Peer-Revied (2)
- Peer-review (2)
- (Verlags-)lektorat (1)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (1)
- Review-Status-unbekannt (1)
- Verlagslektorat (1)
Publisher
- de Gruyter (48)
- Leibniz-Institut für Deutsche Sprache (IDS) (14)
- Hempen (13)
- De Gruyter (12)
- Narr Francke Attempto (12)
- Erich Schmidt (10)
- Institut für Deutsche Sprache (10)
- Lexical Computing CZ s.r.o. (8)
- Stauffenburg (7)
- Narr (6)
In der gegenwärtigen Zeit wird die Gesellschaft durch eine Vielzahl von Krisen geprägt, was sich deutlich in der Sprache niederschlägt. Der russisch-ukrainische Krieg stellt einen komplexen Krisendiskurs dar, der sowohl die ukrainische Gesellschaft als auch die internationale Gemeinschaft erheblich beeinflusst (Tripps, Vogel 2022). Seit 2022 zeigen sich im Krisendiskurs in der Ukraine und in Deutschland sowohl Gemeinsamkeiten als auch signifikante Unterschiede, die auf historische und politische Kontexte, mediale Darstellungen, kulturelle Spezifika, unterschiedliche Wahrnehmungen sowie sprachliche Besonderheiten zurückzuführen sind.
Probleme in kleinere Teilprobleme zu zerlegen, zu systematisieren und die Auswertung zu algorithmisieren sind wichtige kulturelle Fertigkeiten. Durch die stattfindende Weiterentwicklung der Geisteswissenschaften hin zu Digital Humanities eröffnen sich neuen Ansätze, Methoden, Gegenstände und Arbeitsmittel \u2013 Programmierung, eine wichtige Kulturtechnik, wird gegenwärtig aber nicht in der Breite des Faches gelehrt. Denn obwohl der Bedarf dafür vorhanden ist, fehlt es an adäquaten Lehr- und Lernmaterialien. Die geplante Lerneinheitengruppe soll sich diesem Desiderat annehmen und leicht verständliche, auf die Gegenstände der Germanistik fokussierte Ressourcen entwickeln. Da für die Philologien verschiedene Programmiersprachen in Frage kommen (z . B. Python, Java, C# u. a.) kommen, fokussiert sich dieser Kurs auf die einfache und interaktive Programmiersprache Python. Es wird darauf geachtet, dass neben dem sprachtypischen Wissen (Syntax, verfügbare Bibliotheken etc.) auch allgemeines Wissen über Programmiersprachen vermittelt wird (Refactoring, Wie findet man Hilfe?, Was ist ein guter Programmierstil?).
From a cross-linguistic perspective, language models are interesting because they can be used as idealised language learners that learn to produce and process language by being trained on a corpus of linguistic input. In this paper, we train different language models, from simple statistical models to advanced neural networks, on a database of 41 multilingual text collections comprising a wide variety of text types, which together include nearly 3 billion words across more than 6,500 documents in over 2,000 languages. We use the trained models to estimate entropy rates, a complexity measure derived from information theory. To compare entropy rates across both models and languages, we develop a quantitative approach that combines machine learning with semiparametric spatial filtering methods to account for both language- and document-specific characteristics, as well as phylogenetic and geographical language relationships. We first establish that entropy rate distributions are highly consistent across different language models, suggesting that the choice of model may have minimal impact on cross-linguistic investigations. On the basis of a much broader range of language models than in previous studies, we confirm results showing systematic differences in entropy rates, i.e. text complexity, across languages. These results challenge the long-held notion that all languages are equally complex. We then show that higher entropy rate tends to co-occur with shorter text length, and argue that this inverse relationship between complexity and length implies a compensatory mechanism whereby increased complexity is offset by increased efficiency. Finally, we introduce a multi-model multilevel inference approach to show that this complexity-efficiency trade-off is partly influenced by the social environment in which languages are used: languages spoken by larger communities tend to have higher entropy rates while using fewer symbols to encode messages.
In a previous study, Claessens, Kyritsis, and Atkinson (CKA) demonstrated the importance of controlling for geographic proximity and cultural similarity in cross-national analyses. Based on a simulation study, CKA showed that methods commonly used to control for spatial and cultural non-independence are insufficient in reducing false positives while maintaining the ability to detect true effects. CKA strongly advocate the use of Bayesian random effect models in such situations, arguing that among the studied model types, they are the only ones that reduced false positives while maintaining high statistical power. However, in this comment, we argue that the apparent superiority of such models is overstated by CKA due to a form of methodological circularity called 'leakage' in statistics and machine learning, because the same proximity matrix is used both to generate the simulated data and as an input to only the Bayesian models for comparison. When this leakage is controlled for, we show that Bayesian models do not outperform most other methods.
In diesem Band geht es um das Debattieren, Opponieren und Protestieren. Diese substantivierten Verben bezeichnen Typen von Handlungen, die sich in politischen Situationen und Kontexten abspielen. Doch wie gelangen wir eigentlich zu dieser Zuschreibung? Als sprachliche Zeichen erhalten die genannten Handlungsbezeichnungen ihre Bedeutung – pragmatisch betrachtet – im Gebrauch und – semiotisch betrachtet – durch Differenz zu anderen Zeichen. Setzen wir etwa die Bedeutungen und möglichen Gebrauchskontexte von ›Debattieren‹ zu ›Diskutieren‹ oder ›Opponieren‹ bzw. ›Protestieren‹ zu ›Widersprechen‹ in ein Verhältnis, so haben letztgenannte jeweils eine allgemeinere Bedeutung und können sich auf unterschiedlichste Kommunikationssituationen beziehen. Erstgenannte finden jedoch in einem stärker geregelten, mitunter einem institutionalisierten Rahmen statt, zum Beispiel im Parlament oder einer Polittalkshow. Wir stellen also fest, dass sich die Bedeutung von Debattieren, Opponieren und Protestieren vor allem durch den praktischen Hintergrund, der in diesen Fällen politischen Charakter hat, ergibt.
Wortverbindungen sind der Schlüssel zu einer kulturell angemessenen Kommunikation. Mithilfe von Korpusdaten kann phraseologisches Wissen nahe am tatsächlichen Sprachgebrauch vermittelt werden. Der vorliegende Artikel stellt die Beiträge der Themenausgabe „Korpora, Phraseologie und DaF“ vor, die den Einsatz von Korpora, ihre hohe Wirksamkeit, aber auch die damit verbundenen Probleme für die Lehr- und Lernpraxis aus unterschiedlichen phraseodidaktischen Perspektiven beleuchten. Folgende Schwerpunkte der Beiträge werden in der Einleitung zusammengefasst: Frequenz als Mittel zur Erfassung besonders typischer und daher bevorzugt zu vermittelnder Phraseme; die Authentizität und Variabilität von Sprachdaten für das Verständnis relevanter Gebrauchsmerkmale; der Nutzen korpusbasierter Analysen für die Entwicklung interkultureller Kompetenz sowie die Möglichkeiten, korpusbasierte Beispiele und Übungen in den Unterricht zu integrieren.
This paper addresses the importance of teaching digital literacy among German studies students, enrolled in teacher training, by introducing a seminar which combines Digitally-Mediated Communication (DMC) and sociolinguistics. We present real-life digital communication scenarios for research-based learning in order to increase student engagement and foster digital literacy for future teaching careers. Practical experiences in applying corpus-based methods in a German linguistics class are discussed, utilizing the NottDeuYTSch corpus and the KorAP search engine. The investigation of youth language use cases demonstrates students' ability to develop their own research projects while also putting DMC data at the forefront of authentic language use analysis.
Wir schreiben das Jahr 2002 und die besten Herrenmannschaften messen sich in Südkorea und Japan bei der Fußballweltmeisterschaft. In Deutschland wird der Bundestrainer zur Melodie von Guantanamera lauthals besungen: Ein’ Rudi Völler / es gibt nur ein’ Rudi Völler / ein’ Rudi Völlaaa hallt es durch alle Straßen.
Ganz abgesehen davon, ob das stimmt – und man mag sich gar nicht ausmalen, welche Qualen die zweifelsohne vorhandenen Namensvettern des Bundestrainers damals über sich ergehen lassen mussten – behaupteten die Fans, dass es nicht zwei oder gar noch mehr Rudi Völlers gibt, sondern genau einen. Wir haben es hier also mit einer verkürzten Form von einen (in meiner Verschriftlichung signalisiert durch das Apostroph am Ende) zu tun. Wenn im Jahr 2005 der damalige ZDF-Sportchef Gruschwitz sagt, dass „ein Rudi Völler mit seiner Sympathie und Persönlichkeit […] natürlich ein Thema für den Sender“ (Berliner Zeitung, 14.02.2005) sei, ist das ein anderes ein, nämlich der omnipräsente unbestimmte Artikel: ein Mensch, ein Auto, ein Kuchen und ein Rudi Völler eben. Doch ob das tatsächlich alles dasselbe ist, und welche Funktion der unbestimmte Artikel vor Rudi Völler in der obigen Aufzählung eigentlich hat, dieser Frage möchte ich in diesem Beitrag nachgehen.