Refine
Year of publication
- 2020 (229) (remove)
Document Type
- Article (88)
- Part of a Book (83)
- Conference Proceeding (23)
- Other (13)
- Book (12)
- Part of Periodical (7)
- Working Paper (2)
- Report (1)
Is part of the Bibliography
- yes (229) (remove)
Keywords
- Deutsch (60)
- Korpus <Linguistik> (50)
- COVID-19 (34)
- Neologismus (28)
- Sprachgebrauch (28)
- Gesprochene Sprache (22)
- Forschungsdaten (20)
- Wortschatz (19)
- Konversationsanalyse (14)
- Lexikostatistik (14)
Publicationstate
- Veröffentlichungsversion (114)
- Zweitveröffentlichung (81)
- Postprint (14)
- Ahead of Print (1)
Reviewstate
- (Verlags)-Lektorat (86)
- Peer-Review (85)
Publisher
- Leibniz-Institut für Deutsche Sprache (IDS) (44)
- European Language Resources Association (19)
- de Gruyter (18)
- Narr Francke Attempto (17)
- CLARIN (6)
- Gesellschaft für deutsche Sprache e.V. (6)
- Heidelberg University Publishing (6)
- Spektrum der Wissenschaft Verlagsgesellschaft (5)
- Benjamins (4)
- Erich Schmidt (4)
Die zentrale Aufgabenstellung des Verbundprojektes TextTransfer (Pilot) war eine Machbarkeitsprüfung für die Entwicklung eines Text-Mining-Verfahrens, mit dem Forschungsergebnisse automatisiert auf Hinweise zu Transfer- und Impactpotenzialen untersucht werden können. Das vom Projektkoordinator IDS verantwortete Teilprojekt konzentrierte sich dabei auf die Entwicklung der methodischen Grundlagen, während der Projektpartner TIB vornehmlich für die Bereitstellung eines geeigneten Datensatzes verantwortlich war. Solchen automatisierten Verfahren liegen zumeist textbasierte Daten als physisches Manifest wissenschaftlicher Erkenntnisse zugrunde, die im Falle von TextTransfer (Pilot) als empirische Grundlage herangezogen wurden. Das im Verbund zur Anwendung gebrachte maschinelle Lernverfahren stützte sich ausschließlich auf deutschsprachige Projektendberichte öffentlich geförderter Forschung. Diese Textgattung eignet sich insbesondere hinsichtlich ihrer öffentlichen Verfügbarkeit bei zuständigen Gedächtnisorganisationen und aufgrund ihrer im Vergleich zu anderen Formaten wissenschaftlicher Publikation relativen strukturellen wie sprachlichen Homogenität. TextTransfer (Pilot) ging daher grundsätzlich von der Annahme struktureller bzw. sprachlicher Ähnlichkeit in Berichtstexten aus, bei denen der Nachweis tatsächlich erfolgten Transfers zu erbringen war. Im Folgenden wird in diesen Fällen von Texten bzw. textgebundenen Forschungsergebnissen mit Transfer- und Impactpotenzial gesprochen werden. Es wurde ferner postuliert, dass sich diese Indizien von sprachlichen Eigenschaften in Texten zu Projekten ohne nachzuweisenden bzw. ggf. auch niemals erfolgtem, aber potenziell möglichem Transfer oder Impact unterscheiden lassen. Mit einer Verifizierung dieser Annahmen war es möglich, Transfer- oder Impactwahrscheinlichkeiten in großen Mengen von Berichtsdaten ohne eingehende Lektüre zu prognostizieren.
Von Gummistiefelmomenten
(2020)
Von Nichtstun und Erholung (an Weihnachten und zu anderen Zeiten) (aus der Rubrik Neuer Wortschatz)
(2020)
Dieser Beitrag beschreibt, welche Schritte nötig sind, um die Daten des Archivs der Grafen v. Platen (AGP) für Forschungsdateninfrastrukturen (FDI) zugänglich zu machen: die Daten konvertieren, die Metadaten extrahieren, Daten und Metadaten indizieren sowie die Datenmodelle für Daten und Metadaten so ergänzen, dass sie die Bestände des Archivs sinnvoll erfassen. Zugleich wird begründet, weshalb man überhaupt solchen Aufwand treiben sollte: nämlich, damit die Daten einem größeren Publikum zur Verfügung stehen und überdies mit Werkzeugen bearbeitet werden können, die in den Infrastrukturen zur Verfügung stehen, und damit eine weitere Verlinkung und Kombination mit externen Ressourcen erfolgen kann, sodass ein deutlicher Mehrwert entstehen kann.
Vorwort
(2020)
Das Theonym Gott für den christlichen Gott weist im Frühneuhochdeutschen eine Reihe ungewöhnlicher grammatischer Eigenschaften auf, die in diesem Beitrag korpusbasiert untersucht werden. Zum einen hat es sich von seiner appellativischen Herkunft emanzipiert, wie beispielsweise am fehlenden Artikel deutlich wird, zum anderen nutzt es aber das für einen Namen ungewöhnliche es-Flexiv im Genitiv (Pauls, Gottes) und tritt, wie unbelebte Appellative, als Genitivattribut dominant nachgestellt auf (Haus __ Gottes). In der Schreibung bildet sich die Doppelmajuskel <GOtt> heraus, die es bis ins 18. Jh. visuell von der übrigen Lexik abhebt. Damit weist das Theonym im Frühneuhochdeutschen eine Sondergrammatik auf, in abgeschwächter Form besteht sie bis heute fort. Der Beitrag argumentiert dafür, dass es sich um ein Resultat besonderer kommunikativer Relevanz handelt.
Aus diesem Grunde haben wir uns empirisch der Frage genähert, wie oder ob bestimmte Gruppen heute überhaupt noch Wörterbücher nutzen und ob sie sie bewusst von anderen sprachbezogenen Daten im Web unterscheiden. Es sollten empirische Daten gesammelt werden, um zu erfahren, wie DaF-Lernende tatsächlich arbeiten (und nicht was sie dazu retrospektiv sagen), vor allem um eine bessere empirische Basis für den Unterricht zur Verfügung zu haben. Zentrale Fragen dabei waren:
• Wie nutzen DaF-Lernende heutzutage lexikografische Ressourcen?
• Welche Suchstrategien wenden sie an?
• Differenzieren sie zwischen den unterschiedlichen Ressourcen?
• Welche Strategien erweisen sich als besonders erfolgreich?
N-grams are of utmost importance for modern linguistics and language theory. The legal status of n-grams, however, raises many practical questions. Traditionally, text snippets are considered copyrightable if they meet the originality criterion, but no clear indicators as to the minimum length of original snippets exist; moreover, the solutions adopted in some EU Member States (the paper cites German and French law as examples) are considerably different. Furthermore, recent developments in EU law (the CJEU's Pelham decision and the new right of newspaper publishers) also provide interesting arguments in this debate. The proposed paper presents the existing approaches to the legal protection of n-grams and tries to formulate some clear guidelines as to the length of n-grams that can be freely used and shared.
Terminologiearbeit im wirtschaftlichen Kontext geht von zwei Arbeitsphasen aus: einer umfassenden deskriptiven Phase, in der die Begriffsstruktur und der aktuelle Terminologiegebrauch erfasst, aber noch nicht bewertet werden, sowie einer präskriptiven Phase, in der der eigentliche Standardisierungseingriff erfolgt. In der Praxis wird die deskriptive Phase oft reduziert und der Schwerpunkt unmittelbar auf die Präskription gelegt. In unserem Beitrag diskutieren wir das Potenzial, das eine ausführliche deskriptive Terminologiearbeit zur Verbesserung der Wissenskommunikation im Rahmen des Wissensmanagements birgt. Am Beispiel eines wissenschaftlichen Projektes im Bereich Grammatik des Deutschen zeigen wir, wie diese eng an der Theorie orientierte Ausgestaltung der Deskription in der Praxis aussieht, welche Herausforderungen sie mit sich bringt und wie ihre Ergebnisse das Wissensmanagement unterstützen können.
Zwischen den Jahren oder eine Zeit zwischen den Zeiten. Sprachliche Betrachtungen zur "Normalität"
(2020)
In der deutschsprachigen Gender-Mainstreaming-Debatte treten sprachpolitische Positionen in Konflikt mit grammatischen Regularitäten und orthografischen Normen – nicht selten ohne wesentliche Annäherung. Der Beitrag beleuchtet die Debatte aus der Perspektive des Rats für deutsche Rechtschreibung und argumentiert anhand paradigmatischer Textbeispiele aus dem aktuellen Schreibgebrauch für eine textsorten- und zielgruppenspezifische Realisierung geschlechtergerechter Schreibung. Ausgehend vom breiten Spektrum entsprechender Strategien in bisherigen Leitfäden, Richtlinien und Empfehlungen werden Möglichkeiten einer orthografisch korrekten und sprachlich angemessenen Umsetzung aufgezeigt – in einem multiperspektivischen Ausgleichsversuch beider Diskurspole: Gendergerechte Texte sollen sachlich korrekt, verständlich, lesbar und vorlesbar sein, Rechtssicherheit und Eindeutigkeit gewährleisten sowie die Konzentration auf wesentliche Sachverhalte und Kerninformationen sicherstellen. Abschließend wird diskutiert, welche Rolle der Rat vor dem Hintergrund seines Auftrags der Bewahrung der Einheitlichkeit der Orthografie im gesamten deutschen Sprachraum in der Debatte einnehmen könnte und sollte.
Mit der Tagung zu Bauernkomödien des 17. Jahrhunderts verfolgten Markus Denkler (Münster) und Michael Elmentaler (Kiel) ein ungewöhnliches Konzept, das einen besonders intensiven wissenschaftlichen Austausch ermöglichte: Gemeinsame Textgrundlage für alle Beitragenden stellten zwölf hoch- und niederdeutsche Bauernkomödien aus dem 17. Jahrhundert (ca. 1593–1701) dar. Dabei handelt es sich um Dramen mit bäuerlichen Figuren, die eine komödiantische Ausrichtung haben und in Prosaform verfasst sind. Alle Vortragenden erhielten im Vorfeld Zugriff auf die Sammlung und entwickelten daraus in der Folge Fragestellungen für ihre Vorträge. Inhaltlich ergaben sich drei Blöcke. Zwei literaturwissenschaftliche Beiträge ordneten die Textsorte literatur- und kulturhistorisch ein. Daran schlossen sich ein umfangreicher Block zur historischen Dialogforschung und Pragmatik und ein etwas kürzerer zu historischer Varietätenlinguistik und Grammatik an.
The article focuses on the lexeme Ahnung. A lexicographic analysis shows the range of Information offered by Ahnung in selected dictionaries, aespecially monolingual DaF dictionaries, and displays how the Spectrum of meaning is represented in them. Corpus-based analyses from two samples from FOLK and DeReKo investigate exemplary form characteristics and, with regard to the written-language data, the occurrence in text types. Ahnung shows a slightly higher combinatorial potential in written-linguistic data than in spoken-linguistic data. A clear tendency to the connection keine Ahnung is however to be recognized in both data sets.