Refine
Year of publication
Document Type
- Part of a Book (4766)
- Article (3066)
- Book (1027)
- Conference Proceeding (752)
- Part of Periodical (321)
- Review (291)
- Other (165)
- Working Paper (86)
- Doctoral Thesis (70)
- Report (37)
Language
- German (8405)
- English (1969)
- Russian (145)
- French (39)
- Multiple languages (23)
- Spanish (16)
- Portuguese (14)
- Italian (9)
- Polish (7)
- Ukrainian (5)
Keywords
- Deutsch (5283)
- Korpus <Linguistik> (1103)
- Wörterbuch (639)
- Konversationsanalyse (483)
- Rezension (447)
- Grammatik (440)
- Gesprochene Sprache (398)
- Interaktion (387)
- Rechtschreibung (385)
- Sprachgebrauch (379)
Publicationstate
- Veröffentlichungsversion (4142)
- Zweitveröffentlichung (1891)
- Postprint (457)
- Ahead of Print (13)
- Preprint (12)
- Erstveröffentlichung (8)
- (Verlags)-Lektorat (4)
- Hybrides Open Access (2)
- Ahead-of-Print (1)
- Verlags-Lektorat (1)
Reviewstate
- (Verlags)-Lektorat (4174)
- Peer-Review (1746)
- Verlags-Lektorat (94)
- Peer-review (56)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (46)
- Review-Status-unbekannt (16)
- Peer-Revied (12)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (11)
- (Verlags-)Lektorat (10)
- Verlagslektorat (5)
Publisher
- de Gruyter (1389)
- Institut für Deutsche Sprache (1093)
- Schwann (638)
- Narr (541)
- Leibniz-Institut für Deutsche Sprache (IDS) (302)
- Narr Francke Attempto (261)
- De Gruyter (248)
- Niemeyer (200)
- Lang (184)
- IDS-Verlag (182)
Vor nun 23 Jahren, im September 2000, starteten Tylman Ule und ich ein kleines Projekt zur Ermittlung neuer Wörter auf der Basis von Texten im World Wide Web. So konnte letztendlich die Wortschatzentwicklung der ersten zwanzig Jahre des neuen Jahrtausends aufgezeichnet werden. In diesem Aufsatz beschreibe ich noch einmal unser Vorgehen und ziehe eine quantitative und qualitative Bilanz des Projekts. Ein Fazit nach 20 Jahren ist, dass das Konzept „Neologismus“ nach wie vor nur vage zu umreißen ist.
Gegenstand dieses Beitrags ist der Zusammenhang von sprachlich-textueller Organisation mit Fragen der Wissensorganisation bzw. der Wissensvermittlung in und mit Zeitschriftenbeiträgen, Zeitschriftenheften und Serien von Heften. Die Aspekte der sprachlichen Gestaltung umfassen: Textorganisation, Text/Bild-Koordination, Multimodalität und Wortgebrauch. Ich formuliere erste Befunde, erläutere ausgewählte Beispiele und umreiße einige Zukunftsaufgaben. Am Rande werden auch Fragen einer Theorie von Texttypen/multimodalen Angeboten diskutiert.
Mathematische Beweistexte weisen Beweisstrategie-spezifische Strukturierungsschemata auf, die sich mithilfe von Frames modellieren lassen. Diese Frames lassen sich teilweise empirisch-induktiv aus Textdaten gewinnen. Da die Frames aber zahlreiche Subtypen aufweisen und in Beweistexten für kompetentere Rezipienten nur elliptisch realisiert werden, müssen neben die empirisch-induktiven Verfahren (corpus-driven approach) auch intuitiv-hypothesenbildende (corpus-based approach) treten.
Wir beschreiben die Entwicklung und Implementierung eines Online-Glossars für „Klimakomposita“; Nominalkomposita, die mit Klima- beginnen. Wir interessieren uns nicht für sachliche oder technische Begriffe, sondern für diejenigen, die im politisch motivierten Diskurs benutzt werden, um – mehr oder weniger unterschwellig – subjektive Beurteilungen zu kommunizieren, wie etwa in Klimareligion oder Klimahysterie. Unser Vorgehen ist korpusbasiert: Wir beschreiben die Zusammenstellung eines Textkorpus, das Material von den beiden Seiten der Klimaaktivist*innen und der Klimaskeptiker*innen umfasst, die Selektion der im Glossar zu behandelnden Stichwörter und das Vorgehen beim Formulieren ihrer Beschreibungen.
The consideration of group-internal linguistic perspectives is an essential aspect of the Linguistics of Diversity and Inclusion. In the field of queer linguistics, this has so far mostly been done at the micro level, for example in the context of so-called small stories and other qualitative approaches, or smaller peer group corpora. Research on external perspectives is more common, e.g. on discourses in mainstream media or in political discussions about (a part of) the queer community. In German-speaking contexts, linguistic research on queer topics in general is still in its early stages, and corpus-based approaches to researching internal perspectives in particular are still rare. In our article, we present a new corpus resource that enables comprehensive corpusbased research on queer topics in German: the Queere Korpus (QK). The corpus is designed to comprise a balanced amount of various text types from three different German-speaking countries: Germany, Austria, and Switzerland. So far, it contains 55,916,108 tokens distributed across a total of 28 gay, lesbian, queer and non-binary/trans* sources. We included online magazines, websites and blogs, and (digitized) print magazines. In our paper, we describe the corpus compilation and structure in detail and outline possible research questions and goals, exemplified by an analysis of the corpus stratification regarding the topic “Ehe für Alle” (same-sex marriage). While the corpus is not yet publicly available, we provide an extensive dataset of frequency lists, co-occurrences and N-grams together with this article.
Der Artikel argumentiert, dass das konversationsanalytische Prinzip der ‚natürlichen‘ Daten nicht vereinbar ist mit Forschungsfragen, die über die deskriptive Rekonstruktion der Ordnung verdeckter Alltagsinteraktion hinaus gehen. In forschungspraktischer Perspektive diskutiert der Beitrag, wie Natürlichkeit mit Reichhaltigkeit und Vergleichbarkeit unter den Bedingungen der grundsätzlichen Kontextualisierung aller Interaktion versöhnt werden kann. Abschließend erörtert er die Aspekte einer korpustechnologischen Aufbereitung.
Mental Maps in EncycNet: Exploring Global Representation in a Historical, German Knowledge Graph
(2024)
First popularized by Google in 2012 (Singhal 2012), knowledge graphs (KG) have now become a staple data representation method. KGs can be described as directed graphs, where the nodes (subject and object entities) represent any type of human knowledge. The edge specifies the relationship between subject and object.
KGs are increasingly moving into the (digital) humanities. At their core, the humanities facilitate the preservation, dissemination, and analysis of cultural heritage knowledge. In all three aspects, this work is gradually changing towards the digital, such as digital thesauri. The network structure of KGs in particular opens up new possibilities for data aggregation and data analysis in the humanities. For one, KGs are an opportunity to interlink different fields of study through ontologies. They can also be used as additional sources for text preparation, as a new technology to query, aggregate, and analyze data in new ways, or to discover previously unseen relationships (Hawkins 2022, Zhang et al. 2021). In other words, as per Hyvönen (2020), KGs are not only good for data exploration and solving pre-set problems, they can also be employed for “finding research problems in the first place, for addressing them, and even for solving them automatically under the constraints set by the human researcher.”
This abstract introduces the first openly published version of the EncycNet KG, a semantic knowledge graph built from historical German encyclopedias, as well as its potential for the digital humanities. In particular, using EncycNet and Wikidata, we analyze how the representation of countries in encyclopedias has changed from the 19th century until today.
In diesem Beitrag greifen wir das im Deutschunterricht bislang noch wenig genutzte Potenzial einer Verknüpfung von Sprachreflexion mit der Recherche und Analyse authentischer Sprachdaten mithilfe digitaler Textkorpora auf und machen es für das materialgestützte Schreiben nutzbar. Dazu skizzieren wir didaktische Grundlagen und curriculare Vorgaben zum materialgestützten Schreiben und entwickeln einen Vorschlag zur Weiterentwicklung dieser Aufgabenart, die Möglichkeiten der Nutzung digitaler Textkorpora als Werkzeuge zur Informationsgewinnung beim materialgestützten Schreiben verdeutlicht und in konkrete Unterrichtsüberlegungen mündet.
Als eine der beliebtesten Social-Media-Plattformen rückt Instagram immer mehr in den Fokus von Sprachwissenschaftler*innen. Bislang gibt es jedoch noch keine Standards für Korpora, die multimodale und ephemere Daten enthalten, wie sie für Instagram typisch sind. Gleichzeitig besteht auch bei Studierenden ein großes Interesse an einer wissenschaftlichen Untersuchung der Plattform, weshalb sich die Integration in die akademische Lehre aufdrängt. Datengrundlagen für Untersuchungen im Rahmen von Seminar- und Abschlussarbeiten entstehen häufig nach individueller Absprache. Mit der INSTAB-Formel wird hier ein Vorschlag unterbreitet, wie Schritt für Schritt eine Datensammlung angelegt werden kann, ohne dass Studierende über Programmierkenntnisse oder besondere technische Voraussetzungen verfügen. Die so generierte Datenbasis ermöglicht es Studierenden, qualitativ ausgerichteten Fragestellungen nachzugehen.