Allgemeines
Refine
Year of publication
Document Type
- Part of a Book (73)
- Article (33)
- Book (9)
- Review (9)
- Conference Proceeding (2)
Has Fulltext
- yes (126)
Keywords
- Deutsch (98)
- Sprachgeschichte (42)
- Biografie (16)
- Rezension (14)
- Wissenschaftsgeschichte (9)
- Historische Sprachwissenschaft (8)
- Bibliografie (7)
- Germanistik (7)
- Konrad-Duden-Preis (7)
- Linguistik (7)
Publicationstate
Reviewstate
- (Verlags)-Lektorat (32)
- Peer-Review (6)
Publisher
- Niemeyer (21)
- Schwann (16)
- de Gruyter (16)
- Institut für Deutsche Sprache (12)
- Dudenverlag (9)
- Steiner (5)
- Winter (5)
- Akademie Verlag (4)
- Institut für deutsche Sprache (IDS) (3)
- Bibliogr. Inst. Dudenverlag (2)
Mental Maps in EncycNet: Exploring Global Representation in a Historical, German Knowledge Graph
(2024)
First popularized by Google in 2012 (Singhal 2012), knowledge graphs (KG) have now become a staple data representation method. KGs can be described as directed graphs, where the nodes (subject and object entities) represent any type of human knowledge. The edge specifies the relationship between subject and object.
KGs are increasingly moving into the (digital) humanities. At their core, the humanities facilitate the preservation, dissemination, and analysis of cultural heritage knowledge. In all three aspects, this work is gradually changing towards the digital, such as digital thesauri. The network structure of KGs in particular opens up new possibilities for data aggregation and data analysis in the humanities. For one, KGs are an opportunity to interlink different fields of study through ontologies. They can also be used as additional sources for text preparation, as a new technology to query, aggregate, and analyze data in new ways, or to discover previously unseen relationships (Hawkins 2022, Zhang et al. 2021). In other words, as per Hyvönen (2020), KGs are not only good for data exploration and solving pre-set problems, they can also be employed for “finding research problems in the first place, for addressing them, and even for solving them automatically under the constraints set by the human researcher.”
This abstract introduces the first openly published version of the EncycNet KG, a semantic knowledge graph built from historical German encyclopedias, as well as its potential for the digital humanities. In particular, using EncycNet and Wikidata, we analyze how the representation of countries in encyclopedias has changed from the 19th century until today.
This paper outlines a proposal for the use of knowledge graphs for historical German domain adaptation. From the EncycNet project, the encyclopedia-based knowledge graph from the early 20th century was borrowed to examine whether text-based domain adaptation using the source encyclopedia’s text or graph-based adaptation produces a better domain-specific model. To evaluate the approach, a novel historical test dataset based on a second encyclopedia of the early 20th century was created. This dataset is categorized by knowledge type (factual, linguistic, lexical) with special attention paid to distinguishing simple and expert knowledge. The main finding is that, surprisingly, simple knowledge has the most potential for improvement, whereas expert knowledge lags behind. In this study, broad signals like simple definitions and word origin yielded the best results, while more specialized knowledge such as synonyms were not as effectively represented. A follow-up study was carried out in favor of simple contemporary lexical knowledge to control for historicity and text genre, where the results confirm that language models can still be enhanced by incorporating simple lexical knowledge using the proposed workflow.
Mit der Tagung zu Bauernkomödien des 17. Jahrhunderts verfolgten Markus Denkler (Münster) und Michael Elmentaler (Kiel) ein ungewöhnliches Konzept, das einen besonders intensiven wissenschaftlichen Austausch ermöglichte: Gemeinsame Textgrundlage für alle Beitragenden stellten zwölf hoch- und niederdeutsche Bauernkomödien aus dem 17. Jahrhundert (ca. 1593–1701) dar. Dabei handelt es sich um Dramen mit bäuerlichen Figuren, die eine komödiantische Ausrichtung haben und in Prosaform verfasst sind. Alle Vortragenden erhielten im Vorfeld Zugriff auf die Sammlung und entwickelten daraus in der Folge Fragestellungen für ihre Vorträge. Inhaltlich ergaben sich drei Blöcke. Zwei literaturwissenschaftliche Beiträge ordneten die Textsorte literatur- und kulturhistorisch ein. Daran schlossen sich ein umfangreicher Block zur historischen Dialogforschung und Pragmatik und ein etwas kürzerer zu historischer Varietätenlinguistik und Grammatik an.
Betrachtet man "Verfallserscheinungen" des Verbalsystems wie Übergänge stark > schwach, so zeigt sich, dass hier weder Rezenz noch Verfall zu konstatieren ist. Mit diachroner und analytischer Tiefe offenbart sich ein gestaffelter, systematischer Komplexitätsabbau, der seine Hochphase im Frühneuhochdeutschen hat und sich schlecht mit der Passivität und Chaos implizierenden Verfallsmetapher verträgt: Reorganisation statt Dekadenz. Entwicklungen wie der präteritale Numerusausgleich ('ich sang' – 'wir sungen' > 'ich sang' – 'wir sangen') oder die Herausbildung der vereinfachten Ablautalternanz X–o–o sind nie nur Komplexitätsreduktion, sondern immer auch Systematisierung; sie bremsen Verfall. Dabei ist der Gewinn an Systematik i.d.R. nicht Normautoritäten geschuldet, sondern ihm liegen sprachsystematische, kognitive und frequenzielle Faktoren zugrunde.