Refine
Year of publication
Document Type
- Report (35) (remove)
Language
- German (32)
- English (2)
- Multiple languages (1)
Keywords
- Deutsch (7)
- Tagungsbericht (7)
- CLARIAH-DE (6)
- Edition (6)
- Digitale Edition (5)
- Basisformat des Deutschen Textarchivs (DTABf) (4)
- Kongressbericht (4)
- Linguistik (4)
- Austauschformat (3)
- Institut für Deutsche Sprache (IDS) (3)
Publicationstate
Reviewstate
- Peer-Review (9)
- (Verlags)-Lektorat (5)
Publisher
Die zentrale Aufgabenstellung des Verbundprojektes TextTransfer (Pilot) war eine Machbarkeitsprüfung für die Entwicklung eines Text-Mining-Verfahrens, mit dem Forschungsergebnisse automatisiert auf Hinweise zu Transfer- und Impactpotenzialen untersucht werden können. Das vom Projektkoordinator IDS verantwortete Teilprojekt konzentrierte sich dabei auf die Entwicklung der methodischen Grundlagen, während der Projektpartner TIB vornehmlich für die Bereitstellung eines geeigneten Datensatzes verantwortlich war. Solchen automatisierten Verfahren liegen zumeist textbasierte Daten als physisches Manifest wissenschaftlicher Erkenntnisse zugrunde, die im Falle von TextTransfer (Pilot) als empirische Grundlage herangezogen wurden. Das im Verbund zur Anwendung gebrachte maschinelle Lernverfahren stützte sich ausschließlich auf deutschsprachige Projektendberichte öffentlich geförderter Forschung. Diese Textgattung eignet sich insbesondere hinsichtlich ihrer öffentlichen Verfügbarkeit bei zuständigen Gedächtnisorganisationen und aufgrund ihrer im Vergleich zu anderen Formaten wissenschaftlicher Publikation relativen strukturellen wie sprachlichen Homogenität. TextTransfer (Pilot) ging daher grundsätzlich von der Annahme struktureller bzw. sprachlicher Ähnlichkeit in Berichtstexten aus, bei denen der Nachweis tatsächlich erfolgten Transfers zu erbringen war. Im Folgenden wird in diesen Fällen von Texten bzw. textgebundenen Forschungsergebnissen mit Transfer- und Impactpotenzial gesprochen werden. Es wurde ferner postuliert, dass sich diese Indizien von sprachlichen Eigenschaften in Texten zu Projekten ohne nachzuweisenden bzw. ggf. auch niemals erfolgtem, aber potenziell möglichem Transfer oder Impact unterscheiden lassen. Mit einer Verifizierung dieser Annahmen war es möglich, Transfer- oder Impactwahrscheinlichkeiten in großen Mengen von Berichtsdaten ohne eingehende Lektüre zu prognostizieren.
Dialektologische Fachtagung Bredevoort und Doetinchem (Niederlande), 14. bis 17. September 1996
(1998)
Das neue Onlineformat PREPCONonline führt durch die Welt der Korpusdaten und zeigt, welchen Erklärungswert authentische Sprache, die von Experten aufbereitet ist, für die eigene sprachliche Kompetenz haben kann. Dieser Ansatz folgt der Überzeugung, dass vor allem auf einem gehobenen Kompetenzniveau reale Sprachausschnitte, die für einen Aspekt des Gebrauchs besonders typisch sind, möglichst unverfälscht abrufbar sein sollten, um Sprache, so wie sie wirklich verwendet wird, versteh- und anwendbar zu machen.
Die Abbildung und Modellierung von Varianz wird im Projekt Wechselwirkungen zwischen linguistischen Verfahren, Methoden und Algorithmen auf der sprachlichen Seite u.a. repräsentiert durch die Metalemmaliste, die Lemmata der neuhochdeutschen Standardsprache mit diachronisch und diatopisch markierten Lemmata verknüpft. Die zeitlich und regional markierten Varianten stammen aus Wörterbüchern des Trierer Wörterbuchnetzes. Die Lemmata der nhd. Standardsprache werden in einer korpusgenerierten Basislemmaliste (BLL) zur Verfügung gestellt, in der neben den Lemmata auch Angaben zu deren Wortart(en) und Gebrauchshäufigkeit verzeichnet sind. Die Lemmata der BLL bilden das Gemeinsame Dritte, auf das die Lemmata der Varietäten-Wörterbücher in der Metalemmaliste abgebildet sind, die Lemmata der BLL der nhd. Standardsprache konstituieren die Metalemmata der Metalemmaliste. Die BLL soll in ihrer Funktion als Tertium Comparationis den Sprachgebrauch im heutigen Standarddeutsch widerspiegeln. Dadurch wird sichergestellt, dass die verschiedenen Instanzen der Varietätenlemmata auf Lemmata abgebildet werden, die momentan in der Standardsprache gebräuchlich sind. Über das Metalemma lassen sich die äquivalenten Ausdrücke in den Varietäten finden, ohne dass man von deren regionalen oder historischen Ausprägungen Kenntnisse besitzt. Die Umsetzung der semasiologischen Zugriffsmöglichkeit auf sämtliche Varietätenlemmata über ein Lemma der nhd. Standardsprache erfolgt auf der Grundlage einer XML-basierten Datenbank nach aktuellen Standards der Kodierung von Lexikoneinträgen (TEI P5). Die Metalemmaliste ist dynamisch und netzartig konzipiert, so dass immer neue Teilbereiche, Verzweigungen und Ontologien angedockt werden können (vgl. TV 2). Die Anknüpfung der Varietätenlemmata an die Lemmata der nhd. Standardsprache aus der BLL erfolgt mit Hilfe von Algorithmen, die im TV 3.2. (Informatik Würzburg) implementiert wurden.
Die Editionsmatrix EdMa ist ein Hilfsmittel zur Kategorisierung von Editionen, das als Ausgangspunkt für eigene Planungen von Editorinnen und Editoren und für eine gezielte Beratung genutzt werden kann.
Die vorliegende Handreichung bzw. Anleitung zur kriterienbasierten Erfassung und Kategorisierung digitaler Editionen ist im Kontext des Projekts CLARIAH-DE entstanden, welches in seiner ersten Phase von April 2019 bis März 2021 vom Bundesministerium für Bildung und Forschung gefördert wurde.
Das vorliegende Dokument befasst sich mit der Anwendung des DTA-Basisformats für Manuskripte (DTABf-M) auf die Edition handgeschriebener historischer Texte und ist im Kontext des CLARIAH-DE-Projekts (2019–2021) entstanden. Innerhalb von Arbeitspaket (AP) 1 „Forschungsdaten, Standards, Verfahren“ wird anhand ausgewählter Fallbeispiele evaluiert, inwieweit sich das Basisformat des Deutschen Textarchivs (DTABf) sinnvoll als Austauschformat für digitale Editionen allgemein einsetzen lässt. Die Evaluation wurde anhand eines kürzlich abgeschlossenen Editionsprojektes, welches an der Herzog August Bibliothek (HAB) Wolfenbüttel angesiedelt ist, durchgeführt. Bei dem Projekt "Selbstzeugnisse der Frühen Neuzeit in der Herzog August Bibliothek. Digitale Edition des Diariums von Herzog August dem Jüngeren, Selbstzeugnis-Repertorium und Forschungsportal" handelt es sich um ein vom Niedersächsischen Ministerium für Wissenschaft und Kultur (Pro* Niedersachsen) gefördertes Unternehmen.
Das vorliegende Dokument befasst sich mit der Anwendung des DTA-Basisformats für Manuskripte (DTABf-M) auf die kritische Edition handgeschriebener historischer Texte und ist im Kontext des CLARIAH-DE-Projekts (2019–2021) entstanden. Innerhalb von Arbeitspaket (AP) 1 „Forschungsdaten, Standards, Verfahren“ wird anhand ausgewählter Fallbeispiele evaluiert, inwieweit sich das Basisformat des Deutschen Textarchivs (DTABf) sinnvoll als Austauschformat für digitale Editionen allgemein einsetzen lässt. Die Evaluation wurde anhand der kommentierten Edition der Reise- und Sammlungsbeschreibungen Philipp Hainhofers vorgenommen, welche an der Herzog August Bibliothek (HAB) Wolfenbüttel angesiedelt ist und in Kooperation mit der Trierer Arbeitsstelle für Künstlersozialgeschichte entsteht.