Refine
Year of publication
Document Type
- Report (35) (remove)
Language
- German (32)
- English (2)
- Multiple languages (1)
Keywords
- Deutsch (7)
- Tagungsbericht (7)
- CLARIAH-DE (6)
- Edition (6)
- Digitale Edition (5)
- Basisformat des Deutschen Textarchivs (DTABf) (4)
- Kongressbericht (4)
- Linguistik (4)
- Austauschformat (3)
- Institut für Deutsche Sprache (IDS) (3)
Publicationstate
Reviewstate
- Peer-Review (9)
- (Verlags)-Lektorat (5)
Publisher
Die zentrale Aufgabenstellung des Verbundprojektes TextTransfer (Pilot) war eine Machbarkeitsprüfung für die Entwicklung eines Text-Mining-Verfahrens, mit dem Forschungsergebnisse automatisiert auf Hinweise zu Transfer- und Impactpotenzialen untersucht werden können. Das vom Projektkoordinator IDS verantwortete Teilprojekt konzentrierte sich dabei auf die Entwicklung der methodischen Grundlagen, während der Projektpartner TIB vornehmlich für die Bereitstellung eines geeigneten Datensatzes verantwortlich war. Solchen automatisierten Verfahren liegen zumeist textbasierte Daten als physisches Manifest wissenschaftlicher Erkenntnisse zugrunde, die im Falle von TextTransfer (Pilot) als empirische Grundlage herangezogen wurden. Das im Verbund zur Anwendung gebrachte maschinelle Lernverfahren stützte sich ausschließlich auf deutschsprachige Projektendberichte öffentlich geförderter Forschung. Diese Textgattung eignet sich insbesondere hinsichtlich ihrer öffentlichen Verfügbarkeit bei zuständigen Gedächtnisorganisationen und aufgrund ihrer im Vergleich zu anderen Formaten wissenschaftlicher Publikation relativen strukturellen wie sprachlichen Homogenität. TextTransfer (Pilot) ging daher grundsätzlich von der Annahme struktureller bzw. sprachlicher Ähnlichkeit in Berichtstexten aus, bei denen der Nachweis tatsächlich erfolgten Transfers zu erbringen war. Im Folgenden wird in diesen Fällen von Texten bzw. textgebundenen Forschungsergebnissen mit Transfer- und Impactpotenzial gesprochen werden. Es wurde ferner postuliert, dass sich diese Indizien von sprachlichen Eigenschaften in Texten zu Projekten ohne nachzuweisenden bzw. ggf. auch niemals erfolgtem, aber potenziell möglichem Transfer oder Impact unterscheiden lassen. Mit einer Verifizierung dieser Annahmen war es möglich, Transfer- oder Impactwahrscheinlichkeiten in großen Mengen von Berichtsdaten ohne eingehende Lektüre zu prognostizieren.
Dialektologische Fachtagung Bredevoort und Doetinchem (Niederlande), 14. bis 17. September 1996
(1998)
Das neue Onlineformat PREPCONonline führt durch die Welt der Korpusdaten und zeigt, welchen Erklärungswert authentische Sprache, die von Experten aufbereitet ist, für die eigene sprachliche Kompetenz haben kann. Dieser Ansatz folgt der Überzeugung, dass vor allem auf einem gehobenen Kompetenzniveau reale Sprachausschnitte, die für einen Aspekt des Gebrauchs besonders typisch sind, möglichst unverfälscht abrufbar sein sollten, um Sprache, so wie sie wirklich verwendet wird, versteh- und anwendbar zu machen.
Die Abbildung und Modellierung von Varianz wird im Projekt Wechselwirkungen zwischen linguistischen Verfahren, Methoden und Algorithmen auf der sprachlichen Seite u.a. repräsentiert durch die Metalemmaliste, die Lemmata der neuhochdeutschen Standardsprache mit diachronisch und diatopisch markierten Lemmata verknüpft. Die zeitlich und regional markierten Varianten stammen aus Wörterbüchern des Trierer Wörterbuchnetzes. Die Lemmata der nhd. Standardsprache werden in einer korpusgenerierten Basislemmaliste (BLL) zur Verfügung gestellt, in der neben den Lemmata auch Angaben zu deren Wortart(en) und Gebrauchshäufigkeit verzeichnet sind. Die Lemmata der BLL bilden das Gemeinsame Dritte, auf das die Lemmata der Varietäten-Wörterbücher in der Metalemmaliste abgebildet sind, die Lemmata der BLL der nhd. Standardsprache konstituieren die Metalemmata der Metalemmaliste. Die BLL soll in ihrer Funktion als Tertium Comparationis den Sprachgebrauch im heutigen Standarddeutsch widerspiegeln. Dadurch wird sichergestellt, dass die verschiedenen Instanzen der Varietätenlemmata auf Lemmata abgebildet werden, die momentan in der Standardsprache gebräuchlich sind. Über das Metalemma lassen sich die äquivalenten Ausdrücke in den Varietäten finden, ohne dass man von deren regionalen oder historischen Ausprägungen Kenntnisse besitzt. Die Umsetzung der semasiologischen Zugriffsmöglichkeit auf sämtliche Varietätenlemmata über ein Lemma der nhd. Standardsprache erfolgt auf der Grundlage einer XML-basierten Datenbank nach aktuellen Standards der Kodierung von Lexikoneinträgen (TEI P5). Die Metalemmaliste ist dynamisch und netzartig konzipiert, so dass immer neue Teilbereiche, Verzweigungen und Ontologien angedockt werden können (vgl. TV 2). Die Anknüpfung der Varietätenlemmata an die Lemmata der nhd. Standardsprache aus der BLL erfolgt mit Hilfe von Algorithmen, die im TV 3.2. (Informatik Würzburg) implementiert wurden.
Die Editionsmatrix EdMa ist ein Hilfsmittel zur Kategorisierung von Editionen, das als Ausgangspunkt für eigene Planungen von Editorinnen und Editoren und für eine gezielte Beratung genutzt werden kann.
Die vorliegende Handreichung bzw. Anleitung zur kriterienbasierten Erfassung und Kategorisierung digitaler Editionen ist im Kontext des Projekts CLARIAH-DE entstanden, welches in seiner ersten Phase von April 2019 bis März 2021 vom Bundesministerium für Bildung und Forschung gefördert wurde.
Das vorliegende Dokument befasst sich mit der Anwendung des DTA-Basisformats für Manuskripte (DTABf-M) auf die Edition handgeschriebener historischer Texte und ist im Kontext des CLARIAH-DE-Projekts (2019–2021) entstanden. Innerhalb von Arbeitspaket (AP) 1 „Forschungsdaten, Standards, Verfahren“ wird anhand ausgewählter Fallbeispiele evaluiert, inwieweit sich das Basisformat des Deutschen Textarchivs (DTABf) sinnvoll als Austauschformat für digitale Editionen allgemein einsetzen lässt. Die Evaluation wurde anhand eines kürzlich abgeschlossenen Editionsprojektes, welches an der Herzog August Bibliothek (HAB) Wolfenbüttel angesiedelt ist, durchgeführt. Bei dem Projekt "Selbstzeugnisse der Frühen Neuzeit in der Herzog August Bibliothek. Digitale Edition des Diariums von Herzog August dem Jüngeren, Selbstzeugnis-Repertorium und Forschungsportal" handelt es sich um ein vom Niedersächsischen Ministerium für Wissenschaft und Kultur (Pro* Niedersachsen) gefördertes Unternehmen.
Das vorliegende Dokument befasst sich mit der Anwendung des DTA-Basisformats für Manuskripte (DTABf-M) auf die kritische Edition handgeschriebener historischer Texte und ist im Kontext des CLARIAH-DE-Projekts (2019–2021) entstanden. Innerhalb von Arbeitspaket (AP) 1 „Forschungsdaten, Standards, Verfahren“ wird anhand ausgewählter Fallbeispiele evaluiert, inwieweit sich das Basisformat des Deutschen Textarchivs (DTABf) sinnvoll als Austauschformat für digitale Editionen allgemein einsetzen lässt. Die Evaluation wurde anhand der kommentierten Edition der Reise- und Sammlungsbeschreibungen Philipp Hainhofers vorgenommen, welche an der Herzog August Bibliothek (HAB) Wolfenbüttel angesiedelt ist und in Kooperation mit der Trierer Arbeitsstelle für Künstlersozialgeschichte entsteht.
Das Projekt „Bürgernahe Sprache in der Finanzverwaltung“ verfolgt das Ziel, Texte aus dem Bereich der Steuerverwaltung in bürgernaher Sprache umzusetzen. Im September 2020 hat das IDS in enger Rückbindung an den Lenkungskreis des Projektes begonnen, eine Pilotstudie zu entwickeln. Hierin wurden ausgewählte Texte (Textbausteine) in einem Online-Umfrageformat mit verschiedenen Bewertungsskalen aufbereitet. Die Beispieltexte in der Studie stammen aus den Erläuterungstexten zum Einkommensteuerbescheid sowie den Ausfüllanleitungen zur Grundsteuer. Die Testpersonen sollten in mehreren unterschiedlichen Aufgabenblöcken ausgewählte Texte in Vorher- und/oder Nachher-Versionen über die Bewertungsskala bewerten. Zusätzlich konnten sie auf jeder Aufgabenseite Anmerkungen in einem Freifeld notieren. Das Ziel der Umfrage ist es, Bürgerinnen und Bürger zu ihren Eindrücken zu befragen und aus den Ergebnissen Rückschlüsse auf die Verständlichkeit der Texte zu ziehen. Ein wichtiges übergeordnetes Ziel der Pilotstudie ist es, die eigentlichen Adressatinnen und Adressaten der Texte in die Projektarbeit mit einzubeziehen. Die Einschätzungen und Anmerkungen der Beteiligten geben für den weiteren Projektverlauf hilfreiche Hinweise und werden in die weiteren Überlegungen und praktischen Umsetzungen einfließen. Dieser Bericht fasst die Ergebnisse aus der Pilotstudie zusammen. Er gibt zu den verschiedenen Blöcken, die die Probandinnen und Probanden bearbeitet haben, Einblick, wie die Testpersonen die ihnen präsentierten Texte bewertet haben. Dabei werden die quantitativ ausdrückbaren Ergebnisse durch grafische Darstellungen visualisiert und in textueller Form zusammengefasst. Die Antworten auf die offenen Fragen geben einen qualitativen Eindruck der Anmerkungen, die die Probandinnen und Probanden in Freifeldern hinterlassen haben.
The Lyon’s team research task consists in the study of the way in which multilingual resources are mobilized in team work within collaborative activities; how they are exploited in a specific way in order both to enhance collaboration and to respect the specificities of the members’ linguistic competences and practices within the team. Central to our analytical work, which is inspired by ethnomethodological conversation analysis, is the relationship between multilingual resources and the situated organization of linguistic uses and of social practices.
Privacy in its many aspects is protected by various legal texts (e.g. the Basic Law, Civil Code, Criminal Code, or even the Law on Copyright in artistic and photographic works (KunstUrhG), which protects image rights). Data protection law, which governs the processing of information about individuals (personal data), also serves to protect their privacy. However, some information referring to the public sphere of an individual’s life (e.g. the fact that X is a mayor of Smallville) may still be considered personal data (see below), and as such fall within the scope of data protection rules. In this sense, data protection laws concern information that is not private.
Therefore, privacy and data protection, although closely related, are distinct notions: one can violate someone else’s privacy without processing his or her personal data (e.g. simply by knocking at one’s door at night, uninvited), and vice versa: one can violate data protection rules without violating privacy.
The following handouts focus exclusively on data protection rules, and specifically on the General Data Protection Regulation (GDPR). However, please keep in mind that compliance with the GDPR is not the only aspect of protecting privacy of individuals in research projects. Other rules, such as academic ethics and community standards (such as CARE) also need to be observed.