@techreport{Witt2021, author = {Andreas Witt}, title = {Verbundprojekt: TextTransfer (Pilot) - Korpusgest{\"u}tzte Erkennung von Verwertungsmustern in wissenschaftlichen Texten. Abschlussbericht Gesamtprojekt nach Nr. 3.2. BNBest-BMBF 98}, institution = {Leibniz-Institut f{\"u}r Deutsche Sprache (IDS)}, address = {Mannheim}, doi = {10.2314/KXP:1760102822}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:mh39-107706}, pages = {90}, year = {2021}, abstract = {Die zentrale Aufgabenstellung des Verbundprojektes TextTransfer (Pilot) war eine Machbarkeitspr{\"u}fung f{\"u}r die Entwicklung eines Text-Mining-Verfahrens, mit dem Forschungsergebnisse automatisiert auf Hinweise zu Transfer- und Impactpotenzialen untersucht werden k{\"o}nnen. Das vom Projektkoordinator IDS verantwortete Teilprojekt konzentrierte sich dabei auf die Entwicklung der methodischen Grundlagen, w{\"a}hrend der Projektpartner TIB vornehmlich f{\"u}r die Bereitstellung eines geeigneten Datensatzes verantwortlich war. Solchen automatisierten Verfahren liegen zumeist textbasierte Daten als physisches Manifest wissenschaftlicher Erkenntnisse zugrunde, die im Falle von TextTransfer (Pilot) als empirische Grundlage herangezogen wurden. Das im Verbund zur Anwendung gebrachte maschinelle Lernverfahren st{\"u}tzte sich ausschlie{\"s}lich auf deutschsprachige Projektendberichte {\"o}ffentlich gef{\"o}rderter Forschung. Diese Textgattung eignet sich insbesondere hinsichtlich ihrer {\"o}ffentlichen Verf{\"u}gbarkeit bei zust{\"a}ndigen Ged{\"a}chtnisorganisationen und aufgrund ihrer im Vergleich zu anderen Formaten wissenschaftlicher Publikation relativen strukturellen wie sprachlichen Homogenit{\"a}t. TextTransfer (Pilot) ging daher grunds{\"a}tzlich von der Annahme struktureller bzw. sprachlicher {\"A}hnlichkeit in Berichtstexten aus, bei denen der Nachweis tats{\"a}chlich erfolgten Transfers zu erbringen war. Im Folgenden wird in diesen F{\"a}llen von Texten bzw. textgebundenen Forschungsergebnissen mit Transfer- und Impactpotenzial gesprochen werden. Es wurde ferner postuliert, dass sich diese Indizien von sprachlichen Eigenschaften in Texten zu Projekten ohne nachzuweisenden bzw. ggf. auch niemals erfolgtem, aber potenziell m{\"o}glichem Transfer oder Impact unterscheiden lassen. Mit einer Verifizierung dieser Annahmen war es m{\"o}glich, Transfer- oder Impactwahrscheinlichkeiten in gro{\"s}en Mengen von Berichtsdaten ohne eingehende Lekt{\"u}re zu prognostizieren.}, language = {de} }