@book{FiedlerK{\"o}llerBoppetal.2024, author = {Fiedler, Norman and K{\"o}ller, Christoph and Bopp, Jutta and Schneider, Felix}, title = {Linguistisches Impact-Assessment: Maschinelle Prognose mit Realit{\"a}tsabgleich im Projekt TextTransfer}, editor = {Fiedler, Norman and Hein, Katrin and Lindenfelser, Siegwalt and Trawiński, Beata}, isbn = {978-3-948831-67-7}, issn = {2749-9855}, doi = {10.21248/idsopen.7.2024.15}, series = {IDSopen: Online-only Publikationen des Leibniz-Instituts f{\"u}r Deutsche Sprache}, number = {7}, publisher = {Leibniz-Institut f{\"u}r Deutsche Sprache (IDS)}, pages = {52}, year = {2024}, abstract = {Empirische Ans{\"a}tze halten zunehmend Einzug in die Methodik und Herangehensweise geisteswissenschaftlicher Forschung. Die Sprachwissenschaften st{\"u}tzen sich zunehmend auf Forschungsdaten und Sprachmodelle, um ein digitales Bild nat{\"u}rlicher Sprachen zu erzeugen. Auf dieser Grundlage wird es m{\"o}glich, entlang nutzerspezifischer Suchanfragen des distant reading automatisiert semantische Muster in Texten zu erkennen. Seit mithilfe solcher Modelle, etwa in Suchmaschinen, webbasierten {\"U}bersetzungs- oder Konversationstools, sprachliche Informationen maschinell in sinnhaften Zusammenh{\"a}ngen reproduziert werden k{\"o}nnen, sind die Implikationen sogenannter K{\"u}nstlicher Intelligenz (KI) zu einem Thema im gesamtgesellschaftlichen Diskurs avanciert. Vielen Linguisten ist es deshalb ein Anliegen, ihre Erkenntnisse f{\"u}r neue Anwendungsfelder jenseits ihrer unmittelbaren disziplin{\"a}ren Umgebung zu {\"o}ffnen und zu einer fundierten Debatte beizutragen. Dieser Feststellung gegen{\"u}ber steht die Einsicht, dass Forschungsergebnisse aller Disziplinen zwar archiviert, aber mangels gezielter Interpretierbarkeit großer und komplexer Datenmengen h{\"a}ufig f{\"u}r diesen breiten Diskurs nicht genutzt werden. Ein nachweisbarer Impact bleibt aus. An dieser Schnittstelle erarbeitet das vom Bundesministerium f{\"u}r Bildung und Forschung (BMBF) finanzierte Projekt TextTransfer einen Ansatz, um per distant reading auf Art und Wahrscheinlichkeit eines gesellschaftlichen, wirtschaftlichen oder politischen Impacts textgebundenen Forschungswissens zu schließen. Zu diesem Zweck baut TextTransfer ein maschinelles Lernverfahren auf, das auf empirischem Erfahrungswissen zu Impacterfolgen von Forschungsprojekten fußt. Als wesentlicher Baustein dieses Erfahrungsgewinns gilt die Verifizierbarkeit der Lernergebnisse. Der vorliegende Artikel zeigt einen ersten Ansatz im Projekt, ein Sprachmodell in einem gesteuerten Lernverfahren mit belastbaren Lerndaten zu trainieren, um m{\"o}glichst hohe Pr{\"a}zision im Impact-Assessment zu erreichen.}, subject = {Korpus }, language = {de} }