Refine
Year of publication
Document Type
- Article (8)
- Part of a Book (6)
- Conference Proceeding (3)
- Book (1)
- Contribution to a Periodical (1)
- Review (1)
Has Fulltext
- yes (20)
Keywords
- Linguistische Datenverarbeitung (20) (remove)
Publicationstate
- Veröffentlichungsversion (5)
- Postprint (2)
- Zweitveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (5)
- Peer-Review (2)
- Verlags-Lektorat (1)
Publisher
- Institut für Deutsche Sprache (3)
- de Gruyter (2)
- ELRA (1)
- Mentis-Verlag (1)
- Narr Francke Attempto (1)
- Niemeyer (1)
- Schmidt (1)
- Schwann (1)
- Springer International Publishing (1)
- University of Victoria (1)
Ziel des vorliegenden Beitrages ist es, LingTermNet, ein Online-Repositorium für linguistische Fachtermini, vorzustellen. Methodologisch und hinsichtlich seiner lexikografischen Umsetzung basiert LingTermNet auf framesemantischen Prinzipien, die auch dem Berkeleyer FrameNet-Projekt zugrunde liegen. Dargestellt werden zunächst leitende theoretische Annahmen; im Zentrum steht sodann die Präsentation von Aufbau und Struktur der Ressource. Im Unterschied zu ‘traditionellen’ Wörterbüchern entstehen Einträge in LingTermNet auf der Grundlage von framesemantischen Annotationen, deren Auswertung auf zwei Ebenen lexikografisch aufgearbeitet werden: Die framesemantische Ebene dokumentiert Frames und ihre Beziehungen untereinander, die lemmaspezifische Ebene basiert auf framesemantischen Untersuchungserkenntnissen, wobei die Einträge hier klassischen Wörterbuchdefinitionen ähneln.
Große Sprachkorpora sind als empirische Basis für die Arbeit des Linguisten zunehmend wichtig geworden. Dabei gehen die Arbeiten zum Korpusaufbau Hand in Hand mit der Entwicklung immer komfortablerer computerlinguistischer Werkzeuge zur Verwaltung und Analyse großer Datenmengen. Mit dem Fortschritt in den Möglichkeiten der Datenerschließung stellt sich die Frage, wie die Linguistik dies in Erkenntniszuwachs umsetzen kann. Diese aktuelle Frage nach dem Zusammenhang von Datenverfügbarkeit und Wissenszuwachs stand im Zentrum der Jahrestagung des Instituts für Deutsche Sprache 2006. Das Jahrbuch Sprachkorpora - Datenmengen und Erkenntnisfortschritt stellt theoretische und methodische Fragen zu Anlage und Nutzung großer Korpora ins Zentrum und behandelt sie aus der Sicht verschiedener linguistischer Teildisziplinen wie Grammatik, Lexik/Lexikographie, Pragmatik/Soziolinguistik und Computerlinguistik/Informatik. Dabei werden anhand von Darstellungen zu aktuellen Projekten die unterschiedlichen Anforderungen an die Zusammensetzung und Aufbereitung von Sprachkorpora und an die Recherchemöglichkeiten ebenso deutlich wie Kernfragen der Methodologie, z.B. nach dem Status des linguistischen Datums selbst oder nach der Verbindung von quantitativen und qualitativen Verfahren.
In the mid-1990s, the Faculty of Linguistics and Literary-Studies at Bielefeld University began to establish the field Text technology, both in research and education. Text technology is a new field of research on the border of Computational Linguistics and Computational Philology.
This paper focuses on Text technology in academic education. In 2002, Text Technology was introduced as a minor subject for B.A. Programs. It is organized in modules: Module 1 introduces the characteristics of electronic texts and documents, typography, typesetting systems and hypertext. Module 2 introduces one or two programming languages relevant to the field of humanities computing. Markup languages and the principles of information structuring are the main topics of Module 3. The formal fundamentals of computer-based text processing, as formal languages and their grammars, Logics et cetera are subjects of another module. The paper ends with a short description of other Bachelor- and Master-Programs at Bielefeld University which contain text technological themes.
Learning from Errors. Systematic Analysis of Complex Writing Errors for Improving Writing Technology
(2015)
In this paper, we describe ongoing research on writing errors with the ultimate goal to develop error-preventing editing functions in word-processors. Drawing from the state-of-the-art research in errors carried out in various fields, we propose the application of a general concept for action-slips as introduced by Norman. We demonstrate the feasibility of this approach by using a large corpus of writing errors in published texts. The concept of slips considers both the process and the product: some failure in a procedure results in an error in the product, i.e., is visible in the written text. In order to develop preventing functions, we need to determine causes of such visible errors.
Der Umgang mit Gesprächskorpora am IDS Mannheim: Die Recherche in der COSMAS-II-Gesprächsdatenbank
(2005)
GAIS – GesprächsAnalytisches InformationsSystem. Ein hypermediales Lernsystem zur Gesprächsforschung
(2002)
Der vorliegende Beitrag stellt das vom BMBF geförderte Projekt GAIS (GesprächsAnalytisches InformationsSystem) vor, welches am Institut für Deutsche Sprache (IDS) entwickelt wird. GAIS ist ein hypermediales und didaktisch aufbereitetes Lernsystem zur Gesprächsanalyse für Einsteiger und Experten. Durch die unterschiedlichen Schwierigkeitsgrade ist es sowohl für Lehrende als auch für Lernende konzipiert. GAIS bietet eine Plattform, die Theorie, Praxis, Beispiele, Links, Anwendungen und Literatur zur Gesprächsforschung bündelt. Nutzer können diese Informationen rezipieren, ihre Kenntnisse überprüfen und mit technischen Werkzeugen eigene Analysen erstellen.
In this feasibility study we aim at contributing at the practical use of domain ontologies for hypertext classification by introducing an algorithm generating potential keywords. The algorithm uses structural markup information and lemmatized word lists as well as a domain ontology on linguistics. We present the calculation and ranking of keyword candidates based on ontology relationships, word position, frequency information, and statistical significance as evidenced by log-likelihood tests. Finally, the results of our machine-driven classification are validated empirically against manually assigned keywords.
Der Artikel diskutiert Ziele, Methoden und Probleme einer geplanten deutsch-französischen Übersetzungsplattform. Auf der Basis paralleler und vergleichbarer Korpora sollen mit Hilfe dieses elektronischen Werkzeuges nicht nur Übersetzungsvorschläge für Einzelwörter, sondern auch für Kollokationen, Phrasen und systematisierte Verwendungskontexte gemacht werden. Dabei geht es vor allem um die Erfassung jener Einheiten, die nicht in traditionellen Wörterbüchern stehen, aber bereits Usus sind. Das Projekt integriert drei Herangehensweisen: Korpusbasiertheit, Orientierung auf Idiomatizität als relevanes Übersetzungsprinzip, Kontextbezogenheit. Der Beitrag umreißt den Projektansatz anhand der Kollokationsproblematik.
In this paper we present an evaluation of rule-based morphological components for German for use in an interactive editing environment. The criteria for the evaluation are deduced from the intended use of these components, namely availability, performance, programming interfaces, and analysis quality. We evaluated systems developed and maintained since decades as well as new systems. However, we note serious general shortcomings when looking closer at recent implementations and come to the conclusion that the oldest system is the only one that satisfies our requirements.