Refine
Year of publication
Document Type
- Part of a Book (62)
- Article (17)
- Conference Proceeding (13)
- Book (11)
- Other (5)
- Part of Periodical (3)
Language
- German (89)
- English (21)
- Multiple languages (1)
Keywords
- Deutsch (60)
- Grammatik (34)
- Korpus <Linguistik> (31)
- Terminologie (15)
- Computerlinguistik (13)
- Grammis (13)
- Genitiv (9)
- Informationssystem (8)
- Sprachgebrauch (7)
- Datenbank (6)
Publicationstate
- Veröffentlichungsversion (40)
- Zweitveröffentlichung (32)
- Postprint (3)
- Preprint (1)
Reviewstate
- (Verlags)-Lektorat (51)
- Peer-Review (18)
- (Verlags-)Lektorat (1)
- Peer-review (1)
Publisher
- Institut für Deutsche Sprache (29)
- Narr Francke Attempto (23)
- de Gruyter (9)
- Narr (6)
- Gesellschaft für Sprachtechnologie und Computerlinguistik (4)
- Springer (4)
- Universitätsverlag Rhein-Ruhr (3)
- European Language Resources Association (ELRA) (2)
- European language resources association (ELRA) (2)
- Peter Lang (2)
Vorwort
(2012)
Seit Mitte der 1990er Jahre wird am Institut für deutsche Sprache (IDS) in Mannheim erforscht, wie der hochkomplexe Gegenstandsbereich „Grammatik“ unter Ausnutzung digitaler Sprachressourcen und hypertextueller Navigationsstrukturen gleichermaßen wissenschaftlich fundiert und anschaulich vermittelt werden kann. Die grammatischen Online-Informationssysteme des IDS wenden sich nicht allein an Forscher und die interessierte Öffentlichkeit in Deutschland, sondern in gleichem Maße an Germanisten und Deutsch-Lernende in der ganzen Welt. Der vorliegende Beitrag beschreibt die damit verbundenen Hoffnungen und Anspruche. Daran anschließend thematisiert er praktische Einsatzmöglichkeiten und skizziert die funktionale und inhaltliche Weiterentwicklung der digitalen Grammatik-Angebote.
Der vorliegende Band befasst sich mit dem Stand und der Entwicklung von Forschungsinfrastrukturen für die germanistische Linguistik und einigen angrenzenden Bereichen. Einen zentralen Aspekt dabei bildet die Notwendigkeit, Kooperativität in der Wissenschaft im institutionellen Sinne, aber auch in Hinsicht auf die wissenschaftliche Praxis zu organisieren. Dies geschieht in Verbunden als Kooperationsstrukturen, wobei Sprachwissenschaft und Sprachtechnologie miteinander verbunden werden. Als zentraler Forschungsressource kommen dabei Korpora und ihrer Erschließung durch spezielle, linguistisch motivierte Informationssysteme besondere Bedeutung zu. Auf der Ebene der Daten werden durch Annotations- und Modellierungsstandards die Voraussetzung für eine nachhaltige Nutzbarkeit derartiger Ressourcen geschaffen.
Einleitung
(2023)
Sprachanfragen als authentische Primärdaten bergen Erkenntnispotenziale für eine große Bandbreite linguistischer und transferwissenschaftlicher Forschungsfragen und Methoden. Der Beitrag skizziert diese Potenziale und legt dabei den Fokus auf wissenschaftskommunikative Prozesse im Austausch linguistischer Laien und Experten. Anhand erster Ergebnisse einer empirischen korpusgestützten Untersuchung von ca. 50.000 Sprachanfragen wird skizziert, welche Erkenntnisse aus diesen Daten für die Vermittlung von Sprachwissen in einer zunehmend digitalisierten und vernetzten Gesellschaft gewonnen werden können.
Ziel des vorliegenden Beitrages ist es, LingTermNet, ein Online-Repositorium für linguistische Fachtermini, vorzustellen. Methodologisch und hinsichtlich seiner lexikografischen Umsetzung basiert LingTermNet auf framesemantischen Prinzipien, die auch dem Berkeleyer FrameNet-Projekt zugrunde liegen. Dargestellt werden zunächst leitende theoretische Annahmen; im Zentrum steht sodann die Präsentation von Aufbau und Struktur der Ressource. Im Unterschied zu ‘traditionellen’ Wörterbüchern entstehen Einträge in LingTermNet auf der Grundlage von framesemantischen Annotationen, deren Auswertung auf zwei Ebenen lexikografisch aufgearbeitet werden: Die framesemantische Ebene dokumentiert Frames und ihre Beziehungen untereinander, die lemmaspezifische Ebene basiert auf framesemantischen Untersuchungserkenntnissen, wobei die Einträge hier klassischen Wörterbuchdefinitionen ähneln.
Linguistic query systems are special purpose IR applications. We present a novel state-of-the-art approach for the efficient exploitation of very large linguistic corpora, combining the advantages of relational database management systems (RDBMS) with the functional MapReduce programming model. Our implementation uses the German DEREKO reference corpus with multi-layer
linguistic annotations and several types of text-specific metadata, but the proposed strategy is language-independent and adaptable to large-scale multilingual corpora.