Refine
Year of publication
- 2013 (12) (remove)
Document Type
- Part of a Book (10)
- Article (2)
Has Fulltext
- yes (12)
Keywords
- Deutsch (8)
- Wortbildung (4)
- computerunterstützte Lexikographie (4)
- Wörterbuch (3)
- eLexiko (2)
- Absentiv (1)
- Automatic recognition of speech (1)
- Automatische Spracherkennung (1)
- Benutzer (1)
- Clause type (1)
Publicationstate
- Veröffentlichungsversion (11)
- Postprint (1)
Reviewstate
- Verlags-Lektorat (12) (remove)
Publisher
- Narr (7)
- De Gruyter (1)
- Sagner (1)
- de Gruyter (1)
Automatic recognition of speech, thought, and writing representation in German narrative texts
(2013)
This article presents the main results of a project, which explored ways to recognize and classify a narrative feature—speech, thought, and writing representation (ST&WR)—automatically, using surface information and methods of computational linguistics. The task was to detect and distinguish four types—direct, free indirect, indirect, and reported ST&WR—in a corpus of manually annotated German narrative texts. Rule-based as well as machine-learning methods were tested and compared. The results were best for recognizing direct ST&WR (best F1 score: 0.87), followed by indirect (0.71), reported (0.58), and finally free indirect ST&WR (0.40). The rule-based approach worked best for ST&WR types with clear patterns, like indirect and marked direct ST&WR, and often gave the most accurate results. Machine learning was most successful for types without clear indicators, like free indirect ST&WR, and proved more stable. When looking at the percentage of ST&WR in a text, the results of machine-learning methods always correlated best with the results of manual annotation. Creating a union or intersection of the results of the two approaches did not lead to striking improvements. A stricter definition of ST&WR, which excluded borderline cases, made the task harder and led to worse results for both approaches.
Dieser Beitrag geht auf die 2010 erschienene Dissertation „Migration, Sprache und Rassismus“ des Verfassers zurück. Dort untersucht er mit ethnografischen und gesprächsanalytischen bzw. -rhetorischen Methoden den kommunikativen Stil von zwei mehrheitlich türkischstämmigen, akademischen Gruppen der zweiten Migrantengeneration in Deutschland. Im Fokus der Studie steht das Milieu der „emanzipatorischen Migranten“, die ethnische Zuschreibungen wie „Türken“, „Kurden“, Italiener“ etc. ablehnen und sich als (kultur-)politische Initiativen gegen Diskriminierung und für gleiche Bürgerrechte einsetzen. Als Fallstudie für diese soziale Welt analysiert der Autor die Mannheimer Gruppe der „Unmündigen“. Sein Erkenntnisinteresse richtet sich auf die Fragen, welche rhetorischen Verfahren die Beteiligten im Umgang mit Diskriminierungs- und Marginalisierungserfahrungen entwickelt haben und wie sie in ihrer gruppeninternen Kommunikation auf das Türkische und das Deutsche in ihrem Sprachrepertoire zurückgreifen. Im vorliegenden Artikel wird auf den letztgenannten Aspekt eingegangen und untersucht, welche Formen und Funktionen die deutsch-türkische Variationspraxis der „emanzipatorischen Migranten“ aufweist.
Die Wortbildungsangaben im Online-Wörterbuch und wie Nutzer sie beurteilen – eine Umfrage zu elexiko
(2013)
Der vorliegende Beitrag betrachtet das Thema der Wortbildung im Online-Wörterbuch aus der Perspektive der Wörterbuchbenutzer. Zunächst werden an einzelnen Beispielen die unterschiedlichen Angabebereiche im Internetwörterbuch und die verschiedenen Arten der Wortbildungsangaben aufgezeigt, auf die ein Wörterbuchbenutzer beim Nachschlagen stoßen kann (Kap. 2). Daran anschließend werden mit elexiko und BZVelexiko kurz die beiden Projekte vorgestellt, die an den Mannheimer Nutzerumfragen beteiligt waren. Schließlich werden die Ergebnisse zweier Online-Befragungen präsentiert, die Anfang 2011 am Institut für Deutsche Sprache durchgeführt wurden und an denen insgesamt über 1 100 Personen teilnahmen. In diesem Kontext stehen dabei allein die Teilergebnisse zum Thema Wortbildung im Mittelpunkt (Kap. 3). Ein Ausblick auf die weitere geplante Forschung rundet den Beitrag ab (Kap. 4).
Einleitung
(2013)
Dieser Beitrag behandelt primäre, sekundäre und tertiäre Quellen in der Lexikographie und beschreibt insbesondere ihre Nutzung für die Erarbeitung des deutschsprachigen Online-Wörterbuches elexiko. Anhand verschiedener Beispiele wird die lexikographische Praxis im Umgang mit sehr unterschiedlichen Quellen in diesem Projekt deutlich. Zugleich wird über die unterschiedlichen Definitionen von ‘Quelle’ in der Sprachwissenschaft wie in den Geschichtswissenschaften nachgedacht.
Präpositionalobjektsätze
(2013)
Beginnend mit der Vergangenheit, nämlich mit einem Rückblick auf die allgemeine Konzeption für die Wortbildungsangaben in elexiko, einem im Aufbau befindlichen Online-Wörterbuch zum Gegenwartsdeutschen, wird in dem Beitrag anhand einiger Beispiele aus elexiko-Wortartikeln gezeigt, wie die Angaben zur Gebildetheit der Stichwörter in elexiko gegenwärtig umgesetzt sind und wie die vorhandenen Recherchemöglichkeiten in diesem Bereich ausgebaut werden könnten. Anschließend wird erläutert, um welche anderen Angaben die Angabe zur Gebildetheit des Stichwortes zukünftig ergänzt werden kann, wobei dies auf die Frage der Lemmatisierung von Wortbildungselementen in elexiko beschränkt bleibt. Zugleich stellen einige Beispiele mit Wortbildungsangaben aus anderen Online-Wörterbüchern eine Vergleichsbasis für elexiko dar. Insgesamt will der Beitrag anhand verschiedener Einblicke in die Praxis der Erarbeitung von Wortbildungsangaben in Online-Wörterbüchern dazu beitragen, sowohl Praxis wie Theorie solcher Angaben im elektronischen Wörterbuch zu diskutieren.
Zum sogenannten Absentiv
(2013)
In dem Beitrag präsentieren und diskutieren die Autoren zunächst einige Untersuchungen aus der Benutzungsforschung zu elektronischen Wörterbüchern, die sich mit der nutzerseitigen Beurteilung des Mehrwerts multimedialer und benutzeradaptiver Elemente befassen (Kap. 1. In einem zweiten Teil versuchen sie, ausgehend von den Stärken und Schwächen vorhandener Ansätze in diesem Bereich, Antworten auf die Frage zu finden, welche Anforderungen an Visualisierungstechniken und ‑strategien in elektronischen Wörterbüchern gestellt werden müssen, um einen solchen Mehrwert zu erhalten (Kap. 2). Abschließend stellen sie als praktisches Beispiel für eine mögliche Umsetzung solcher Anforderungen den Prototyp einer Software zur interaktiven Erkundung von Wortbildungsangaben im Wörterbuch vor.