Refine
Year of publication
Document Type
- Part of a Book (22)
- Article (8)
- Book (2)
Has Fulltext
- yes (32)
Is part of the Bibliography
- no (32) (remove)
Keywords
- Deutsch (32) (remove)
Publicationstate
- Veröffentlichungsversion (30)
- Postprint (1)
Reviewstate
- Verlags-Lektorat (32) (remove)
Publisher
- Narr (6)
- de Gruyter (5)
- Institut für Deutsche Sprache (4)
- De Gruyter (3)
- Winter (2)
- N. G. Elwert (1)
- Niemeyer (1)
- Pädagogischer Verlag Schwann (1)
- Sagner (1)
Aus den Argumentstrukturen von Verben lassen sich vielfach eigenständige Argumentstrukturmuster mit idiosynkratischen formalen oder inhaltlichen Eigenschaften abstrahieren. Der Artikel zeigt, dass sich Ähnlichkeiten zwischen solchen Mustern nicht, wie von Goldberg (1995) vorgeschlagen, über das Konzept polysemer Argumentstrukturkonstruktionen erfassen lassen, sondern adäquater über ein Netz von Familienähnlichkeiten modelliert werden können. Die einzelnen Argumentstrukturmuster zeigen dabei eine Vielzahl von idiosynkratischen lexikalischen Kookkurrenzen, die spezifisch für die je einzelnen Argumentstrukturmuster sind und in einer implikativen Beziehung zu diesen stehen. Überlegungen zur angemessenen sprachtheoretischen Modellierung der Daten zeigen dabei sowohl Schwächen valenzbasierter Theorien als auch Mängel konstruktionsbasierter Ansätze auf.
Automatic recognition of speech, thought, and writing representation in German narrative texts
(2013)
This article presents the main results of a project, which explored ways to recognize and classify a narrative feature—speech, thought, and writing representation (ST&WR)—automatically, using surface information and methods of computational linguistics. The task was to detect and distinguish four types—direct, free indirect, indirect, and reported ST&WR—in a corpus of manually annotated German narrative texts. Rule-based as well as machine-learning methods were tested and compared. The results were best for recognizing direct ST&WR (best F1 score: 0.87), followed by indirect (0.71), reported (0.58), and finally free indirect ST&WR (0.40). The rule-based approach worked best for ST&WR types with clear patterns, like indirect and marked direct ST&WR, and often gave the most accurate results. Machine learning was most successful for types without clear indicators, like free indirect ST&WR, and proved more stable. When looking at the percentage of ST&WR in a text, the results of machine-learning methods always correlated best with the results of manual annotation. Creating a union or intersection of the results of the two approaches did not lead to striking improvements. A stricter definition of ST&WR, which excluded borderline cases, made the task harder and led to worse results for both approaches.
Eine der linguistischen Teildisziplinen, in der schon seit vielen Jahren korpusgestützt gearbeitet wird, ist die Lexikografie. Wörterbücher sind lange vor der Entstehung großer elektronischer Textsammlungen mit den entsprechenden Korpusrecherche- und -analysewerkzeugen auf der Basis von umfänglichen Belegsammlungen entstanden, die nach dem Verständnis vieler Lexikografen das Korpus (bzw. die Primärquelle) des Wörterbuches darstellen. Noch heute arbeiten verschiedene Großwörterbücher (z. B. das Oxford English Dictionary) am Ausbau ihrer Belegsammlungen und benutzen diese neben zum Teil eigens aufgebauten elektronischen Wörterbuchkorpora im engeren Sinn. Welche Chancen und Probleme sich bei korpusgestützter Arbeit an Wörterbücher ergeben, wird in diesem Beitrag an deutschsprachigen Online-Wörterbüchern aufgezeigt, wobei zunächst einige Definitionen erarbeitet werden müssen. Ein kurzer Ausblick auf die Auswirkungen korpusgestützter Arbeit an Online-Nachschlagewerken auf den lexikografischen Prozess schließt diesen Beitrag ab.
Das elexiko-Portal: Ein neuer Zugang zu lexikografischen Arbeiten am Institut für Deutsche Sprache
(2007)
Das elexiko-Portal soll verschiedene lexikografische Projekte des IDS in einem Verbund zusammenführen und - soweit das die Inhalte zulassen - gemeinsame Recherchemöglichkeiten über verschiedene lexikografische Produkte hinweg bieten. In diesem Aufsatz geht es v. a. darum zu zeigen, wie die XML-basierte Modellierung für das Portal aufgebaut ist, um zum einen die Basis für diese flexiblen Zugriffsstrukturen zu legen und zum anderen der Verschiedenheit der beteiligten Projekte Rechnung zu tragen. Gleichzeitig werden Perspektiven für eine flexiblere Darstellung der Daten und für die zukünftige Weiterentwicklung von Recherchemöglichkeiten aufgezeigt.
Dieser Beitrag geht auf die 2010 erschienene Dissertation „Migration, Sprache und Rassismus“ des Verfassers zurück. Dort untersucht er mit ethnografischen und gesprächsanalytischen bzw. -rhetorischen Methoden den kommunikativen Stil von zwei mehrheitlich türkischstämmigen, akademischen Gruppen der zweiten Migrantengeneration in Deutschland. Im Fokus der Studie steht das Milieu der „emanzipatorischen Migranten“, die ethnische Zuschreibungen wie „Türken“, „Kurden“, Italiener“ etc. ablehnen und sich als (kultur-)politische Initiativen gegen Diskriminierung und für gleiche Bürgerrechte einsetzen. Als Fallstudie für diese soziale Welt analysiert der Autor die Mannheimer Gruppe der „Unmündigen“. Sein Erkenntnisinteresse richtet sich auf die Fragen, welche rhetorischen Verfahren die Beteiligten im Umgang mit Diskriminierungs- und Marginalisierungserfahrungen entwickelt haben und wie sie in ihrer gruppeninternen Kommunikation auf das Türkische und das Deutsche in ihrem Sprachrepertoire zurückgreifen. Im vorliegenden Artikel wird auf den letztgenannten Aspekt eingegangen und untersucht, welche Formen und Funktionen die deutsch-türkische Variationspraxis der „emanzipatorischen Migranten“ aufweist.
Deutscher Wortschatz im Internet: Das Informationssystem elexiko und sein Modulprojekt Neologismen
(2007)
Die Normierung der deutschen Standardaussprache geht in ihren Ursprüngen auf die 1898 durch die Siebs-Kommission beschlossenen Regelungen für die deutsche Bühnenaussprache zurück. Seit 1964 bildet der Nachrichtensprecher bei der Ausübung seines Berufs die Grundlage für die gegenwärtigen deutschen Aussprachekodizes. Diese eingeschränkte empirische Basis zusammen mit einem primär präskriptiven Anspruch der Kodifikatoren führt dazu, dass auch das aktuellste Aussprachewörterbuch des Deutschen (DAW) in vielen Fällen den tatsächlichen Standardsprachgebrauch in Deutschland nur unzureichend repräsentiert. Dies wird im vorliegenden Beitrag durch den Vergleich mit Sprachdaten aus dem Korpus „Deutsch heute“, das Lese- und Spontansprache v.a. von Oberstufenschülern am Gymnasium aus dem ganzen deutschen Sprachraum enthält, anhand von acht unterschiedlichen sprachlichen Phänomenen gezeigt. Der Beitrag schließt mit einem Plädoyer für realitätsnähere Kodifikationen, die sich am Sprachgebrauch der „educated speaker“ orientieren (wie es v.a. im englischsprachigen Raum der Fall ist), weil sie der aktuellen Sprachsituation im Deutschen weit besser Rechnung tragen als die derzeit existierenden Kodizes.
Ein vergleichender Blick auf die Buchstabenverteilung im Anlaut und im Auslaut von Rufnamen, Familiennamen und Appellativa zeigt, dass die Rufnamen hinsichtlich ihrer Anlaut- und Auslautstruktur besonders distinkt sind. Familiennamen hingegen zeigen sowohl Charakteristika der alphabetischen Verteilung von Appellativen wie von Rufnamen, sind also weniger distinkt, durch die Mischung dieser Charakteristika aber auch als Gruppe gekennzeichnet.
Einleitung
(2011)
Einleitung
(2013)
Präpositionalobjektsätze
(2013)
Rückblick in Dankbarkeit
(2015)
Sprachkritik, dahinsickernd
(2007)
Three popular collections of essays concerning correct language use in German are reviewed from a linguist’s point of view. It is claimed that the overall picture of language that Sick conveys to the layperson is inadequate; in addition, the author fails to reflect explicitly on the purpose and consequences of his prescriptive approach to language use.
Voll Energie stecken und voller Geigen hängen - seltsame Phrasentypen und ungewöhnliche Valenzmuster
(2015)
elexiko ist ein im Aufbau befindliches Online-Wörterbuch, d. h. es ist ständigen Änderungen in Form von Korrekturen oder Ergänzungen unterworfen. Diese betreffen sowohl die Stichwortliste als auch die lexikografischen Angaben. In diesem Beitrag sollen einige kleinere konzeptionelle Entscheidungen und offene Fragen, die in den anderen Beiträgen in diesem Sammelband noch nicht thematisiert wurden, zusammengefasst werden.
Wortbildung
(2005)
Zum sogenannten Absentiv
(2013)
Will man im Deutschen einen andauernden, noch im Verlauf befindlichen Vorgang (z. B. den, dass Sie gerade diese Zeilen lesen) ausdrücken, könnte es standardsprachlich von Ihnen als Leser dieser kleinen Sprachbetrachtung z. B. heissen: Sie sind gerade dabei zu lesen. Oder: Sie sind beim Lesen. Oder: Genau in diesem Moment lesen Sie. In der gesprochenen Sprache (und nicht nur dort) kann man aber auch hören (bzw. lesen): Sie sind gerade am Lesen. Dieser letzte Satz interessiert uns hier, denn an ihm scheiden sich die Geister. Vielen Sprechern gilt diese so genannte Verlaufsform nicht als standard-sprachlich korrekt, sie ordnen sie der regionalen (nämlich insbesondere westdeutschen) Umgangssprache zu und würden sie des-halb im geschriebenen Deutsch vermeiden. Anderen wiederum ist die Verlaufsform völlig vertraut, sie bewerten sie nicht als ungrammatisch oder falsch und zögern auch nicht, sie im schriftlichen Kontext zu verwenden. Auch die Grammatiken zum Gegenwartsdeutschen sind sich in der Beurteilung dieser Ausdrucksweise nicht einig. Im Folgenden will ich zunächst die Verlaufsform in ihrer Bildungs-und Verwendungsweise vorstellen, diesen Befund mit dem Beleg-material in der DUDEN-Sprachkartei und einer anderen Datenbank zum Gegenwartsdeutschen vergleichen, einen Blick auf die sich wandelnde Einschätzung dieses Phänomens in der DUDEN-Grammatik werfen und schliesslich erläutern, wie die Dudenredaktion Sätze wie Sie sind gerade am Lesen heute bewertet.
Zwischenräume – Phänomene, Methoden und Modellierung im Bereich zwischen Lexikon und Grammatik
(2011)
Der Beitrag führt in den Sammelband „Sprachliches Wissen zwischen Lexikon und Grammatik“ ein und diskutiert zunächst den Zusammenhang zwischen den drei Dichotomien Lexikon versus Grammatik, Wort versus Phrase und Idiosynkrasie versus Regel. Im Folgenden werden Varianten des Konstruktionsbegriffs dargestellt und hinsichtlich verschiedener Dimensionen analysiert. Einer Darstellung der im Zusammenhang mit der Lexikon-Grammatik-Abgrenzung diskutierten Phänomene und angewandten empirischen Methoden schließt sich eine Übersicht über die Aufsätze des Sammelbandes an.