Refine
Year of publication
Document Type
- Part of a Book (73)
- Article (14)
- Book (6)
- Conference Proceeding (1)
Has Fulltext
- yes (94)
Keywords
- Deutsch (48)
- Korpus <Linguistik> (11)
- Wörterbuch (11)
- Lexikographie (9)
- Wortbildung (8)
- computerunterstützte Lexikographie (8)
- Verb (7)
- Computerunterstützte Lexikographie (6)
- eLexiko (6)
- Grammatik (5)
Publicationstate
- Veröffentlichungsversion (79)
- Postprint (5)
- Zweitveröffentlichung (1)
Reviewstate
- Verlags-Lektorat (94) (remove)
Publisher
- De Gruyter (17)
- Institut für Deutsche Sprache (14)
- Narr (14)
- de Gruyter (12)
- Winter (4)
- Lang (2)
- Niemeyer (2)
- Sagner (2)
- Amsterdam (1)
- Benjamins (1)
Im vorliegenden Artikel wird eine gemeinschaftliche Folgekommunikation über den Film "Angel Heart" anhand einer Diskussion einer Gruppe von Jugendlichen untersucht. Die Gruppenmitglieder (Sandra, Sonja, Andi und Michel) waren zum Zeitpunkt der Aufnahme 16 Jahre alt und verbrachten regelmäßig gemeinsam ihre Freizeit. Die Diskussion fand im Anschluss an die Rezeption des Films statt. Sie wurde vom Autor des vorliegenden Textes initiiert und geleitet, wobei versucht wurde, den Interessen der Jugendlichen und der sich zwischen ihnen entspinnenden Gesprächsdynamik zu folgen. Die Gruppendiskussion wurde konversationsanalytisch ausgewertet.
Will man im Deutschen einen andauernden, noch im Verlauf befindlichen Vorgang (z. B. den, dass Sie gerade diese Zeilen lesen) ausdrücken, könnte es standardsprachlich von Ihnen als Leser dieser kleinen Sprachbetrachtung z. B. heissen: Sie sind gerade dabei zu lesen. Oder: Sie sind beim Lesen. Oder: Genau in diesem Moment lesen Sie. In der gesprochenen Sprache (und nicht nur dort) kann man aber auch hören (bzw. lesen): Sie sind gerade am Lesen. Dieser letzte Satz interessiert uns hier, denn an ihm scheiden sich die Geister. Vielen Sprechern gilt diese so genannte Verlaufsform nicht als standard-sprachlich korrekt, sie ordnen sie der regionalen (nämlich insbesondere westdeutschen) Umgangssprache zu und würden sie des-halb im geschriebenen Deutsch vermeiden. Anderen wiederum ist die Verlaufsform völlig vertraut, sie bewerten sie nicht als ungrammatisch oder falsch und zögern auch nicht, sie im schriftlichen Kontext zu verwenden. Auch die Grammatiken zum Gegenwartsdeutschen sind sich in der Beurteilung dieser Ausdrucksweise nicht einig. Im Folgenden will ich zunächst die Verlaufsform in ihrer Bildungs-und Verwendungsweise vorstellen, diesen Befund mit dem Beleg-material in der DUDEN-Sprachkartei und einer anderen Datenbank zum Gegenwartsdeutschen vergleichen, einen Blick auf die sich wandelnde Einschätzung dieses Phänomens in der DUDEN-Grammatik werfen und schliesslich erläutern, wie die Dudenredaktion Sätze wie Sie sind gerade am Lesen heute bewertet.
Für Nutzer(innen) wie für Verleger von CD-ROM-Wörterbüchern ist die Frage nach deren Qualität wichtig. Aus praktischen Verlagserfahrungen heraus werden im Folgenden Kriterien für eine qualitätvolle Publikation von Wörterbüchern auf CD-ROM entwickelt und zugleich Chancen und Probleme der elektronischen Publikation thematisiert.
According to a widespread conception, quantitative linguistics will eventually be able to explain empirical quantitative findings (such as Zipf’s Law) by deriving them from highly general stochastic linguistic ‘laws’ that are assumed to be part of a general theory of human language (cf. Best (1999) for a summary of possible theoretical positions). Due to their formal proximity to methods used in the so-called exact sciences, theoretical explanations of this kind are assumed to be superior to the supposedly descriptive-only approaches of linguistic structuralism and its successors. In this paper I shall try to argue that on close inspection such claims turn out to be highly problematic, both on linguistic and on science-theoretical grounds.
Ein vergleichender Blick auf die Buchstabenverteilung im Anlaut und im Auslaut von Rufnamen, Familiennamen und Appellativa zeigt, dass die Rufnamen hinsichtlich ihrer Anlaut- und Auslautstruktur besonders distinkt sind. Familiennamen hingegen zeigen sowohl Charakteristika der alphabetischen Verteilung von Appellativen wie von Rufnamen, sind also weniger distinkt, durch die Mischung dieser Charakteristika aber auch als Gruppe gekennzeichnet.
Grammatik
(2005)
Wortbildung
(2005)
Belege in elexiko
(2005)
Dieser Beitrag beschäftigt sich mit dem Wort Norm in mehrfacher Hinsicht. Am Gegenstand des Wortes Norm wird über Fragen der lexikografischen Norm gedruckter Wörterbücher reflektiert und andererseits wird überlegt, welche Informationen in welcher Präsentation zum Wort Norm aus drei verschiedenen Online-Angeboten, die Zugriff auf umfangreiche elektronische Textkorpora gewähren, zu ermitteln sind. Es schließt sich ein Vorschlag zur lexikografischen Behandlung in einem Online-Wortschatzinformationssystem an, der berücksichtigt, welche Norm bzw. Normen (darunter auch Sprachnormen) in einem Textkorpus zur Gegenwartssprache erwähnt, dokumentiert, erläutert bzw. behandelt werden.
Sprachkritik, dahinsickernd
(2007)
Three popular collections of essays concerning correct language use in German are reviewed from a linguist’s point of view. It is claimed that the overall picture of language that Sick conveys to the layperson is inadequate; in addition, the author fails to reflect explicitly on the purpose and consequences of his prescriptive approach to language use.
In diesem Beitrag geht es einerseits um eine Definition dessen, was korpusgestützte Lexikographie ist, und andererseits um eine Bestandsaufnahme der gegenwärtigen Praxis korpusgestützter Lexikographie. Dabei wird ein Schwerpunkt gelegt auf allgemeinsprachige Wörterbücher der Gegenwartssprache, deren Inhalt die Beschreibung von Bedeutung und Verwendung von Lexemen ist. Außerdem liegt die Einschätzung zugrunde, dass die Auswertung elektronischer Korpora die Wörterbucharbeit weitgehend positiv beeinflusst und verändert, vorausgesetzt, dass zugrunde gelegte Korpus wurde für das geplante Wörterbuch so gut wie möglich in Umfang und Zusammensetzung eingerichtet.
Deutscher Wortschatz im Internet: Das Informationssystem elexiko und sein Modulprojekt Neologismen
(2007)
Das elexiko-Portal: Ein neuer Zugang zu lexikografischen Arbeiten am Institut für Deutsche Sprache
(2007)
Das elexiko-Portal soll verschiedene lexikografische Projekte des IDS in einem Verbund zusammenführen und - soweit das die Inhalte zulassen - gemeinsame Recherchemöglichkeiten über verschiedene lexikografische Produkte hinweg bieten. In diesem Aufsatz geht es v. a. darum zu zeigen, wie die XML-basierte Modellierung für das Portal aufgebaut ist, um zum einen die Basis für diese flexiblen Zugriffsstrukturen zu legen und zum anderen der Verschiedenheit der beteiligten Projekte Rechnung zu tragen. Gleichzeitig werden Perspektiven für eine flexiblere Darstellung der Daten und für die zukünftige Weiterentwicklung von Recherchemöglichkeiten aufgezeigt.
We present SPLICR, the Web-based Sustainability Platform for Linguistic Corpora and Resources. The system is aimed at people who work in Linguistics or Computational Linguistics: a comprehensive database of metadata records can be explored in order to find language resources that could be appropriate for one’s spe cific research needs. SPLICR also provides a graphical interface that enables users to query and to visualise corpora. The project in which the system is developed aims at sustainably archiving the ca. 60 language resources that have been constructed in three collaborative research centres. Our project has two primary goals: (a) To process and to archive sustainably the resources so that they are still available to the research community in five, ten, or even 20 years time. (b) To enable researchers to query the resources both on the level of their metadata as well as on the level of linguistic annotations. In more general terms, our goal is to enable solutions that leverage the interoperability, reusability, and sustainability of heterogeneous collec- tions of language resources.
Medienkompetenz gilt als zentrale Qualifikation in der Informations- und Wissensgesellschaft, die das Leben, Lernen und Arbeiten betrifft. Für das Erlangen dieser Kompetenz sind sowohl Individuen als auch Organisationen und Systeme verantwortlich. Da sie zur Voraussetzung der aktiven Teilhabe und kreativen Mitbestimmung dieser Gesellschaft geworden ist, sollten alle Ziel- und Altersgruppen über diese Kompetenz verfügen. Sowohl in der Medienforschung als auch in der Förderung von Medienkompetenz für Menschen mit Migrationshintergrund liegen in Deutschland jedoch große Defizite vor. Aktuelle Integrationsinitiativen und offizielle Stellungnahmen betonen die Notwendigkeit, diese Mängel zu beseitigen und die großen Potenziale der Integration durch Medien effizienter zu nutzen. Studien zur Mediennutzung von Erwachsenen und Kindern zeigen, dass die Voraussetzungen hierzu relativ gut sind. So sind Menschen mit Migrationshintergrund in ihren Haushalten oft besser mit Medien ausgestattet als deutsche Haushalte. Auch wird die Mehrheit der Zuwanderer von deutschen und heimatsprachigen Medienangeboten erreicht. Die Mediennutzung wird stärker von soziodemografischen Faktoren als von der ethnischen Zugehörigkeit bestimmt. Um die heterogene Gruppe der Menschen mit Migrationshintergrund für die interkulturelle Medienarbeit erreichen zu können, sind vielfältige Aspekte und Zusammenhänge zu berücksichtigen. Ausgewählte Projekte und Aktivitäten bieten Anregungen zur praktischen Förderung von Medienkompetenz für diese Zielgruppe.
Das Ungarische verfügt neben einem definiten (a(z)) auch über einen indefiniten Artikel (egy). Dieser kann als schwächer grammatikalisiert angesehen werden als sein Gegenstück im Deutschen (ein), da er in einer Reihe von Kontexten, in denen ein obligatorisch erscheint, nur optional auftritt und teilweise sogar ausgeschlossen ist. Die folgenden Überlegungen zielen darauf ab, solche Kontexte mit Hilfe syntaktischer und/oder semantisch-pragmatischer Beschreibungskategorien zu identifizieren. Dabei beschränken wir uns aus Raumgründen auf die Vorkommensmöglichkeiten des indefiniten Artikels in Subjekt- und Objektfunktion, wobei wir generische Verwendungen generell unberücksichtigt lassen.
Die Datengrundlage bilden zum einen das Ungarische Nationalkorpus (Sigle MNSZ), zum anderen zwei literarische Texte, der Roman Szindbäd haza- megy/Sinbad geht heim von Sändor Märai (Sigle SM) sowie die Anthologie Modern magyar novelläk/Moderne ungarische Erzählungen (Sigle UE). Weiterhin wird auf in der Literatur angeführte Beispiele zurückgegriffen.
In this paper we present an evaluation of rule-based morphological components for German for use in an interactive editing environment. The criteria for the evaluation are deduced from the intended use of these components, namely availability, performance, programming interfaces, and analysis quality. We evaluated systems developed and maintained since decades as well as new systems. However, we note serious general shortcomings when looking closer at recent implementations and come to the conclusion that the oldest system is the only one that satisfies our requirements.
Eine der linguistischen Teildisziplinen, in der schon seit vielen Jahren korpusgestützt gearbeitet wird, ist die Lexikografie. Wörterbücher sind lange vor der Entstehung großer elektronischer Textsammlungen mit den entsprechenden Korpusrecherche- und -analysewerkzeugen auf der Basis von umfänglichen Belegsammlungen entstanden, die nach dem Verständnis vieler Lexikografen das Korpus (bzw. die Primärquelle) des Wörterbuches darstellen. Noch heute arbeiten verschiedene Großwörterbücher (z. B. das Oxford English Dictionary) am Ausbau ihrer Belegsammlungen und benutzen diese neben zum Teil eigens aufgebauten elektronischen Wörterbuchkorpora im engeren Sinn. Welche Chancen und Probleme sich bei korpusgestützter Arbeit an Wörterbücher ergeben, wird in diesem Beitrag an deutschsprachigen Online-Wörterbüchern aufgezeigt, wobei zunächst einige Definitionen erarbeitet werden müssen. Ein kurzer Ausblick auf die Auswirkungen korpusgestützter Arbeit an Online-Nachschlagewerken auf den lexikografischen Prozess schließt diesen Beitrag ab.
Der vorliegende Beitrag beschäftigt sich mit der Frage, wie unter den organi- sations- und situationsstrukturellen Bedingungen einer spezifischen sozialen Situation - das Filmset als professioneller Handlungsrahmen - Verstehen hergestellt und als empirisch manifestes Phänomen dokumentiert wird. Es geht zum einen darum, spezifische, für das konkrete professionelle Handlungsfeld konstitutive Verstehensanforderungen zu rekonstruieren. Zum anderen sollen auf der Grundlage dieses Profils spezifischer Handlungsanforderungen zwei Verfahren der Verstehensdokumentation im Detail analysiert werden.
Aus den Argumentstrukturen von Verben lassen sich vielfach eigenständige Argumentstrukturmuster mit idiosynkratischen formalen oder inhaltlichen Eigenschaften abstrahieren. Der Artikel zeigt, dass sich Ähnlichkeiten zwischen solchen Mustern nicht, wie von Goldberg (1995) vorgeschlagen, über das Konzept polysemer Argumentstrukturkonstruktionen erfassen lassen, sondern adäquater über ein Netz von Familienähnlichkeiten modelliert werden können. Die einzelnen Argumentstrukturmuster zeigen dabei eine Vielzahl von idiosynkratischen lexikalischen Kookkurrenzen, die spezifisch für die je einzelnen Argumentstrukturmuster sind und in einer implikativen Beziehung zu diesen stehen. Überlegungen zur angemessenen sprachtheoretischen Modellierung der Daten zeigen dabei sowohl Schwächen valenzbasierter Theorien als auch Mängel konstruktionsbasierter Ansätze auf.
Zwischenräume – Phänomene, Methoden und Modellierung im Bereich zwischen Lexikon und Grammatik
(2011)
Der Beitrag führt in den Sammelband „Sprachliches Wissen zwischen Lexikon und Grammatik“ ein und diskutiert zunächst den Zusammenhang zwischen den drei Dichotomien Lexikon versus Grammatik, Wort versus Phrase und Idiosynkrasie versus Regel. Im Folgenden werden Varianten des Konstruktionsbegriffs dargestellt und hinsichtlich verschiedener Dimensionen analysiert. Einer Darstellung der im Zusammenhang mit der Lexikon-Grammatik-Abgrenzung diskutierten Phänomene und angewandten empirischen Methoden schließt sich eine Übersicht über die Aufsätze des Sammelbandes an.
Einleitung
(2011)
elexiko ist ein im Aufbau befindliches Online-Wörterbuch, d. h. es ist ständigen Änderungen in Form von Korrekturen oder Ergänzungen unterworfen. Diese betreffen sowohl die Stichwortliste als auch die lexikografischen Angaben. In diesem Beitrag sollen einige kleinere konzeptionelle Entscheidungen und offene Fragen, die in den anderen Beiträgen in diesem Sammelband noch nicht thematisiert wurden, zusammengefasst werden.
Der Artikel stellt die Projekte vor, die sich im Rahmen der Projektmesse zur „Elektronischen Lexikografie“ präsentiert haben. Diese Messe wurde begleitend zur 46. Jahrestagung des Instituts für Deutsche Sprache veranstaltet. Es wird in diesem Beitrag auf der Basis der Messepräsentationen dargelegt, inwiefern Entwicklungen der Korpuslexikografie und der Internetlexikografie die lexikografische Erfassung syntagmatischer Aspekte des deutschen Wortschatzes befördern und welche lexikografischen Internetressourcen dazu verfügbar sind.
Der Beitrag beschäftigt sich auf der Grundlage einer Einzelfallanalyse mit der Frage, wie Personen erkennbar machen, dass sie an einer Interaktion beteiligt sind. Die Frage, wer auf welche Weise und mit welchen Rechten und Pflichten an einer Interaktion teilnimmt/teilnehmen darf, und woran dies die Beteiligten und der Analytiker erkennen, gehört zu den etablierten Fragestellungen der Interaktionsanalyse. Im vorliegenden Beitrag wendet sich der Autor diesem Thema mit einem spezifischen Erkenntnisinteresse zu: Ihn interessiert, wie Personen, die über eine längere Phase keinen verbalen Beitrag zur Interaktion leisten, verdeutlichen, dass sie sich ungeachtet ihrer verbalen Abstinenz als Teil der laufenden Interaktion verstehen und verhalten. Oder, um es im Vorgriff auf spätere konzeptuelle Überlegungen zu formulieren: Dass sie Mitglieder/Beteiligte eines Interaktionsensembles sind, ohne sich verbal an dessen Konstitution zu beteiligen. Im Zentrum des Erkenntnisinteresses steht die Frage nach den Ressourcen, die von den verbal abstinenten Interaktionsbeteiligten eingesetzt werden, um zu verdeutlichen, dass sie an einer laufenden Interaktion teilnehmen und die Frage nach Gemeinsamkeiten und Unterschieden in den Beteiligungsformaten, die sie dabei produzieren.
Zum sogenannten Absentiv
(2013)
Präpositionalobjektsätze
(2013)
Automatic recognition of speech, thought, and writing representation in German narrative texts
(2013)
This article presents the main results of a project, which explored ways to recognize and classify a narrative feature—speech, thought, and writing representation (ST&WR)—automatically, using surface information and methods of computational linguistics. The task was to detect and distinguish four types—direct, free indirect, indirect, and reported ST&WR—in a corpus of manually annotated German narrative texts. Rule-based as well as machine-learning methods were tested and compared. The results were best for recognizing direct ST&WR (best F1 score: 0.87), followed by indirect (0.71), reported (0.58), and finally free indirect ST&WR (0.40). The rule-based approach worked best for ST&WR types with clear patterns, like indirect and marked direct ST&WR, and often gave the most accurate results. Machine learning was most successful for types without clear indicators, like free indirect ST&WR, and proved more stable. When looking at the percentage of ST&WR in a text, the results of machine-learning methods always correlated best with the results of manual annotation. Creating a union or intersection of the results of the two approaches did not lead to striking improvements. A stricter definition of ST&WR, which excluded borderline cases, made the task harder and led to worse results for both approaches.