Refine
Year of publication
Document Type
- Part of a Book (73)
- Article (14)
- Book (6)
- Conference Proceeding (1)
Has Fulltext
- yes (94)
Keywords
- Deutsch (48)
- Korpus <Linguistik> (11)
- Wörterbuch (11)
- Lexikographie (9)
- Wortbildung (8)
- computerunterstützte Lexikographie (8)
- Verb (7)
- Computerunterstützte Lexikographie (6)
- eLexiko (6)
- Grammatik (5)
Publicationstate
- Veröffentlichungsversion (79)
- Postprint (5)
- Zweitveröffentlichung (1)
Reviewstate
- Verlags-Lektorat (94) (remove)
Publisher
- De Gruyter (17)
- Institut für Deutsche Sprache (14)
- Narr (14)
- de Gruyter (12)
- Winter (4)
- Lang (2)
- Niemeyer (2)
- Sagner (2)
- Amsterdam (1)
- Benjamins (1)
Präpositionalobjektsätze
(2013)
Automatic recognition of speech, thought, and writing representation in German narrative texts
(2013)
This article presents the main results of a project, which explored ways to recognize and classify a narrative feature—speech, thought, and writing representation (ST&WR)—automatically, using surface information and methods of computational linguistics. The task was to detect and distinguish four types—direct, free indirect, indirect, and reported ST&WR—in a corpus of manually annotated German narrative texts. Rule-based as well as machine-learning methods were tested and compared. The results were best for recognizing direct ST&WR (best F1 score: 0.87), followed by indirect (0.71), reported (0.58), and finally free indirect ST&WR (0.40). The rule-based approach worked best for ST&WR types with clear patterns, like indirect and marked direct ST&WR, and often gave the most accurate results. Machine learning was most successful for types without clear indicators, like free indirect ST&WR, and proved more stable. When looking at the percentage of ST&WR in a text, the results of machine-learning methods always correlated best with the results of manual annotation. Creating a union or intersection of the results of the two approaches did not lead to striking improvements. A stricter definition of ST&WR, which excluded borderline cases, made the task harder and led to worse results for both approaches.
Sprache in der Medizin
(2015)
Medizinisches Wissen und Handeln ist ohne Sprache nicht denkbar: weder in der Arzt-Patienten-Kommunikation noch in fachinternen und fachexternen Medizintexten oder in den Medien. Dieser Beitrag liefert einen nähernden Überblick über verschiedene Formen medizinischer Kommunikation. Im Zentrum stehen dabei (1) der Konnex von Sprache und Wissen in der Medizin, (2) Arzt-Patient-Gespräche als Primärkommunikation und (3) der Zusammenhang zwischen Medialisierung und Medikalisierung.
Dieser Beitrag geht auf die 2010 erschienene Dissertation „Migration, Sprache und Rassismus“ des Verfassers zurück. Dort untersucht er mit ethnografischen und gesprächsanalytischen bzw. -rhetorischen Methoden den kommunikativen Stil von zwei mehrheitlich türkischstämmigen, akademischen Gruppen der zweiten Migrantengeneration in Deutschland. Im Fokus der Studie steht das Milieu der „emanzipatorischen Migranten“, die ethnische Zuschreibungen wie „Türken“, „Kurden“, Italiener“ etc. ablehnen und sich als (kultur-)politische Initiativen gegen Diskriminierung und für gleiche Bürgerrechte einsetzen. Als Fallstudie für diese soziale Welt analysiert der Autor die Mannheimer Gruppe der „Unmündigen“. Sein Erkenntnisinteresse richtet sich auf die Fragen, welche rhetorischen Verfahren die Beteiligten im Umgang mit Diskriminierungs- und Marginalisierungserfahrungen entwickelt haben und wie sie in ihrer gruppeninternen Kommunikation auf das Türkische und das Deutsche in ihrem Sprachrepertoire zurückgreifen. Im vorliegenden Artikel wird auf den letztgenannten Aspekt eingegangen und untersucht, welche Formen und Funktionen die deutsch-türkische Variationspraxis der „emanzipatorischen Migranten“ aufweist.
Physische oder psychische Schädigung und die Erfahrung von Hilflosigkeit sind zwei Grundvoraussetzungen für Traumatisierung. Hilflosigkeit ist ein Zustand extrem reduzierter Agency im Angesicht von Gefahr und drohender Schädigung. Wenn Erzähler Gewalterfahrungen darstellen, beinhaltet dies nicht nur die Darstellung reduzierter Agency, sondern auch die Auseinandersetzung damit, wie Gewalt motiviert war: Wer war verantwortlich für die Gewaltausübung? Wie schuldhaft war sie? Gab das erzählte Selbst Anlass zu gewalttätigen Reaktionen? Da Fragen nach Verantwortung, Schuld und Absicht zentral für das Erleben und die Bewältigung von Gewalterfahrungen sind, ist die Frage, wie Agency zugeschrieben wird, grundlegend für die Analyse von Erzählungen traumatischer Gewalterfahrungen. Lucius-Hoene (2012) hat aufgezeigt, dass Agency im Erzählen auf verschiedenen Ebenen relevant wird. Die vorliegende Untersuchung befasst sich mit der Ebene der narrativen Darstellung der Gewalterfahrung, d.h. der Darstellung von Opfer- und Täterschaft, Macht und Hilflosigkeit, Schuld und Rechtfertigung von Gewalt. Nach einer kurzen Einführung in soziologische, philosophische und linguistische Konzepte von Agency werden zwei Typen von Erzählungen physischer Gewalterfahrungen kontrastiert. Die Untersuchung konzentriert sich auf die narrativen Praktiken der Zuschreibung von Schuld und Verantwortung.
Im vorliegenden Artikel wird eine gemeinschaftliche Folgekommunikation über den Film "Angel Heart" anhand einer Diskussion einer Gruppe von Jugendlichen untersucht. Die Gruppenmitglieder (Sandra, Sonja, Andi und Michel) waren zum Zeitpunkt der Aufnahme 16 Jahre alt und verbrachten regelmäßig gemeinsam ihre Freizeit. Die Diskussion fand im Anschluss an die Rezeption des Films statt. Sie wurde vom Autor des vorliegenden Textes initiiert und geleitet, wobei versucht wurde, den Interessen der Jugendlichen und der sich zwischen ihnen entspinnenden Gesprächsdynamik zu folgen. Die Gruppendiskussion wurde konversationsanalytisch ausgewertet.
This paper shows how understanding in interaction is informed by temporality, and in particular, by the workings of retrospection. Understanding is a temporally extended, sequentially organized process. Temporality, namely, the sequential relationship of turn positions, equips participants with default mechanisms to display understandings and to expect such displays. These mechanisms require local management of turn-taking to be in order, i.e., the possibility and the expectation to respond locally and reciprocally to prior turns at talk. Sequential positions of turns in interaction provide an infrastructure for displaying understanding and accomplishing intersubjectivity. Linguistic practices specialized in displaying particular kinds of (not) understanding are adapted to the individual sequential positions with respect to an action-to-be-understood.
Pragmatik revisited
(2015)
Die Pragmatik hat sich im Lauf der letzten 40 Jahre fest als linguistische Teildisziplin etabliert. Schon relativ früh hat sich ein Kanon von Fragestellungen und Konzepten herausgebildet, der den Gegenstandsbereich der Pragmatik z.B. in Lehrbüchern und Enzyklopädien ausmacht. Die kanonischen Gegenstände (v.a. Sprechakte, Implikaturen, Präsuppositionen und Deixis) sind über die Zeit erstaunlich stabil geblieben. Der Beitrag regt an, dieses Gegenstandsverständnis von ,Pragmatik‘ angesichts der Entwicklungen der Forschung in den letzten Dekaden zu überdenken. Folgende Fragen sind dabei leitend:
- Welche Konzepte und Eigenschaften des Gegenstandsbereichs haben sich in der empirischen Erforschung des sprachlichen Handelns im Kontext als grundlegend erwiesen, ohne bisher entsprechend als Grundkategorien des „Kanons“ der Pragmatik begriffen worden zu sein?
- Welche Konsequenzen haben die empirischen Forschungen der letzten Zeit für die Relevanz und das Verständnis der klassischen pragmatischen Themen und Konzepte?
Es wird dafür plädiert, vier Bestimmungsstücke des sprachlichen Handelns ins Zentrum der Auffassung von ,Pragmatik‘ zu stellen: Zeitlichkeit, Leiblichkeit, Sozialität und Epistemizität.
The authors establish a phenomenological perspective on the temporal constitution of experience and action. Retrospection and projection (i.e. backward as well as forward orientation of everyday action), sequentiality and the sequential organization of activities as well as simultaneity (i.e. participants’ simultaneous coordination) are introduced as key concepts of a temporalized approach to interaction. These concepts are used to capture that every action is produced as an inter-linked step in the succession of adjacent actions, being sensitive to the precise moment where it is produced. The adoption of a holistic, multimodal and praxeological perspective additionally shows that action in interaction is organized according to several temporal orders simultaneously in operation. Each multimodal resource used in interaction has its own temporal properties.
Valenz im Fokus: Vorwort
(2015)
Die Festschrift Valenz im Fokus: Grammatische und lexikografische Studien enthält zum einen die Beiträge des internationalen Kolloquiums „Valenz im Fokus“, das am 12. Juli 2013 im Institut für Deutsche Sprache in Mannheim zu Ehren von Jacqueline Kubczak veranstaltet wurde, zum anderen weitere Beiträge von Kollegen aus der ganzen Welt, die zum einen als elektronische Publikation während des Kolloquiums präsentiert wurden, zum anderen speziell für diese Festschrift hinzukamen.
In diesem Beitrag wird an einigen Beispielen aus der nominalen Morphologie bzw. der Morphosyntax der deutschen Substantivgruppe gezeigt, wie sich in den Veränderungen in diesem Bereich, die sich über das 20. Jahrhundert hin beobachten lassen, Fragen eines langfristigen Systemwandels mit Regularitäten des Sprachgebrauchs überlagern. Im Mittelpunkt soll die Frage der Markierung der Kasus – insbesondere in den allgemein als „kritisch“ angesehenen Fällen von Genitiv und Dativ – stehen. Wenn man die Daten dazu betrachtet, sieht man, dass in den meisten Fällen schon zum Anfang des 20. Jahrhunderts eine weitgehende Anpassung an die Regularitäten der Monoflexion erfolgt war, auch, dass dieser Prozess über das Jahrhundert hin fortschreitet. Bemerkenswert ist, dass insgesamt die als „alt“ angesehenen Fälle in den untersuchten Korpora geschriebener Sprache (sehr) selten auftauchen, dass aber in zunehmendem Ausmaß die daraus folgende Markiertheit in der einen oder anderen Weise funktional genutzt wird. Einen Fall eigener Art stellt in diesem Zusammenhang der Genitiv dar, der sich bei den starken Maskulina und Neutra bekanntlich dem Trend zur „Einmalmarkierung“ der Kasus an den flektierten, das Substantiv begleitenden Elementen widersetzt. Das führt zu der bekannten Orientierung dieser Formen auf die Nicht-Objekt-Verwendungen und auch zu einem auffälligen Maß an Variation in der Nutzung der entsprechenden Flexionsformen.
Das Lexikon menschlicher Sprachen basiert auf quantitativen Verteilungen, die sich am Zipfschen Gesetz orientieren: Wenige Lexeme werden extrem häufig verwendet und sehr, sehr viele Lexeme sind extrem selten. Auch funktional zusammenhängende Teilwortschätze wie Wörter einer bestimmten Wortart, Verben, die in einem bestimmten Argumentstrukturmuster auftreten, oder Komposita zu einem bestimmten Grundwort zeigen ähnliche Frequenzverteilungen, weisen aber auch jeweils typische Abweichungen von einer Zipfschen Verteilung auf. Zipfnahe Verteilungen sind charakteristisch für dynamische, selbstorganisierende Systeme, und Veränderungen im Wortschatz oder in Teilwortschätzen sind insofern auf der Basis solcher Verteilungen zu interpretieren. Der Artikel plädiert dafür, lexikologischen Sprachdokumentationen ein dynamisches Lexikonkonzept zugrunde zu legen, in dem die Verteilungscharakteristika als Grundlage der Wortschatzstruktur eine zentrale Rolle spielen.
Zwischenräume – Phänomene, Methoden und Modellierung im Bereich zwischen Lexikon und Grammatik
(2011)
Der Beitrag führt in den Sammelband „Sprachliches Wissen zwischen Lexikon und Grammatik“ ein und diskutiert zunächst den Zusammenhang zwischen den drei Dichotomien Lexikon versus Grammatik, Wort versus Phrase und Idiosynkrasie versus Regel. Im Folgenden werden Varianten des Konstruktionsbegriffs dargestellt und hinsichtlich verschiedener Dimensionen analysiert. Einer Darstellung der im Zusammenhang mit der Lexikon-Grammatik-Abgrenzung diskutierten Phänomene und angewandten empirischen Methoden schließt sich eine Übersicht über die Aufsätze des Sammelbandes an.
Aus den Argumentstrukturen von Verben lassen sich vielfach eigenständige Argumentstrukturmuster mit idiosynkratischen formalen oder inhaltlichen Eigenschaften abstrahieren. Der Artikel zeigt, dass sich Ähnlichkeiten zwischen solchen Mustern nicht, wie von Goldberg (1995) vorgeschlagen, über das Konzept polysemer Argumentstrukturkonstruktionen erfassen lassen, sondern adäquater über ein Netz von Familienähnlichkeiten modelliert werden können. Die einzelnen Argumentstrukturmuster zeigen dabei eine Vielzahl von idiosynkratischen lexikalischen Kookkurrenzen, die spezifisch für die je einzelnen Argumentstrukturmuster sind und in einer implikativen Beziehung zu diesen stehen. Überlegungen zur angemessenen sprachtheoretischen Modellierung der Daten zeigen dabei sowohl Schwächen valenzbasierter Theorien als auch Mängel konstruktionsbasierter Ansätze auf.
Zum sogenannten Absentiv
(2013)
This article presents a system which allows components of situations referred to by communication verbs to be combined in different ways to yield representations of different reference situation types. These are subsequently used as the basis of a comparison of the corresponding communication verbs in German and Spanish. Verbs referring to the same special reference situation type are shown to constitute a lexical field. Concentrating on the lexical fields of German and Spanish forbid-verbs, specific types of inform-verbs and persuade-verbs, we show that the procedure applied may in principle be used to cover the whole inventory of communication verbs in a bilingual conceptual (i.e. onomasiological) dictionary.
Wort und Wortschatz
(2015)
Das Verständnis darüber, was ein Wort ist, zeigt sich je nach linguistischer Teildisziplin, je nach Untersuchungsinstrument und je nach betrachtetem Medium (Schriftlichkeit, Mündlichkeit) als äußerst wandelbar und kontrovers. Zunächst wird eine Übersicht über die wichtigsten Wortbegriffe in Geschichte und Gegenwart gegeben, um zu zeigen, wie sehr sich ein formaler, am Schriftbild orientierter Wortbegriff von semantisch-kognitiven Wortbegriffen unterscheidet. Anschließend wird dargelegt, wie sich welche sprachwissenschaftlichen Methoden auf die Konstituierung des Phänomens "Wort" auswirken und dass die isolierende Sicht auf das Einzelwort durch die Betrachtung von Relationen zwischen Wörtern abgelöst wurde. Dabei kommt den neueren, computerlinguistisch fundierten Verfahren besondere Relevanz zu. Auf dieser Basis wird gezeigt, welche Aspekte und Ebenen der Wortforschung es aktuell gibt; dabei wird der Interaktion von theoretischen wie anwendungsbezogenen Forschungsperspektiven und dem gesellschaftlichen bzw. Laieninteresse an Wörtern besondere Beachtung geschenkt.
Die Normierung der deutschen Standardaussprache geht in ihren Ursprüngen auf die 1898 durch die Siebs-Kommission beschlossenen Regelungen für die deutsche Bühnenaussprache zurück. Seit 1964 bildet der Nachrichtensprecher bei der Ausübung seines Berufs die Grundlage für die gegenwärtigen deutschen Aussprachekodizes. Diese eingeschränkte empirische Basis zusammen mit einem primär präskriptiven Anspruch der Kodifikatoren führt dazu, dass auch das aktuellste Aussprachewörterbuch des Deutschen (DAW) in vielen Fällen den tatsächlichen Standardsprachgebrauch in Deutschland nur unzureichend repräsentiert. Dies wird im vorliegenden Beitrag durch den Vergleich mit Sprachdaten aus dem Korpus „Deutsch heute“, das Lese- und Spontansprache v.a. von Oberstufenschülern am Gymnasium aus dem ganzen deutschen Sprachraum enthält, anhand von acht unterschiedlichen sprachlichen Phänomenen gezeigt. Der Beitrag schließt mit einem Plädoyer für realitätsnähere Kodifikationen, die sich am Sprachgebrauch der „educated speaker“ orientieren (wie es v.a. im englischsprachigen Raum der Fall ist), weil sie der aktuellen Sprachsituation im Deutschen weit besser Rechnung tragen als die derzeit existierenden Kodizes.
Grammatik
(2005)
Will man im Deutschen einen andauernden, noch im Verlauf befindlichen Vorgang (z. B. den, dass Sie gerade diese Zeilen lesen) ausdrücken, könnte es standardsprachlich von Ihnen als Leser dieser kleinen Sprachbetrachtung z. B. heissen: Sie sind gerade dabei zu lesen. Oder: Sie sind beim Lesen. Oder: Genau in diesem Moment lesen Sie. In der gesprochenen Sprache (und nicht nur dort) kann man aber auch hören (bzw. lesen): Sie sind gerade am Lesen. Dieser letzte Satz interessiert uns hier, denn an ihm scheiden sich die Geister. Vielen Sprechern gilt diese so genannte Verlaufsform nicht als standard-sprachlich korrekt, sie ordnen sie der regionalen (nämlich insbesondere westdeutschen) Umgangssprache zu und würden sie des-halb im geschriebenen Deutsch vermeiden. Anderen wiederum ist die Verlaufsform völlig vertraut, sie bewerten sie nicht als ungrammatisch oder falsch und zögern auch nicht, sie im schriftlichen Kontext zu verwenden. Auch die Grammatiken zum Gegenwartsdeutschen sind sich in der Beurteilung dieser Ausdrucksweise nicht einig. Im Folgenden will ich zunächst die Verlaufsform in ihrer Bildungs-und Verwendungsweise vorstellen, diesen Befund mit dem Beleg-material in der DUDEN-Sprachkartei und einer anderen Datenbank zum Gegenwartsdeutschen vergleichen, einen Blick auf die sich wandelnde Einschätzung dieses Phänomens in der DUDEN-Grammatik werfen und schliesslich erläutern, wie die Dudenredaktion Sätze wie Sie sind gerade am Lesen heute bewertet.
Einleitung
(2011)
elexiko ist ein im Aufbau befindliches Online-Wörterbuch, d. h. es ist ständigen Änderungen in Form von Korrekturen oder Ergänzungen unterworfen. Diese betreffen sowohl die Stichwortliste als auch die lexikografischen Angaben. In diesem Beitrag sollen einige kleinere konzeptionelle Entscheidungen und offene Fragen, die in den anderen Beiträgen in diesem Sammelband noch nicht thematisiert wurden, zusammengefasst werden.
Wortbildung
(2005)
Dieser Beitrag beschäftigt sich mit dem Wort Norm in mehrfacher Hinsicht. Am Gegenstand des Wortes Norm wird über Fragen der lexikografischen Norm gedruckter Wörterbücher reflektiert und andererseits wird überlegt, welche Informationen in welcher Präsentation zum Wort Norm aus drei verschiedenen Online-Angeboten, die Zugriff auf umfangreiche elektronische Textkorpora gewähren, zu ermitteln sind. Es schließt sich ein Vorschlag zur lexikografischen Behandlung in einem Online-Wortschatzinformationssystem an, der berücksichtigt, welche Norm bzw. Normen (darunter auch Sprachnormen) in einem Textkorpus zur Gegenwartssprache erwähnt, dokumentiert, erläutert bzw. behandelt werden.
Für Nutzer(innen) wie für Verleger von CD-ROM-Wörterbüchern ist die Frage nach deren Qualität wichtig. Aus praktischen Verlagserfahrungen heraus werden im Folgenden Kriterien für eine qualitätvolle Publikation von Wörterbüchern auf CD-ROM entwickelt und zugleich Chancen und Probleme der elektronischen Publikation thematisiert.
Belege in elexiko
(2005)
Eine der linguistischen Teildisziplinen, in der schon seit vielen Jahren korpusgestützt gearbeitet wird, ist die Lexikografie. Wörterbücher sind lange vor der Entstehung großer elektronischer Textsammlungen mit den entsprechenden Korpusrecherche- und -analysewerkzeugen auf der Basis von umfänglichen Belegsammlungen entstanden, die nach dem Verständnis vieler Lexikografen das Korpus (bzw. die Primärquelle) des Wörterbuches darstellen. Noch heute arbeiten verschiedene Großwörterbücher (z. B. das Oxford English Dictionary) am Ausbau ihrer Belegsammlungen und benutzen diese neben zum Teil eigens aufgebauten elektronischen Wörterbuchkorpora im engeren Sinn. Welche Chancen und Probleme sich bei korpusgestützter Arbeit an Wörterbücher ergeben, wird in diesem Beitrag an deutschsprachigen Online-Wörterbüchern aufgezeigt, wobei zunächst einige Definitionen erarbeitet werden müssen. Ein kurzer Ausblick auf die Auswirkungen korpusgestützter Arbeit an Online-Nachschlagewerken auf den lexikografischen Prozess schließt diesen Beitrag ab.
Ein vergleichender Blick auf die Buchstabenverteilung im Anlaut und im Auslaut von Rufnamen, Familiennamen und Appellativa zeigt, dass die Rufnamen hinsichtlich ihrer Anlaut- und Auslautstruktur besonders distinkt sind. Familiennamen hingegen zeigen sowohl Charakteristika der alphabetischen Verteilung von Appellativen wie von Rufnamen, sind also weniger distinkt, durch die Mischung dieser Charakteristika aber auch als Gruppe gekennzeichnet.
In diesem Beitrag geht es einerseits um eine Definition dessen, was korpusgestützte Lexikographie ist, und andererseits um eine Bestandsaufnahme der gegenwärtigen Praxis korpusgestützter Lexikographie. Dabei wird ein Schwerpunkt gelegt auf allgemeinsprachige Wörterbücher der Gegenwartssprache, deren Inhalt die Beschreibung von Bedeutung und Verwendung von Lexemen ist. Außerdem liegt die Einschätzung zugrunde, dass die Auswertung elektronischer Korpora die Wörterbucharbeit weitgehend positiv beeinflusst und verändert, vorausgesetzt, dass zugrunde gelegte Korpus wurde für das geplante Wörterbuch so gut wie möglich in Umfang und Zusammensetzung eingerichtet.
Dieser Beitrag behandelt primäre, sekundäre und tertiäre Quellen in der Lexikographie und beschreibt insbesondere ihre Nutzung für die Erarbeitung des deutschsprachigen Online-Wörterbuches elexiko. Anhand verschiedener Beispiele wird die lexikographische Praxis im Umgang mit sehr unterschiedlichen Quellen in diesem Projekt deutlich. Zugleich wird über die unterschiedlichen Definitionen von ‘Quelle’ in der Sprachwissenschaft wie in den Geschichtswissenschaften nachgedacht.
Beginnend mit der Vergangenheit, nämlich mit einem Rückblick auf die allgemeine Konzeption für die Wortbildungsangaben in elexiko, einem im Aufbau befindlichen Online-Wörterbuch zum Gegenwartsdeutschen, wird in dem Beitrag anhand einiger Beispiele aus elexiko-Wortartikeln gezeigt, wie die Angaben zur Gebildetheit der Stichwörter in elexiko gegenwärtig umgesetzt sind und wie die vorhandenen Recherchemöglichkeiten in diesem Bereich ausgebaut werden könnten. Anschließend wird erläutert, um welche anderen Angaben die Angabe zur Gebildetheit des Stichwortes zukünftig ergänzt werden kann, wobei dies auf die Frage der Lemmatisierung von Wortbildungselementen in elexiko beschränkt bleibt. Zugleich stellen einige Beispiele mit Wortbildungsangaben aus anderen Online-Wörterbüchern eine Vergleichsbasis für elexiko dar. Insgesamt will der Beitrag anhand verschiedener Einblicke in die Praxis der Erarbeitung von Wortbildungsangaben in Online-Wörterbüchern dazu beitragen, sowohl Praxis wie Theorie solcher Angaben im elektronischen Wörterbuch zu diskutieren.
Einleitung
(2013)
Deutscher Wortschatz im Internet: Das Informationssystem elexiko und sein Modulprojekt Neologismen
(2007)
In this paper, the authors use the 2012 log files of two German online dictionaries (Digital Dictionary of the German Language and the German Version of Wiktionary) and the 100,000 most frequent words in the Mannheim German Reference Corpus from 2009 to answer the question of whether dictionary users really do look up frequent words, first asked by de Schryver et al. (2006). By using an approach to the comparison of log files and corpus data which is completely different from that of the aforementioned authors, we provide empirical evidence that indicates - contrary to the results of de Schryver et al. and Verlinde/Binon (2010) - that the corpus frequency of a word can indeed be an important factor in determining what online dictionary users look up. Finally, we incorporate word class Information readily available in Wiktionary into our analysis to improve our results considerably.
Rückblick in Dankbarkeit
(2015)