Refine
Year of publication
- 2015 (41) (remove)
Document Type
- Article (41) (remove)
Has Fulltext
- yes (41)
Is part of the Bibliography
- yes (41) (remove)
Keywords
- Deutsch (15)
- Computerunterstützte Lexikographie (6)
- Korpus <Linguistik> (6)
- Kongressbericht (4)
- Wörterbuch (4)
- Elektronisches Wörterbuch (3)
- Kritische Diskursanalyse (3)
- Rezension (3)
- Diskursanalyse (2)
- Fremdsprache (2)
Publicationstate
- Veröffentlichungsversion (26)
- Postprint (2)
Reviewstate
- (Verlags)-Lektorat (15)
- Peer-Review (12)
- Peer-review (4)
- Peer-Revied (2)
- Verlags-Lektorat (2)
- Review-Status-unbekannt (1)
Publisher
- Institut für Deutsche Sprache (6)
- De Gruyter (1)
- Dictionary Society of North America (1)
- Elsevier (1)
- John Benjamins (1)
When formulating a request for an object, speakers can choose among different grammatical resources that would all serve the overall purpose. This paper examines the social contexts indexed and created by the choice of the turn format can I have x to request a shared good (the pepper grinder, a tissue from a box on the table, etc.) in British English informal interaction. The analysis is based on a video corpus of approximately 25 h of everyday interaction among family and friends. In its home environment, a request in the format can I have x treats the other as being in control over the relevant material object, a control that is the contingent outcome of ongoing courses of action. This contingent control over a shared good produces an obligation to make it available. This analysis is supported by an examination of similarly formatted request turns in other languages, of can I have x in another interactional environment (after a relevant offer has been made) in British English, and of deviant cases. The results highlight the intimate connection of request format selection to the present engagements of (prospective) request recipients.
1993 erscheint mit Langenscheidts Großwörterbuch Deutsch als Fremdsprache das erste eigens für nichtmuttersprachliche Deutschlerner konzipierte einsprachige Wörterbuch. Genau zwanzig Jahre später, 2013, geben Duden/Cornelsen das Duden - Basiswörterbuch Deutsch als Fremdsprache heraus. Damit könnte bereits der Schlussstein unter die kurze Epoche der DaF-Print-Lexikografie gesetzt sein, denn weitere Planungen für gedruckte DaF-Wörterbücher gibt es vonseiten der Verlage nicht. Das bedeutet allerdings nur ein Ende für die DaF-Wörterbücher in ihrer bisherigen Erscheinung, denn das Bedürfnis des Nachschlagens beziehungsweise der Bedarf an sprachlichen Daten bleiben weiterhin bestehen, solange Deutsch als Fremdsprache gelernt wird. Der Beitrag beschreibt, wie Wörterbücher ihre äußere Form ändern können, um unter den sich wandelnden gesellschaftlichen Bedingungen zu überleben. Dabei existieren zwei Möglichkeiten: Die Wörterbücher können entweder quasi unsichtbar werden, wenn sie in intelligenten Textumgebungen aufgehen, oder sie können in umfangreiche Lernportale integriert werden. Der Beitrag untersucht bestehende Angebote und macht Vorschläge für eine Weiterentwicklung dieser Wörterbücher.
Gehören nun die Männer an den Herd? Anmerkungen zum Wandel der Rollenbilder von Mann und Frau
(2015)
Damit wir uns über Gerichte und Getränke verständigen können, benennen wir sie. Viele Benennungen informieren über Zutaten oder Zubereitung, zum Beispiel Geschmortes Lamm mit rosa Pfeffer. In diesem Beitrag geht es um Benennungen anderer, besonderer Art, zum Beispiel Benennungen wie Ich träume von Casablanca, Armer Ritter und Studentenkuss. Ich nenne sie kostümierte Benennungen, weil sie das Benannte komplett verkleiden. Wir müssen schon wissen oder noch in Erfahrung bringen, um was es sich handelt. Der Beitrag analysiert diesen speziellen Typ von Benennungen morphologisch und semantisch, er zeigt die Strukturen und Sinnhintergründe der Benennungen auf.
Natural language Processing tools are mostly developed for and optimized on newspaper texts, and often Show a substantial performance drop when applied to other types of texts such as Twitter feeds, Chat data or Internet forum posts. We explore a range of easy-to-implement methods of adapting existing part-of-speech taggers to improve their performance on Internet texts. Our results show that these methods can improve tagger performance substantially.
Klaus Fischer / Fabio Mollica (Hrsg.): Valenz, Konstruktion und Deutsch als Fremdsprache [Rezension]
(2015)
We present studies using the 2013 log files from the German version of Wiktionary. We investigate several lexicographically relevant variables and their effect on look-up frequency: Corpus frequency of the headword seems to have a strong effect on the number of visits to a Wiktionary entry. We then consider the question of whether polysemic words are looked up more often than monosemic ones. Here, we also have to take into account that polysemic words are more frequent in most languages. Finally, we present a technique to investigate the time-course of look-up behaviour for specific entries. We exemplify the method by investigating influences of (temporary) social relevance of specific headwords.
This paper presents some results from an online survey regarding the functions and presentation of lexicographically compiled and automatically compiled corpus citations in a general monolingual e-dictionary of German (elexico). Our findings suggest that dictionary users have a clear understanding of the functions of corpus citations in lexicography.
Some structures in printed dictionaries also occur in online dictionaries, some do not occur, some need to be adapted whereas new structures may be introduced in online dictionaries. This paper looks at one type of structure, known in printed dictionaries as outer texts. It is argued that the notions of a frame structure and front and back matter texts do not apply to online dictionaries. The data distribution in online dictionaries does not only target the dictionary articles. There are components outside the word list section of the dictionary. These components are not always texts. They could e.g. also be video clips. Consequently the notion of outer texts in printed dictionaries is substituted by the notion of outer features in online dictionaries. This paper shows how outer features help to constitute a feature compound. The outer features in eight online dictionaries are discussed. Where the users guidelines text is a compulsory outer text in printed dictionaries it seems that an equivalent feature is often eschewed in online dictionaries. A distinction is made between dictionary-internal and dictionary-external outer features, illustrating that outer features can be situated in other sources than the specific dictionary. More research is needed to formulate models for online features that can play a comprehensive role in online dictionaries.
Corpus-assisted analyses of public discourse often focus on the level of the lexicon. This article argues in favour of corpus-assisted analyses of discourse, but also in favour of conceptualising salient lexical items in public discourse in a more determined way. It draws partly on non-Anglophone academic traditions in order to promote a conceptualisation of discourse keywords, thereby highlighting how their meaning is determined by their use in discourse contexts. It also argues in favour of emphasising the cognitive and epistemic dimensions of discourse-determined semantic structures. These points will be exemplified by means of a corpus-assisted, as well as a frame-based analysis of the discourse keyword financial crisis in British newspaper articles from 2009. Collocations of financial crisis are assigned to a generic matrix frame for ‘event’ which contains slots that specify possible statements about events. By looking at which slots are more, respectively less filled with collocates of financial crisis, we will trace semantic presence as well as absence, and thereby highlight the pragmatic dimensions of lexical semantics in public discourse. The article also advocates the suitability of discourse keyword analyses for systematic contrastive analyses of public/political discourse and for lexicographical projects that could serve to extend the insights drawn from corpus-guided approaches to discourse analysis.
Der Aufsatz untersucht die grammatische Gestaltung zweigliedriger Nominalgruppen mit quantifizierendem nominalem Erstglied (Nquant) und quantifiziertem, durch ein Adjektivattribut erweitertem, nominalem Zweitglied (Adj+N), z.B. (mit) einem Glas kaltem Wasser. In der deutschen Gegenwartssprache ist in solchen Fügungen mit Varianten zu rechnen: (mit) einem Glas kalten Wassers, (mit) einem Glas kaltes Wasser. Insgesamt lassen sich fünf Konstruktionstypen unterscheiden. Anhand einer Belegsammlung aus literarischen Prosatexten vom 17. bis zum 20. Jahrhundert wird insbesondere die quantitative Verteilung von Konstruktionen mit Genitiv vs. Kasusübereinstimmung ins Auge gefasst. Anders als bei Nquant+N-Gruppen ohne Adjektivattribut im Zweitglied zeigt sich ein kräftiger Anstieg im Anteil der Genitivkonstruktion vom 17. bis zum 19. und nur ein leichter Rückgang im 20. Jahrhundert. Dieser Befund stimmt nur zum Teil mit den Darstellungen in der Standardliteratur überein. Eine mögliche Erklärung für die quantitative Entwicklung der Genitivkonstruktion in der Literatursprache liegt im Einfluss normativer Grammatiken.
We analyze the linguistic evolution of selected scientific disciplines over a 30-year time span (1970s to 2000s). Our focus is on four highly specialized disciplines at the boundaries of computer science that emerged during that time: computational linguistics, bioinformatics, digital construction, and microelectronics. Our analysis is driven by the question whether these disciplines develop a distinctive language use—both individually and collectively—over the given time period. The data set is the English Scientific Text Corpus (scitex), which includes texts from the 1970s/1980s and early 2000s. Our theoretical basis is register theory. In terms of methods, we combine corpus-based methods of feature extraction (various aggregated features [part-of-speech based], n-grams, lexico-grammatical patterns) and automatic text classification. The results of our research are directly relevant to the study of linguistic variation and languages for specific purposes (LSP) and have implications for various natural language processing (NLP) tasks, for example, authorship attribution, text mining, or training NLP tools.
Speakers’ linguistic experience is for the most part experience with language as used in conversational interaction. Though highly relevant for usage-based linguistics, the study of such data is as yet often left to other frameworks such as conversation analysis and interactional linguistics (Couper-Kuhlen and Selting 2001). On the basis of a case study of salient usage patterns of the two German motion verbs kommen and gehen in spontaneous conversation, the present paper argues for a methodological integration of quantitative corpus-linguistic methods with qualitative conversation analytic approaches to further the usage-based study of conversational interaction.
Using the Google Ngram Corpora for six different languages (including two varieties of English), a large-scale time series analysis is conducted. It is demonstrated that diachronic changes of the parameters of the Zipf–Mandelbrot law (and the parameter of the Zipf law, all estimated by maximum likelihood) can be used to quantify and visualize important aspects of linguistic change (as represented in the Google Ngram Corpora). The analysis also reveals that there are important cross-linguistic differences. It is argued that the Zipf–Mandelbrot parameters can be used as a first indicator of diachronic linguistic change, but more thorough analyses should make use of the full spectrum of different lexical, syntactical and stylometric measures to fully understand the factors that actually drive those changes.
In this contribution, we present a novel approach for the analysis of cross-reference structures in digital dictionaries on the basis of the complete dictionary database. Using paradigmatic items in the German Wiktionary as an example, we show how analyses based on graph theory can be fruitfully applied in this context, e. g. to gain an overview of paradigmatic references as a whole or to detect closely connected groups of headwords. Furthermore, we connect information about cross-reference structures with corpus frequencies and log file statistics. In this way, we can answer questions such as the following ones: Are frequent words paradigmatically linked more closely than others? Are closely linked headwords or headwords that stand more solitary in the dictionary visited significantly more often?
Die öffentliche Akzeptanz und Wirkung natur- und technikwissenschaftlicher Forschung hängt grundlegend davon ab, ob sich die Ziele und Forschungsergebnisse an die Öffentlichkeit vermitteln lassen. Doch die Inhalte aktueller Forschungsvorhaben sind für ein Laienpublikum oft nur schwer zugänglich und verständlich. Vor dem Hintergrund, die gesellschaftliche Diskussion natur- und technikwissenschaftlicher Forschung zu verbessern, untersuchen und bewerten wir im Projekt PopSci – Understanding Science einen wichtigen Sektor des populärwissenschaftlichen Diskurses in Deutschland empirisch. Hierfür identifizieren wir die linguistischen Merkmale deutscher populärwissenschaftlicher Texte durch korpusbasierte Methoden und untersuchen deren Effekt auf die kognitive Verarbeitung der Texte durch Laien. Dazu setzen wir Vor- und Nachwissenstests ein. Außerdem messen wir die Blickbewegungen der Leserinnen und Leser, während sie populärwissenschaftliche Texte lesen. Aus dieser Kombination von unterschiedlichen Methoden versuchen wir, erste Empfehlungen zur Verbesserung des linguistischen Stils und der Wissensrepräsentation populärwissenschaftlicher Texte abzuleiten.
In this paper, general problems with easily confused words among a language community are addressed. Serving as an example, the difficulties of semantic differentiation between the use of German sensibel and sensitiv are discussed. One the one hand, the question is raised as to how a speech community faces challenges of semantic shifts and how monolingual dictionaries document lexical items with similar semantic aspects. On the other hand, I will demonstrate the discrepancies of information on meaning as retrieved and interpreted from large corpus data. It will be shown how the semantics of words change and hence cause confusion among speakers. As a result, empirical evidence opens up several questions concerning the prescriptive vs. descriptive treatment of paronymic items such as sensibel/sensitiv and it demands different approaches to the lexicographic description of such words in future reference works.
Recipient design is a key constituent of intersubjectivity in interaction. Recipient design of turns is informed by prior knowledge about and shared experience with recipients. Designing turns in order to be maximally effective for the particular recipient(s) is crucial for accomplishing intersubjectively coordinated action. This paper reports on a specific pragmatic structure of recipient design, i.e. counter-factual recipient design, and how it impinges on intersubjectivity in interaction. Based on an analysis of video-recordings data from driving school lessons in German, two kinds of counterfactual recipient design of instructors' requests are distinguished: pedagogic and egocentric turn-design. Counterfactual, pedagogic turn-design is used strategically to diagnose student skills and to create opportunities for corrective instructions. Egocentric turn-design rests on private, non-shared knowledge of the instructor. Egocentrically designed turns imply expectations of how to comply with requests which cannot be recovered by the student and which lead to a breakdown of intersubjective cooperation. This paper identifies practices, sources and interactional consequences of these two kinds of counterfactual recipient design. In addition, the study enhances our understanding of recipient design in at least three ways. It shows that recipient design does not only concern referential and descriptive practices, but also the indexing intelligible projections of next actions; it highlights the productive, other-positioning effects of recipient design; it argues that recipient design should be analyzed in terms of temporally extended interactional trajectories, linking turn-constructional practices to interactional histories and consecutive trajectories of joint action.
Die Stichwortliste bildet eine tragende Säule von gedruckten als auch von Online-Wörterbüchern. Daher ist die Konzeption und Erarbeitung einer Stichwortliste auch eine zentrale Aufgabe in der Anfangsphase des am IDS in Angriff genommenen Paronymwörterbuchs. Welche Überlegungen dabei angestellt, welche Ideen entwickelt und welche Pläne bzw. Entscheidungen schließlich umgesetzt wurden, wird in dem Beitrag aufgezeigt.
In dem Beitrag wird der Frage nachgegangen, inwiefern die Frequenz eines Wortes mit seiner orthographischen Richtigschreibung zusammenhangt. Werden häufige Wörter öfter und früher richtig geschrieben? Und welche Rolle spielt dabei die orthographische Regelhaftigkeit der Wortstrukturen? Unter Zuhilfenahme maschineller Analyseverfahren aus der Großstudie "Automatisierte Rechtschreibdiagnostik" (Fay/Berkling/Stüker 2012) werden diesbezuglich über 1000 Schülertexte von Klasse 2 bis 8 untersucht. Im Ergebnis werden zum einen einige Annahmen, die bislang vor allem auf Erfahrungswerten aus der sprachdidaktischen Arbeit fußten, empirisch bestätigt, zum anderen werden sie hinsichtlich spezifischer Rechtschreibphänomene differenziert und erweitert.
Gegenstand des Beitrags sind Phraseologismen, die seit den 1990er-Jahren in den deutschen Wortschatz eingegangen sind und im Neoglogismenwörterbuch (www.owid.de) präsentiert werden. Dargestellt werden u.a. Funktionen von Phraseologismen wie Schließung von Benennungslücken und Ausdrucksverstärkung. Entstehungsprozesse wie Metaphorisierung und elliptische Kürzung, Wortbildungsprozesse auf der Basis von Phraseologismen sowie Einflüsse aus dem Englischen.
Ziel des vorliegenden Beitrags ist es, auszuloten, wie Sprechen und Handeln, das wir aus dem Alltag kennen, einzuschätzen ist, wenn es im Fernsehen und vor allem im so genannten Reality-TV erscheint. Einen guten Einstieg, diese Problemstellung zu illustrieren, bieten Pannen, wie man sie etwa aus Nachrichtensendungen wie der Tagesschau kennt.