Refine
Year of publication
- 2015 (170) (remove)
Document Type
- Part of a Book (82)
- Article (41)
- Book (24)
- Conference Proceeding (8)
- Other (7)
- Working Paper (6)
- Master's Thesis (1)
- Preprint (1)
Is part of the Bibliography
- yes (170) (remove)
Keywords
- Deutsch (64)
- Korpus <Linguistik> (28)
- Gesprochene Sprache (11)
- Interaktion (11)
- Verb (11)
- Wörterbuch (10)
- Computerlinguistik (8)
- Computerunterstützte Lexikographie (8)
- Argumentstruktur (7)
- Kommunikation (7)
Publicationstate
- Veröffentlichungsversion (59)
- Postprint (5)
- Zweitveröffentlichung (3)
- Preprint (2)
Reviewstate
- (Verlags)-Lektorat (27)
- Verlags-Lektorat (25)
- Peer-Review (18)
- Peer-review (4)
- Review-Status-unbekannt (3)
- Peer-Revied (2)
- Verlagslektorat (2)
- (Verlags-)lektorat (1)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (1)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (1)
Publisher
- De Gruyter (30)
- Institut für Deutsche Sprache (27)
- de Gruyter (9)
- Narr Francke Attempto (8)
- Lang (7)
- Frank & Timme (4)
- Winter (4)
- Schneider-Verl. Hohengehren (3)
- Benjamins (2)
- ELTE, Germanistisches Institut (2)
Der Trickster ist ein mythisch-literarischer Archetyp, dessen listenreicher, verwandlungsfähiger Charakter seit Ende des 19. Jahrhunderts Mythenforscher, Literaturwissenschaftler, Soziologen und Psychologen fasziniert. Erstmals wird in dieser Arbeit mit den Methoden der linguistischen Gesprächsanalyse und dem semiotischen Vergleich gezeigt, wie sich der Trickster als kommunikative Identität in Alltagsgesprächen manifestiert.
In den Gesprächen männlicher Erwerbsloser auf einem Hamburger Platz entsteht die Identität des Tricksters als Ausdruck und Bearbeitung sozialer Marginalisierungsprozesse: durch sprachliche Mittel, wie z. B. im Fiktionalisieren als Gestaltwandler und Doppelgänger, im Rätselspiel als ‚Meister des sprachlichen Kodes‘, im Klatschgespräch als ein die gesellschaftlichen Absurditäten karikierender Schelm. Damit knüpft die Arbeit an die linguistische Identitätsforschung an und eröffnet mit der Methode des kultursemiotischen Vergleichs zudem neue Perspektiven auf diese.
Wie gelingt es den Beteiligten an Brandeinsatzübungen der Feuerwehr, die ‚Einsatzräume‘ durch multimodale Interaktion herzustellen? Wie machen sie Orte unter der Perspektive des Einsatzes als organisationale Schauplätze erst verständlich und damit benutzbar? Und welche Rolle spielen alte und neue technische Medien für die Orientierung und Navigation? Institutionelle Handlungspraktiken von Feuerwehrleuten mit eigens für und durch sie (mit )entwickelten neuen digitalen Medien – sogenannten ‚Landmarken‘ – werden beispielhaft für derartige Interaktionsprozesse analysiert und Settings mit ausschließlich herkömmlichen Hilfsmitteln gegenübergestellt. Methodisch schließt die Untersuchung an die Angewandte Gesprächsforschung und die ethnomethodologisch-konversationsanalytisch geprägten ‚Studies of Work‘ und ‚Workplace Studies‘ an.
Die Arbeit wurde von der Gesellschaft für Angewandte Linguistik (GAL) mit dem doctima-Preis 2015 ausgezeichnet.
Mit den Methoden der Interaktionalen Linguistik und der Konversationsanalyse untersucht die vorliegende Arbeit syntaktische Ko-Konstruktionen im gesprochenen Deutsch, wobei der Fokus auf Vervollständigungen eines zweiten Sprechers vor einem möglichen syntaktischen Abschlusspunkt liegt. Auf der Basis von 199 Ko-Konstruktionen aus informellen Interviews und Tischgesprächen leistet die Arbeit eine erste umfassende Analyse der gemeinsamen Konstruktion einer syntaktischen Gestalt durch zwei Sprecher im Deutschen.
Die Struktur der Ko-Konstruktionen wird in einem ersten Schritt über die Basisoperationen der Online-Syntax, Projektion und Retraktion, beschrieben. Im Fokus steht hier die Frage, an welchen Projektionen sich der zweite Sprecher orientiert, wobei sowohl syntaktische und prosodische als auch semanto-pragmatische Aspekte in die Analyse miteinbezogen werden. In einem zweiten Schritt wird die zeitliche und sequenzielle Organisation der Ko-Konstruktionen detailliert herausgearbeitet. Ein Schwerpunkt liegt hier auf einer genauen Darstellung und Analyse der verschiedenen Handlungsoptionen des ersten Sprechers nach der ko-konstruierten Vervollständigung.
Neologismen
(2015)
Zur Ko-Konstruktion einer amüsanten Unterbrechung während einer argumentativen Auseinandersetzung
(2015)
In diesem Beitrag möchte ich die These vertreten, dass Varianz das konstitutive Merkmal von Sprache ist - der geschriebenen, aber insbesondere auch der gesprochenen. Demgegenüber stand in der Linguistik über lange Zeit die Vorstellung im Vordergrund, dass Sprache ein homogener Gegenstand sei - und sie dies, um wechselseitige Verständigung zu ermöglichen, auch sein müsse. Ich werde zunächst in Abschnitt 2 diese Homogenitätsthese in Erinnerung rufen, um dann in Abschnitt 3 zu explizieren, was ich unter sprachlicher Varianz verstehe. In Abschnitt 4 werde ich einige theoretische Konzepte zur linguistischen Modellierung von Varianz skizzieren und ihre Grundannahmen explizieren. Die besondere Vielfalt der Varianz in der gesprochenen Sprache und die Gründe für diese Vielfalt stehen im Mittelpunkt von Abschnitt 5. Schließen werde ich, indem ich in Abschnitt 6 ein alternatives Konzept zur Modellierung von Varianz vorstelle, das für die Beschreibung der Varianz in der gesprochenen Sprache in besonderer Weise geeignet ist. Es konzeptualisiert Varianz als graduelles und kontinuierliches Phänomen, nicht als qualitative Differenz zwischen in sich annähernd homogenen Entitäten.
Linguisten-Lektüre
(2015)
Tagset und Richtlinie für das PoSTagging von Sprachdaten aus Genres internetbasierter Kommunikation
(2015)
This paper presents some results from an online survey regarding the functions and presentation of lexicographically compiled and automatically compiled corpus citations in a general monolingual e-dictionary of German (elexico). Our findings suggest that dictionary users have a clear understanding of the functions of corpus citations in lexicography.
1993 erscheint mit Langenscheidts Großwörterbuch Deutsch als Fremdsprache das erste eigens für nichtmuttersprachliche Deutschlerner konzipierte einsprachige Wörterbuch. Genau zwanzig Jahre später, 2013, geben Duden/Cornelsen das Duden - Basiswörterbuch Deutsch als Fremdsprache heraus. Damit könnte bereits der Schlussstein unter die kurze Epoche der DaF-Print-Lexikografie gesetzt sein, denn weitere Planungen für gedruckte DaF-Wörterbücher gibt es vonseiten der Verlage nicht. Das bedeutet allerdings nur ein Ende für die DaF-Wörterbücher in ihrer bisherigen Erscheinung, denn das Bedürfnis des Nachschlagens beziehungsweise der Bedarf an sprachlichen Daten bleiben weiterhin bestehen, solange Deutsch als Fremdsprache gelernt wird. Der Beitrag beschreibt, wie Wörterbücher ihre äußere Form ändern können, um unter den sich wandelnden gesellschaftlichen Bedingungen zu überleben. Dabei existieren zwei Möglichkeiten: Die Wörterbücher können entweder quasi unsichtbar werden, wenn sie in intelligenten Textumgebungen aufgehen, oder sie können in umfangreiche Lernportale integriert werden. Der Beitrag untersucht bestehende Angebote und macht Vorschläge für eine Weiterentwicklung dieser Wörterbücher.
Spiegelpaar im Paarspiegel
(2015)
Reading corpora are text collections that are enriched with processing data. From a corpus linguist’s perspective, they can be seen as an extension of classical linguistic corpora with human language processing behavior. From a psycholinguist’s perspective, reading corpora allow to test psycholinguistic hypotheses on subsets of language and language processing as it is ‘in the wild’ – in contrast to strictly controlled language material in isolated sentences, as used in most psycholinguistic experiments. In this paper, we will investigate a relevance-based account of language processing which states that linguistic structures, that are embedded deeper syntactically, are read faster because readers allocate less attention to these structures.
Diese Arbeit beschreibt und analysiert die soziale und sprachliche Welt von Orchestermusikern. Am Beispiel des „Mikrokosmos“ eines Orchesters untersucht sie das Zusammenspiel von beruflich-strukturellen Bedingungen, kulturell vermittelten Orientierungen und sprachlichen Handlungsmustern. Dabei werden das notwendige Hintergrundwissen über die soziale Kategorien, Leitbilder und Kriterien für Professionalität sowie die Handlungsdispositionen von Orchestermusikern dargestellt. Elemente einer historischen Entwicklung der Institution Orchester werden ebenso wie biografische Erfahrungen der Musiker und Musikerinnen auf ihre Relevanz für die Kommunikation im Orchester hin untersucht.
Die Stichwortliste bildet eine tragende Säule von gedruckten als auch von Online-Wörterbüchern. Daher ist die Konzeption und Erarbeitung einer Stichwortliste auch eine zentrale Aufgabe in der Anfangsphase des am IDS in Angriff genommenen Paronymwörterbuchs. Welche Überlegungen dabei angestellt, welche Ideen entwickelt und welche Pläne bzw. Entscheidungen schließlich umgesetzt wurden, wird in dem Beitrag aufgezeigt.
Gehören nun die Männer an den Herd? Anmerkungen zum Wandel der Rollenbilder von Mann und Frau
(2015)
Ziel des vorliegenden Beitrags ist es, auszuloten, wie Sprechen und Handeln, das wir aus dem Alltag kennen, einzuschätzen ist, wenn es im Fernsehen und vor allem im so genannten Reality-TV erscheint. Einen guten Einstieg, diese Problemstellung zu illustrieren, bieten Pannen, wie man sie etwa aus Nachrichtensendungen wie der Tagesschau kennt.
ln einer korpuspragmatischen Sicht auf Sprachgebrauch werden sogenannte Sprachgebrauchsmuster, die typisch für bestimmte Sprachausschnitte sind, datengeleitet berechnet. Solche Sprachgebrauchsmuster können z.B. diskursanalytisch gedeutet werden; noch relativ unerforscht ist aber ein konstruktionsgrammatischer Blick auf solche Muster. An zwei Beispielen wird gezeigt, wie mit der Berechnung von typischen n-Grammen (auf der Basis von Wortformen, sowie komplexer auf der Basis von Wortformen und Wortartkategorien) Sprachgebrauchsmuster berechnet werden können: Beim ersten Beispiel werden typische Formulierungsmuster in Leserbriefen, beim zweiten Beispiel aus einem politischen Diskurs (Wulff-Affäre), untersucht. Der Beitrag zielt in der Folge darauf ab, diese Muster dem usage-based-approach der KxG folgend als Konstruktionen zu deuten, die soziopragmatischen Verwendungsbedingungen gehorchen.
In Deutschland leben 7,5 Millionen erwachsene Analphabeten. Daher ist der Bedarf an Materialien zum Erlernen der Schrift gestiegen. Der vorliegende Band ist begleitend für den Rechtschreibunterricht von (vor allem) Erwachsenen gedacht, die Deutsch auf einem (nahezu) muttersprachlichen Niveau beherrschen. Die systemische Beschreibung des Rechtschreibwortschatzes, insbesondere durch seine orthographische Annotation und die Kennzeichnung von Lernstellen, stützt sich größten teils auf die Darstellung der deutschen Orthographie im Rahmencurriculum Schreiben (kurz RCS) des Deutschen Volkshochschulverbandes. Außerdem lehnt sich der vorliegende Wortschatz an Themen an, die sich aus dem alltäglichen Leben ableiten. Lehrende finden in diesem Band gezielt reichlich Material zum Üben im Unterrichtskontext und können bei Bedarf auch neues Übungsmaterial erstellen; sie sollen aber auch zusätzlich vermitteln, dass sie selbst als Experten von Fall zu Fall in Wörterlisten nachschlagen müssen. Für den Lerner soll der Rechtschreibwortschatz dazu beitragen, die Eigeninitiative zu fördern und zu selbständigem praktischen Üben ermutigen.
Duden - Das Aussprachewörterbuch: [Aussprache und Betonung von über 132 000 Wörtern und Namen]
(2015)
Speakers’ linguistic experience is for the most part experience with language as used in conversational interaction. Though highly relevant for usage-based linguistics, the study of such data is as yet often left to other frameworks such as conversation analysis and interactional linguistics (Couper-Kuhlen and Selting 2001). On the basis of a case study of salient usage patterns of the two German motion verbs kommen and gehen in spontaneous conversation, the present paper argues for a methodological integration of quantitative corpus-linguistic methods with qualitative conversation analytic approaches to further the usage-based study of conversational interaction.
This article reports about the on-going work on a new version of the metadata framework Component Metadata Infrastructure (CMDI), central to the CLARIN infrastructure. Version 1.2 introduces a number of important changes based on the experience gathered in the last five years of intensive use of CMDI by the digital humanities community, addressing problems encountered, but also introducing new functionality. Next to the consolidation of the structure of the model and schema sanity, new means for lifecycle management have been introduced aimed at combatting the observed proliferation of components, new mechanism for use of external vocabularies will contribute to more consistent use of controlled values and cues for tools will allow improved presentation of the metadata records to the human users. The feature set has been frozen and approved, and the infrastructure is now entering a transition phase, in which all the tools and data need to be migrated to the new version.
Bilingual Kindergarten programmes. The interaction of language management and language attitudes
(2015)
We analyze the linguistic evolution of selected scientific disciplines over a 30-year time span (1970s to 2000s). Our focus is on four highly specialized disciplines at the boundaries of computer science that emerged during that time: computational linguistics, bioinformatics, digital construction, and microelectronics. Our analysis is driven by the question whether these disciplines develop a distinctive language use—both individually and collectively—over the given time period. The data set is the English Scientific Text Corpus (scitex), which includes texts from the 1970s/1980s and early 2000s. Our theoretical basis is register theory. In terms of methods, we combine corpus-based methods of feature extraction (various aggregated features [part-of-speech based], n-grams, lexico-grammatical patterns) and automatic text classification. The results of our research are directly relevant to the study of linguistic variation and languages for specific purposes (LSP) and have implications for various natural language processing (NLP) tasks, for example, authorship attribution, text mining, or training NLP tools.
Using the Google Ngram Corpora for six different languages (including two varieties of English), a large-scale time series analysis is conducted. It is demonstrated that diachronic changes of the parameters of the Zipf–Mandelbrot law (and the parameter of the Zipf law, all estimated by maximum likelihood) can be used to quantify and visualize important aspects of linguistic change (as represented in the Google Ngram Corpora). The analysis also reveals that there are important cross-linguistic differences. It is argued that the Zipf–Mandelbrot parameters can be used as a first indicator of diachronic linguistic change, but more thorough analyses should make use of the full spectrum of different lexical, syntactical and stylometric measures to fully understand the factors that actually drive those changes.
In dem Beitrag wird der Frage nachgegangen, inwiefern die Frequenz eines Wortes mit seiner orthographischen Richtigschreibung zusammenhangt. Werden häufige Wörter öfter und früher richtig geschrieben? Und welche Rolle spielt dabei die orthographische Regelhaftigkeit der Wortstrukturen? Unter Zuhilfenahme maschineller Analyseverfahren aus der Großstudie "Automatisierte Rechtschreibdiagnostik" (Fay/Berkling/Stüker 2012) werden diesbezuglich über 1000 Schülertexte von Klasse 2 bis 8 untersucht. Im Ergebnis werden zum einen einige Annahmen, die bislang vor allem auf Erfahrungswerten aus der sprachdidaktischen Arbeit fußten, empirisch bestätigt, zum anderen werden sie hinsichtlich spezifischer Rechtschreibphänomene differenziert und erweitert.
Some structures in printed dictionaries also occur in online dictionaries, some do not occur, some need to be adapted whereas new structures may be introduced in online dictionaries. This paper looks at one type of structure, known in printed dictionaries as outer texts. It is argued that the notions of a frame structure and front and back matter texts do not apply to online dictionaries. The data distribution in online dictionaries does not only target the dictionary articles. There are components outside the word list section of the dictionary. These components are not always texts. They could e.g. also be video clips. Consequently the notion of outer texts in printed dictionaries is substituted by the notion of outer features in online dictionaries. This paper shows how outer features help to constitute a feature compound. The outer features in eight online dictionaries are discussed. Where the users guidelines text is a compulsory outer text in printed dictionaries it seems that an equivalent feature is often eschewed in online dictionaries. A distinction is made between dictionary-internal and dictionary-external outer features, illustrating that outer features can be situated in other sources than the specific dictionary. More research is needed to formulate models for online features that can play a comprehensive role in online dictionaries.
In this contribution, we present a novel approach for the analysis of cross-reference structures in digital dictionaries on the basis of the complete dictionary database. Using paradigmatic items in the German Wiktionary as an example, we show how analyses based on graph theory can be fruitfully applied in this context, e. g. to gain an overview of paradigmatic references as a whole or to detect closely connected groups of headwords. Furthermore, we connect information about cross-reference structures with corpus frequencies and log file statistics. In this way, we can answer questions such as the following ones: Are frequent words paradigmatically linked more closely than others? Are closely linked headwords or headwords that stand more solitary in the dictionary visited significantly more often?
Das Wörterbuch "Neuer Wortschatz" präsentiert den deutschen Wortschatz, der zwischen 2001 und 2010 aufgekommen und in die Allgemeinsprache eingegangen ist. Lexikografisch umfassend beschrieben sind mehr als 570 neue Wörter (z.B. Umweltzone, twittern), neue feste Wortverbindungen (z.B. grünes Rezept, etwas ist kein Ponyhof) und neue Bedeutungen etablierter Wörter (z.B. Heuschrecke 'Finanzinvestor', Stolperstein 'Gedenkstein'). Zu den aus herkömmlichen Wörterbüchern bekannten Angaben z.B. zur Aussprache, Grammatik, Bedeutung treten neue, z.B. zur Wortbildung, zu Enzyklopädischem, die den erhöhten Informationsbedarf in Bezug auf neuen Wortschatz befriedigen helfen. Zusätzlich finden sich neologismusspezifische Angaben zu Aufkommen und Ausbreitung im Erfassungszeitraum - unter Einbeziehung von Zeitverlaufsgrafiken - sowie zur Erstbuchung in einschlägigen Wörterbüchern.
Das Wörterbuch "Neuer Wortschatz" präsentiert den deutschen Wortschatz, der zwischen 2001 und 2010 aufgekommen und in die Allgemeinsprache eingegangen ist. Lexikografisch umfassend beschrieben sind mehr als 570 neue Wörter (z.B. Umweltzone, twittern), neue feste Wortverbindungen (z.B. grünes Rezept, etwas ist kein Ponyhof) und neue Bedeutungen etablierter Wörter (z.B. Heuschrecke 'Finanzinvestor', Stolperstein 'Gedenkstein'). Zu den aus herkömmlichen Wörterbüchern bekannten Angaben z.B. zur Aussprache, Grammatik, Bedeutung treten neue, z.B. zur Wortbildung, zu Enzyklopädischem, die den erhöhten Informationsbedarf in Bezug auf neuen Wortschatz befriedigen helfen. Zusätzlich finden sich neologismusspezifische Angaben zu Aufkommen und Ausbreitung im Erfassungszeitraum - unter Einbeziehung von Zeitverlaufsgrafiken - sowie zur Erstbuchung in einschlägigen Wörterbüchern.
Rassmatrivajutsja novye frazeologizmy nemeckogo jazyka i aspekty ich leksikografičeskogo opisanija v „Nemecko-russkom slovare neologizmov“. Obščaja dolja novych frazeologizmov ot obščego količestva neologizmov nemeckogo jazyka v period s 1991 po 2012 gody sostavljaet okolo šesti procentov. K kategorii frazeologizmov v slovare otnosjatsja ustojčivye sočetanija slov raznoj struktury i stepeni idiomatičnosti. Naibolee mnogočislenny frazeologizmy – imennye gruppy, za nimi sledujut glagol’nye gruppy i frazeologizmy-predloženija. Vyjavljajutsja i opisyvajutsja strukturnye i semantičeskie osobennosti frazeologizmov raznych frazovych kategorij. Osveščajutsja osobennosti podači frazeologizmov v slovnike i tipy leksikografičeskoj informacii v strukture slovarnoj stat’i, učityvajuščie specifiku frazeologičeskich neologizmov kak edinic leksikografičeskogo opisanija.
Abtönung
(2015)
Abstufung
(2015)
Wir können auch Hochdeutsch – Das Institut für Deutsche Sprache in Mannheim – ein Ort der Ideen
(2015)
Der vorliegende Beitrag erkundet den Zusammenhang zwischen der Komplexität politischer Argumentationsprozesse und der Diversifikation der Semantik von Schlüsselwörtern, deren Bedeutung im Argumentationsprozess umkämpft und in zahlreichen Facetten entfaltet widAdegenstand der Untersuchung ist die Verwendung von „Ökologie" in den Schlichtungsgesprächen zum Bahnprojekt Stuttgart 21. Im Unterscheid zu bisher vorliegenden Analysen zu semantischen Kämpfen geht es weniger darum, wie ein Ausdruck von einer Partei im Gegensatz zu anderen semantisiert wird. Es wird vielmehr gezeigt, wie semantische Diversifizierung und Ambiguität von „Ökologie" im expertischen Argumentationsprozess entstehen und welche kommunikativen Effekte dies für die Möglichkeit der Bürgerbeteiligung mit sich bringt. Es werden drei Praktiken identifiziert, mit denen die Interaktionsteilnehmer selbst auf semantische Diversifizierung und Ambiguität reagieren und versuchen, den Ausdruck eindeutig interpretierbar und die Quaestio entscheidbar zu machen: Strategieunterstellungen, Popularisierungen und Populismus. Die Interaktionsanalysen zeigen dabei, dass diese Praktiken selbst die Problematik, die sie lösen sollen, reproduzieren.
Usenet is a large online resource containing user-generated messages (news articles) organised in discussion groups (newsgroups) which deal with a wide variety of different topics. We describe the download, conversion, and annotation of a comprehensive German news corpus for integration in DeReKo, the German Reference Corpus hosted at the Institut für Deutsche Sprache in Mannheim.
This paper discusses computational linguistic methods for the semi-automatic analysis of modality interdependencies (the combination of complex resources such as speaking, writing, and visualizing; MID) in professional crosssituational interaction settings. The overall purpose of the approach is to develop models, methods, and a framework for the description and analysis of MID forms and functions. The paper describes work in progress—the development of an annotation framework that allows annotating different data and file formats at various levels, to relate annotation levels and entries independently of the given file format, and to visualize patterns.
Natural language Processing tools are mostly developed for and optimized on newspaper texts, and often Show a substantial performance drop when applied to other types of texts such as Twitter feeds, Chat data or Internet forum posts. We explore a range of easy-to-implement methods of adapting existing part-of-speech taggers to improve their performance on Internet texts. Our results show that these methods can improve tagger performance substantially.
Das vorliegende Handbuch vermittelt einige ausgewählte Untersuchungsperspektiven auf die Phänomene Wort und Wortschatz. Die einzelnen Beiträge ordnen die Gegenstände in einen jeweils spezifischen Zusammenhang ein und fokussieren dabei auf sprachliche Kontexte, interdisziplinäre Zusammenhänge, methodische Herangehensweisen unter dem Blickwinkel der linguistischen Theorie oder der angewandten Linguistik. Das Konzept des Wortes und des Wortschatzes erhält daher in jedem Beitrag eine eigene Bedeutung und Funktion. In Summe kommt dadurch ein komplexes Verständnis von Wort und Wortschatz zum Ausdruck, das Vielfalt und Interdisziplinarität statt Einschränkung und singuläre Ausrichtung zulässt.
Learning from Errors. Systematic Analysis of Complex Writing Errors for Improving Writing Technology
(2015)
In this paper, we describe ongoing research on writing errors with the ultimate goal to develop error-preventing editing functions in word-processors. Drawing from the state-of-the-art research in errors carried out in various fields, we propose the application of a general concept for action-slips as introduced by Norman. We demonstrate the feasibility of this approach by using a large corpus of writing errors in published texts. The concept of slips considers both the process and the product: some failure in a procedure results in an error in the product, i.e., is visible in the written text. In order to develop preventing functions, we need to determine causes of such visible errors.
The task-oriented and format-driven development of corpus query systems has led to the creation of numerous corpus query languages (QLs) that vary strongly in expressiveness and syntax. This is a severe impediment for the interoperability of corpus analysis systems, which lack a common protocol. In this paper, we present KoralQuery, a JSON-LD based general corpus query protocol, aiming to be independent of particular QLs, tasks and corpus formats. In addition to describing the system of types and operations that Koral- Query is built on, we exemplify the representation of corpus queries in the serialized format and illustrate use cases in the KorAP project.
Vorwort
(2015)
This paper presents a dictionary writing system developed at the Institute for the German Language in Mannheim (IDS) for an ongoing international lexicographical project that traces the way of German loanwords in the East Slavic languages Russian, Belarusian and Ukrainian that were possibly borrowed via Polish. The results will be published in the Lehnwortportal Deutsch (LWP, lwp.ids-mannheim.de), a web portal for loanword dictionaries with German as the common donor language. The system described here is currently in use for excerpting data from a large range of historical and contemporary East Slavic monolingual dictionaries. The paper focuses on the tools that help in merging excerpts that are etymologically related to one and the same Polish etymon. The merging process involves eliminating redundancies and inconsistencies and, above all, mapping word senses of excerpted entries onto a common cross-language set of ‘metasenses’. This mapping may involve literally hundreds of excerpted East Slavic word senses, including quotations, for one ‘underlying’ Polish etymon.
The present thesis introduces KoralQuery, a protocol for the generic representation of queries to linguistic corpora. KoralQuery defines a set of types and operations which serve as abstract representations of linguistic entities and configurations. By combining these types and operations in a nested structure, the protocol may express linguistic structures of arbitrary complexity. It achieves a high degree of neutrality with regard to linguistic theory, as it provides flexible structures that allow for the setting of certain parameters to access several complementing and concurrent sources and layers of annotation on the same textual data. JSON-LD is used as a serialisation format for KoralQuery, which allows for the well-defined and normalised exchange of linguistic queries between query engines to promote their interoperability. The automatic translation of queries issued in any of three supported query languages to such KoralQuery serialisations is the second main contribution of this thesis. By employing the introduced translation module, query engines may also work independently of particular query languages, as their backend technology may rely entirely on the abstract KoralQuery representations of the queries. Thus, query engines may provide support for several query languages at once without any additional overhead. The original idea of a general format for the representation of linguistic queries comes from an initiative called Corpus Query Lingua Franca (CQLF), whose theoretic backbone and practical considerations are outlined in the first part of this thesis. This part also includes a brief survey of three typologically different corpus query languages, thus demonstrating their wide variety of features and defining the minimal target space of linguistic types and operations to be covered by KoralQuery.
Jedes Wort besitzt zwei Geschichten, eine Geschichte seiner Ausdrucksseite und eine seines Inhalts. Beide Seiten entwickeln sich meist, aufgrund der Arbitrarität des sprachlichen Zeichens, unabhängig voneinander, sie können sich jedoch auch wechselseitig beeinflussen. Dieser Beitrag fokussiert beide Seiten der Wortgeschichte: kurz den Wandel der formalen Seite, ausführlicher den Bedeutungswandel mit seinen innovativen Verfahren und die Archaisierung. Dabei wird die Perspektive des Einzelwortes eingenommen, die von der Perspektive des Wortschatzes zu trennen ist. Der Wortschatzwandel umfasst weitere Prozesse, auf die nicht eingegangen wird, so die Vermehrung des Wortschatzes durch Wortbildung und Entlehnung. Aufgrund der Vielfalt der stattfindenden Prozesse strebt dieser Beitrag keine Vollständigkeit an. Zudem können die meisten wortgeschichtlichen Erscheinungen nur kurz charakterisiert und nicht ausführlich diskutiert werden.
Das Wort in der Sprachkritik
(2015)
Wer Sprachkritik betreibt, grenzt sich von allen übrigen Sprachverwendern ab, indem er kritisch wertend die Sprache betrachtet. Diese Bewertungen werden meist am einzelnen Wort, an der Aussage oder der Äußerung vollzogen. In der Sprachkritik kommt der Kritik am einzelnen Wort oder an einer einzelnen Äußerung besondere Bedeutung zu, vollzieht sich unser Denken und unsere Wahrnehmung der Welt doch nicht selten in vorgeprägten Schlag- und Schlüsselwörtern. Dieser Beitrag zur Sprachkritik richtet daher den Fokus auf das Wort als sprachliche Einheit. Nach einer definitorischen Einführung in die Gegenstände und Kriterien der Sprachkritik werden vier Bereiche von wortbezogener Sprachkritik erläutert – politische Sprachkritik, feministische Sprachkritik, Sprachpurismus und medienwirksame Sprachkritik –, wobei das Verhältnis von Wort- und Sachkritik stets mitbetrachtet wird. Dabei wird auch das Spannungsfeld von laienlinguistischer und linguistischer Sprachkritik berücksichtigt, wenn in der Öffentlichkeit die Streitfrage „Wer darf welches Wort inwieweit kritisieren?“ diskutiert wird. Die in Abschnitt 3 gewählten Beispiele sollen dabei dazu dienen, das einzelne Wort oder einen bestimmten Ausdruck als Element sprachkritischer Betrachtung zu fokussieren.
Sinnrelationen wurden lange als stabile Beziehungen zwischen Wörtern betrachtet. Dabei zeigen gebrauchsorientierte Untersuchungen, dass Sinnrelationen dynamische Phänomene sind, die sich kommunikativen Bedürfnissen anpassen. Neuere Studien erforschen die Prozesse, die zur Herstellung von Gegensatz bzw. Ähnlichkeit erforderlich sind. Sie untersuchen variable Strukturen, ihre Funktionen sowie kontextuelle Bedingungen und erklären, warum einige Antonyme bessere Gegensatzpaare bilden als andere. Dieser Beitrag konzentriert sich auf deutsche und englische Synonyme und Antonyme aus korpus- und psycholinguistischer Perspektive. Im Mittelpunkt stehen Beschreibungen kontextbasierter und variabler Strukturen, in denen sinnverwandte Wörter regelhaft vorkommen. Es wird gezeigt, dass diese Strukturen über diverse Funktionen verfügen und dass mithilfe kognitiver Prozesse unterschiedlich stark konventionalisierte Muster entstehen. Traditionelle Klassifikationen und Definitionen werden im Lichte neuer empirischer Studien kritisch hinterfragt. Neuere Theorien, die sich um die Einbettung flexibler Beziehungen bemühen, werden erörtert.
In vielen Theorien zur Sprachproduktion spielt die Einheit Wort eine zentrale Rolle: Bei der Planung einer Äußerung werden vorsprachliche Konzepte angenommen, die jedes für sich einer lexikalischen Komponente für eine geeignete Wortwahl übergeben werden. Eine syntaktische Komponente sorgt für eine angemessene Formulierung. Kollokationen als Wortverbindungen bringen den zusätzlichen Einfluss mit ein, dass Wörter vielfach gemeinsam in präferierten Kombinationen gewählt werden. Dieser fällt aber nur dann auf, wenn das Ergebnis nicht das sonst Erwartbare ist – das allerdings von verschiedenen Faktoren (z. B. der situativen Angemessenheit) abhängig ist. Ein Kollokationsbegriff, der auf Abweichungen aufbaut, trägt nur im Vergleich zu einem nicht pauschal definierbaren Standard. Wenn sich Kollokationen aber im Kern auf Gebrauchspräferenzen zurückführen lassen, sind sie empirisch zugänglich. Kollokationen zeigen sich ermergent im Sprachgebrauch und lassen sich in Korpora aufspüren. Eine Einordnung bezüglich Auffälligkeiten (etwa zur Übersetzungsäquivalenz oder zur Idiomatik) ist jeweils eine perspektiven-bezogene Interpretation des allgemeinen Konzepts.
Wortschatz
(2015)
Die Beschäftigung mit ‚dem Wortschatz‘ ist insofern komplex, als man sich zunächst einer riesigen Menge von Wörtern gegenübersieht. Hilfreich ist es, grundsätzlich zwischen dem Wortschatz einer Sprache und dem Wortschatz einer bestimmten Person(engruppe) zu unterscheiden. Egal, welche Wörtermenge man weiter einkreisen möchte, die Annäherungsschritte sind grundsätzlich die gleichen: sammeln – segmentieren – klassifizieren – interpretieren – ordnen/vernetzen. In dem Beitrag wird für einen dynamischen, prozessualen Wortschatzbegriff plädiert: Die Reflexion über acht Leitfragen soll es Fachleuten wie Laien ermöglichen, das Konzept Wortschatz für ihre Zwecke zu präzisieren: – Wie lässt sich ein Wortschatz ermitteln? – Woraus kann ein Wortschatz bestehen? – Welche Arten von Wortschätzen gibt es? – Auf welcher Textbasis werden Wortschätze erhoben? – Welche Fachdisziplinen widmen sich der Untersuchung von Wortschätzen? – Wie ist ein Wortschatz in sich strukturiert? – Wo (bzw. wie) wird Wortschatz gespeichert? – Wie lassen sich ein Wortschatz und dessen Einheiten adäquat beschreiben?
Handbuch Wort und Wortschatz
(2015)
Was Wort und Wortschatz sind, scheint auf den ersten Blick völlig unstrittig. Aber der sicher geglaubte Begriff des Worts wandelt und verschiebt sich hin zu Wortfügungen und Wortelementen, wenn Methoden aus Mündlichkeitsforschung, kognitiver und Korpuslinguistik einbezogen werden. Das Wort und der Wortschatz, verstanden als beziehungsreiches Gefüge zwischen den nur scheinbar isolierten Einzelwörtern, werden in sprachsystematischen wie anwendungsbezogenen Perspektiven beleuchtet: Bestandteile, aus denen Wörter bestehen, mehr oder weniger feste Wortverbindungen, Wörter in Satz- bzw. Äußerungszusammenhang; Wortschätze betrachtet nach Umfang, Zusammensetzung und Anwendungszweck; Wörter in visuellen Kontexten; Bedeutung und Begriff; Wörter und Wortschätze in sprachkritischer, in diachroner Sicht, in der Rechtschreibung, in der Schönen Literatur, im Wortschatzerwerb und im Wörterbuch. Notwendigerweise wird besonderes Augenmerk auf die aktuelleren methodischen Möglichkeiten wortbezogener Forschung gelegt, insofern sie maßgeblich zu einem flexibilisierten, dynamischen Verständnis des Worts beigetragen haben und beitragen. Die Handbuchbeiträge verbinden grundlegende Informationen zum jeweiligen Thema mit aktuellen Forschungsperspektiven.
In diesem Beitrag werden Teilergebnisse aus einer Untersuchung von zehn einsprachigen deutschen Wörterbüchern (darunter Allgemeine Bedeutungswörterbücher, Lernerwörterbücher und auf Syntagmen fokussierte Spezialwörterbücher) und den darin befindlichen syntagmatischen Verwendungsmustern präsentiert. Zunächst erfolgt eine inhaltliche und terminologische Hinführung. Im Anschluss werden Analyseergebnisse anhand des Beispiellexems Kaffee zusammengefasst dargestellt und diskutiert. Außerdem wird gezeigt, dass Unterschiede in der Auswahl und Aufbereitung der syntagmatischen Verwendungsmuster in Hinblick auf die verschiedenen Wörterbuchtypen bestehen. Ein Einblick in einige zusammenfassende Ergebnisse sowie weitere Forschungsfragen runden den Beitrag ab.
Der valenztheoretischen Behandlung von Argumentstrukturen stehen seit längerer Zeit konstruktionsgrammatische Theorien gegenüber, die die syntaktisch-semantischen Konstruktionen selbst als primäre Objekte der Sprachbeschreibung sehen, welche dann spezifische Lexeme als lexikalische Füllungen selegieren. Die Beiträge dieses Bandes zeigen, dass sich die beiden Ansätze nicht ausschließen müssen, sondern sich bei der theoretischen Modellierung der regelhaften und idiosynkratischen Aspekte von Argumentstrukturen auf fruchtbare Weise ergänzen können. Neben rein theoretisch orientierten Studien enthält der Band Beiträge, deren Gegenstand die Evaluierung von Methoden zur empirischen Fundierung dieser Theorien ist. Zudem wird der Phänomenbereich aus metalexikografischer und aus der Perspektive des Fremd- bzw. Zweitspracherwerbs betrachtet. Zum Teil werden in den Beiträgen kontrastive Analysen vorgenommen, vor allem hinsichtlich des Sprachenpaares Deutsch - Spanisch. Die angewandten Aspekte des Themas werden dabei immer auch an theoretische und empirische Überlegungen rückgebunden. Die Struktur des Bandes reflektiert den Fokus, den die einzelnen Beiträge setzen: Repräsentationen, Konstruktionen, Wortfelder und Methoden.
Positioning
(2015)
Over the last two decades, “positioning” has become an established concept used to elucidate how identities are deployed and negotiated in narratives. This chapter first locates positioning in the larger field of research on identities and discourse. Commonalities and differences in conceptions of positioning are highlighted. In the following, the historical development of theoretical approaches to positioning and their methodological implications are reviewed in more detail. The article closes by taking up two current lines of debate concerning the future development of the concept of positioning.
Pädiatrische Gespräche
(2015)
In this paper, a method for measuring synchronic corpus (dis-)similarity put forward by Kilgarriff (2001) is adapted and extended to identify trends and correlated changes in diachronic text data, using the Corpus of Historical American English (Davies 2010a) and the Google Ngram Corpora (Michel et al. 2010a). This paper shows that this fully data-driven method, which extracts word types that have undergone the most pronounced change in frequency in a given period of time, is computationally very cheap and that it allows interpretations of diachronic trends that are both intuitively plausible and motivated from the perspective of information theory. Furthermore, it demonstrates that the method is able to identify correlated linguistic changes and diachronic shifts that can be linked to historical events. Finally, it can help to improve diachronic POS tagging and complement existing NLP approaches. This indicates that the approach can facilitate an improved understanding of diachronic processes in language change.
Recipient design is a key constituent of intersubjectivity in interaction. Recipient design of turns is informed by prior knowledge about and shared experience with recipients. Designing turns in order to be maximally effective for the particular recipient(s) is crucial for accomplishing intersubjectively coordinated action. This paper reports on a specific pragmatic structure of recipient design, i.e. counter-factual recipient design, and how it impinges on intersubjectivity in interaction. Based on an analysis of video-recordings data from driving school lessons in German, two kinds of counterfactual recipient design of instructors' requests are distinguished: pedagogic and egocentric turn-design. Counterfactual, pedagogic turn-design is used strategically to diagnose student skills and to create opportunities for corrective instructions. Egocentric turn-design rests on private, non-shared knowledge of the instructor. Egocentrically designed turns imply expectations of how to comply with requests which cannot be recovered by the student and which lead to a breakdown of intersubjective cooperation. This paper identifies practices, sources and interactional consequences of these two kinds of counterfactual recipient design. In addition, the study enhances our understanding of recipient design in at least three ways. It shows that recipient design does not only concern referential and descriptive practices, but also the indexing intelligible projections of next actions; it highlights the productive, other-positioning effects of recipient design; it argues that recipient design should be analyzed in terms of temporally extended interactional trajectories, linking turn-constructional practices to interactional histories and consecutive trajectories of joint action.
Mit traditionellen Methoden der Narratologie ist es nur möglich, eine begrenzte Menge von (meist kanonischen) Texten zu untersuchen. Computer hingegen können große Textmengen bewältigen und über die breitere empirische Basis einen neuen Blick auf das literarischen Schaffen eröffnen. Dazu ist es jedoch notwendig, narratologische Konzepte auch automatisch erfassbar zu machen. Die vorliegende Studie untersucht, wie ein etabliertes Phänomen des Erzählens – die Wiedergabe von Rede, Gedanken und Geschriebenem in narrativen Texten – mit Hilfe automatischer Methoden identifiziert werden kann. Auf der Basis narratologischer Forschungsliteratur wird zunächst ein Annotationsystem für Redewiedergabeformen entwickelt und auf ein Beispielkorpus von deutschsprachigen Erzähltexten angewendet. Anschließend werden Methoden zur automatischen Erkennung und deren Ergebnisse vorgestellt. Prototypen der beschriebenen Redewiedergabeerkenner sind online frei verfügbar. Die Studie liefert konkrete Ansätze für die automatische Erkennung von Redewiedergabe und demonstriert zugleich Strategien für die Nutzung von Methoden der Digital Humanities in der Narratologie.
Der Aufsatz untersucht die grammatische Gestaltung zweigliedriger Nominalgruppen mit quantifizierendem nominalem Erstglied (Nquant) und quantifiziertem, durch ein Adjektivattribut erweitertem, nominalem Zweitglied (Adj+N), z.B. (mit) einem Glas kaltem Wasser. In der deutschen Gegenwartssprache ist in solchen Fügungen mit Varianten zu rechnen: (mit) einem Glas kalten Wassers, (mit) einem Glas kaltes Wasser. Insgesamt lassen sich fünf Konstruktionstypen unterscheiden. Anhand einer Belegsammlung aus literarischen Prosatexten vom 17. bis zum 20. Jahrhundert wird insbesondere die quantitative Verteilung von Konstruktionen mit Genitiv vs. Kasusübereinstimmung ins Auge gefasst. Anders als bei Nquant+N-Gruppen ohne Adjektivattribut im Zweitglied zeigt sich ein kräftiger Anstieg im Anteil der Genitivkonstruktion vom 17. bis zum 19. und nur ein leichter Rückgang im 20. Jahrhundert. Dieser Befund stimmt nur zum Teil mit den Darstellungen in der Standardliteratur überein. Eine mögliche Erklärung für die quantitative Entwicklung der Genitivkonstruktion in der Literatursprache liegt im Einfluss normativer Grammatiken.