Refine
Year of publication
- 2017 (370) (remove)
Document Type
- Part of a Book (161)
- Article (101)
- Conference Proceeding (43)
- Book (33)
- Part of Periodical (13)
- Other (7)
- Working Paper (6)
- Report (4)
- Doctoral Thesis (2)
Keywords
- Deutsch (154)
- Korpus <Linguistik> (64)
- Gesprochene Sprache (30)
- Grammatik (22)
- Sprachvariante (22)
- Englisch (14)
- Linguistik (14)
- Sprache (14)
- Diskursanalyse (13)
- Interaktion (13)
Publicationstate
- Veröffentlichungsversion (163)
- Zweitveröffentlichung (87)
- Postprint (20)
- Erstveröffentlichung (1)
- Preprint (1)
Reviewstate
- (Verlags)-Lektorat (135)
- Peer-Review (114)
- Peer-review (12)
- (Verlags-)Lektorat (2)
- Peer-Revied (2)
- (Verlags-)lektorat (1)
- Peer Review (1)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (1)
Publisher
- Institut für Deutsche Sprache (56)
- de Gruyter (50)
- Narr Francke Attempto (39)
- Narr (19)
- De Gruyter (17)
- Verlag für Gesprächsforschung (11)
- Stauffenburg (10)
- Hempen (9)
- Springer (6)
- TUDpress (6)
Lexicographic meaning descriptions of German lexical items which are formally and semantically similar and therefore easily confused (so-called paronyms) often do not reflect their current usage of lexical items. They can even contradict one’s personal intuition or disagree with lexical usage as observed in public discourse. The reasons are manifold. Language data used for compiling dictionaries is either outdated, or lexicographic practice is rather conventional and does not take advantage of corpus-assisted approaches to semantic analysis. Despite of various modern electronic or online reference works speakers face uncertainties when dealing with easily confusable words. These are for example sensibel/sensitiv (sensitive) or kindisch/kindlich (childish/childlike). Existing dictionaries often do not provide satisfactory answers as to how to use these sets correctly. Numerous questions addressed in online forums show where uncertainties with paronyms are and why users demand further assistance concerning proper contextual usage (cf. Storjohann 2015). There are different reasons why users misuse certain items or mix up words which are similar in form and meaning. As data from written and more spontaneous language resources suggest, some confusions arise due to ongoing semantic change in the current use of some paronyms. This paper identifies shortcomings of contemporary German Dictionaries and discusses innovative ways of empirical lexicographic work that might pave the way for a new data-driven, descriptive reference work of confusable German terms. Currently, such a guide is being developed at the Institute for German Language in Mannheim implementing corpora and diverse corpus-analytical methods. Its objective is to compile a dictionary with contrastive entries which is a useful reference tool in situation of language doubt. At the same time, it aims at sensitizing users of context dependency and language change.
Es muss Ende der 1980er/Anfang der 1990er Jahre gewesen sein, dass Gerhard Stickel seiner Umgebung erklärt hat, ein Projekt sei per definitionem etwas, das ein Ende hat. Damals begann das Denken in Projekten und ihren zeitlichen Limitierungen die sprachwissenschaftliche Forschung zu dominieren. Heute nun wollen wir beweisen, dass Projekte ihr Ende überleben können. Dies gilt insbesondere für das deutsch-litauisch-lettisch-estnische Projekt KoGloss (Kollaboratives korpusbasiertes Konstruktions-Glossar), das von Januar 2011 bis Dezember 2012 von der EU im Programm Lifelong Learning gefördert wurde. Gerhard Stickel hat es als Experte begleitet. Das Weiterleben des Projekts über sein Finanzierungsende hinaus wird in diesem Beitrag beschrieben.
Schülerduden Grammatik
(2017)
Das Deutsche gehört zu den besonders gut erforschten Sprachen der Welt. Neue Erkenntnisse über seine Grammatik sind am ehesten durch eine Ausweitung der Perspektive über den traditionellen Ansatz hinaus zu erwarten. Im vorliegenden Handbuch zur Nominalgrammatik geschieht dies auf dem Weg des Sprachvergleichs mit anderen europäischen Sprachen, in erster Linie den Kontrastsprachen Englisch, Französisch, Polnisch und Ungarisch. Die Grammatik schließt an die typologische Forschung an und orientiert den Vergleich an allgemeinen semantisch-pragmatischen Funktionsbereichen, so genannten ,funktionalen Domänen‘ wie Referenz, Identifikation, Modifikation. Behandelt werden nominale Wortklassen (wie Substantiv, Adjektiv, Pronomen), das nominale Klassifikationssystem (mit Genus, Numerus und Kasus), die nominale Flexionsmorphologie sowie nominale Syntagmen mit dem Schwerpunkt der NP-Syntax. Der Vergleich stellt die Optionen im Vergleichsspektrum heraus, von denen das Deutsche Gebrauch macht, zeigt aber auch, welche Möglichkeiten nicht realisiert sind, und lässt somit das typologische Profil dieser Sprache im Detail erkennen.
Der Themenkreis dieses Bandes umfasst Fragen der system- und normbezogenen Deskription des Gegenwartsdeutschen unter Berücksichtigung seiner Variierung und Dynamik, darunter insbesondere in den Bereichen des Wortschatzes, der Grammatik, der Textlinguistik und der kontrastiven Sprachforschung, der Sprachpolitik, der Sprachkultur sowie der Sprachdidaktik und des Faches “;Deutsch als Fremdsprache”. Die einzelnen Beiträge können vier zentralen und miteinander verschränkten Arbeitsfeldern zugeordnet werden: “Das Deutsche in der Welt”, “Der Wortschatz in Bewegung”, “In den Tiefen der Grammatik” und “Blicke auf den Sprachgebrauch”.
Personen als Akteure
(2017)
Die besondere Funktion der Akteure im Diskurs besteht darin, Sinn zu schaffen und gleichzeitig selbst Sinnträger zu sein. Akteure sind alle an einem Diskurs einzeln oder kollektiv Beteiligten, die dessen Struktur bestimmen. Der Beitrag modelliert unter dieser Voraussetzung komplexe Akteurskonstellationen, beginnend mit der akteursneutralen Initialphase im diskursiven Raum. Die Diskursprogression ist dann von unterschiedlichen Akteurspositionen gekennzeichnet, die nach der Position der den Diskurs im Hinblick auf Serialität und Pluralität prägenden Diskursgemeinschaft, der Position der Eliten, die diskurssteuernde Funktion haben, sowie der Position der Konsumenten mit rein adressatenbezogener Funktion unterscheidbar sind. Als Effekte der Positionen der Diskursgemeinschaft und der Eliten werden anschließend Konsensualitäts- und Agonalitätsphänomene dargestellt. Die den Diskurs beeinflussende Domänenzugehörigkeit der Beteiligten wird abschließend als weiterer akteursbezogener Faktor in die Modellierung einbezogen.
Begegnungen mit neuen Wörtern: Zu lexikografischen Praktiken im Neologismenwörterbuch des IDS
(2017)
Loblied auf Gerhard Stickel
(2017)
Schriften
(2017)
Vorwort
(2017)
Was macht Stickel?
(2017)
Catching the common cause: extraction and annotation of causal relations and their participants
(2017)
In this paper, we present a simple, yet effective method for the automatic identification and extraction of causal relations from text, based on a large English-German parallel corpus. The goal of this effort is to create a lexical resource for German causal relations. The resource will consist of a lexicon that describes constructions that trigger causality as well as the participants of the causal event, and will be augmented by a corpus with annotated instances for each entry, that can be used as training data to develop a system for automatic classification of causal relations. Focusing on verbs, our method harvested a set of 100 different lexical triggers of causality, including support verb constructions. At the moment, our corpus includes over 1,000 annotated instances. The lexicon and the annotated data will be made available to the research community.
In this paper, an exploratory data-driven method is presented that extracts word-types from diachronic corpora that have undergone the most pronounced change in frequency of occurrence in a given period of time. Combined with statistical methods from time series analysis, the method is able to find meaningful patterns and relationships in diachronic corpora, an idea that is still uncommon in linguistics. This indicates that the approach can facilitate an improved understanding of diachronic processes.
Historical sociolinguistics in colonial New Guinea: The Rhenish mission society in the Astrolabe Bay
(2017)
The Rhenish Mission Society, a German Protestant mission, was active in a small part of northern New Guinea, the Astrolabe Bay, between 1887 and 1932. Up until 1914, this region was under German colonial rule. The German dominance was also reflected in rules on language use in official contexts such as schools and administration.
Missionaries were strongly affected by such rules as their most important tool in mission work was language. In addition, they were also responsible for school education as most schools in the German colonial areas in the Pacific were mission-run. Thus, mission societies had to make decisions about what languages to use, considering their own needs, their ideological convictions, and the colonial government’s requirements. These considerations were framed by the complex setting of New Guinea’s language wealth where several hundred languages were, and still are, spoken.
This paper investigates a small set of original documents from the Rhenish Mission Society to trace what steps were taken and what considerations played a major role in the process of agreeing on a suitable means of communication with the people the missionaries wanted to reach, thereby touching upon topics such as language attitudes, language policies and politics, practical considerations of language learning and language spread, and colonial actions impacting local language ecologies.
Analepses with topic-drop are frequent structures in German interaction. While hitherto the focus on analepses was a rather syntactic one, this paper deals with analeptic structures from a semantic perspective. It particularly concentrates on the semantic relations between the referents of the analepses and the prior interactional context. This analysis shows that even for rather simple analepses which just omit a constituent from the prior utterance, conceptual processes are more decisive for its interpretation than syntactic features of the antecedent constituents. This is even more the case for complex analepses that are only indirectly linked to the prior context, and for the interpretation of which hearers need to draw inferences. The paper argues that theoretical approaches like Conversation Analysis and Interactional Linguistics can profit from adopting a semantic and conceptual perspective for the interpretation of interactional structures.
In diesem Aufsatz wird einzelfallanalytisch der Frage nachgegangen, wie die Struktur einer Kirchenbesichtigung aussieht. Im theoretischen Rahmen, der die Kirchenbesichtigung als kulturelle Praktik konzeptualisiert, wird „Objektkonstitution“ als eine aktive Leistung des Kirchenbesichtigers in den Blick genommen. Bei den Aufnahmen zum Kirchenbesichtigungskorpus wurden die Besichtiger nicht nur bei ihrem Gang durch den Kirchenraum und der visuellen Wahrnehmung bestimmter Raumaspekte gefilmt. Sie wurden vielmehr darum gebeten, ihre visuelle Wahrnehmung durch begleitendes Sprechen auch zu kommentieren. Aufgezeichnet wurde das Besichtigungskorpus mit zwei Kameras: einer Actionkamera, die den Wahrnehmungsraum der Besichtiger dokumentiert, und einer Kontextkamera, die ihnen bei ihrem Weg durch den Raum folgt.
Dieses experimentelle Erhebungsdesign, bei dem exothetisches Sprechen bewusst als wissenschaftliche Erhebungsmethode eingesetzt wird, macht es möglich, das Besichtigungskonzept der Personen als dynamisches Zusammenspiel ihrer visuellen Wahrnehmung des Kirchenraums und ihrer wahrnehmungsbegleitenden Exothese zu rekonstruieren. Dass Objektkonstitution eine aktive Herstellung ist, durch die der Kirchenraum in den Relevanzen seines Betrachters teilweise neu entsteht, zeigt die Fallanalyse in exemplarischer Klarheit: Anton, der analysierte Besichtiger, der sich ausführlich mit zwei großen Gemälden beschäftigt, konstituiert diese de facto als „Bilderrahmen“, ohne überhaupt auf die dargestellten Szenen einzugehen.
Das Konzept De-facto-Didaktik ist der theoretische Rahmen, in dem wir aus multimodal-interaktionsanalytischer Sicht Unterrichtskommunikation analysieren. Es integriert neue Entwicklungen im Bereich Interaktionstheorie, empirische Interaktionsanalyse und Raumlinguistik. Aus einer dezidiert interaktionistischen Perspektive fokussiert das Konzept zunächst bewusst allgemeine Anforderungen der Interaktionskonstitution, um spezifische Aspekte der Unterrichtskommunikation - im konkreten Fall primär das didaktische Handeln der Lehrer - neu perspektivieren zu können. Wie immer man das Geschehen im Unterricht auch konzeptualisieren mag, es ist und bleibt in seiner grundlegenden Struktur und - jenseits seiner institutionellen Prägung und Bedingtheit - ein Ereignis, das in der konkreten Interaktionsarchitektur des Klassenraums, sequenziell-simultan durch das multimodale Verhalten aller Anwesenden gemeinsam hervorgebracht wird. Dabei unterliegen alle Beteiligten ungeachtet ihrer besonderen Beteiligungsrolle den Bedingungen der Interaktionskonstitution.
Wir werden nachfolgend die interaktionstheoretischen Grundlagen skizzieren, auf der unsere Methode der de-facto-didaktisehen Analyse basiert, und führen dann an einem ausgewählten Beispiel vor, wodurch sich dieser analytische Zugang auszeichnet. Zum Abschluss weisen wir nach einem fallspezifischen Resümee auf die anwendungsbezogene Relevanz de-facto-didaktischer Analysen hin.
Das Deutsche gehört zu den besonders gut erforschten Sprachen der Welt. Neue Erkenntnisse über seine Grammatik sind am ehesten durch eine Ausweitung der Perspektive über den traditionellen Ansatz hinaus zu erwarten. Im vorliegenden Handbuch zur Nominalgrammatik geschieht dies auf dem Weg des Sprachvergleichs mit anderen europäischen Sprachen, in erster Linie den Kontrastsprachen Englisch, Französisch, Polnisch und Ungarisch. Die Grammatik schließt an die typologische Forschung an und orientiert den Vergleich an allgemeinen semantisch-pragmatischen Funktionsbereichen, so genannten ,funktionalen Domänen‘ wie Referenz, Identifikation, Modifikation. Behandelt werden nominale Wortklassen (wie Substantiv, Adjektiv, Pronomen), das nominale Klassifikationssystem (mit Genus, Numerus und Kasus), die nominale Flexionsmorphologie sowie nominale Syntagmen mit dem Schwerpunkt der NP-Syntax. Der Vergleich stellt die Optionen im Vergleichsspektrum heraus, von denen das Deutsche Gebrauch macht, zeigt aber auch, welche Möglichkeiten nicht realisiert sind, und lässt somit das typologische Profil dieser Sprache im Detail erkennen.
Die Guidelines sind eine Erweiterung des STTS (Schiller et al. 1999) für die Annotation von Transkripten gesprochener Sprache. Dieses Tagset basiert auf der Annotation des FOLK-Korpus des IDS Mannheim (Schmidt 2014) und es wurde gegenüber dem STTS erweitert in Hinblick auf typisch gesprochensprachliche Phänomene bzw. Eigenheiten der Transkription derselben. Es entstand im Rahmen des Dissertationsprojekts „POS für(s) FOLK – Entwicklung eines automatisierten Part-of-Speech-Tagging von spontansprachlichen Daten“ (Westpfahl 2017 (i.V.)).
Sound units play a pivotal role in cognitive models of auditory comprehension. The general consensus is that during perception listeners break down speech into auditory words and subsequently phones. Indeed, cognitive speech recognition is typically taken to be computationally intractable without phones. Here we present a computational model trained on 20 hours of conversational speech that recognizes word meanings within the range of human performance (model 25%, native speakers 20–44%), without making use of phone or word form representations. Our model also generates successfully predictions about the speed and accuracy of human auditory comprehension. At the heart of the model is a ‘wide’ yet sparse two-layer artificial neural network with some hundred thousand input units representing summaries of changes in acoustic frequency bands, and proxies for lexical meanings as output units. We believe that our model holds promise for resolving longstanding theoretical problems surrounding the notion of the phone in linguistic theory.
Grammatische Variation ist der Sprache inhärent und auch aus dem Standarddeutschen nicht wegzudenken. Man beobachtet, dass ein und dieselbe grammatische, semantische oder pragmatische Funktion mit unterschiedlichen grammatischen Mitteln realisiert wird, und umgekehrt, dass eine grammatische Struktur unterschiedliche Funktionen ausüben kann. Die Variation kann mit grammatikinternen Faktoren, grammatikexternen Parametern wie Medium oder Textsorte und außersprachlichen Dimensionen wie Zeit oder Raum korrelieren. In diesem Band werden zunächst verschiedene Perspektiven auf Variation fokussiert wie die historische, die laienlinguistische, die lernerorientierte, die geographische oder die medienorientierte Sicht. Im Weiteren wird in exemplarischen Studien gezeigt, wie grammatische Variation mit Methoden der Korpus-, Computer-, Psycho- und Neurolinguistik empirisch erschlossen wird. Schließlich werden ausgewählte Variationsphänomene aus den Bereichen Phonologie, Morphologie und Syntax analysiert, und es wird demonstriert, wie sich die aktuelle Grammatikforschung zwischen der immer weiter gehenden Spezifizierung von Variationsgründen und der Annahme der freien Variation sowie zwischen Empirie und Theorie hin- und herbewegt.
Einleitung
(2017)
Standardisierte statistische Auswertungen von Korpusdaten im Projekt "Korpusgrammatik" (KoGra-R)
(2017)
Wir zeigen anhand dreier Beispielanalysen, wie das im IDS-Projekt „Korpusgrammatik“ entwickelte Auswertungstool KoGra-R in der quantitativlinguistischen Forschung zur Analyse von Frequenzdaten auf mehreren linguistischen Ebenen eingesetzt werden kann. Wir demonstrieren dies anhand regionaler Präferenzen bei der Selektion von Genitivallomorphen, der Variation von Relativpronomina sowie der Verwendung bestimmter anaphorischer Ausdrucke in Abhängigkeit davon, ob sich das Antezedens im gleichen Satz befindet oder nicht. Die in KoGra-R implementierten statistischen Tests sind für jede dieser Ebenen geeignet, um mindestens einen ersten statistisch abgesicherten Eindruck der Datenlage zu erlangen.
KorAP, die neue Korpusanalyseplattform des IDS, die COSMAS II im Laufe der kommenden 2–3 Jahre ablösen wird, bietet gerade zur Erforschung grammatischer Variation einige besondere Funktionalitäten. Grundlegend ist beispielsweise, dass KorAP die Repräsentation und Abfrage beliebiger und beliebig vieler Annotationsschichten, zum Beispiel zu Konstituenz- und Dependenzrelationen, unterstutzt und damit die Suche nach speziellen grammatischen Phänomenen erleichtert oder erst möglich macht. Darüber hinaus unterstutzt KorAP die Konstruktion virtueller Korpora anhand von Metadatenvariablen und erleichtert damit kontrastive Untersuchungen. Der vorliegende Artikel erläutert die für die grammatische Variationsforschung relevanten KorAP-Funktionalitäten im Einzelnen und gibt einen Einblick in ihre Grundlagen.
Eine reichhaltige Auszeichnung mit Metadaten ist für alle Arten von Korpora für die linguistische Forschung wünschenswert. Für große Korpora (insbesondere Webkorpora) müssen Metadaten automatisch erzeugt werden, wobei die Genauigkeit der Auszeichnung besonders kritisch ist. Wir stellen einen Ansatz zur automatischen Klassifikation nach Themengebiet (Topikdomäne) vor, die auf dem lexikalischen Material in Texten basiert. Dazu überführen wir weniger gut interpretierbare Ergebnisse aus einer so genannten Topikmodellierung mittels eines überwachten Lernverfahrens in eine besser interpretierbare Kategorisierung nach 13 Themengebieten. Gegenüber (automatisch erzeugten) Klassifikationen nach Genre, Textsorte oder Register, die zumeist auf Verteilungen grammatischer Merkmale basieren, erscheint eine solche thematische Klassifikation geeigneter, um zusätzliche Kontrollvariablen für grammatische Variationsstudien bereitzustellen. Wir evaluieren das Verfahren auf Webtexten aus DECOW14 und Zeitungstexten aus DeReKo, für die jeweils getrennte Goldstandard-Datensätze manuell annotiert wurden.
Multinomial processing tree (MPT) models are a class of measurement models that account for categorical data by assuming a finite number of underlying cognitive processes. Traditionally, data are aggregated across participants and analyzed under the assumption of independently and identically distributed observations. Hierarchical Bayesian extensions of MPT models explicitly account for participant heterogeneity by assuming that the individual parameters follow a continuous hierarchical distribution.We provide an accessible introduction to hierarchical MPT modeling and present the user-friendly and comprehensive R package TreeBUGS, which implements the two most important hierarchical MPT approaches for participant heterogeneity—the beta-MPT approach (Smith & Batchelder, Journal of Mathematical Psychology 54:167-183, 2010) and the latent-trait MPT approach (Klauer, Psychometrika 75:70-98, 2010). TreeBUGS reads standard MPT model files and obtains Markov-chain Monte Carlo samples that approximate the posterior distribution. The functionality and output are tailored to the specific needs of MPT modelers and provide tests for the homogeneity of items and participants, individual and group parameter estimates, fit statistics, and within- and between-subjects comparisons, as well as goodness-of-fit and summary plots. We also propose and implement novel statistical extensions to include continuous and discrete predictors (as either fixed or random effects) in the latent-trait MPT model.
Ende des 18. Jahrhunderts ist eine Form der deutschen Sprache ausgebildet und verbreitet, die für die verschiedenartigen Anforderungen einer bürgerlich geprägten öffentlichen Diskurswelt brauchbar ist. Sie lässt sich in einem historischen Konzept „Standardsprache“ deuten. In diesem Konzept werden verschiedene Ausgleichs- und Differenzierungsbemühungen – und -richtungen – des 17. Jahrhunderts aufgehoben, die entwickelten Möglichkeiten neu funktionalisiert. Von dieser Basis aus gesehen ist in der Gegenwart die kommunikative Praxis mit Anspruch auf öffentliche Geltung stark von Variation geprägt. Durch die dabei auftretenden Muster wird allmählich ein Modell kontextbezogener Variabilität etabliert, bei dem so etwas wie „Standard“ in einer Bandbreite von Konstellationen der Interaktion, sprachlichen Modellen und Ausdrucksweisen besteht. Um dieses normative Gefüge modellieren zu können, muss man, wie beispielhaft angedeutet wird, zunächst die Tatbestande und Bedingungen der Varianten genau untersuchen.