Refine
Year of publication
- 2017 (221) (remove)
Document Type
- Part of a Book (95)
- Article (62)
- Book (26)
- Conference Proceeding (24)
- Other (5)
- Working Paper (5)
- Report (3)
- Part of Periodical (1)
Is part of the Bibliography
- yes (221) (remove)
Keywords
- Deutsch (98)
- Korpus <Linguistik> (48)
- Gesprochene Sprache (29)
- Grammatik (12)
- Wörterbuch (11)
- Diskursanalyse (10)
- Interaktion (10)
- Konversationsanalyse (9)
- Rezension (9)
- Computerunterstützte Lexikographie (8)
Publicationstate
- Veröffentlichungsversion (103)
- Zweitveröffentlichung (26)
- Postprint (12)
- Erstveröffentlichung (1)
- Preprint (1)
Reviewstate
- Peer-Review (71)
- (Verlags)-Lektorat (60)
- Peer-review (11)
- (Verlags-)Lektorat (2)
- Peer-Revied (2)
- (Verlags-)lektorat (1)
Publisher
- de Gruyter (26)
- Institut für Deutsche Sprache (20)
- De Gruyter (17)
- Narr Francke Attempto (17)
- Narr (10)
- Verlag für Gesprächsforschung (10)
- Hempen (9)
- Stauffenburg (7)
- TUDpress (6)
- Heidelberg University Publishing (5)
Harold Garfinkel, Begründer der Ethnomethodologie, wäre dieses Jahr 100 Jahre alt geworden, seine Studies in Ethnomethodology werden 50 Jahre. Grund genug diesen doppelten Geburtstag mit einer Tagung zur "deutschsprachigen Vorge-schichte, Wirkung und Rezeption des Werkes und der Person zu würdigen" (so der Ankündigungstext zur Tagung), die nicht ganz zufällig in Konstanz stattfand, lange Zeit und nach wie vor eine Hochburg rekonstruktiver Sozialforschung (auch) ethnomethodologischer Prägung. Die Tagung Harold Garfinkel's 'Studies in Ethnomethodolgy' – Fifty Years After vom 26.-28.10.2017 an der Universität Konstanz, ausgerichtet vom Lehrstuhl für Allgemeine Soziologie und Kultursoziologie und organisiert von Jörg Bergmann, Christian Meyer und Erhard Schüttpelz, tat dies in einer gebührlichen und beson-deren Weise: Die acht Kapitel der Studies in Ethnomethodology (im Folgenden kurz Studies), ein Konvolut aus Essays und Artikeln, die 1967 erschienen sind, dienten als Grundlage zur Strukturierung der Tagung und als Ausgangspunkt der einzelnen Vorträge.
Die folgenden Ausführungen zur Maskierung basieren auf den Erfahrungen bei der Aufbereitung der Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für die Veröffentlichung in der Datenbank für Gesprochenes Deutsch (DGD). Sie sollen anderen Forschern und Forschungsprojekten als praktische Hilfestellung für die Maskierung von Aufnahmen dienen, können aber selbstverständlich nicht die gesamte Bandbreite von Einzelfallentscheidungen und Pflichten der Forschenden abdecken.
Es werden sowohl allgemeine Hinweise zur Maskierung von Audio- und Videoaufnahmen gegeben als auch praktische Tipps zur Umsetzung der Maskierung mit dem Transkriptionseditor FOLKER.
Die in den Ausführungen geschilderten arbeitsteiligen Prozesse in größeren Projekten können in kleineren Projekten einzelner Forscher selbstverständlich auch von einer einzelnen Person ausgeführt werden.
This paper presents a short insight into a new project at the "Institute for the German Language” (IDS) (Mannheim). It gives an insight into some basic ideas for a corpus-based dictionary of spoken German, which will be developed and compiled by the new project "The Lexicon of spoken German” (Lexik des gesprochenen Deutsch, LeGeDe). The work is based on the "Research and Teaching Corpus of Spoken German” (Forschungs- und Lehrkorpus Gesprochenes Deutsch, FOLK), which is implemented in the "Database for Spoken German” (Datenbank für Gesprochenes Deutsch, DGD). Both resources, the database and the corpus, have been developed at the IDS.
This article explores how close one can come to a cultural-scientific perspective on the basis of a constitution-analytical methodology. We do this on the basis of a comparison of the celebration of Totensonntag in Zotzenbach (Southern Hesse) and Sarepta (Wolgograd). In both places, there are protestant churches that perform this ritual to commemorate the dead on this “Sunday of the Dead” as a part of their church service. Our scientific interest lies in the reconstruction of the rituality produced during the in situ execution. In both services, the names of the deceased are read out and a candle is lit for each deceased person. In Zotzenbach the priest reads out the names and an assistant ignites the candles for the deceased, whereas in Sarepta the bereaved are responsible for this. Since the ritual is organised in very different ways in terms of architecture-for-interaction (statically in Zotzenbach, spatially dynamic in Sarepta), we can reconstruct two completely different models of rituality: a demonstrative one (Zotzenbach) and a participative one (Sarepta). The demonstrative model works on the basis of a finely tuned coordination between the two church representatives and is aimed at a dignified execution. The model in Sarepta is not suitable for the production of formality due to its participatory structure. Here, however, the focus is also on the aspect of socialization, which goes beyond the church service and offers the Russian-German worshipers the opportunity to situationally constitute as a culturally homogeneous group.
Der vorliegende Beitrag beschreibt auf der Basis authentischer Alltagsinteraktionen das Formen- und Funktionsspektrum der äußerungsmodalisierenden Kommen-tarphrase ohne Scheiß im gesprochenen Deutsch. Die Konstruktion wird von Inter-agierenden insbesondere als Ressource zur Steigerung des Geltungsanspruchs einer Bezugsäußerung genutzt, wodurch diese als wahr und/oder ernstgemeint modali-siert wird. Damit leistet ohne Scheiß einen wichtigen Beitrag zur Bearbeitung des Erwartungsmanagements durch den/die SprecherIn sowie zur Herstellung von In-tersubjektivität. Die Konstruktion ist syntaktisch variabel und kann somit Äußerun-gen sowohl prospektiv als auch retraktiv modalisieren. Zudem wird mit der Wahl des Lexem Scheiß ein nähesprachliches Register aktiviert, was in Verbindung mit weiteren (prosodischen und/oder lexikalischen) Elementen zu affektiver Aufladung führen kann. Eine abschließende Darstellung häufiger lexikalischer Kookkurrenz-partner und deren funktionaler Bedeutung sowie ein Abgleich zu intrakonstruktio-nalen Varianten wie ohne Witz/ohne Spaß zeigt die Produktivität der Konstruktion im alltäglichen Sprachgebrauch auf.
We present a major step towards the creation of the first high-coverage lexicon of polarity shifters. In this work, we bootstrap a lexicon of verbs by exploiting various linguistic features. Polarity shifters, such as ‘abandon’, are similar to negations (e.g. ‘not’) in that they move the polarity of a phrase towards its inverse, as in ‘abandon all hope’. While there exist lists of negation words, creating comprehensive lists of polarity shifters is far more challenging due to their sheer number. On a sample of manually annotated verbs we examine a variety of linguistic features for this task. Then we build a supervised classifier to increase coverage. We show that this approach drastically reduces the annotation effort while ensuring a high-precision lexicon. We also show that our acquired knowledge of verbal polarity shifters improves phrase-level sentiment analysis.
In the NLP literature, adapting a parser to new text with properties different from the training data is commonly referred to as domain adaptation. In practice, however, the differences between texts from different sources often reflect a mixture of domain and genre properties, and it is by no means clear what impact each of those has on statistical parsing. In this paper, we investigate how differences between articles in a newspaper corpus relate to the concepts of genre and domain and how they influence parsing performance of a transition-based dependency parser. We do this by applying various similarity measures for data point selection and testing their adequacy for creating genre-aware parsing models.
The possibilities of re-use and archiving of spoken and written corpora are affected by personality rights (depending on legal tradition also called: the right of publicity), copyright law and data protection / privacy laws. These recommendations include information about legal aspects which should be considered while creating corpora to ensure the greatest archivability and re-usability possible in compliance with current laws.
The information compiled here shall serve researchers who plan to create corpora or who are involved in evaluation of such measures as a guideline. This information is not exhaustive or to be considered as legal advice. Researchers should consult institutional legal departments and management before making legally relevant decisions. That said, further legal expertise should be sought if possible as early as project planning phases.
Gesprochene Alltagssprache
(2017)
This paper deals with the creation of the first morphological treebank for German by merging two pre-existing linguistic databases. The first of these is the linguistic database CELEX which is a standard resource for German morphology. We build on its refurbished and modernized version. The second resource is GermaNet, a lexical-semantic network which also provides partial markup for compounds. We describe the state of the art and the essential characteristics of both databases and our latest revisions. As the merging involves two data sources with distinct annotation schemes, the derivation of the morphological trees for the unified resource is not trivial. We discuss how we overcome problems with the data and format, in particular how we deal with overlaps and complementary scopes. The resulting database comprises about 100,000 trees whose format can be chosen according to the requirements of the application at hand. In our discussion, we show some future directions for morphological treebanks. The Perl script for the generation of the data from the sources will be made publicly available on our website.
This paper discusses how cognitive aspects can be incorporated into lexicographic meaning descriptions based on corpus-driven analysis. The new German Online dictionary “Paronyme − Dynamisch im Kontrast” is concerned with easily confused words such as effektiv/effizient, sensibel/sensitiv. It is currently in the process of being developed and it aims at adopting a more conceptual and encyclopedic approach to meaning. Contrastive entries emphasize usage, comparing conceptual categories and indicating the mapping of knowledge. Adaptable access to lexicographic details offers different perspectives on information, and authentic examples reflect prototypical structures.
Some of the cognitive features are demonstrated with the help of examples. Firstly, I will outline how patterns of usage imply conceptual categories as central ideas instead of sufficiently logical criteria of semantic distinction. In this way, linguistic findings correlate better with how users conceptualize language. Secondly, it is pointed out how collocates are family members and fillers in contexts. Thirdly, I will demonstrate how contextual structure and function are included by summarizing referential information. Details are drawn from corpus data; they are usage-based patterns illustrating conversational interaction and semantic negotiation in contemporary public discourse. Finally, I will show flexible consultation routines where the focus on structural knowledge changes.
This paper gives an insight into the basic concepts for a corpus-based lexical resource of spoken German, which is being developed by the project "The Lexicon of Spoken German"(Lexik des gesprochenen Deutsch, LeGeDe) at the "Institute for the German Language" (Institut für Deutsche Sprache, IDS) in Mannheim. The focus of the paper is on initial ideas of semi-automatic and automatic resources that assist the quantitative analysis of the corpus data for the creation of dictionary content. The work is based on the "Research and Teaching Corpus of Spoken German" (Forschungs- und Lehrkorpus Gesprochenes Deutsch, FOLK).
This paper discusses changes of lexicographic traditions with respect to approaches to meaning descriptions towards more cognitive perspectives. I will uncover how cognitive aspects can be incorporated into meaning descriptions based on corpus-driven analysis. The new German Online dictionary “Paronyme − Dynamisch im Kontrast” (Storjohann 2014; 2016) is concerned with easily confused words such as effektiv/effizient, sensibel/sensitiv. It is currently in the process of being developed and it aims at adopting a more conceptual and encyclopaedic approach to meaning by incorporating cognitive features. As a corpus-guided reference work it strives to adequately reflect ideas such as conceptual structure, categorisation and knowledge. Contrastive entries emphasise aspects of usage, comparing conceptual categories and indicate the (metonymic) mapping of knowledge. Adaptable access to lexicographic details and variable search options offer different foci and perspectives on linguistic information, and authentic examples reflect prototypical structures. Some of the cognitive features are demonstrated with the help of examples. Firstly, I will outline how patterns of usage imply conceptual categories as central ideas instead of sufficiently logical criteria of semantic distinction. In this way, linguistic findings correlate better with how users conceptualise language. Secondly, it is pointed out how collocates are treated as family members and fillers in contexts. Thirdly, I will demonstrate how contextual structure and functions are included summarising referential information. Details are drawn from corpus data, they are usage-based linguistic patterns illustrating conversational interaction and semantic negotiations in contemporary public discourse. Finally, I will outline consultation routines which activate different facets of structural knowledge, e.g. through changes of the ordering of information or through the visualisation of semantic networks.
Das Verb machen im gesprochenen Deutsch. Bedeutungskonstitution und interaktionale Funktionen
(2017)
Die Arbeit untersucht unter anderem sowohl die semantischen Interpretationen von machen als auch seine pragmatischen Funktionen in der Interaktion, diskutiert die Behandlung von machen in der Lexikographie und liefert dazu einen Vergleich mit der Bedeutung und Funktion des Verbs tun in der gesprochenen Sprache. Außerdem wird die Konstitution von Bedeutung am Beispiel von machen anhand eines eigens entwickelten Ebenenmodells dargestellt, durch welches sich die einzelnen (außer-)sprachlichen Ebenen jeweils abgrenzen und einzeln beschreiben lassen. Die Analysen basieren dabei auf der Grundlage aktueller und spontansprachlicher Interaktionen unterschiedlicher Gesprächstypen.
Languages employ different strategies to transmit structural and grammatical information. While, for example, grammatical dependency relationships in sentences are mainly conveyed by the ordering of the words for languages like Mandarin Chinese, or Vietnamese, the word ordering is much less restricted for languages such as Inupiatun or Quechua, as these languages (also) use the internal structure of words (e.g. inflectional morphology) to mark grammatical relationships in a sentence. Based on a quantitative analysis of more than 1,500 unique translations of different books of the Bible in almost 1,200 different languages that are spoken as a native language by approximately 6 billion people (more than 80% of the world population), we present large-scale evidence for a statistical trade-off between the amount of information conveyed by the ordering of words and the amount of information conveyed by internal word structure: languages that rely more strongly on word order information tend to rely less on word structure information and vice versa. Or put differently, if less information is carried within the word, more information has to be spread among words in order to communicate successfully. In addition, we find that–despite differences in the way information is expressed–there is also evidence for a trade-off between different books of the biblical canon that recurs with little variation across languages: the more informative the word order of the book, the less informative its word structure and vice versa. We argue that this might suggest that, on the one hand, languages encode information in very different (but efficient) ways. On the other hand, content-related and stylistic features are statistically encoded in very similar ways.
The Google Ngram Corpora seem to offer a unique opportunity to study linguistic and cultural change in quantitative terms. To avoid breaking any copyright laws, the data sets are not accompanied by any metadata regarding the texts the corpora consist of. Some of the consequences of this strategy are analyzed in this article. I chose the example of measuring censorship in Nazi Germany, which received widespread attention and was published in a paper that accompanied the release of the Google Ngram data (Michel et al. (2010): Quantitative analysis of culture using millions of digitized books. Science, 331(6014): 176–82). I show that without proper metadata, it is unclear whether the results actually reflect any kind of censorship at all. Collectively, the findings imply that observed changes in this period of time can only be linked directly to World War II to a certain extent. Therefore, instead of speaking about general linguistic or cultural change, it seems to be preferable to explicitly restrict the results to linguistic or cultural change ‘as it is represented in the Google Ngram data’. On a more general level, the analysis demonstrates the importance of metadata, the availability of which is not just a nice add-on, but a powerful source of information for the digital humanities.
In this paper, we will present a first attempt to classify commonly confused words in German by consulting their communicative functions in corpora. Although the use of so-called paronyms causes frequent uncertainties due to similarities in spelling, sound and semantics, up until now the phenomenon has attracted little attention either from the perspective of corpus linguistics or from cognitive linguistics. Existing investigations rely on structuralist models, which do not account for empirical evidence. Still, they have developed an elaborate model based on formal criteria, primarily on word formation (cf. Lăzărescu 1999). Looking from a corpus perspective, such classifications are incompatible with language in use and cognitive elements of misuse.
This article sketches first lexicological insights into a classification model as derived from semantic analyses of written communication. Firstly, a brief description of the project will be provided. Secondly, corpus-assisted paronym detection will be focused. Thirdly, in the main section the paper concerns the description of the datasets for paronym classification and the classification procedures. As a work in progress, new insights will continually be extended once spoken and CMC data are added to the investigations.
Unknown words are a challenge for any NLP task, including sentiment analysis. Here, we evaluate the extent to which sentiment polarity of complex words can be predicted based on their morphological make-up. We do this on German as it has very productive processes of derivation and compounding and many German hapax words, which are likely to bear sentiment, are morphologically complex. We present results of supervised classification experiments on new datasets with morphological parses and polarity annotations.
Ziel einer größer angelegten Studie – die Grundlage dieses Beitrags ist – war es, anhand der „Gassigespräche“ auf gattungsspezifische Ordnungsprinzipien und Familienähnlichkeiten miteinander verwandter Alltagsgattungen einzugehen, die vor allem in westlichen Kulturen etabliert zu sein scheinen. Die ihnen zugrundeliegenden kommunikativen Muster beschreiben wir als mehr oder weniger stark verfestigte Elemente. Mit diesem Beitrag wollen wir einen Einblick in die gattungsanalytische Betrachtung von Alltagskommunikation am Beispiel der Gassigespräche bieten.
Die ältesten schriftlichen Rezepte in deutscher Sprache sind uns im Buoch von guoter Spise aus der Zeit um 1350 überliefert (<http://digital.slub-dresden.de/werkansicht/dlf/2518/1/>, 10.7.2017). Schon damals hatten Rezepte wie heute außer der Kochanleitung einen Namen. Denn um über etwas reden zu können, geben wir allem einen Namen. Im Buoch von guoter Spise heißen die Gerichte Ain mandel suppen oder Ein gebraten gefültes ferhelin.
Cybermobbing ist ein spezifischer Typ digitaler Gewalt, der vor allem unter Kindern und Jugendlichen vorkommt und in den Fokus der breiten Öffentlichkeit geraten ist. Die Cybermobbing-Forschung ist geprägt von zahlreichen sozialpsychologischen und medienwissenschaftlichen Studien. Eine linguistische Beschäftigung mit konkretem Sprachmaterial stand jedoch bis heute aus. Im vorliegenden Buch wird anhand vieler authentischer Beispiele erörtert, wie sich Cybermobbing im Netz zeigt, in welchen Formvarianten es als kommunikatives Phänomen in Erscheinung tritt und wie die Spezifik der Online-Kommunikation in der virtuellen Welt Einfluss auf die spezifischen Prozesse dieser verbalen Gewalt nimmt. Umfangreiche Detailanalysen helfen, die Spezifik des Emotionspotenzials dieser Texte besser zu verstehen. Das Buch ist einerseits für die spezifische Medialität digitaler Kommunikation und somit die Medienlinguistik allgemein äußerst relevant, andererseits bildet es einen wichtigen Referenzpunkt für künftige Untersuchungen anderer Formen verbaler Gewalt in der digitalen Kommunikation wie auch in anderen Kommunikationsformen.
Der Themenkreis dieses Bandes umfasst Fragen der system- und normbezogenen Deskription des Gegenwartsdeutschen unter Berücksichtigung seiner Variierung und Dynamik, darunter insbesondere in den Bereichen des Wortschatzes, der Grammatik, der Textlinguistik und der kontrastiven Sprachforschung, der Sprachpolitik, der Sprachkultur sowie der Sprachdidaktik und des Faches “;Deutsch als Fremdsprache”. Die einzelnen Beiträge können vier zentralen und miteinander verschränkten Arbeitsfeldern zugeordnet werden: “Das Deutsche in der Welt”, “Der Wortschatz in Bewegung”, “In den Tiefen der Grammatik” und “Blicke auf den Sprachgebrauch”.
Der vorliegende Beitrag beschäftigt sich mit Imperativen, die nicht oder nicht nur für Handlungsaufforderungen, sondern auch für gesprächsorganisatorische Zwecke eingesetzt werden. Einschlägige Vertreter wie guck mal, hör mal, komm oder geh wurden in der Literatur meist als Interjektionen, aber auch als Diskursmarker klassifiziert. Anhand einer explorativen Korpusrecherche wird zunächst ein Überblick über die Häufigkeit und einige distributionelle Eigenschaften gesprächsorganisatorischer Imperative im gesprochenen Deutsch gegeben. Anschließend wird ein bisher nicht empirisch untersuchter Vertreter, warte (mal), anhand einer Kollektion von 190 Belegen im Hinblick auf seine Semantik und Funktion untersucht. In turninitialer und syntaktisch vorangestellter Position wird warte (mal) zur Markierung von Unterbrechungen der Progressivität und von Aktivitätswechseln verwendet, z.B. um Verstehensprobleme zu klären oder Argumente in eine Diskussion einzubringen. Tritt es satzmedial auf, markiert es Selbstreparaturen und Häsi-tationen. Es wird argumentiert, dass die Distribution und Funktionen es nicht rechtfertigen, warte (mal) als Diskursmarker zu bezeichnen.
In diesem Aufsatz wird einzelfallanalytisch der Frage nachgegangen, wie die Struktur einer Kirchenbesichtigung aussieht. Im theoretischen Rahmen, der die Kirchenbesichtigung als kulturelle Praktik konzeptualisiert, wird „Objektkonstitution“ als eine aktive Leistung des Kirchenbesichtigers in den Blick genommen. Bei den Aufnahmen zum Kirchenbesichtigungskorpus wurden die Besichtiger nicht nur bei ihrem Gang durch den Kirchenraum und der visuellen Wahrnehmung bestimmter Raumaspekte gefilmt. Sie wurden vielmehr darum gebeten, ihre visuelle Wahrnehmung durch begleitendes Sprechen auch zu kommentieren. Aufgezeichnet wurde das Besichtigungskorpus mit zwei Kameras: einer Actionkamera, die den Wahrnehmungsraum der Besichtiger dokumentiert, und einer Kontextkamera, die ihnen bei ihrem Weg durch den Raum folgt.
Dieses experimentelle Erhebungsdesign, bei dem exothetisches Sprechen bewusst als wissenschaftliche Erhebungsmethode eingesetzt wird, macht es möglich, das Besichtigungskonzept der Personen als dynamisches Zusammenspiel ihrer visuellen Wahrnehmung des Kirchenraums und ihrer wahrnehmungsbegleitenden Exothese zu rekonstruieren. Dass Objektkonstitution eine aktive Herstellung ist, durch die der Kirchenraum in den Relevanzen seines Betrachters teilweise neu entsteht, zeigt die Fallanalyse in exemplarischer Klarheit: Anton, der analysierte Besichtiger, der sich ausführlich mit zwei großen Gemälden beschäftigt, konstituiert diese de facto als „Bilderrahmen“, ohne überhaupt auf die dargestellten Szenen einzugehen.
Der vorliegende Beitrag beschäftigt sich mit ICH WEIß NICHT und der Frage danach, ob einige der Verwendungen als Diskursmarker bezeichnet werden können oder nicht. Es wird zunächst ein Überblick über die Kriterien gegeben, die in der interaktionalen Linguistik für die Diskursmarkerdefinition diskutiert wurden. Dabei wird versucht, definitorische Kriterien von empirischen Befunden abzugrenzen. Es folgt eine Analyse verschiedener Verwendungen von ICH WEIß NICHT. Ein Schwerpunkt liegt dabei auf Verwendungen als epistemischer und pragmatischer Marker, die sowohl mit prospektiver Orientierung als auch mit retrospektiver Orientierung vorkommen. Abschließend wird der Unterschied zwischen definitorischen und empirischen Kriterien für die Diskursmarkerdefinition systematisiert. Auf dieser Basis argumentieren wir dafür, dass alle Verwendungen von ICH WEIß NICHT, die diskursfunktionale Eigenschaften haben und syntaktisch desintegriert sind, Diskursmarkerverwendungen sind. Einige davon sind prototypischer, während andere Fälle eher marginal sind, da sie einige Merkmale, die die meisten Diskursmarker kennzeichnen, nicht aufweisen.
Wie können Diskursmarker in einem Korpus gesprochener Sprache auffindbar gemacht werden? Was ist Part-of-Speech-Tagging und wie funktioniert es? In diesem Artikel soll anhand der POS-Kategorie Diskursmarker dargestellt werden, wie für das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) ein Part-of-Speech-Tagging entwickelt wurde, das auf die Annotation typisch gesprochen-sprachlicher Phänomene ausgerichtet ist. Diskursmarker sollen dafür aus der Sicht maschineller Sprachverarbeitung dargestellt werden, d. h. wie eine POS-Kategorie Diskursmarker so definiert werden kann, dass sie automatisch annotiert werden kann. Schließlich soll gezeigt werden, wie man auch weitere Diskursmarker in der Datenbank auffinden kann
Intention des Kooperationsprojektes „Grammatische Kenntnisse in der Sekundarstufe II“ (GramKid-SII) des Instituts für Deutsche Sprache (IDS) und der Ruhr-Universität Bochum ist, die deutschdidaktische Behauptung, Grammatikunterricht bis in die Sekundarstufe II führe zu besseren expliziten und nachhaltigen Grammatikkenntnissen des Deutschen, empirisch in Form einer longitudinalen Interventionsstudie mit Kontrollgruppendesign zu untersuchen.
Qualifizierungsmaßnahmen wie „Perspektive für Flüchtlinge Plus“ (PerFPlus) können als wichtige Bestandteile der neuen Willkommenskultur in Deutschland betrachtet werden. Deutschland als Einwanderungsland kann mit Hilfe solcher Initiativen gezielt für Arbeitsbereiche und Berufsgruppen werben, in denen es an Nachwuchs mangelt. Den Neuzugewanderten bieten sie die eine Chance sich in der hiesigen Arbeitswelt zu orientieren und Berufsfelder zu erkunden, die ihnen bislang noch nicht oder nur in anderer Form bekannt waren. Auf der anderen Seite bergen solche Maßnahmen aber auch ihr Risiko: Wenn sie ihr Ziel verfehlen und Frustrationen auf beiden Seiten erzeugen, sind lange Warteschleifen, Arbeitslosigkeit und möglicherweise politische Polarisierung und Radikalisierung die Folge. Insofern ist eine schnelle Intervention hinsichtlich der Verbesserung solcher Maßnahmen essentiell. Der vorliegende Bericht soll die konzeptionell-arbeitenden Teams bei der Bundesagentur für Arbeit (BA) sowie bei Bildungsanbietern die mit der BA kooperieren bei ihren wichtigen Aufgaben unterstützen. Alle Partner bleiben im Bericht anonym.
Recently, a claim was made, on the basis of the German Google Books 1-gram corpus (Michel et al., Quantitative Analysis of Culture Using Millions of Digitized Books. Science 2010; 331: 176–82), that there was a linear relationship between six non-technical non-Nazi words and three ‘explicitly Nazi words’ in times of World War II (Caruana-Galizia. 2015. Politics and the German language: Testing Orwell’s hypothesis using the Google N-Gram corpus. Digital Scholarship in the Humanities [Online]. http://dsh.oxfordjournals.org/cgi/doi/10.1093/llc/fqv011 (accessed 15 April 2015)). Here, I try to show that apparent relationships like this are the result of misspecified models that do not take into account the temporal aspect of time-series data. The main point of this article is to demonstrate why such analyses run the risk of incorrect statistical inference, where potential effects are both meaningless and can potentially lead to wrong conclusions.
Multinomial processing tree (MPT) models are a class of measurement models that account for categorical data by assuming a finite number of underlying cognitive processes. Traditionally, data are aggregated across participants and analyzed under the assumption of independently and identically distributed observations. Hierarchical Bayesian extensions of MPT models explicitly account for participant heterogeneity by assuming that the individual parameters follow a continuous hierarchical distribution.We provide an accessible introduction to hierarchical MPT modeling and present the user-friendly and comprehensive R package TreeBUGS, which implements the two most important hierarchical MPT approaches for participant heterogeneity—the beta-MPT approach (Smith & Batchelder, Journal of Mathematical Psychology 54:167-183, 2010) and the latent-trait MPT approach (Klauer, Psychometrika 75:70-98, 2010). TreeBUGS reads standard MPT model files and obtains Markov-chain Monte Carlo samples that approximate the posterior distribution. The functionality and output are tailored to the specific needs of MPT modelers and provide tests for the homogeneity of items and participants, individual and group parameter estimates, fit statistics, and within- and between-subjects comparisons, as well as goodness-of-fit and summary plots. We also propose and implement novel statistical extensions to include continuous and discrete predictors (as either fixed or random effects) in the latent-trait MPT model.
Lexikalische Dekomposition
(2017)
In recent years, formal semantic research on the meaning of tense and aspect has benefited from a number of studies investigating languages with graded tense systems. This paper contributes a first sketch of the temporal marking system of Awing (Grassfields Bantu), focusing on two varieties of remote past and remote future. We argue that the data support a "symmetric" analysis of past and future tense in Awing. In our specific proposal, Awing temporal remoteness markers are uniformly analyzed as quantificational tense operators, and both the past and the future paradigm include a form that prevents contextual restriction of this temporal quantifier.
Eine reichhaltige Auszeichnung mit Metadaten ist für alle Arten von Korpora für die linguistische Forschung wünschenswert. Für große Korpora (insbesondere Webkorpora) müssen Metadaten automatisch erzeugt werden, wobei die Genauigkeit der Auszeichnung besonders kritisch ist. Wir stellen einen Ansatz zur automatischen Klassifikation nach Themengebiet (Topikdomäne) vor, die auf dem lexikalischen Material in Texten basiert. Dazu überführen wir weniger gut interpretierbare Ergebnisse aus einer so genannten Topikmodellierung mittels eines überwachten Lernverfahrens in eine besser interpretierbare Kategorisierung nach 13 Themengebieten. Gegenüber (automatisch erzeugten) Klassifikationen nach Genre, Textsorte oder Register, die zumeist auf Verteilungen grammatischer Merkmale basieren, erscheint eine solche thematische Klassifikation geeigneter, um zusätzliche Kontrollvariablen für grammatische Variationsstudien bereitzustellen. Wir evaluieren das Verfahren auf Webtexten aus DECOW14 und Zeitungstexten aus DeReKo, für die jeweils getrennte Goldstandard-Datensätze manuell annotiert wurden.
Einleitung
(2017)
Wir setzen mit diesem Text unsere gemeinsamen Analysen des Zusammenhangs von Gottesdienst und Kirchenraum fort. Methodologisch entwickeln wir mit der sozial-räumlichen Positionierung ein Konzept, bei dem Interaktionsarchitektur-, Sozialtopographie- und Interaktionsraumanalyse zusammenkommen. Es handelt sich um einen ersten systematischen Versuch, fallbasiert das Konzept "Positionierung" zu entmetaphorisieren und es im engsten Wortsinne erstmalig und primär im Raum zu verankern. Das zentrale Argument für die Ent-Metaphorisierung des Konzeptes besteht in der Tatsache, dass bereits lange bevor das erste Wort gesprochen wird, Personen im institutionellen Funktionsraum (hier Kirche) durch die Einnahme bestimmter Positionen soziale Ansprüche stellen und ihre Präsenz sozial aufladen. Es ist zudem empirisch evident, dass in dem von uns analysierten Fall die Beteiligten durch ihr Positionierungsverhalten (und zwar ausschließlich darüber!) neben der gemeinsamen verbalen Bearbeitung thematisch-pragmatischer Relevanzen jeweils eigene und durchaus konkurrenzielle Ziele auf der "Beziehungsebene" verfolgen.
Modeling the properties of German phrasal compounds within a usage-based constructional approach
(2017)
This paper discusses phrasal compounds in German (e.g.“Man-muss-doch-überalles-reden-können”-Credo, ‘one-should-be-able-to-talk-about-everything motto’). It provides the first empirically based investigation and description of this wordformation type within the theoretical framework of construction grammar. While phrasal compounds pose a problem for “traditional” generative approaches, I argue that a usage-based constructional model (e.g. Langacker 1987; Goldberg 2006) which takes into consideration aspects of frequency provides a suitable approach to modeling and explaining their properties. For this purpose, a large inventory of phrasal compounds was extracted from the German Reference Corpus (DeReKo) and modeled as pairings of form and meaning at different levels of specificity and abstractness within a bottom-up process.
Overall, this paper not only presents a new and original approach to phrasal compounds, but also offers interesting perspectives for dealing with composition in general.
Das von der Leibniz-Gemeinschaft geförderte Projekt „Lexik des gesprochenen Deutsch“(LeGeDe, Leibniz-Wettbewerb 2016, Förderlinie I: „Innovative Vorhaben“) nahm im September 2016 am Institut für Deutsche Sprache (IDS) seine Arbeit auf.1 Das Hauptziel ist die Erstellung einer korpusbasierten lexikografischen Online-Ressource zur Lexik des gesprochenen Deutsch auf der Grundlage von lexikologischen und gesprächsanalytischen Untersuchungen authentischer gesprochensprachlicher Daten. Als Kooperationsprojekt der Abteilungen Lexik und Pragmatik arbeiten Mitarbeiter/innen aus der Lexikologie, Lexikografie, Interaktionalen bzw. Gesprächslinguistik, Korpus- und Computerlinguistik und den Empirischen Methoden zusammen, wodurch sowohl aus der Sicht der Gesprochene- Sprache-Forschung als auch aus lexikografischer Perspektive eine innovative Form der Sprachbeschreibung entstehen soll.
Die Weimarer Republik (1918-1933) ist eine der relevantesten historischen Zeiträume der jüngeren deutschen Geschichte, ist sie doch erste deutsche Demokratie und Vorläuferperiode des Nationalsozialismus. Damit ist sie sowohl positives als auch negatives Referenzobjekt für die Gesellschaft, das politische System und den öffentlichen Sprachgebrauch der heutigen Bundesrepublik.
Diese Bibliografie bietet einen Überblick über das Forschungsfeld der Sprache, der Sprecher und deren Themen in der Weimarer Zeit. Sie informiert systematisch über methodische Ansätze, Forschungsbeiträge,Nachschlagewerke und Quellen.
Theateraufführungen sind ohne Zuschauer nicht denkbar. Zugleich erweisen sich Proben aber als öffentlichkeitsabgeschirmte und intime Vorgänge, da eine (zu frühe) Orientierung an möglichen Publikums-Effekten den kreativen Prozess stört. Auf der Grundlage von über 30 Stunden Videoaufnahmen von Theaterproben zeige ich an ausgewählten Ausschnitten, wie Theatermachende sich sprachlich und körperlich im Probenprozess auf das Publikum beziehen, wie dies interaktiv realisiert wird und welche Rückschlüsse das auf die Weisen der Publikumskonstruktion im Kontext von Proben zulässt.
Der Beitrag vermittelt den Gegenstand ‚Sprache und Judentum‘ im Zeichen religiöser Kommunikativität und Judentum als kommunikativ-performatives religiöses Glaubenssystem. Die Spezifizierung des allgemein-religiösen Phänomens der Kommunikativität in Bezug auf die jüdische Religion besteht demzufolge darin, das generell für Religionen geltende Phänomen qualitativ hinsichtlich seiner Ausprägungen als Proprium religiöser jüdischer Praxis darzustellen. Diese Ausprägungen werden kulturanalytisch beschrieben mit den Kategorien ‚kulturelles Gedächtnis‘, ‚rituelle Kommunikation‘ und ‚kulturelles Zeichensystem‘. Ihnen zugeordnet sind die jeweils entsprechenden zentralen religiösen Performanzen der jüdischen Tradition.
Researchers interested in the sounds of speech or the physical gestures of Speakers make use of audio and video recordings in their work. Annotating these recordings presents a different set of requirements to the annotation of text. Special purpose tools have been developed to display video and audio Signals and to allow the creation of time-aligned annotations. This chapter reviews the most widely used of these tools for both manual and automatic generation of annotations on multimodal data.
Romancescamming ist ein kriminologisches Phänomen, das die Prinzipien des traditionellen Heiratsschwindels auf die Interaktion in Sozialen Medien überträgt. Sie hat in den letzten Jahren zu erheblichen finanziellen und emotionalen Schäden bei den Opfern geführt. Der vorliegende Beitrag nähert sich dem Phänomen aus zwei Perspektiven. Die kriminologische Betrachtung zeigt, wie Romancescamming von vergleichbaren Phänomenen, wie Cybergrooming oder Sextortion abzugrenzen ist und zeigt einen gemeinsamen Nenner auf: die Etablierung einer Vertrauensbasis. Da diese im Web 2.0 vornehmlich über Sprache aufgebaut werden muss, wird in der linguistischen Analyse der Frage nachgegangen, welche konkreten Strategien Täter anwenden. Beide Ansätze führen zu Ratschlägen für die Prävention.
TV-Formate
(2017)
Am 12. Mai 1965 nahmen der Staat Israel und die Bundesrepublik Deutschland offiziell diplomatische Beziehungen auf. Damit kam über 15 Jahre nach der Konstitution der beiden Länder und 20 Jahre nach dem Ende der Shoah ein komplexer Prozess der langsamen politischen Annäherung zu einem keineswegs selbstverständlichen Abschluss. Das fünfzigjährige Jubiläum dieses Ereignisses im Jahr 2015 war weltweit, vor allem aber in Israel und Deutschland, Anlass für zahlreiche Veranstaltungen, über die eine offizielle bilaterale Webseite <www.de50il.org/> (Stand: 6.11.2017) Auskunft gibt. Im Rahmen des Jubiläums wurde am 30. September 2015 in einer feierlichen Abendveranstaltung im Jüdischen Museum Berlin offiziell das „Wörterbuch deutscher Lehnwörter im Hebräischen“ von Uriel Adiv in einer ersten Fassung im „Lehnwortportal Deutsch“ des IDS freigeschaltet. Eine von Koautor Jakob Mendel erheblich überarbeitete und verbesserte zweite Version ging im Mai 2017 online. Der vorliegende Beitrag möchte einige Hintergründe zum deutschen Lehnwortschatz im modernen Hebräischen darstellen sowie die Entstehungsgeschichte des Werks und seinen Platz in der lehnwortlexikografischen Publikationsplattform „Lehnwortportal Deutsch“ <http://lwp.ids-mannheim.de/> (Stand: 6.11.2017) beleuchten.
Der Band enthält Beiträge, die auf der 4. Jahrestagung des Netzwerks 'Diskurs – interdisziplinär' 2014 gehalten wurden. Der Fokus der Beiträge ist auf Diskurs als ein semiotisches Kohärenzphänomen gerichtet. Komplexe von Zeichensystemen, die aufeinander verweisen und miteinander Sinn konstituieren, werden in ihrer diskursiven Geprägtheit beschrieben. Im Sinn einer Diskurssemiotik werden diskursive Kodierungen und ihre mutuellen Beziehungen als Bedeutung schaffende Instanzen dargestellt. Diese werden beispielhaft in Bereichen wie der Ess-, Körper-, Bild- und Filmsemiotik, der Semiotik der Kleidung und des Internets, der Raum- und der Geosemiotik sowie der Musiksemiotik exemplifiziert. Der Betrachtung des multimodalen Zusammenhangs von Text, Bild und Ton kommt dabei ein hoher Stellenwert zu. Damit präsentiert der Band Beispiele interdisziplinärer Ansätze und gibt den aktuellen Forschungsstand diskurssemiotischer Diskussionen wieder.
Bis heute und weltweit genießt der „Mechanismus der menschlichen Sprache“ des Wolfgang von Kempelen unter Kennern einen beinahe legendären Ruf. In Methodik und Argumentation zählte dieses Buch seinerzeit zur wissenschaftlichen Avantgarde der erst im Entstehen begriffenen Phonetik. Heute jedoch ist seine Rezeption mit erheblichen Hürden verbunden: Insbesondere seine altertümliche Sprache und die Frakturschrift behindern eine intensive Auseinandersetzung. Zudem fehlte bislang eine englische Übersetzung.
Bis heute und weltweit genießt der „Mechanismus der menschlichen Sprache“ des Wolfgang von Kempelen unter Kennern einen beinahe legendären Ruf. In Methodik und Argumentation zählte dieses Buch seinerzeit zur wissenschaftlichen Avantgarde der erst im Entstehen begriffenen Phonetik. Heute jedoch ist seine Rezeption mit erheblichen Hürden verbunden: Insbesondere seine altertümliche Sprache und die Frakturschrift behindern eine intensive Auseinandersetzung. Zudem Fehlte bislang eine englische Übersetzung.
Die Beiträge dieses Tagungsbandes thematisieren die Erstellung digitaler historischer Zeitungskorpora, Merkmale und Entwicklungstendenzen der Sprache der Zeitungen auf verschiedenen Ebenen und auf der Grundlage einzelner Korpora sowie die Bewertung der Zeitungssprache aus zeitgenössischer Sicht.
Die Vorträge gehen zurück auf den Workshop "Die Zeitung als das Medium der neueren Sprachgeschichte? Korpora, Analyse und Wirkung" am Institut für Deutsche Sprache (IDS) - in Zusammenarbeit mit dem Europäischen Zentrum für Sprachwissenschaften (EZS) - am 20./21.11.2014 in Mannheim.
Schülerduden Grammatik
(2017)
Sprichwörter im Gebrauch
(2017)
Eine am Gebrauch orientierte Sprachbeschreibung ist auch in der Grammatik mit sprachlicher Variation und mit Veränderungen des Gebrauchs konfrontiert. Anhand dreier Beispiele aus dem zentralen Bereich der deutschen Grammatik soll gezeigt werden, dass sich in der Variation, die man dort beobachtet, eine funktionale Nutzung des vorhandenen Inventars darstellt. Diese funktionale Nutzung ist dadurch gekennzeichnet, dass seltenere und daher synchron auffälligere Konstruktionen für spezifische Funktionen genutzt werden. Der Genitiv ist tatsächlich aus formalen Gründen seiner Morphologie auffällig. Er ist nicht vom Dativ unterschieden beim Femininum, doppelt markiert bei den starken Maskulina und Neutra und nur beschränkt bildbar im Plural. Diese Eigenheiten beschränken seine Nutzung als normaler Kasus. Gerade aber die auffällige Markierung mit dem Element {-(e)s} hat dazu geführt, dass der Genitiv nun zur Anzeige genereller Abhängigkeit genutzt wird, und zwar als Genitivattribut wie als unmarkierte Form bei einer Gruppe von Präpositionen (wie ‚dank‘, ‚trotz‘, ‚wegen‘, ‚entlang‘ usw.). Beim zweiten Fall, dem Verhältnis von starken und schwachen Verben, zeigt sich, dass der Übergang von der starken zur schwachen Flexion, die erkennbar den Normalfall im morphologischen System darstellt, gerade häufige und in ihrer Bedeutung grundlegende Verben (wie ‚geben‘, ‚nehmen‘ usw.) nicht betrifft, so dass die starke Flexion als Markierung für solch einen zentralen Status gelten kann. Der dritte Punkt hängt damit zusammen: das Ausgreifen der ‚würde‘-Form als Konjunktiv II (auch bei gut markierten starken Verben) ist so im größeren Zusammenhang der Nutzung von Klammerformen zu sehen.
Vorwort
(2017)
Slogans
(2017)
Das Archiv für Gesprochenes Deutsch (AGD, Stift/Schmidt 2014) am Institut für Deutsche Sprache ist die zentrale Sammelstelle für Korpora des Gesprochenen Deutsch. Gegründet als Deutsches Spracharchiv (DSAv) im Jahre 1932 hat es über Eigenprojekte, Kooperationen und Übernahmen von Daten aus abgeschlossenen Forschungsprojekten einen Bestand von etwa 50 Variations- und Gesprächskorpora aufgebaut. Heute ist dieser Bestand fast vollständig digitalisiert und wird zu einem großen Teil der wissenschaftlichen Gemeinschaft über die Datenbank für Gesprochenes Deutsch (DGD) im Internet zur Nutzung in Forschung und Lehre angeboten.
Körperliche wie seelische Gesundheit ist ein hohes individuelles und gesellschaftliches Gut und Grundrecht. Häufig wird die Gesundheit durch ihr Gegenteil, d. h. in der Verständigung über Krankheit, thematisiert. Der gesellschaftliche Austausch über Krankheiten, Gesundheitsrisiken und Behandlungsmethoden ist untrennbar mit Sprache verknüpft (Busch/Spranz-Fogasy 2015); die Sprache ist „[…] das zentrale Medium, um medizinisches Wissen herzustellen, zu systematisieren, zu tradieren und auszutauschen.“ (Busch/Spranz-Fogasy 2015: 336). Ausgehend von dieser Prämisse wurde das Netzwerk „Linguistik und Medizin“ gegründet, um die Forschungstätigkeiten der verschiedenen linguistischen Disziplinen, die an den Verbindungslinien von „Sprache – Wissen – Medizin“ arbeiten, zu bündeln: Forschungsdesiderate sollen kooperierend bearbeitet und die interdisziplinäre Anschlussfähigkeit zwischen linguistischen und medizinischen, psychiatrischen sowie salutogenetischen Forschungsbereichen auf- und ausgebaut werden.
Vorwort
(2017)
This paper provides a formal semantic analysis of past interpretation in Medumba (Grassfields Bantu), a graded tense language. Based on original fieldwork, the study explores the empirical behavior and meaning contribution of graded past morphemes in Medumba and relates these to the account of the phenomenon proposed in Cable (Nat Lang Semant 21:219–276, 2013) for Gĩkũyũ. Investigation reveals that the behavior of Medumba gradedness markers differs from that of their Gĩkũyũ counterparts in meaningful ways and, more broadly, discourages an analysis as presuppositional eventuality or reference time modifiers. Instead, the Medumba markers are most appropriately analyzed as quantificational tenses. It also turns out that Medumba, though belonging to the typological class of graded tense languages, shows intriguing similarities to genuinely tenseless languages in allowing for temporally unmarked sentences and exploiting aspectual and pragmatic cues for reference time resolution. The more general cross-linguistic implication of the study is that the set of languages often subsumed under the label “graded tense” does not in fact form a natural class and that more case-by-case research is needed to refine this category.
This paper explores the syntax of agreement in Insular Scandinavian in copular clauses with two potential goals for agreement. Data from three production experiments - one in Faroese and two in Icelandic - establish several new facts. First, in both languages agreement with the second nominal (DP2) is possible/preferred. Second, there is considerable variation (both within and between languages, and indeed speakers) in the patterns observed. Third, Icelandic shows a surprising pattern of “partial” agreement with DP2 - agreement in number but not person. We discuss the implications for current theorising about agreement, proposing that in these languages, at least, agreement is downwards, and that the available agreement options depend in part on the syntactic position of DPI when agreement is established.
In the lexicon of pidgin and creole languages we can see an important part of these languages’ history of origin and of language contact. The current paper deals with the lexical sources of Tok Pisin and, more specifically, with words of German origin found in this language. During the period of German colonial domination of New Guinea and a number of insular territories in the Pacific (ca. 1885–1915), German words entered the emerging Tok Pisin lexicon. Based on a broad range of lexical and lexicographic data from the early 20th century up until today, we investigate the actual or presumed German origin of a number of Tok Pisin words and trace different lexical processes of integration that are linked to various, often though not always colonially determined, contact settings and sociocultural interactions.
Nachkriegszeit: BRD
(2017)
Rekontextualisierung von Hate Speech als Aneignungs- und Positionierungsverfahren in Sozialen Medien
(2017)
Hate Speech wird im vorliegenden Aufsatz nicht als Medium der Herabwürdigung betrachtet, sondern als Positionierungsverfahren. Es handelt sich bei Hate Speech Liebert (2015, 176) zufolge um eine „unorganisierte [...] Praktik" innerhalb der Online-Kommunikation. Das würde erstens bedeuten, dass keine strategische Dekonstruktion einer spezifischen Identität damit verbunden ist, wie das etwa beim Cybermobbing der Fall wäre. Es gibt also keine Verabredungen und gruppenkonstitutiven Prozesse außerhalb der medial vermittelten Kommunikation. Es scheint jedoch auch die diskursdynamischen Prozesse auszublenden, die sich ad hoc „organisieren", wo Hassrede praktiziert wird. Zweitens ruft der Terminus der „Unorganisiertheit" die Assoziation einer strukturellen Unterspezifikation auf und damit das Bedürfnis nach einer präzisierenden Definition für diese Praktik. Drittens ware davon auszugehen, dass Hass-Kommentare verstreut an Diskursorten und zu willkürlichen Diskurszeiten auftreten, die deshalb nicht vorhersagbar sind.
Interaktion und Medien
(2017)
Am 1. September 2016 hat das Forschungsprojekt „Lexik des gesprochenen Deutsch“ (= LeGeDe) am Institut für Deutsche Sprache in Mannheim als Kooperationsprojekt der Abteilungen Pragmatik und Lexik seine Arbeit aufgenommen. Dieses drittmittelgeförderte Projekt der Leibniz-Gemeinschaft (Leibniz-Wettbewerb 2016; Förderlinie 1: Innovative Vorhaben) hat eine Laufzeit von drei Jahren (1.9.2016-31.8.2019) und besteht aus einem Team von Mitarbeiterinnen und Mitarbeitern aus den Bereichen Lexikologie, Lexikografie, Gesprächsforschung, Korpus- und Computerlinguistik sowie Empirische Methoden. Im folgenden Beitrag werden neben Informationen zu den Eckdaten des Projekts, zu den unterschiedlichen Ausgangspunkten, dem Gegenstandsbereich, den Zielen sowie der LeGeDe-Datengrundlage vor allem einige grundlegende Forschungsfragen und methodologische Ansätze aufgezeigt sowie erste Vorschläge zur Gewinnung, Analyse und Strukturierung der Daten präsentiert. Zur lexikografischen Umsetzung werden verschiedene Möglichkeiten skizziert und im Ausblick einige Herausforderungen zusammengefasst.
In the first volume of Corpus Linguistics and Linguistic Theory, Gries (2005. Null-hypothesis significance testing of word frequencies: A follow-up on Kilgarriff. Corpus Linguistics and Linguistic Theory 1(2). doi:10.1515/ cllt.2005.1.2.277. http://www.degruyter.com/view/j/cllt.2005.1.issue-2/cllt.2005. 1.2.277/cllt.2005.1.2.277.xml: 285) asked whether corpus linguists should abandon null-hypothesis significance testing. In this paper, I want to revive this discussion by defending the argument that the assumptions that allow inferences about a given population – in this case about the studied languages – based on results observed in a sample – in this case a collection of naturally occurring language data – are not fulfilled. As a consequence, corpus linguists should indeed abandon null-hypothesis significance testing.
Das Projekt GramKidSII (Grammatische Kenntnisse in der Sekundarstufe II) hat zum Ziel, die deutschdidaktische Behauptung, Grammatikunterricht bis in die Sekundarstufe II führe zu besseren und langfristig anhaltenden Grammatikkenntnissen, empirisch in Form einer longitudinalen Interventionsstudie mit Kontrollgruppendesign zu überprüfen. Im vorliegenden Beitrag stellen wir eine Pilotierungsstudie vor, die die Anwendungsmöglichkeiten einer Selbstlerneinheit für die geplante Interventionsstudie testet. Anhand der Ergebnisse zeigen wir, dass die von uns entworfene Selbstlerneinheit insbesondere dann schwer zur Vermittlung der deutschen Grammatik einsetzbar ist, wenn die von Grammatiken empfohlenen Regeln mit dem Sprachgefühl der Probanden konfligieren.
Reden über Geld
(2017)
Die Guidelines sind eine Erweiterung des STTS (Schiller et al. 1999) für die Annotation von Transkripten gesprochener Sprache. Dieses Tagset basiert auf der Annotation des FOLK-Korpus des IDS Mannheim (Schmidt 2014) und es wurde gegenüber dem STTS erweitert in Hinblick auf typisch gesprochensprachliche Phänomene bzw. Eigenheiten der Transkription derselben. Es entstand im Rahmen des Dissertationsprojekts „POS für(s) FOLK – Entwicklung eines automatisierten Part-of-Speech-Tagging von spontansprachlichen Daten“ (Westpfahl 2017 (i.V.)).
Lexicographic meaning descriptions of German lexical items which are formally and semantically similar and therefore easily confused (so-called paronyms) often do not reflect their current usage of lexical items. They can even contradict one’s personal intuition or disagree with lexical usage as observed in public discourse. The reasons are manifold. Language data used for compiling dictionaries is either outdated, or lexicographic practice is rather conventional and does not take advantage of corpus-assisted approaches to semantic analysis. Despite of various modern electronic or online reference works speakers face uncertainties when dealing with easily confusable words. These are for example sensibel/sensitiv (sensitive) or kindisch/kindlich (childish/childlike). Existing dictionaries often do not provide satisfactory answers as to how to use these sets correctly. Numerous questions addressed in online forums show where uncertainties with paronyms are and why users demand further assistance concerning proper contextual usage (cf. Storjohann 2015). There are different reasons why users misuse certain items or mix up words which are similar in form and meaning. As data from written and more spontaneous language resources suggest, some confusions arise due to ongoing semantic change in the current use of some paronyms. This paper identifies shortcomings of contemporary German Dictionaries and discusses innovative ways of empirical lexicographic work that might pave the way for a new data-driven, descriptive reference work of confusable German terms. Currently, such a guide is being developed at the Institute for German Language in Mannheim implementing corpora and diverse corpus-analytical methods. Its objective is to compile a dictionary with contrastive entries which is a useful reference tool in situation of language doubt. At the same time, it aims at sensitizing users of context dependency and language change.
Die Autoren beschäftigen sich mit Aspekten von Unterrichtskommunikation, die in der Regel übersehen oder in ihrer Relevanz nicht hinreichend fokussiert werden. Sie verdeutlichen exemplarisch, welche Erkenntnisse damit verbunden sind, wenn man Unterrichtsgeschehen nicht sofort als institutionelle Interaktion verengt und vorschnell auf Wissensvermittlung verkürzt, sondern trotz der faktischen Relevanz dieser beiden Aspekte das Geschehen im Klassenraum hinsichtlich basaler, interaktionskonstitutiver Anforderungen befragt. Unterricht als gemeinsame Herstellung der Beteiligten betrachtet und als raumbasiertes Unternehmen konzeptualisiert.