Refine
Year of publication
Document Type
- Part of a Book (316) (remove)
Has Fulltext
- yes (316)
Keywords
- Deutsch (187)
- Korpus <Linguistik> (35)
- Grammatik (27)
- Konversationsanalyse (23)
- Wortbildung (21)
- Wörterbuch (18)
- Lexikographie (15)
- Gesprochene Sprache (14)
- Rechtschreibreform (14)
- Rechtschreibung (14)
Publicationstate
- Veröffentlichungsversion (182)
- Zweitveröffentlichung (64)
- Erstveröffentlichung (2)
- Postprint (2)
- Verlags-Lektorat (1)
Reviewstate
- (Verlags)-Lektorat (236)
- Verlags-Lektorat (14)
- (Verlags-) Lektorat (1)
- (Verlags-)Lektorat (1)
- Veröffentlichungsversion (1)
Publisher
- Narr (316) (remove)
Begegnungen mit neuen Wörtern: Zu lexikografischen Praktiken im Neologismenwörterbuch des IDS
(2017)
Zur Semantik von fast
(1977)
Die "Verben" (-> Wortarten) sind im Deutschen unter anderem dadurch gekennzeichnet, daß sie über Formen verfügen, die in je unterschiedlicher Weise zum Ausdruck (-»-Morphologie) bringen, inwiefern/inwieweit Ausdrücke, die die entsprechenden Verben enthalten,in ihrer Bedeutung von zeitlichen Faktoren abhängen. Dabei wirken diese sog. Tempusformen mit anderen Elementen von Äußerungen zusammen, insbesondere mit Temporalverbialen, aber auch mit Nominalgruppen (NOGR, -*•) wie z.B. der ehemalige Präsident, der zukünftige Schwiegersohn etc.
Fastival
(1977)
Die hier versammelten Papiere stellen die schriftlichen Niederschläge einer Diskussion dar, die sich im Verlauf des Sommers 1974 abspielte. Den Beiträgen eignet der Charakter der spontanen Rede und Gegenrede; so mögen viele der enthaltenen Überlegungen keine abgeschlossenen Vorschläge ergeben. Dennoch wurde auf eine inhaltliche Überarbeitung verzichtet: Zum einen wäre sonst der Zusammenhang der gegeneinander aufgebauten Argumente zerstört worden, zum anderen kommen die Probleme und ihre schwebende (Un)-gelöstheit am besten in der kontradiktorischen Beleuchtung einer spontanen Diskussion zum Ausdruck.
fast, fast, fast ...
(1977)
In diesem Beitrag wird das internationale Forschungsnetzwerk EuroGr@mm' und die kontrastive Komponente der Internetplattform ProGr@mm1 des Instituts für Deutsche Sprache in Mannheim vorgestellt. In Kap. 2 wird auf die unterschiedlichen universitären und außeruniversitären Zielgruppen eingegangen. Die damit verbundenen Anwendungsmöglichkeiten werden in Kap. 3 gezeigt. Sie stützen sich dabei auf die mit der Lernplattform gewonnenen Erfahrungen aus der eigenen Praxis in der universitären Lehre. Danach wird in Kap. 4 exemplarisch ein zentraler Bereich der Grammatik - die Wortstellung - kontrastiv aus deutsch-ungarischer Perspektive betrachtet. Der Beitrag schließt mit der Zusammenfassung und einer kurzen Weiterführung zur Typologie (Kap. 5).
Vorschlag zu einer Typik der Kommunikationssituationen in der gesprochenen deutschen Standardsprache
(1975)
The paper discusses from various angles the morphosyntactic annotation of DeReKo, the Archive of General Reference Corpora of Contemporary Written German at the Institut für Deutsche Sprache (IDS), Mannheim. The paper is divided into two parts. The first part covers the practical and technical aspects of this endeavor. We present results from a recent evaluation of tools for the annotation of German text resources that have been applied to DeReKo. These tools include commercial products, especially Xerox' Finite State Tools and the Machinese products developed by the Finnish company Connexor Oy, as well as software for which academic licenses are available free of charge for academic institutions, e.g. Helmut Schmid's Tree Tagger. The second part focuses on the linguistic interpretability of the corpus annotations and more general methodological considerations concerning scientifically sound empirical linguistic research. The main challenge here is that unlike the texts themselves, the morphosyntactic annotations of DeReKo do not have the status of observed data; instead they constitute a theory and implementation-dependent interpretation. In addition, because of the enormous size of DeReKo, a systematic manual verification of the automatic annotations is not feasible. In consequence, the expected degree of inaccuracy is very high, particularly wherever linguistically challenging phenomena, such as lexical or grammatical variation, are concerned. Given these facts, a researcher using the annotations blindly will run the risk of not actually studying the language but rather the annotation tool or the theory behind it. The paper gives an overview of possible pitfalls and ways to circumvent them and discusses the opportunities offered by using annotations in corpus-based and corpus-driven grammatical research against the background of a scientifically sound methodology.
Conversation is usually considered to be grammatically simple, while academic writing is often claimed to be structurally complex, associated primarily with a greater use of dependent clauses. Our goal in the present paper is to challenge these stereotypes, based on the results of large-scale corpus investigations. We argue that both conversation and professional academic writing are grammatically complex but that their complexities are dramatically different. Surprisingly, the traditional view that complexity is realized through extensive clausal embedding leads to the conclusion that conversation is more complex than academic writing. In contrast, written academic discourse is actually much more ‘compressed’ than elaborated, and the complexities of academic writing are realized mostly as phrasal embedding rather than embedded clauses.
The development of tools for computer-assisted transcription and analysis of extensive speech corpora is one main issue at the Institute of German Language (IDS) and the Institute of Natural Language Processing (IMS). Corpora of natural spoken dialogue have been transcribed, and the analogue recordings of these discourses are digitized. An automatic segmentation system is employed which is based on Hidden Markov Models. The orthographic representation of the speech signal is transformed into a phonetic representation, the phonetic transcription is transformed into a system-internal representation, and the time alignment between text and speech signal follows. In this article, we also describe the retrieval software Cosmas II and its special features for searching discourse transcripts and playing time aligned passages.
Relativpronomenselektion und grammatische Variation: 'was' vs. 'das' in attributiven Relativsätzen
(2019)
Vorwort
(2006)
Vorwort
(2006)
This article details the process of creating the Nottinghamer Korpus deutscher YouTube-Sprache ('The Nottingham German YouTube Language Corpus' - or NottDeuYTSch corpus) and outlines potential research opportunities. The corpus was compiled to analyse the online language produced by young German-speakers and offers significant opportunity for in-depth research across several linguistic fields including lexis, morphology, syntax, orthography, and conversational and discursive analysis. The NottDeuYTSch corpus contains over 33 million words taken from approximately 3 million YouTube comments from videos published between 2008 to 2018 targeted at a young, German-speaking demographic and represent an authentic language snapshot of young German speakers. The corpus was proportionally sampled based on video category and year from a database of 112 popular German-speaking YouTube channels in the DACH region for optimal representativeness and balance and contains a considerable amount of associated metadata for each comment that enable further longitudinal cross-sectional analyses. The NottDeuYTSch corpus is available for analysis as part of the German Reference Corpus (DeReKo).
In sprachpragmatischen und Argumentationstheorien wird Aufrichtigkeit als normative Kommunikationsbedingung veranschlagt, deren Erfülltheit jedoch nur sehr begrenzt verhandelbar sei. Im Gegensatz dazu wird in diesem Beitrag anhand eines Gesprächsbeispiels untersucht, welche Relevanz Gesprächsteilnehmer Aufrichtigkeit beimessen, mit welchen Argumenten sie Aufrichtigkeit verhandeln und welche Funktionen die Argumente und Relevanzsetzungen im Hinblick auf den Gesprächszweck und die Handlungsorientierungen der Interaktanten haben. Die gesprächsanalytischen Resultate deuten darauf hin, daß zwischen erfahrungsbezogenen und strikt mentalistischen Kriterien für Aufrichtigkeit zu unterscheiden ist und daß der interpretativen Haltung des Rezipienten eine theoretisch bislang unterschätzte Rolle für die Beurteilung und Kommunikationsrelevanz der Aufrichtigkeit eines Kommunikators zukommt. Die empirische Untersuchung zeigt, daß die Thematisierung von Aufrichtigkeit eine mächtige rhetorische Ressource der Gesprächssteuerung darstellt. Ihre rhetorische Wirksamkeit beruht nicht darauf, daß Aufrichtigkeit eine faktisch konstitutive Kommunikationsbedingung ist, sondern verdankt sich der Tatsache, daß Aufrichtigkeit ein zentraler Wert einer alltagsweltlich dominanten mentalistischen Kommunikationsideologie ist, die sich in den normativen Bestimmungen von sprachpragmatischen und Argumentationstheorien reflektiert.
In this paper we present some preliminary considerations concerning the possibility of automatic parsing an annotated corpus for N-N compounds. This should in prin- ciple be possible at least for relational and stereotype compounds, if the lemmatization of the corpus connects the lemmata with lexical entries as described in Höhle (1982). These lexical entries then supply the necessary information about the argument structure of a relational noun or about the stereotypical purpose associated with the noun’s referent which can be used to establish a relation between the first and the head constituent of the compound.
Das Austrian Media Corpus (amc) ist mit derzeit rund 11 Mrd. Token eines der größten deutschsprachigen Korpora journalistischer Prosa. Es bietet damit weitreichende Analysemöglichkeiten für eine Vielzahl sprachwissenschaftlicher Aspekte, wie z. B. die Analyse grammatischer, orthographischer und lexikalischer Variation oder die Erforschung diskurslinguistischer wie attitudinal-perzeptiver Fragestellungen. In diesem Beitrag geben wir Einblicke in Beispielanalysen zu Standard(schrift)sprache auf Basis des amc sowie deren Bedeutung für die Erforschung von Sprachvariation in Österreich, um das enorme Potenzial des Korpus für sprachwissenschaftliche Fragestellungen zu illustrieren.
The availability of electronic corpora of historical stages of languages has been wel- comed as possibly attenuating the inherent problem of diachronic linguistics, i.e. that we only have access to what has chanced to come down to us - the problem which was memorably named by Labov (1992) as one of “Bad Data”. However, such corpora can only give us access to an increased amount ot historical material and this can essentially still only be a partial and possibly distorted picture of the actual language at a particular period of history. Corpora can be improved by taking a more representative sample of extant texts if these are available (as they are in significant number for periods after the invention of printing). But, as examples from the recently compiled GerManC corpus of seventeenth and eighteenth century German show, the evidence from such corpora can still fail to yield definitive answers to our questions about earlier stages of a language. The data still require expert interpretation, and it is important to be realistic about what can legitimately be expected from an electronic historical corpus.
Im Beitrag werden die Methodologie und die Ziele eines Projekts vorgestellt, das anstrebt, auf der Grundlage eines breiten Korpus von Texten aus allen Ländern und Regionen des zusammenhängenden deutschen Sprachgebiets die Variation in der Grammatik der geschriebenen deutschen Standardsprache zu erfassen, in einem Handbuch zu dokumentieren und damit eine Basis sowohl für Grammatiken als auch für weitergehende grammatische Untersuchungen zu schaffen. Nach einleitenden Bemerkungen zum Projekt und zu der Frage, in welcher Relation die geplante „Variantengrammatik des Standarddeutschen“ zum bereits erhältlichen „Variantenwörterbuch des Deutschen“ von Ammon et al. (2004) steht, folgt ein Forschungsüberblick zur grammatischen Variation in der Standardsprache. Dann werden Beispiele für grammatische Variabilität in verschiedenen Phänomenbereichen gegeben, und es wird anhand von zwei Fallbeispielen gezeigt, wie eine grammatische Beschreibung dieser Phänomene aussehen kann. Um Angaben zur arealen Distribution grammatischer Varianten machen zu können, wird den Analysen ein Korpus zugrunde gelegt, das sich auf den geschriebenen Standard beschränkt und darunter den Sprachgebrauch in der Presse fasst. Das Korpus, das als Basis für die Erstellung der geplanten Variantengrammatik dient, wird im Beitrag kurz vorgestellt, außerdem wird erläutert, welche Zielsetzungen mit einer solchen Grammatik verbunden sind.
Schriften
(2017)
Vorwort
(2017)
Vorwort
(2008)