OPUS 4 | Search

Faktoren der konvergenten und divergenten Äquivalenz von präpositionalen Wortverbindungen: Deutsch - Slowakisch (2018)

Ďurčo, Peter

Präpositionale Wortverbindungen (PWVs) und präpositionale lexikalisch geprägte Muster - speziell der Typ der binären Konstruktionen - sind ein in der (kontrastiven) Mehrwortforschung bislang kaum beachteter Typ, wie bereits mehrfach betont. Wenn in den deutschen PWVs die interne Stelle zwischen der Präposition und dem Nomen überproportional häufig nicht mit einem Artikel besetzt ist, ist bei solchen Kombinationen mit einem potenziell hohen Lexikalisierungsgrad zu rechnen. Solche PWVs kann man als autonome Einheiten auffassen, und dementsprechend soll man sie auch als feste Wortverbindungen untersuchen. Die formale und inhaltliche Grundlage für das kontrastive Modell bildet das UWV-Modell (vgl. Steyer 2000, 2013) und das Konzept lexikalisch geprägter Muster (siehe Steyer in diesem Band). Im Folgenden wird diese Herangehensweise auf die Äquivalenzfindung im Sprachenpaar Deutsch (DE) - Slowakisch (SK) angewendet. Einen zentralen Stellenwert nimmt die Kontrastierung von Kollokationsfeldern, von rekurrenten lexikalischen Erweiterungsmustern und komplexeren Wortverbindungsmuster ein. Es handelt sich um ein monodirektional angelegtes Modell Deutsch -> Fremdsprache, die korpusbasierte kontrastive Aufbereitung und Beschreibung schließt jedoch eine Bi- oder auch Multidirektionalität nicht aus. Die komplexe Äquivalenzproblematik und die entsprechenden Konvergenzen und Divergenzen werden in diesem Beitrag anhand folgender ausgewählter Kontrastbereiche im Vergleich Deutsch -> Zielsprache Slowakisch diskutiert: a) Verhältnis des deutschen Lemmas zu seinem prototypischen Äquivalent bzw. den prototypischen Äquivalenten, b) Bedeutung(en) und Gebrauchsspezifika der PWVs, c) interne und externe Variabilität der zugrundeliegenden Muster der PWVs und ihrer äquivalenten PWV-Muster; d) typische Einbettungen der äquivalenten PWVs in Satzkonstruktionen und semantische Merkmale verbaler Satelliten.

Verbale Konstruktionen auf dem Weg wohin? peut-être, maybe, scheints (2018)

Zifonun, Gisela

In Beispielen wie (1) Du hast scheints / Weiß Gott nichts begriffen. (2) It cost £200, give or take. (3) Qu’est ce qu’il a dit? werden verbale Konstruktionen (kurz: VK, hier jeweils die fett gesetzten Teile) in einer Weise gebraucht, die der Grammatik verbaler Konstruktionen zuwiderläuft. In (1) und (2) wird die verbale Konstruktion wie ein Adverb/eine Partikel gebraucht bzw. wie ein Ausdruck in der Funktion eines (adverbialen) Adjunkts/ Supplements. In (3) ist die verbale Konstruktion zum Bestandteil einer periphrastischen interrogativen Konstruktion geworden. Wie sind solche ‘Umfunktionalisierungen’ – wie ich das Phänomen zunächst vortheoretisch bezeichnen möchte – einzuordnen? Handelt es sich um Lexikalisierung oder um Grammatikalisierung? Oder um ein Phänomen der dritten Art? Die Umfunktionalisierung verbaler Syntagmen bzw. Konstruktionen – ich gebrauche die Abkürzung UVK für ‘umfunktionalisierte verbale Konstruktion(en)’ – ist ein bisher weniger gut untersuchtes Phänomen, etwa gegenüber der Umfunktionalisierung von Präpositionalphrasen, die sprachübergreifend zu komplexen, „sekundären“ Präpositionen werden können (man vergleiche DEU auf Grund + Genitiv / von, ENG on top of, FRA à cause de).

Topologie und Wortstruktur von Konnektoren im Sprachvergleich (2018)

Zifonun, Gisela

Am Beispiel von zwei Fallstudien wird die Frage der Generalisierbarkeit von an einer Einzelsprache gewonnenen Erkenntnissen über Verknüpfungselemente (Konnektoren) und konnektorale Strukturen aufgeworfen. Empirisch geht es zum einen um die Topologie von Adverbkonnektoren, zum anderen um das Verhältnis zwischen Adverbkonnektoren, Subjunktoren (bzw. Untersatzeinleitern) und den ihnen zugrundeliegenden Präpositionen. Methodischer Ausgangspunkt sind jeweils die Analysen und Klassifikationen des HDK, also ein dezidiert auf das Deutsche bezogener Ansatz. Es soll gezeigt werden, dass die feinkörnige einzelsprachliche Analyse, wie sie das HDK bietet, mit Gewinn auch auf andere europäische Sprachen, hier Englisch, Französisch und am Rande auch Polnisch, adaptiert werden kann, wenn die Rahmenbedingungen stimmen, also zugrundeliegende funktionale komparative Konzepte und sprachspezifische Strukturprinzipien beachtet werden. Dann ist auch ein Zugewinn für die Beschreibung des Deutschen zu erwarten.

Tag für Tag Arbeit über Arbeit: Konstruktionsgrammatische Zugänge zu Reduplikationsstrukturen im Deutschen (2018)

Ziem, Alexander

Der Beitrag gliedert sich in drei Teile. In Abschnitt 2 führe ich zunächst den Begriff der Phraseoschablone ein und erläutere, inwiefern diese Untergruppe der Phraseologismen Eigenschaften von grammatischen Konstruktionen aufweist, deren konzise Erfassung eine notwendige Voraussetzung dafür ist, Beschränkungen bei der Produktivität und der semantischen Variabilität der Phraseologismen zu erklären. Daran anschließend werden in Abschnitt 3 Ergebnisse einer korpuslinguistischen Fallstudie nominaler Reduplikationen mit den Präpositionen an, in und über dargelegt und erörtert. Abschnitt 4 fasst schließlich die erzielten Ergebnisse im übergeordneten Zusammenhang zusammen und gibt einen Ausblick auf weitere Forschungsfragen.

Musterbasierte Lexikografie und das Konstruktikon. Probleme und Perspektiven am Beispiel des deutschen in-Prädikativs (2018)

Zeschel, Arne

The effectiveness of lexicographic tools for optimising written L1-texts (2018)

Wolfer, Sascha ; Bartz, Thomas ; Weber, Tassja ; Abel, Andrea ; Meyer, Christian M. ; Müller-Spitzer, Carolin ; Storrer, Angelika

We present an empirical study addressing the question whether, and to which extent, lexicographic writing aids improve text revision results. German university students were asked to optimise two German texts using (1) no aids at all, (2) highlighted problems, or (3) highlighted problems accompanied by lexicographic resources that could be used to solve the specific problems. We found that participants from the third group corrected the largest number of problems and introduced the fewest semantic distortions during revision. Also, they reached the highest overall score and were most efficient (as measured in points per time). The second group with highlighted problems lies between the two other groups in almost every measure we analysed. We discuss these findings in the scope of intelligent writing environments, the effectiveness of writing aids in practical usage situations and teaching dictionary skills.

Negation modeling for German polarity classification (2018)

Wiegand, Michael ; Wolf, Maximilian ; Ruppenhofer, Josef

We present an approach for modeling German negation in open-domain fine grained sentiment analysis. Unlike most previous work in sentiment analysis, we assume that negation can be conveyed by many lexical units (and not only common negation words) and that different negation words have different scopes. Our approach is examined on a new dataset comprising sentences with mentions of polar expressions and various negation words. We identify different types of negation words that have the same scopes. We show that already negation modeling based on these types largely outperforms traditional negation models which assume the same scope for all negation words and which employ a window-based scope detection rather than a scope detection based on syntactic information.

Overview of the GermEval 2018 Shared Task on the Identification of Offensive Language (2018)

Wiegand, Michael ; Siegel, Melanie ; Ruppenhofer, Josef

We present the pilot edition of the GermEval Shared Task on the Identification of Offensive Language. This shared task deals with the classification of German tweets from Twitter. It comprises two tasks, a coarse-grained binary classification task and a fine-grained multi-class classification task. The shared task had 20 participants submitting 51 runs for the coarse-grained task and 25 runs for the fine-grained task. Since this is a pilot task, we describe the process of extracting the raw-data for the data collection and the annotation schema. We evaluate the results of the systems submitted to the shared task. The shared task homepage can be found at https://projects.cai. fbi.h-da.de/iggsa/

Wortbildung als grammatische Strukturbildung. Plädoyer für die Berücksichtigung der morphologischen "Antimaterie" (2018)

Werner, Martina

In current corpuslinguistic investigations, especially the collection of linguistic data and the frequency of linguistic phenomena (i.e. in the "linguistic matter") is in the center of interest of morphological discussions. This paper argues in favor of taking also morphological "antimatter" in account, i.e. surveying the structure of words containing morphological restrictions which cannot be proven systematically. With recourse to Popper's falsificationism and starting with prominent restrictions in the morphology of German, the article discusses theoretical consequences and chances for morphological theory with special emphasis on morphological change, i.e. when antimatter becomes matter and vice versa.

Referential null subjects in German. Dialects and diachronic continuity (2018)

Weiß, Helmut ; Volodina, Anna

Null subjects (NSs) have been a central research topic in generative syntax ever since the 1980s. This chapter considers the situation of German NSs both from a dialectological and from a diachronic perspective and attempts to reconstruct a direct line concerning the licensing conditions of pro-drop from Old High German (OHG) through Middle High German (MHG) and Early New High German (ENHG) to current dialects of New High German (NHG). Particularly, we will argue that German changed from a consistent, yet asymmetric pro-drop language to a partial, but symmetric one. In order to demonstrate that this development took place and the steps involved, we survey the existing empirical evidence and introduce new data.

An OT analysis of do-support across varieties of German (2018)

Weber, Thilo

Just like most varieties of West Germanic, virtually all varieties of German use a construction in which a cognate of the English verb 'do' (standard German 'tun') functions as an auxiliary and selects another verb in the bare infinitive, a construction known as 'do'-periphrasis or 'do'-support. The present paper provides an Optimality Theoretic (OT) analysis of this phenomenon. It builds on a previous analysis by Bader and Schmid (An OT-analysis of 'do'-support in Modern German, 2006) but (i) extends it from root clauses to subordinate clauses and (ii) aims to capture all of the major distributional patterns found across (mostly non-standard) varieties of German. In so doing, the data are used as a testing ground for different models of German clause structure. At first sight, the occurrence of 'do' in subordinate clauses, as found in many varieties, appears to support the standard CP-IP-VP analysis of German. In actual fact, however, the full range of data turn out to challenge, rather than support, this model. Instead, I propose an analysis within the IP-less model by Haider (Deutsche Syntax - generativ. Vorstudien zur Theorie einer projektiven Grammatik, Narr, Tübingen, 1993 et seq.). In sum, the 'do'-support data will be shown to have implications not only for the analysis of clause structure but also for the OT constraints commonly assumed to govern the distribution of 'do', for the theory of non-projecting words (Toivonen in Non-projecting words, Kluwer, Dordrecht, 2003) as well as research on grammaticalization.

Wortbildung und Variation bei Konnektoren (2018)

Waßner, Ulrich Hermann

In einem der zentralen Projekte der Abteilung Grammatik des IDS, Korpusgrammatik – grammatische Variation im standardsprachlichen und standardnahen Deutsch, wird derzeit u.a. die Wortbildung bearbeitet. Es werden auch Erkenntnisse und weiterführende Fragestellungen berücksichtigt, die sich aus dem Ende 2014 abgeschlossenen Projekt zur Semantik der deutschen Konnektoren ergeben haben. Das neue Projekt stützt sich noch stärker als schon das Konnektoren-Projekt auf Korpusauswertungen. Methodik und erste Ergebnisse werden im vorliegenden Text an zwei exemplarischen Fallgruppen demonstriert: Zunächst geht es um eine Reihe konzessiver Subjunktoren der Bildungsmuster ob-/wenn-/wiewohl etc.; sodann um Bildungen auf -falls, die zu den Adverbkonnektoren gehören. Bestand und sich aus dessen Systematisierung ergebende Wortbildungsmuster werden aus Korpusbelegen vervollständigt, und unterliegende Wortbildungsverfahren (im Kontrast zu der Lage bei den Hauptwortarten) werden diskutiert. Dabei zeigen sich unerwartete Mustervarianten, die auch Hinweise auf die Produktivität der Wortbildungsverfahren geben. Schließlich werden die Varianten mit grammatikexternen Metadaten korreliert, wobei die Möglichkeiten des statistischen Tools KoGra-R genutzt werden.

Henrike Helmer. 2016. Analepsen in der Interaktion. Semantische und sequenzielle Eigenschaften von Topik-Drop im gesprochenen Deutsch (OraLingua 13). Heidelberg: Universitätsverlag Winter. 274 S. Ewa Trutkowski. 2016. Topic Drop and Null Subjects in German (Linguistics and Philosophy 5). Berlin, Boston: De Gruyter. 248 S. [Rezension] (2018)

Volodina, Anna

angenommen ist nicht vorausgesetzt – eine korpuslinguistische Analyse (2018)

Volodina, Anna

In HDK-1 und in HDK-2 werden Perfektpartizipien wie angenommen und vorausgesetzt in der ‚absoluten‘ Verwendung ohne Auxiliar als vollständig grammatikalisierte Konnektoren mit konditionaler Semantik behandelt. Zwar werden sie von semantisch unterschiedlichen Verben gebildet, in der Verwendung als Konnektor lassen sich aber zumindest hinsichtlich der Wahrheitsbedingungen kaum semantische Unterschiede mehr erkennen. Deutliche Unterschiede zeigen sich aber im Sprachgebrauch: Basierend auf einer groß angelegten Korpusstudie wird gezeigt, dass sich angenommen und vorausgesetzt stark unterscheiden hinsichtlich a) ihrer Präferenz für die Einbettung von V2- vs. dass-Nebensätzen, b) des präferierten Verbmodus im Nebensatz, c) der topologischen Präferenz des untergeordneten Satzes sowie d) der Kookkurrenz mit anderen Ausdrücken. Es wird versucht, diese Unterschiede mit einem pragmatisch-funktionalen Ansatz zu erklären.

An empirically validated, onomasiologically structured, and linguistically motivated online terminology. Re-designing scientific resources on German grammar (2018)

Suchowolec, Karolina ; Lang, Christian ; Schneider, Roman

Terminological resources play a central role in the organization and retrieval of scientific texts. Both simple keyword lists and advanced modelings of relationships between terminological concepts can make a most valuable contribution to the analysis, classification, and finding of appropriate digital documents, either on the web or within local repositories. This seems especially true for long-established scientific fields with elusive theoretical and historical branches, where the use of terminology within documents from different origins is often far from being consistent. In this paper, we report on the progress of a linguistically motivated project on the onomasiological re-modeling of the terminological resources for the grammatical information system grammis. We present the design principles and the results of their application. In particular, we focus on new features for the authoring backend and discuss how these innovations help to evaluate existing, loosely structured terminological content, as well as to efficiently deal with automatic term extraction. Furthermore, we introduce a transformation to a future SKOS representation. We conclude with a positioning of our resources with regard to the Knowledge Organization discourse and discuss how a highly complex information environment like grammis benefits from the re-designed terminological KOS.

German lexicography in the Internet era (2018)

Storjohann, Petra

Language shift in slow motion: evidence from German-Canadian family papers (2018)

Stolberg, Doris

Language shift after migration has been reported to occur within three generations. While this pattern holds in many cases there is also some counter evidence. In this paper, family documents from a German immigration community in Canada are investigated to trace individual decisions of language choice that contributed to an extended process of shift taking four generations and more than a century.

Usuelle satzwertige Wortverbindungen und gebrauchsbasierte Muster (2018)

Steyer, Kathrin ; Hein, Katrin

Die Analyse sprachlicher Massendaten zeigt, wie zentral mehr oder weniger feste Wortverbindungen als Lexikoneinheiten für die Sprachkompetenz sind. Der Beitrag geht zunächst kurz auf aktuelle Entwicklungen in der Phraseologie ein: eine Abkehr von der starken Betonung des Idiosynkratischen einerseits und die Hinwendung zum Vorgeprägten andererseits. Wir führen hierzu den Terminus‚ lexikalisch geprägte Muster‘ (LGM) ein. In einer Detailanalyse beschäftigen wir uns mit satzwertigen Wortverbindungen im Spannungsfeld zwischen ausgeprägter Lexikalisierung, die auf eine gesonderte kognitive Verankerung hindeutet, und der Konstitution abstrakter Spruchmuster als LGM-Subtyp. Im zweiten Teil zeigen wir, wie usuelle Wortverbindungen innerhalb von Phrasenkomposita zur Lexembildung beitragen.

Lexikalisch geprägte Muster. Modell, Methoden und Formen der Onlinepräsentation (2018)

Steyer, Kathrin

Building a morphological treebank for German from a linguistic database (2018)

Steiner, Petra ; Ruppenhofer, Josef

German is a language with complex morphological processes. Its long and often ambiguous word forms present a bottleneck problem in natural language processing. As a step towards morphological analyses of high quality, this paper introduces a morphological treebank for German. It is derived from the linguistic database CELEX which is a standard resource for German morphology. We build on its refurbished, modernized and partially revised version. The derivation of the morphological trees is not trivial, especially for such cases of conversions which are morpho-semantically opaque and merely of diachronic interest. We develop solutions and present exemplary analyses. The resulting database comprises about 40,000 morphological trees of a German base vocabulary whose format and grade of detail can be chosen according to the requirements of the applications. The Perl scripts for the generation of the treebank are publicly available on github. In our discussion, we show some future directions for morphological treebanks. In particular, we aim at the combination with other reliable lexical resources such as GermaNet.

Multiethnolektale Syntax. Artikel, Präpositionen und Pronomen in der Jugendsprache (2018)

Siegel, Vanessa

Multiethnolektale Sprechweisen von Jugendlichen sind in mittel- und nordeuropäischen Ländern nicht nur ein Thema soziolinguistischer Forschung, sie werden auch in der Öffentlichkeit viel diskutiert. Trotz der großen Aufmerksamkeit, die das Thema auf sich zieht, gibt es für das Deutsche nur wenige Untersuchungen, die die linguistischen Phänomene auf ausreichender empirischer Basis beschreiben und auswerten. In der vorliegenden Korpusstudie wird die Sprache von Jugendlichen aus Stuttgart analysiert. Im Zentrum der Untersuchung stehen multiethnolektale Syntagmen, bei denen Artikel, Präpositionen und Pronomen nicht verwendet werden. Die Forschungsergebnisse basieren auf über 6.000 Einzelbelegen aus Audiodaten, die im Rahmen von informellen Interviews in den Stadtteilen Stuttgart-Nord, Bad Cannstatt und Hallschlag entstanden sind. Die Funktion und der Gebrauch von Artikeln, Präpositionen und Pronomen im autochthonen Deutschen werden detailliert beschrieben, bevor anhand von umfangreichen syntaktischen und semantischen Analysen die sprachlichen Bedingungen herausausgearbeitet werden, unter denen die Jugendlichen die multiethnolektalen Strukturen verwenden. Gestützt werden diese Auswertungen durch Aussagen über die Häufigkeit der grammatischen Varianten in den verschiedenen syntaktisch-semantischen Kontexten. Eine multivariate Analyse bindet zudem außersprachliche Faktoren, beispielsweise den Einfluss der verschiedenen Familiensprachen, mit ein und zeigt, welche Variablen die Verwendung der multiethnolektalen Syntagmen steuern. Darüber hinaus liefern Auswertungen und Beobachtungen zum situativen Gebrauch wichtige Forschungsergebnisse zur multiethnolektalen Sprachvariation.

Die Entstehung und Entwicklung des Begriffs (Deutsche) Stabilitätskultur (2018)

Schäfer, Stefan

Es ist nicht zuletzt die Stabilitätskultur der Währung wie auch der Staatsfinanzen, die seit ihrer Gründung immer zum Selbstverständnis der Bundesrepublik Deutschland gehört hat und gehört. (Bundesregierung 2010) Dieser Satz stammt aus der Regierungserklärung, die Angela Merkel am 19. Mai 2010 vor dem Deutschen Bundestag abgegeben hat, um die erste ‚Griechenland- Rettung‘ zu begründen. Dass die Bundeskanzlerin die „Stabilitätskultur der Währung“ an zentraler Stelle heranzieht, um ihre Position zu untermauern, ist kein Zufall; handelt es sich dabei doch um ein Konzept, welches nicht nur, wie die Kanzlerin selbst sagt, „immer zum Selbstverständnis der Bundesrepublik Deutschland gehört hat“, sondern insbesondere auch im Vorfeld der Euro-Einführung seit Beginn der 1990er Jahre im Mittelpunkt vieler Diskussionsbeiträge stand.

Sprachpurismus und Sprachkritik im Deutschen (2018)

Schwinn, Horst

Sprachpurismus ist eine Form der Sprachkritik, die sich die 'Reinhaltung‘ der Sprache zum obersten Ziel gesetzt hat. Unter Reinhaltung ist zunächst die Zurückdrängung fremdsprachlicher Einflüsse vor allem im Bereich der Lexik zu verstehen, aber auch Versuche der Herausbildung eines Standards und der Entwicklung einer Hochsprache bzw. Nationalsprache sind Gegenstände des Purismus. Sprachpurismus kann individuell als auch institutionell sein. Die ersten institutionellen Versuche zur Reinhaltung des Deutschen gehen auf die Sprachgesellschaften des 17. Jahrhunderts zurück. Diachron betrachtet hat sich der Fokus des Purismus auf unterschiedliche Aspekte der Sprache und der Sprachverwendung gerichtet; gemeinsam ist allen puristischen Bestrebungen, dass sie in der Regel gesellschaftlich an ein Erstarken des Nationalgefühls gekoppelt sind. Trotz institutioneller Bestrebung und im Gegensatz zu anderen Sprachen ist für das Deutsche der Purismus keine Form der Sprachpolitik, also nicht staatlich gelenkt.

Zur Semantik von Verben im Spracherwerb (2018)

Schulz, Petra

Nomen werden vermeintlich früher erworben als Verben, da sie dem Noun Bias zufolge konzeptuell einfacher sind. In Studien zum frühen Wortschatzerwerb spielen Verben folglich häufig keine prominente Rolle. Am Beispiel des Deutschen zeigt dieser Beitrag auf, wie sich die Verbbedeutung entwickelt. Dem hier vertretenen Ansatz des Event Structural Bootstrapping zufolge erschließen Kinder sich die Verbbedeutung durch eine Fokussierung auf den Endzustand. Daher spielen telische Verben fur den frühen Spracherwerb eine zentrale Rolle. Ergebnisse aus verschiedenen Spracherwerbsstudien zur Produktion und zur Interpretation von Verben bestätigen, dass deutschsprachige Kinder eine klare Endzustandsorientierung zeigen. Dass Verben und deren Semantik früher erworben werden als bis dato angenommen, spricht gleichzeitig gegen einen starken Noun Bias.

IAA-Werbung, Frankfurt 2015 - oder: der Retro-Brockhaus zum Selberschreiben (2018)

Sassen, Claudia

Die Internationale Auto-Ausstellung (IAA) wurde 2015 mit einer Enzyklopädie beworben, die genau drei Einträge bereithält: ‚Stau‘, ‚Auffahrunfall‘ und ‚Einparken‘. Die mit äußerster Beflissenheit vorgenommene Ausgestaltung dieser Einträge scheint eine Parodie authentischer Nachschlagewerke zu sein, bildet diese jedoch exakter ab, als man zu hoffen wagt.

Marek Konopka & Angelika Wöllstein (Hg.). 2017. Grammatische Variation. Empirische Zugänge und theoretische Modellierung (Jahrbuch des Instituts für Deutsche Sprache 2016). Berlin, Boston: De Gruyter Mouton. xvi, 356 S. (2018)

Salzmann, Martin

Distinguishing affixoid formations from compounds (2018)

Ruppenhofer, Josef ; Wiegand, Michael ; Wilm, Rebecca ; Markert, Katja

We study German affixoids, a type of morpheme in between affixes and free stems. Several properties have been associated with them – increased productivity; a bleached semantics, which is often evaluative and/or intensifying and thus of relevance to sentiment analysis; and the existence of a free morpheme counterpart – but not been validated empirically. In experiments on a new data set that we make available, we put these key assumptions from the morphological literature to the test and show that despite the fact that affixoids generate many low-frequency formations, we can classify these as affixoid or non-affixoid instances with a best F1-score of 74%.

Argument omissions in multiple German corpora (2018)

Ruppenhofer, Josef

A harmonised testsuite for POS tagging of German social media data (2018)

Rehbein, Ines ; Ruppenhofer, Josef ; Zimmermann, Victor

We present a testsuite for POS tagging German web data. Our testsuite provides the original raw text as well as the gold tokenisations and is annotated for parts-of-speech. The testsuite includes a new dataset for German tweets, with a current size of 3,940 tokens. To increase the size of the data, we harmonised the annotations in already existing web corpora, based on the Stuttgart-Tübingen Tag Set. The current version of the corpus has an overall size of 48,344 tokens of web data, around half of it from Twitter. We also present experiments, showing how different experimental setups (training set size, additional out-of-domain training data, self-training) influence the accuracy of the taggers. All resources and models will be made publicly available to the research community.

Phonological analysis at the word level: the role of corpora (2018)

Raffelsiefen, Renate ; Geumann, Anja

Notions such as “corpus-driven” versus “theory-driven” bring into focus the specific role of corpora in linguistic research. As for phonology with its intrinsic focus on abstract categorical representation, there is a question of how a strictly corpus-driven approach can yield insight into relevant structures. Here we argue for a more theory-driven approach to phonology based on the concept of a phonological grammar in terms of interacting constraints. Empirical validation of such grammars comes from the potential convergence of the evidence from various sources including typological data, neutralization patterns, and in particular patterns observed in the creative use of language such as acronym formation, loanword adaptation, poetry, and speech errors. Further empirical validation concerns specific predictions regarding phonetic differences among opposition members, paradigm uniformity effects, and phonetic implementation in given segmental and prosodic contexts. Corpora in the narrowest sense (i.e. “raw” data consisting of spontaneous speech produced in natural settings) are useful for testing these predictions, but even here, special purpose-built corpora are often necessary.

Phonologische Abstraktheit und symbolische Repräsentation (2018)

Raffelsiefen, Renate

Symbolische Repräsentation sprachlicher Lautstruktur beinhaltet die Zergliederung kontinuierlicher Rede in diskrete Einheiten, die mit einem finiten Inventar von Zeichen assoziiert werden. Die Grundidee hinter dieser Abstraktion ist, „wiederkehrendes“ Material, das trotz phonetischer Unterschiede als gleich aufgefasst wird, mit jeweils gleichen Zeichen zu assoziieren. Die Entwicklung geeigneter Verfahren zur Ermittlung einheitlicher und empirisch adäquater Abstraktionsgrade wurde in strukturalistischen Arbeiten vehement diskutiert, scheint aber allgemein seltsam vernachlässigt. In vorliegendem Beitrag wird ein solches im Rahmen der Optimalitätstheorie entwickeltes Verfahren anhand der sogenannten Vokalopposition im Deutschen vorgestellt. Verschiedene Typen konvergierender empirischer Evidenz untermauern die Annahme einer einzigen phonologisch relevanten Abstraktionsebene mit fünfzehn qualitativ unterschiedlichen Vollvokalen.

Handbuch der deutschen Sprachminderheiten in Übersee: Vorwort (2018)

Plewnia, Albrecht ; Riehl, Claudia Maria

54. Jahrestagung des Instituts für Deutsche Sprache (IDS): Neues vom heutigen Deutsch: empirisch - methodisch - theoretisch. 13. bis 15. März 2018 in Mannheim (2018)

Overath, Santana

Neues vom heutigen Deutsch. Empirisch - methodisch - theoretisch. Bericht von der 54. Jahrestagung des Instituts für Deutsche Sprache, Mannheim, 13. - 15. März 2018 (2018)

Overath, Santana

Über 400 Wissenschaftler/-innen aus insgesamt 25 verschiedenen Herkunftsländern kamen dieses Jahr zur 54. Jahrestagung des Instituts für Deutsche Sprache (IDS) nach Mannheim in den Rosengarten. Unter dem Titel „Neues vom heutigen Deutsch. Empirisch – methodisch – theoretisch“ konnten sich die Besucher/-innen hier über drei Tage hinweg insgesamt 14 Fachvorträge zu verschiedensten Gebieten der Sprachwissenschaft anhören.

Revisiting delayed completions. The retrospective management of co-participant action (2018)

Oloff, Florence

Since Lerner coined the notion of delayed completion in 1989, this recurrent social practice of continuing one’s speaking turn while disregarding an intermediate co-participant’s utterance has not been investigated with regard to embodied displays and actions. A sequential approach to videotaped mundane conversations in German will explain the occurrence and use of delayed completions. First, especially in multi-party and multi-activity settings, delayed completions can result from reduced monitoring and coordinating activities. Second, recipients can use intra-turn response slots for more extended responsive actions than the current speaker initially projected, leading to delayed completion sequences. Finally, delayed completions are used for blocking possibly misaligned co-participant actions. The investigation of visible action illustrates that delayed completions are a basic practice for retrospectively managing co-participant response slots.

Die Wucht und Strömung war immens – wie stark ist der Ellipseneffekt? (2018)

Münzberg, Franziska ; Hansen-Morath, Sandra

Our corpus study is concerned with subject-verb agreement in contemporary German, more precisely the variation in verb number. We focus on subjects consisting of noun phrases coordinated by the conjunction und (‘and’). In our samples, both nouns are in singular. Number resolution – i.e., plural verb despite of the singular nouns – can be regarded as the default choice in contemporary German. However, our data show that eliding the second determiner in the subject enhances the probability of using the singular verb. This ellipsis effect is highly significant in German and Austrian texts. It seems to be weaker in Swiss texts. Regression analyses reveal that the ellipsis effect is stronger than both the highly significant influence of subject individuation and the significant effect of subject agentivity.

Datenbank attributive Adjektive (2018)

Münzberg, Franziska ; Falke, Stefan ; Hansen-Morath, Sandra ; Waßner, Ulrich Hermann

In der Datenbank zum Datensatz attributive_Adjektive_1.csv finden sich 1.598 Belege zu artikellosen Nominalphrasen mit je zwei attributiven Adjektiven im Dativ Singular Maskulinum oder Neutrum. Die Datenbank attributive Adjektive enthält zu jedem Beleg neben dem Satzkontext eine Reihe von Annotationen. Dazu gehören Metadaten wie Register und regionale Zuordnung sowie Annotationen zur Phonologie, Morphosyntax, Semantik und Frequenz. Anhand dieser Annotationen lassen sich Hypothesen zur Adjektivflexion und -reihenfolge überprüfen. Nach einer Auswahl aus diesen Annotationen können Sie hier suchen. Alternativ können Sie unter „Download“ das gesamte Suchergebnis mit allen Annotationen und inklusive aller Belege, die bei der Untersuchung von Adjektivflexion und -reihenfolge als Fehlbelege eingestuft worden sind, herunterladen.

Datenbank attributive Adjektive (2018)

Münzberg, Franziska ; Falke, Stefan ; Hansen-Morath, Sandra ; Waßner, Ulrich Hermann

In der Datenbank zum Datensatz attributive_Adjektive_1.csv finden sich 1.598 Belege zu artikellosen Nominalphrasen mit je zwei attributiven Adjektiven im Dativ Singular Maskulinum oder Neutrum. Die Datenbank attributive Adjektive enthält zu jedem Beleg neben dem Satzkontext eine Reihe von Annotationen. Dazu gehören Metadaten wie Register und regionale Zuordnung sowie Annotationen zur Phonologie, Morphosyntax, Semantik und Frequenz. Anhand dieser Annotationen lassen sich Hypothesen zur Adjektivflexion und -reihenfolge überprüfen. Nach einer Auswahl aus diesen Annotationen können Sie hier suchen. Alternativ können Sie unter „Download“ das gesamte Suchergebnis mit allen Annotationen und inklusive aller Belege, die bei der Untersuchung von Adjektivflexion und -reihenfolge als Fehlbelege eingestuft worden sind, herunterladen.

Quantitative Analyse lexikalischer Daten (2018)

Müller-Spitzer, Carolin ; Wolfer, Sascha ; Koplenig, Alexander

Quantitativ ausgerichtete empirische Linguistik hat in der Regel das Ziel, grose Mengen sprachlichen Materials auf einmal in den Blick zu nehmen und durch geeignete Analysemethoden sowohl neue Phanomene zu entdecken als auch bekannte Phanomene systematischer zu erforschen. Das Ziel unseres Beitrags ist es, anhand zweier exemplarischer Forschungsfragen methodisch zu reflektieren, wo der quantitativ-empirische Ansatz fur die Analyse lexikalischer Daten wirklich so funktioniert wie erhofft und wo vielleicht sogar systembedingte Grenzen liegen. Wir greifen zu diesem Zweck zwei sehr unterschiedliche Forschungsfragen heraus: zum einen die zeitnahe Analyse von produktiven Wortschatzwandelprozessen und zum anderen die Ausgleichsbeziehung von Wortstellungsvs. Wortstrukturregularitat in den Sprachen der Welt. Diese beiden Forschungsfragen liegen auf sehr unterschiedlichen Abstraktionsebenen. Wir hoffen aber, dass wir mit ihnen in groser Bandbreite zeigen konnen, auf welchen Ebenen die quantitative Analyse lexikalischer Daten stattfinden kann. Daruber hinaus mochten wir anhand dieser sehr unterschiedlichen Analysen die Moglichkeiten und Grenzen des quantitativen Ansatzes reflektieren und damit die Interpretationskraft der Verfahren verdeutlichen.

Nonverbale graphische Ressourcen bei Reparaturen in der interaktionalen informellen Schriftlichkeit am Beispiel der deutschen Chat-Kommunikation via IRC-Chat und WhatsApp (2018)

Mostovaia, Irina

The aim of this paper is to present the results of an empirical analysis of the use of non-alphabetic graphic signs (e.g. asterisks, slashes, plus signs etc.) in the context of repairs in Russian and German informal electronic communication. The data for the analysis were taken from the “Mobile Communication Database MoCoDa” (http://mocoda.spracheinteraktion.de/), which contains Russian and German private electronic communication via SMS, WhatsApp and other short message services, and the “Dortmunder Chat-Korpus” (http://www.chatkorpus.tu-dortmund.de/korpora.html). This paper describes the functions of various graphic resources in the context of repairs in both data collections and compares the occurrences of these functions in current Russian and German computer-mediated communication. It concludes that particular signs in both data sets share the same subset of functions, but they differ in terms of how frequently these resources occur in each form of communication.

Der Ausdruck der Intensivierung in komparativen Phrasem-Konstruktionen im Deutschen und im Italienischen: Eine konstruktionsgrammatische Untersuchung (2018)

Mollica, Fabio ; Schafroth, Elmar

Im Folgenden werden wir uns überwiegend mit der syntaktischen Realisierung der Intensivierung auseinandersetzen, wobei die morphologische anhand des Phänomens der Komposition nicht unkommentiert bleiben wird. Im Vordergrund unserer Analyse stehen überwiegend Fälle lexikalischer und se-mantischer bzw. funktionaler Divergenz zwischen dem Deutschen und dem Italienischen. Die von uns analysierten komparativen Phraseologismen wurden anhand einer Suche in ein- und zweisprachigen Wörterbüchern des Deutschen und des Italienischen ausgewählt. Unser Beitrag ist wie folgt strukturiert: Kapitel 2 gibt einen Überblick über die komparative Phrasem-Konstruktion aus kontrastiver Sicht: Es werden ihre strukturellen (morphosyntaktischen), semantischen und pragmatischen Hauptmerkmale beschrieben. Aufgrund ihrer Frequenz wird überwiegend auf die Subtypen mit einem Verb (Kap. 2.1.) und einem prädikativen Adjektiv (2.2.) als tertium comparations eingegangen. Da die Beziehung zwischen Metapher und Vergleich sehr eng ist, werden in Kapitel 3 die Analogien und Unterschiede zwischen diesen rhetorischen Figuren kurz skizziert. Kapitel 4 ist der interlingualen Analyse der phraseologischen Einheiten gewidmet, bei denen dasselbe Konzept im Deutschen und im Italienischen entweder durch einen (lexikalisierten) Vergleich oder durch eine (lexikalisierte) Metapher realisiert wird. Wie zu sehen sein wird, kann man außerdem intralingual manchmal auch die Kookkurrenz beider sprachlichen Formen feststellen. In Kapitel 5 wird der Objektbereich der komparativen Phrasem-Konstruktionen aus konstruktionsgrammatischer Sicht vertieft, wobei vor allem auf Hierarchisierungen von Konstruktionen, Vererbungsrelationen, Produktivität, kognitive Verfestigung (entrenchment) und Emergenzphänomene eingegangen wird.

fLexiCoGraph: creating and managing curated graph-based lexicographical data (2018)

Meyer, Peter ; Eppinger, Mirjam

We present the conceptual foundations and basic features of fLexiCoGraph, a generic software package for creating and presenting curated human-oriented lexicographical resources that are roughly modeled according to Měchura’s (2016) idea of graph-augmented trees. The system is currently under development and will be made accessible as open source software. As a sample use case we discuss an existing online database of loanwords borrowed from German into other languages which is based on a growing number of language-specific loanword dictionaries (Lehnwortportal Deutsch). The paper outlines the conceptual foundations of fLexiCoGraph’s hybrid graph/XML data model. To establish a database, XML-based resources may be imported or even input manually. An additional graph database layer is then constructed from these XML source documents in a freely configurable, but automated way; subsequently, the resulting graph can be manipulated and enlarged through a visual user interface in such a way that keeps the relationship to the source document information explicit at all times. We sketch the tooling support for different kinds of graph-level editing processes, including mechanisms for dealing with updated XML source documents and coping with duplicate or inconsistent information, and briefly discuss the browser interface for end users.

Auf der Suche nach Äquivalenz. Lexikalisch geprägte Muster kontrastiv: Deutsch-Spanisch (2018)

Mellado Blanco, Carmen ; Steyer, Kathrin

Erwartungen an eine korpusbasierte lexikografische Ressource zur ‚Lexik des gesprochenen Deutsch in der Interaktion‘: Ergebnisse aus zwei empirischen Studien (2018)

Meliss, Meike ; Möhrs, Christine ; Ribeiro Silveira, Maria

Two empirical studies were carried out in the project „Lexik des gesprochenen Deutsch” (LeGeDe) at the Institute for the German Language (IDS) in Mannheim. The main goal of these studies was to shed light on people’s expectations of the planned lexicographical online-resource. In the first study, selected experts were interviewed in the form of a guided interview. In the second study, a broader online survey was conducted, which should reach a wider range of potential users. This contribution introduces the basic concepts of the project LeGeDe, outlines the two studies and presents selected results on four subject blocks: (i) sociodemographic data, (ii) personal use of (online) dictionaries, (iii) individual experience with the lexis of spoken language and (iv) expectations concerning a lexicographical online-resource for spoken German.

Creating a list of headwords for a lexical resource of spoken German (2018)

Meliss, Meike ; Möhrs, Christine ; Batinić, Dolores ; Perkuhn, Rainer

Except for some recent advances in spoken language lexicography (cf. Verdonik & Sepesy Maučec 2017, Hansen & Hansen 2012, Siepmann 2015), traditional lexicographic work is mainly oriented towards the written language. In this paper, we describe a method we used to identify relevant headword candidates for a lexicographic resource for spoken language that is currently being developed at the Institute for the German Language (IDS, Mannheim). We describe the challenges of the headword selection for a dictionary of spoken language, and having made considerations regarding our headword concept, we present the corpus-based procedures that we used in order to facilitate the headword selection. After presenting the results regarding the selection of one-word lemmas, we discuss the opportunities and limitations of our approach.

Expansivergänzungen und Verbklassen: Eine inter- und intralinguale Annäherung (2018)

Meliss, Meike

Ausgehend von der engelschen Ergänzungstypologie soll in dem Beitrag die Leistung der Expansivergänzung für valenztheoretisch fundierte Verbanalysen in Verbindung mit bestimmten Verbsubklassen genauer untersucht werden. Eine ausführliche Darstellung der Begriffsgeschichte und der Abgrenzungsproblematik zeigt die Notwendigkeit auf, die semantischen, morpho-syntaktischen und funktionalen Kriterien zur Begriffsbestimmung für inter- und intralinguale Studien integrativ zu erfassen.

Fussball digital - korpuslinguistische Perspektiven auf die Sprache des Fussballs (2018)

Meier, Simon

Fußball wird nicht nur gespielt und geschaut. Über Fußball wird auch gesprochen und geschrieben, und zwar überaus ausdauernd und ausführlich. Um jedes Fußballspiel herum rankt sich eine Vielzahl von Kommunikationsereignissen, Gesprächen und Texten, in denen das eigentliche Spielgeschehen kommentiert, besprochen und gedeutet wird. Das beginnt beim Coaching am Spielfeldrand und in der Kabine, bei den Zurufen, Choreografien und Sprechchören der Fans auf den Tribünen und reicht über die Interviews mit Spielern, Trainern und Experten, die Spielberichte und -analysen in Fernsehen, Radio, Presse bis hin zu den unzähligen Alltagsgesprächen, in denen etwa die Ergebnisse vom Vortag diskutiert werden. In jüngerer Zeit haben sich zudem im Internet neue Formen des Redens über den Fußball etabliert. Liveticker informieren über die gerade laufenden Spiele, Taktikblogs wie <spielverlagerung.de> liefern ausführlichste Taktikanalysen, und auch in sozialen Netzwerken wie Twitter oder Facebook ist der Fußball eine schier unerschöpfliche thematische Ressource.

Experimentelle Syntax: eine Fallstudie zur Verbalkomplexbildung im Deutschen (2018)

Markus, Bader ; Ellsiepen, Emilia

This paper shows how experimental methods can advance syntactic description and syntactic theory. The empirical domain is the order of verbs in German verb clusters containing a modal verb in the perfect. Such clusters are special insofar as prescriptive grammar requires the finite verb to appear in cluster-initial instead of cluster-final position (e.g., hat lesen müssen 'has read must' instead of lesen müssen hat 'read must has'). Contrary to this requirement, experiments show that native speakers accept the auxiliary also in later positions as long as it precedes the modal verb. The acceptability data are corroborated by corpus data and experimental data from language production. The relevance of the experimental data for syntactic theory are discussed.

„Ich zerstöre meinen Feind“ – die Evolution von Battle-Rap in Deutschland (2018)

Margara, Andreas

Das Wörterbuch "Idiomatik Deutsch-Spanisch" (2013) aus der Sicht muster- und formelhaften Sprachgebrauchs (2018)

Mansilla, Ana

Eine Wörterbuchforschung für das Sprachenpaar Deutsch-Spanisch an der Schnittstelle zwischen Phraseologie und Konstruktionsgrammatik existiert bislang praktisch nicht. Ziel der vorliegenden Arbeit ist es daher, einen Beitrag zur Schließung dieser Lücke zu leisten, und zwar am Beispiel der „Idiomatik Deutsch-Spanisch" (IDSP) (Schemann et al. 2013). Die Phraseologieforschung befasst sich zwar schon lange mit nicht-kompositionalen Konstruktionen (die heterogen benannt werden z.B. Satzmuster, Phraseoschablonen, Phrasem- Konstruktionen, Schemata), die empirische Fundierung ist aber eher noch unsystematisch und bezogen auf die Lexikografie eher noch im Anfang begriffen. Es wird zum einen gezeigt, welchen großen Stellenwert solchen Mustern in der „Idiomatik Deutsch-Spanisch" (ebd.) zukommt. Zum anderen wird ein Vorschlag unterbreitet, mit dem die im Wörterbuch verzeichneten Phraseme und Muster unter einer dem Aspekt verfestigter Muster und Schemata klassifiziert und gruppiert werden können.

Open Access

Refine

Author

Year of publication

Document Type

Language

Has Fulltext

Is part of the Bibliography

Keywords

Publicationstate

Reviewstate

Publisher

142 search hits