Refine
Year of publication
- 2019 (361) (remove)
Document Type
- Article (124)
- Part of a Book (110)
- Conference Proceeding (39)
- Book (34)
- Review (25)
- Part of Periodical (14)
- Other (9)
- Working Paper (4)
- Doctoral Thesis (1)
- Report (1)
Language
- German (250)
- English (106)
- Multiple languages (2)
- Ukrainian (2)
- Chinese (1)
Keywords
- Deutsch (144)
- Korpus <Linguistik> (65)
- Gesprochene Sprache (26)
- Sprache (19)
- Konversationsanalyse (17)
- Rezension (16)
- Automatische Sprachanalyse (15)
- Grammatik (15)
- Interaktion (15)
- Kommunikation (15)
Publicationstate
- Zweitveröffentlichung (164)
- Veröffentlichungsversion (137)
- Postprint (29)
- Erstveröffentlichung (2)
Reviewstate
- Peer-Review (148)
- (Verlags)-Lektorat (145)
- (Verlags-)Lektorat (2)
- Peer review (1)
- Peer-review (1)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (1)
Publisher
- de Gruyter (66)
- Leibniz-Institut für Deutsche Sprache (IDS) (33)
- Leibniz-Institut für Deutsche Sprache (20)
- Erich Schmidt (18)
- Narr Francke Attempto (11)
- German Society for Computational Linguistics & Language Technology und Friedrich-Alexander-Universität Erlangen-Nürnberg (9)
- Stauffenburg (8)
- Winter (8)
- Institut für Deutsche Sprache (7)
- Lang (6)
Der Blick auf die Syntax und generell auf die Grammatik ist traditionell aszendent, 'von unten nach oben' gerichtet: Einer Wortgrammatik folgt eine Satzgrammatik und dieser eventuell eine Textgrammatik. Doch wir schreiben und sprechen weder in Wörtern noch in Sätzen, sondern wir produzieren Texte und Gespäche. Deshalb musste auch der diametral entgegengesetzte Blick, der zu einer deszendenten Grammatik fuhrt, möglich sein. Eine solche Grammatik liegt mit der Grammatischen Textanalyse (= GTA), einer funktionalen Syntax des Gegenwartsdeutschen vor, die das grammatische System 'von oben nach unten' - von der Text- (Textglieder) über die Satz- (Satzglieder) zur Wortgruppenebene (Wortgruppenglieder) - modelliert. Im Beitrag werden Grundlagen und Leitbegriffe der GTA vorgestellt und an ausgewählten Phänomenen exemplifiziert.
Linguistic relativists have traditionally asked 'how language influences thought', but conversation analysts and anthropological linguists have moved the focus from thought to social action. We argue that 'social action' should in this context not become simply a new dependent variable, because the formulation 'does language influence action' suggests that social action would already be meaningfully constituted prior to its local (verbal and multi-modal) accomplishment. We draw on work by the gestalt psychologist Karl Duncker to show that close attention to action-in-a-situation helps us ground empirical work on cross-cultural diversity in an appreciation of the invariances that make culture-specific elements of practice meaningful.
Ziel des Beitrags ist es, in einer explorativen Untersuchung zu ermitteln, ob und wie in Deutschland und in Polen geschlechtergerechter Sprachgebrauch praktiziert wird. In beiden Gesellschaften wird derzeit mit den einschlägigen Verfahren noch experimentiert. Die feministische Presse spielt dabei eine Vorreiterrolle. Der Beitrag ist in drei inhaltliche Teile gegliedert. Der erste Teil schildert in knapper Form die Entwicklung in der sprachlichen Markierung von Sexuszugehörigkeit und -differenz, wie sie in der deutschen und der polnischen Gesellschaft in der Nachkriegszeit stattgefunden hat. Der zweite Teil befasst sich mit den sprachstrukturellen Grundlagen für die Möglichkeiten des ›Genderns‹ in beiden Sprachen. Hier werden sowohl Gemeinsamkeiten als auch Unterschiede nachgewiesen. Der dritte Teil ist einer kleinen empirischen Studie gewidmet. Es werden Publikationen in erster Linie der feministischen Presse beider Länder aus der jüngsten Zeit auf ihren Umgang mit geschlechterdifferenzierender Sprache hin untersucht.
Novel formats of construction-based description hold great potential for phenomena that fall through the cracks in traditional kinds of linguistic reference works. On the example of German verb argument structure constructions with a prepositional object, we demonstrate that a construction-based description of such phenomena is superior to existing lexicographic and grammaticographic treatments, but that it also poses a number of new problems. The most fundamental of these relates to the fact that construction-based analyses can be proposed on different levels of abstraction. We illustrate pertinent problems relating to the precise identification of constructional form and meaning and suggest a multi-layered descriptive format for web-based electronic reference constructica that can accommodate these challenges. Semantically, the proposed solution integrates both lumping and splitting perspectives on constructional grain size and permits users to flexibly zoom in and out on individual elements in the resource. Formally, it can capture variation in the number and marking of realised arguments as found in e.g. passives and transitivity alternations. Aspects of the theoretical controversy between Construction Grammar and Valency Theory are addressed where relevant, but our focus is on questions of description and the practical implementation of construction-based analyses in a suitable type of linguistic reference work.
Der Beitrag untersucht das Zusammenspiel von funktionaler Spezialisierung und phonetischer Reduktion bei pragmatischen Markern aus komplexen Syntagmen. Im Fokus steht die Reduktionsform [ˈzɐmɐ], die potenziell auf die Marker <ich sag mal> oder <sagen wir (mal)> zurückgeführt werden konnte. Anhand einer Analyse ihrer phonetischen Reduktionsformen und Interaktionsfunktionen wird gezeigt, dass eine Rückführung auf <sagen wir (mal)> plausibler ist. Im Anschluss werden Realisierungen der Wortverbindung ‚sagen wir‘ als kompositioneller Matrixsatz mit Verwendungen als pragmatischer Marker verglichen. Die Befunde deuten auf einen Einfluss der Funktion der Zielstruktur auf ihre lautliche Realisierung hin, was sich als Indiz für einen unabhängigen Zeichenstatus der reanalysierten Markerverwendung interpretieren lasst.
In German linguistics, a traditional distinction is made between (i) prepositional objects (POs) and prepositional adverbials, and (ii), among the latter, between adverbial complements and adjuncts. As a contribution to the debate on points of contact and possible syntheses between valency-based and construction-based approaches to verb argument structure, a corpus-based constructionist account of German PO and PP adverbial verb argument structures involving the preposition vor ‘in front of’ is developed. It is argued that ‘desemanticised’ PO-uses of vor are markers of inherently meaningful verb argument structure constructions that form a transparently motivated network comprising both PO and PP adverbial patterns. Analyses are presented for five interrelated families of vor constructions within the overall network thus defined. Their meanings are shown to reflect an interplay of more concrete spatial meanings of the preposition and the lexical semantics of verbal fillers of these constructions. Once conventionalised, they are subject to regular processes of metaphorical and metonymic semantic extension that are tentatively unravelled to create an integrated semantic map of verbal vor-constructions in present day German.
Smooth turn-taking in conversation depends in part on speakers being able to communicate their intention to hold or cede the floor. Both prosodic and gestural cues have been shown to be used in this context. We investigate the interplay of pitch movements and hand gestures at locations at which speaker change becomes relevant, comparing their use in German and Swedish. We find that there are some shared functions of prosody and gesture with regard to turn-taking in the two languages, but that these shared functions appear to be mediated by the different phonological demands on pitch in the two languages.
Looking at gestures as a means for communication, they can serve conversational participants at several levels. As co-speech gestures, they can add information to the verbally expressed content and they can serve to manage turn-taking. In order to look closer at the interplay between these resources in face-to face conversation, we annotated hand gestures, syntactic completion points and the related turn-organisation, and measured the timing of gesture strokes and their lexical/phrasal referent. In a case study on German, we observe the trend that speakers vary less in gesturelexis on- and offsets when keeping the turn after syntactic completions than at speaker changes, backchannel or other locations of a conversation. This indicates that timing properties of non-verbal cues interact with verbal cues to manage turn-taking.
The following article shows how several verbal argument structure patterns can build clusters or families. Argument structure patterns are conceptualised as form-meaning pairings related by family relationships. These are based on formal and / or semantic characteristics of the individual patterns making up the family. The small family of German argument structure patterns containing vor sich her and vor sich hin is selected to illustrate the process whereby pattern meaning combines with the syntactic and semantic properties of the patterns’ individual components to constitute a higher-level family or cluster of argument structure patterns. The study shows that the patterns making up the family are similar with regard to some of their formal characteristics, but differ quite clearly with respect to their meaning. The article also discusses the conditions of usage of the individual patterns of the family, the contribution of verb meaning and prepositional meaning to the overall meaning of the patterns, coercion effects, and productivity issues.
We examine the new task of detecting derogatory compounds (e.g. curry muncher). Derogatory compounds are much more difficult to detect than derogatory unigrams (e.g. idiot) since they are more sparsely represented in lexical resources previously found effective for this task (e.g. Wiktionary). We propose an unsupervised classification approach that incorporates linguistic properties of compounds. It mostly depends on a simple distributional representation. We compare our approach against previously established methods proposed for extracting derogatory unigrams.
We discuss the impact of data bias on abusive language detection. We show that classification scores on popular datasets reported in previous work are much lower under realistic settings in which this bias is reduced. Such biases are most notably observed on datasets that are created by focused sampling instead of random sampling. Datasets with a higher proportion of implicit abuse are more affected than datasets with a lower proportion.
We present a descriptive analysis on the two datasets from the shared task on Source, Subjective Expression and Target Extraction from Political Speeches (STEPS), the only existing German dataset for opinion role extraction of its size. Our analysis discusses the individual properties of the three components, subjective expressions, sources and targets and their relations towards each other. Our observations should help practitioners and researchers when building a system to extract opinion roles from German data.
A Supervised learning approach for the extraction of opinion sources and targets from German text
(2019)
We present the first systematic supervised learning approach for the extraction of opinion sources and targets on German language data. A wide choice of different features is presented, particularly syntactic features and generalization features. We point out specific differences between opinion sources and targets. Moreover, we explain why implicit sources can be extracted even with fairly generic features. In order to ensure comparability our classifier is trained and tested on the dataset of the STEPS shared task.
In diesem Artikel wird der Tempus-Modus-Gebrauch in indirekter Redewiedergabe im Niederdeutschen im Vergleich mit dem Hochdeutschen, Englischen und Norwegischen untersucht. Die hochdeutsche Standardsprache verfügt über eine voll ausgebaute Indikativ-Konjunktiv-Unterscheidung, wobei eine der Funktionen des Konjunktivs in der Markierung indirekter Rede besteht. Viele andere germanische Sprachen, hier vertreten durch das Englische und Norwegische, kennen keine vergleichbare Konjunktivkategorie (mehr). Indirekte Rede steht dort im Indikativ, wobei häufig das Phänomen der Tempusverschiebung zu beobachten ist. Das nördliche Niederdeutsche kennt ebenfalls keine distinkten Konjunktivformen, womit sich die Frage stellt, ob auch die Redewiedergabe wie in den anderen konjunktivlosen Sprachen funktioniert. Der vorliegende Beitrag geht dieser Frage im Rahmen einer empirischen Untersuchung nach. Als Datengrundlage dienen nordniederdeutsche Radionachrichten. Es zeigt sich, dass die Verteilung von Präsens und Präteritum in den niederdeutschen Radiodaten weiter ausfällt als in den konjunktivlosen Vergleichssprachen: Das Präsens tritt, wie im Hochdeutschen, auch dort auf, wo im Englischen und Norwegischen mit einer Verschiebung zum Präteritum zu rechnen wäre. Und für das Präteritum ergibt sich eine reportiv-konjunktivische Verwendung, die keine Entsprechung im Englischen oder Norwegischen hat.
Variation im Sprachgebrauch - 'angenommen' und 'vorausgesetzt' als einbettende Prädikatsausdrücke
(2019)
Gegenstand ist eine vergleichende empirische Korpusstudie zur Bedeutung des Ausdrucks geschäftsmäßig im (bundesdeutschen) Gemeinsprach- und juristischen Fachsprachgebrauch. Die Studie illustriert an einem aktuellen Fall strittiger Wortdeutung (hier zu § 217 StGB) die Möglichkeiten computergestützter Sprachgebrauchsanalyse für die Auslegung vor Gericht und die Normtextprognose in der Rechtsetzung.
Naming and titling have been discussed in sociolinguistics as markers of status or solidarity. However, these functions have not been studied on a larger scale or for social media data. We collect a corpus of tweets mentioning presidents of six G20 countries by various naming forms. We show that naming variation relates to stance towards the president in a way that is suggestive of a framing effect mediated by respectfulness. This confirms sociolinguistic theory of naming and titling as markers of status.
Little strokes fell great oaks. Creating CoRoLa, the reference corpus of contemporary Romanian
(2019)
The paper presents the quite long-standing tradition of Romanian corpus acquisition and processing, which reaches its peak with the reference corpus of contemporary Romanian language (CoRoLa). The paper describes decisions behind the kinds of texts collected, as well as processing and annotation steps, highlighting the structure and importance of metadata to the corpus. The reader is also introduced to the three ways in which (s)he can plunge into the rich linguistic data of the corpus, waiting to be discovered. Besides querying the corpus, word embeddings extracted from it are useful to various natural language processing applications and for linguists, when user-friendly interfaces offer them the possibility to exploit the data.
This paper describes a rule-based approach to detect direct speech without the help of any quotation markers. As datasets fictional and non-fictional texts were used. Our evaluation shows that the results appear stable throughout different datasets in the fictional domain and are comparable to the results achieved in related work.
In this chapter, we discuss steps toward extending CMDI’s semantic interoperability beyond the Social Sciences and Humanities: We stress the need for an initial data curation step, in part supported by a relation registry that helps impose some structure on CMDI vocabulary; we describe the use of authority file information and other controlled vocabulary to help connecting CMDI-based metadata to existing Linked Data; we show how significant parts of CMDI-based metadata can be converted to bibliographic metadata standards and hence entered into library catalogs; and finally we describe first steps to convert CMDI-based metadata to RDF. The initial grassroots approach of CMDI (meaning that anybody can define metadata descriptors and components) mirrors the AAA slogan of the Semantic Web (“Anyone can say Anything about Any topic”). Ironically, this makes it hard to fully link CMDI-based metadata to other Semantic Web datasets. This paper discusses the challenges of this enterprise.
The transfer of research data management from one institution to another infrastructural partner is all but trivial, but can be required, for instance, when an institution faces reorganization or closure. In a case study, we describe the migration of all research data, identify the challenges we encountered, and discuss how we addressed them. It shows that the moving of research data management to another institution is a feasible, but potentially costly enterprise. Being able to demonstrate the feasibility of research data migration supports the stance of data archives that users can expect high levels of trust and reliability when it comes to data safety and sustainability.
Im vorliegenden Beitrag werden auf der Grundlage authentischer Alltagsinteraktionen die Funktionsspektren der Modalpartikeln 'eben' und 'halt' beschrieben. Es wird dargelegt, dass die Partikeln keinesfalls synonym verwendet werden, sondern distinktive Verwendungen aufweisen. Für 'halt' zeigen sich die drei prominenten Verwendungsweisen i) der Kohärenzherstellung, ii) der Verweis auf gemeinsames Wissen und iii) der Einsatz zur informationsstrukturellen (Beitrags-)Gliederung. 'Eben' wird ebenfalls häufig zur Kohärenzherstellung eingesetzt, und trägt darüber hinaus besonders häufig als strategische Ressource zur rhetorischen Verstärkung einer Argumentation oder Schlussfolgerung bei. Abschließend werden die in der Literatur oft behauptete Ersetzbarkeit von 'halt' durch 'eben' und umgekehrt sowie die häufig zugeschriebene Konnotation von Unabänderlichkeit und Sprecherresignation diskutiert.
In this paper we present the results of a survey conducted among students of German Philology at Adam Mickiewicz University in Poznań in the years 2015–2017. The target group was composed of first-semester students from whom we collected data about their lexicographical competence at the start of the program. The results contain some interesting findings, e.g. students prefer online dictionaries, but the number of students using print dictionaries is comparable and we have also observed the rising number of students who use smartphone applications. The aim of the survey is to provide information for university instructors who teach German as a foreign language (DaF) and lexicography.
We present the second edition of the GermEval Shared Task on the Identification of Offensive Language. This shared task deals with the classification of German tweets from Twitter. Two subtasks were continued from the first edition, namely a coarse-grained binary classification task and a fine-grained multi-class classification task. As a novel subtask, we introduce the classification of offensive tweets as explicit or implicit.
The shared task had 13 participating groups submitting 28 runs for the coarse-grained
task, another 28 runs for the fine-grained task, and 17 runs for the implicit-explicit
task.
We evaluate the results of the systems submitted to the shared task. The shared task homepage can be found at https://projects.fzai.h-da.de/iggsa/
Der Beitrag behandelt das Zusammenspiel von Text und Interaktion im Internet. Abschnitt 2 erläutert am Beispiel der Wikipedia, wie sich die textorientierte Arbeit an den Artikeln und das interaktionsorientierte Diskutieren funktional ergänzen. Abschnitt 3 untersucht Links als digitale Kohärenzbildungshilfen und zeigt an einem Fallbeispiel, wie diese in den schriftlichen Diskussionen dafür genutzt werden, relevante Informationen im „virtuellen“ Aufmerksamkeitsbereich präsent und für phorische und deiktische Bezugnahmen zugänglich zu machen. Abschnitt 4 diskutiert Ergebnisse aus zwei Vergleichsstudien zum Gebrauch der Konnektoren 'weil' sowie 'sprich' und 'd.h.' in Wikipedia-Artikeln und Diskussionen, die auf der Basis von Wikipedia-Korpora in der DeReKo-Sammlung des IDS durchgefuhrt wurden.
This paper focuses on easily confused items (so-called paronyms) in German in terms of their general, technical or academic contextual uses. It outlines the semantic discrepancies between contextual usages of pairs such as Methode/Methodologie/Methodik and unehelich/nichtehelich/außerehelich depending on their linguistic registers and varieties. While previous studies lack empirical evidence and primarily operate with morphological criteria (cf. Lăzărescu 1999) the descriptions here derive from corpus-based examinations of general written and of technical discourse. It is shown that causes of lexical confusion arise from formal, phonetic resemblances or semantic similarities, regular co-occurrence, incorrect morphological analogies and political governance of language. Context, knowledge, associations and experience determine the choice of lexical terms. Speakers need to apply linguistic and extra-linguistic principles in order to create adequate contexts. With the help of paronym examples and corpus data, these will be elucidated in more detail.
Der Beitrag führt in das Sonderheft „Paronymie im deutschen Sprachgebrauch“ ein und bündelt gewonnene Einblicke in die lexikologische, korpusanalytische sowie lexikografische Arbeit des Projektes „Paronymwörterbuch“. Er stellt wichtige Erkenntnisse zu Paronymen, ihrem Vorkommen, ihrer Ermittlung und Darstellung, aber auch zu den Methoden der Bedeutungsanalyse, ihren diskursiven Funktionen und dem Umgang mit Verwechslungspotenzial zusammenfassend dar. Vorgestellt werden Forschungsergebnisse, die sich vor allem auf die Verwendung von Paronymen in der öffentlichen Gebrauchssprache beziehen. Aber auch explorative Korpusverfahren werden erläutert sowie innovative, dynamische e-lexikografische Darstellungen präsentiert. Ausgewählte Probleme, die sowohl im Kontext der theoretischen Auseinandersetzung als auch mit der redaktionellen Erfassung von Paronymen auftreten, werden hier diskutiert. Das Sonderheft verbindet dabei theoretische und praktische lexikografische Herangehensweisen an ein bisher linguistisch wenig dokumentiertes Phänomen, das Muttersprachler/innen und Fremdsprachenlernende gleichermaßen verunsichert. Neben den Rückblicken werden ebenso die Ausblicke auf die kommenden Jahre und die damit verbundenen Fragestellungen des Projektes skizziert.
Dieser Beitrag zeigt, inwieweit im Projekt „Paronymwörterbuch“ korpuslinguistische und kognitiv-semantische Elemente bei der Entwicklung einer neuen Online-Ressource berücksichtigt wurden. Damit sollen lexikologische und lexikografische Aspekte miteinander erfolgreich verbunden und die Kluft zwischen linguistischer Theorie und redaktioneller Praxis etwas geschlossen werden. Konzeptuell ausgerichtete Angaben, die linguistische und enzyklopädische Informationen eng miteinander verknüpfen, werden in Korpusdaten ermittelt, interpretiert und z. T. abstrahiert. Sprachliches und außersprachliches Wissen lassen sich gemeinsam abspeichern. Dadurch ist es möglich, kontextuell abhängige sprachliche Informationen mit konzeptuellen Realisierungen und mit diskursiv-thematischen Besonderheiten zusammen nachzuschlagen. Darüber hinaus werden in diesem Beitrag anhand eines Beispiels wichtige dynamische Funktionalitäten des neuen Nachschlagewerkes „Paronyme – Dynamisch im Kontrast“ vorgestellt. So wird gezeigt, wie Artikelanordnungen variieren und verschiedene Perspektiven auf linguistische Phänomene eingenommen werden können. Um Informationen bedarfsgerecht und interessenspezifisch abrufen zu können, wurde eine multifunktionale Ressource geschaffen, die sehr flexibel auf verschiedene Nachschlagesituationen reagieren kann und den Bedürfnissen der Nutzer/innen gerechter wird.
Canadian heritage German across three generations: A diary-based study of language shift in action
(2019)
It is well known that migration has an effect on language use and language choice. If the language of origin is maintained after migration, it tends to change in the new contact setting. Often, migrants shift to the new majority language within few generations. The current paper examines a diary corpus containing data from three generations of one German-Canadian family, ranging from 1867 to 1909, and covering the second to fourth generation after immigration. The paper analyzes changes that can be observed between the generations, with respect to the language system as well as to the individuals’ decision on language choice. The data not only offer insight into the dynamics of acquiring a written register of a heritage language, and the eventual shift to the majority language. They also allow us to identify different linguistic profiles of heritage speakers within one community. It is discussed how these profiles can be linked to the individuals’ family backgrounds and how the combination of these backgrounds may have contributed to giving up the heritage language in favor of the majority language.
Colonial studies
(2019)
Defining groups and affiliating the self and the other with specific social categories is an important part of constructing a colonial conceptualization of societies. Many written documents from the colonial period attest to this practice. The current paper focuses on missionaries’ ways of positioning themselves and others within the colonial context. The German speaking Rheinische Missionsgesellschaft (RMG, Rhenish Mission Society) established mission stations in the Astrolabe Bay area of New Guinea, an area that was under German domination between 1884 and 1914. The paper analyzes how RMG missionaries, by means of language, construct, define, and position different population groups, and it investigates what patterns emerge from these language practices.
Gerhard Stickel (*1937) bietet in diesem Band eine Auswahl aus seinen kleineren Arbeiten, die in der Zeit von 1966 bis 2019 erschienen sind. Geboten wird eine bunte Vielfalt von Aufsätzen und Essays zu Themen, mit denen der Autor sich in all den Jahren befasst hat, darunter: Negation, Kontrastive Grammatik, ‚Fremdwörter', Sprache und Geschlecht, Spracheinstellungen, Rechts- und Verwaltungssprache sowie deutsche und europäische Sprachpolitik. Mehrere Arbeiten sind während Stickels langjähriger Tätigkeit als Direktor des Instituts für Deutsche Sprache (1976-2002) entstanden und ab 2003 im Zusammenhang mit seinen Aufgaben in und für EFNIL, der European Federation of National Institutions for Language. Erhofft wird, dass auch die älteren Arbeiten über ihre Zeitgebundenheit hinaus für manche Linguistinnen und Linguisten sowie andere Sprachinteressierte anregend sein können.
Nur ein paar Überlegungen und Beobachtungen zur Frage nach dem Umfang des deutschen Wortschatzes. Zahlenangaben aus Wörterbüchern und Korpusrecherchen werden referiert. Anhand von Beispielen veralteter, alternder, neuer Wörter und produktiver Wortbildungsmuster wird die prinzipielle Offenheit des Wortschatzes demonstriert.
This paper discusses new perspectives for a usage-based paremiology from a corpus-linguistic point of view. Using the example of proverb patterns, it shows different degrees of fixedness and proverb quality in German-English contrast. An interesting insight is that proverb similarities and differences can also be described by restrictions of semi-abstract schemes.