Refine
Year of publication
- 2021 (356) (remove)
Document Type
- Article (125)
- Part of a Book (115)
- Conference Proceeding (30)
- Other (25)
- Book (19)
- Part of Periodical (16)
- Report (13)
- Review (9)
- Working Paper (2)
- Course Material (1)
Language
- German (246)
- English (107)
- French (1)
- Multiple languages (1)
- Russian (1)
Keywords
- Deutsch (132)
- Korpus <Linguistik> (66)
- COVID-19 (53)
- Interaktion (44)
- Sprachgebrauch (43)
- Konversationsanalyse (42)
- Kommunikation (36)
- Neologismus (33)
- Wortschatz (30)
- Grammatik (27)
Publicationstate
- Veröffentlichungsversion (204)
- Zweitveröffentlichung (116)
- Postprint (27)
- Hybrides Open Access (2)
- Erstveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (160)
- Peer-Review (135)
Publisher
- Leibniz-Institut für Deutsche Sprache (IDS) (65)
- de Gruyter (48)
- IDS-Verlag (39)
- Taylor & Francis (15)
- Verlag für Gesprächsforschung (9)
- Leibniz-Institut für Deutsche Sprache (8)
- Peter Lang (8)
- Winter (8)
- Benjamins (7)
- Zenodo (7)
This study explores how ‘gatherings’ turn into ‘encounters’ in a virtual world (VW) context. Most communication technologies enable only focused encounters between distributed participants, but in VWs both gatherings and encounters can occur. We present close sequential analysis of moments when after a silent gathering, interaction among participants in a VW is gradually resumed, and also investigate the social actions in the verbal (re-)opening turns. Our findings show that like in face-to-face situations, also in VWs participants often use different types of embodied resources to achieve the transition, rather than rely on verbal means only. However, the transition process in VWs has distinctive characteristics compared to the one in face-to-face situations. We discuss how participants in a VW use virtually embodied pre-beginnings to display what we call encounter-readiness, instead of displaying lack of presence by avatar stillness. The data comprise 40 episodes of video-recorded team interactions in a VW.
This report presents a corpus of articulations recorded with Schlieren photography, a recording technique to visualize aeroflow dynamics for two purposes. First, as a means to investigate aerodynamic processes during speech production without any obstruction of the lips and the nose. Second, to provide material for lecturers of phonetics to illustrates these aerodynamic processes. Speech production was recorded with 10 kHz frame rate for statistical video analyses. Downsampled videos (500 Hz) were uplodad to a youtube channel for illustrative purposes. Preliminary analyses demonstrate potential in applying Schlieren photography in research.
We question the growing consensus in the literature that European Americans behave as a homogenous pan-ethnic coalition of voters. Seemingly below the radar of scholarship on voting groups in American politics, we identify a group of white voters that behaves differently from others: German Americans, the largest ethnic group, regionally concentrated in the ‘Swinging Midwest’. Using county level voting returns, ancestry group information from the American Community Survey (ACS), current survey data and historical census data going back as early as 1910, we provide evidence for a partisan and a non-partisan pathway that motivated German Americans to vote for Trump in 2016: a historically grown association with the Republican Party and an acquired taste for isolationist attitudes that mobilizes non-partisan German Americans to support isolationist candidates. Our findings indicate that European American experiences of migration and integration still echo into the political arena of today.
Travel guides and travel reports constitute an important source for the generation and spread of popular geopolitical epistemes and assumptions. With regard to colonial attitudes and their possible perpetuation, it is therefore of great interest what kind of information such texts convey regarding (post)colonial places, and how they contextualize it. The paper compares descriptions of Qingdao (Tsingtau), a German colonized territory between 1897 and 1914, in travel guides and related material from colonial and postcolonial times and in different European languages. It investigates what differences can be found between these descriptions in relation to time, language, and medium (print or online) of publication. Of particular interest is the question whether, and in what ways, colonial perspectives are perpetuated in present-day (especially German) travel literature.
In this paper we present an experimental semantic search function, based on word embeddings, for an integrated online information system on German lexical borrowings into other languages, the Lehnwortportal Deutsch (LWPD). The LWPD synthesizes an increasing number of lexicographical resources and provides basic cross-resource search options. Onomasiological access to the lexical units of the portal is a highly desirable feature for many research questions, such as the likelihood of borrowing lexical units with a given meaning (Haspelmath & Tadmor, 2009; Zeller, 2015). The search technology is based on multilingual pre-trained word embeddings, and individual word senses in the portal are associated with word vectors. Users may select one or more among a very large number of search terms, and the database returns lexical items with word sense vectors similar to these terms. We give a preliminary assessment of the feasibility, usability and efficacy of our approach, in particular in comparison to search options based on semantic domains or fields.
In this paper, we present an overview of freely available web applications providing online access to spoken language corpora. We explore and discuss various solutions with which the corpus providers and corpus platform developers address the needs of researchers who are working with spoken language. The paper aims to contribute to the long-overdue exchange and discussion of methods and best practices in the design of online access to spoken language corpora.
Adjektive und adjektivisch gebrauchte Partizipien als Konstituenten von Nominalgruppen werden in den Grammatiken des Deutschen und des Italienischen verallgemeinernd unter die Attribute zum Nomen gerechnet. Weithin gelten sie unter diesen sogar als prototypisch. Der vorliegende Aufsatz untersucht ihr Flexionsverhalten, ihre Linearstellung, ihre Bedeutungsbeiträge, ihren Konstituentenstatus und ihre informationeile Kennzeichnung. Er führt zu dem Ergebnis, dass die terminologische Tradition in beiden Sprachen grammatische Unterschiede verdeckt, die mehr Aufmerksamkeit verdienen würden. Die Funktionen von Adjektiven in der Nominalgruppe sind faktisch viel weniger einheitlich, als der Attributbegriff insinuiert. Unterschiede sollten in der Beschreibung differenzierter herausgearbeitet werden. Ihre kontrastive Untersuchung ist nicht nur für Grammatiker von Interesse, sondern auch fiir Lehrende des Deutschen und des Italienischen als Fremdsprache sowie der Übersetzung zwischen beiden Sprachen. Sie kann Schwierigkeiten, die im Sprach- und Übersetzungsstudium bekannt sind, systematisieren und erklären und ihre didaktische Bearbeitung erleichtern.
This paper investigates the use of linking adverbs in adversative constructions in German and Italian. In Italian those constructions are very frequently formulated with adverbs such as invece, while wordings without a lexical connective are more typical of German. Corpus data show that the syntactic und semantic conditions favouring the use of adversative adverbs are by and large the same in both languages. Lexical connectives can increase explicitness when the intended adversative interpretation is not obvious on other grounds. The higher frequency of adversative adverbs in Italian is shown to be a consequence of the more restrictive rules of the placement of prosodic accent.
In den letzten Jahren haben sich einige Themen mit Bezug zur deutschen Sprache zu sprachpolitischen Kontroversen entwickelt, die heute mit großer Intensität diskutiert werden. Es handelt sich um Themen wie das der geschlechtergerechten Sprache, das durch verschiedene rechtliche und publizistische Impulse eine immer noch wachsende Präsenz in Medien und Öffentlichkeit besitzt. Auch das Thema des sogenannten politisch korrekten Sprachgebrauchs führt zu polarisiert geführten Debatten. Der vorliegende Beitrag will diese Debatten in ihren Grundzügen nachzeichnen und dabei zeigen, wie diese Themen vermittelt über die Medien und den «Verein Deutsche Sprache» ihren Weg bis in die politische Sphäre gefunden haben. Aus sprachwissenschaftlicher Sicht ist es wichtig, die Grenzen des Politischen so zu ziehen, dass die Sprache selbst in derartigen Kontroversen keinen Schaden nimmt.
Repeating the movements associated with activities such as drawing or sports typically leads to improvements in kinematic behavior: these movements become faster, smoother, and exhibit less variation. Likewise, practice has also been shown to lead to faster and smoother movement trajectories in speech articulation. However, little is known about its effect on articulatory variability. To address this, we investigate the extent to which repetition and predictability influence the articulation of the frequent German word “sie” [zi] (they). We find that articulatory variability is proportional to speaking rate and the duration of [zi], and that overall variability decreases as [zi] is repeated during the experiment. Lower variability is also observed as the conditional probability of [zi] increases, and the greatest reduction in variability occurs during the execution of the vocalic target of [i]. These results indicate that practice can produce observable differences in the articulation of even the most common gestures used in speech.
Auf dem Weg zu einer Kartographie: automatische und manuelle Analysen am Beispiel des Korpus ISW
(2021)
Alleviating pain is good and abandoning hope is bad. We instinctively understand how words like alleviate and abandon affect the polarity of a phrase, inverting or weakening it. When these words are content words, such as verbs, nouns, and adjectives, we refer to them as polarity shifters. Shifters are a frequent occurrence in human language and an important part of successfully modeling negation in sentiment analysis; yet research on negation modeling has focused almost exclusively on a small handful of closed-class negation words, such as not, no, and without. A major reason for this is that shifters are far more lexically diverse than negation words, but no resources exist to help identify them. We seek to remedy this lack of shifter resources by introducing a large lexicon of polarity shifters that covers English verbs, nouns, and adjectives. Creating the lexicon entirely by hand would be prohibitively expensive. Instead, we develop a bootstrapping approach that combines automatic classification with human verification to ensure the high quality of our lexicon while reducing annotation costs by over 70%. Our approach leverages a number of linguistic insights; while some features are based on textual patterns, others use semantic resources or syntactic relatedness. The created lexicon is evaluated both on a polarity shifter gold standard and on a polarity classification task.
This study builds on a large body of work on the use of linguistic forms for requests in social interaction. Using Conversation Analysis / Interactional Linguistics, this study explores the use of two recurrent linguistic formats for requesting in spoken German – simple interrogatives ('do you do ..?') and kannst du VP? ('can you do..?') interrogatives. Based on a corpus of video-recorded, naturally occurring data of mundane data, this study demonstrates one of the interactional factors that is relevant for the choice between alternative interrogative request formats in spoken German – recipient's embodied availability before and during the request initiation. It is shown that simple interrogatives are used to request an action from a recipient who is either available or involved in their own project, which, however, does not have to be suspended or interrupted for the compliance with the request. In contrast, kannst du VP? interrogatives occur in environments in which the recipient is already engaged in a project that must be suspended in order to grant the request.
„Bausteine einer Korpusgrammatik des Deutschen“ ist eine Schriftenreihe, die am Leibniz-Institut für Deutsche Sprache in Mannheim (IDS) entsteht. Sie setzt sich zum Ziel, mit korpuslinguistischen Methoden die Vielfalt und Variabilität der deutschen Grammatik in großer Detailschärfe zu erfas-sen und gleichzeitig für die Validierbarkeit der Ergebnisse zu sorgen. Der zweite Band enthält eine kurze Einleitung und vier als Kapitel einer neuen Grammatik gestaltete Texte: 1. Determination in der Nominalphrase – ein Überblick, 2. Syntaktische Funktionen von Nominalphrasen und Funktio-nen der Kasus, 3. Stellung des adnominalen Genitivs und 4. Genitiv- und von-Attribute: Bestimmung des Variationsbereichs. Der Band ist mit zum Download verfügbaren Datensätzen zu Nominalphrasen sowie Genitiv- und von-Attributen verknüpft.
Bericht vom zweiten nationalen Best-Practice-Workshop der deutschen Open-Access-Monografienfonds
(2021)
Besser als gedacht
(2021)
Das grammatische Wissen von Lehramtsstudierenden ist besser als gedacht. Im Basisartikel (s. Döring/Elsner in diesem Band) wird darauf verwiesen, dass Studien zeigten, dass bei Studierenden zu Studienbeginn das grammatische Wissen nicht in dem gewünschten Maße vorhanden ist und dass auch die universitäre Lehre keinen Ausgleich dieser Defizite bewirken muss. Dennoch bleibt die Frage, ob das, was in den Studien gemessen wird, nicht eher dem terminologischen Wissen entspricht, was bei Studienbeginn nicht vorhanden sein muss, weil der Grammatikunterricht viel zu lang zurückliegt und im Studienverlauf genau diese Termini entweder keine Rolle spielen oder kritisch diskutiert werden, sodass die Fragen auch nicht mehr so einfach beantwortet werden können. Hinter diesen Studien steckt doch letztlich die Frage, welcher Wissensbestand und welcher Wissenszuwachs gemessen werden soll und ob die verwendeten Methoden das geeignete Mittel darstellen. Daher möchten wir in diesem Kommentar aufzeigen, in welcher Weise unserer Meinung nach Lehramtsstudierende solide grammatische Kenntnisse aufweisen (können), in welcher Hinsicht epistemische Überzeugungen von Lehrenden einen Einfluss haben können und welche Aspekte in der unversitären Lehre (im Bereich der Grammatik) zusätzlich berücksichtigt werden sollten, um einen nachhaltigeren Lernerfolg zu ermöglichen. Dies ist durchaus als optimistischer Beitrag zu verstehen, insofern als sich die universitäre Hochschullehre für Lehramtsstudierende im Bereich der Grammatik im positiven Sinne auf den Weg gemacht hat.
This paper reports on an ongoing international project of compiling a freely accessible online Dictionary of German Loans in Polish Dialects. The dictionary will be the first comprehensive lexicographic compendium of its kind, serving as a complement to existing resources on German lexical loans in the literary or standard language. The empirical results obtained in the project will shed new light on the distribution of German loanwords among different dialects, also in comparison to the well-documented situation in written Polish. The dictionary will have a strong focus on the dialectal distribution of Polish dialectal variants for a given German etymon, accessible through interactive cartographic representations and corresponding search options. The editorial process is realized with dedicated collaborative web tools. The new resource will be published as an integrated part of an online information system for German lexical borrowings in other languages, the Lehnwortportal Deutsch, and is therefore highly cross-linked with other loanword dictionaries on Polish as well as Slavic and further European languages.
CLARIAH-DE cross-service search - prospects and benefits of merging subject-specific services
(2021)
CLARIAH-DE combines services and offerings of CLARIN-D and DARIAH-DE. This includes various search applications which are made directly available to researchers. These search applications are presented in this working paper based on their main characteristics and compared with a focus on possible harmonizations. Opportunities and risks of different forms of technical integration are highlighted. Identified challenges can be explained in particular considering the background of different organizational and technical frameworks as well as highly specific and discipline-dependent requirements. The integration work that has already been carried out and the experiences gained with regard to future work and possible integration of further applications are also discussed. The experiences made in CLARIAH-DE can especially be of interest for other projects in the field of digital research infrastructures.
Die durch die Covid-19-Pandemie bedingte Umstellung der Präsenzlehre auf digitale Lehr- und Lernformate stellte Lehrende und Studierende gleichermaßen vor eine Herausforderung. Innerhalb kürzester Zeit musste die Nutzung von Plattformen und digitalen Tools erlernt und getestet werden. Der Beitrag stellt exemplarisch Dienste und Werkzeuge von CLARIAH-DE vor und erläutert, wie die digitale Forschungsinfrastruktur Lehrende und Studierende auch im Rahmen der digitalen Lehre unterstützen kann.
This poster summarizes the results of the CLARIAH-DE Work Package 3: Skills Training and Promotion of Junior Researchers.
For a research field that is characterised by rapid technical development, CLARIAH-DE has to include the promotion of data literacy necessary for the efficient use of this digital research infrastructure as part of its objective. To develop, consolidate and refine a common programme in this area, work package 3 set itself the following sub goals:
- Consolidation of the activities from the previous projects into a joint service
- Cataloguing and reflecting on the methods and tools used in the research field, with the aim of identifying remaining gaps
- Skills training of, individual support for and the promotion of junior researchers
This poster summarizes the results of the CLARIAH-DE Work Package 5 - Community Engagement: Outreach/Dissemination and Liaison.
Work package 5 engages with the community through dissemination activities, outreach and liaison. The work package set itself the following sub goals:
- Combining the existing dissemination and outreach activities of CLARIN-D and DARIAH-DE in a meaningful way and elaborating on them. In some cases this meant continuity, in other cases a new appearance for resources.
- Providing a web portal as a gateway to the CLARIAH-DE project.
- Creating a common identity and corporate identity and maintaining the established level of trust users already put into CLARIN-D and DARIAH-DE.
- Providing a social media presence as well as a physical presence at workshops, conferences and other meetings in the Digital Humanities.
CMDI Explorer
(2021)
We present CMDI Explorer, a tool that empowers users to easily explore the contents of complex CMDI records and to process selected parts of them with little effort. The tool allows users, for instance, to analyse virtual collections represented by CMDI records, and to send collection items to other CLARIN services such as the Switchboard for subsequent processing. CMDI Explorer hence adds functionality that many users felt was lacking from the CLARIN tool space.
Playing videogames is a popular social activity; people play videogames in different places, on different media, in different situations, alone or with partners, online or offline. Unsurprisingly, they thereby share space (physically or virtually) with other playing or non-playing people. The special issue investigates through different contexts and settings how non-players become participants of the gaming interaction and how players and non-players co-construct presence. The introduction provides a problem-related context for the individual contributions and then briefly presents them.
Communicative deviations of respondents in political video interviews in Ukrainian and German
(2021)
The research has the objective to establish the peculiarities of communicative deviations as a cognitive and at the same time discursive phenomenon in Ukrainian- and German-language video interviews from the viewpoint of respondents. The procedure of the research involves the integrated application of methods and techniques of pragmatics, deviatology and communicative linguistics. A new methodological basis has been developed for the reconstruction of communicative deviations using discourse analysis, namely for the reconstruction of a single event in two discursive environments, determining the communicative context and communication of interview in compared languages. The results of the research allow us to identify the features of communicative deviations in political interviews at the external, internal structural levels and at the situational level. The conclusions of the research indicate that the types of communicative deviations in political video interviews are universal in Ukrainian and German, but reflect national and cultural specifics given the peculiarities of both languages and each linguoculture, as well as existing realias, norms, conventions, maxims and rules of communication.
Dieser Beitrag präsentiert die neue multilinguale Ressource CoMParS (Collection of Multilingual Parallel Sequences). CoMParS versteht sich als eine funktional-semantisch orientierte Datenbank von Parallelsequenzen des Deutschen und anderer europäischer Sprachen, in der alle Daten neben den sprachspezifischen und universellen (im Sinne von Universal Dependencies) morphosyntaktischen Annotationen auch nach sprachübergreifenden funktional-semantischen Informationen auf der neudefinierten Annotationsebene Functional Domains annotiert und auf mehreren Ebenen (auch ebenenübergreifend) miteinander verlinkt sind. CoMParS wird in TEI P5 XML kodiert und sowohl als monolinguale wie auch als multilinguale Sprachressource modelliert.
This study analyzes how participants playing VR games construct co-presence and shared gameplay. The analysis focuses on instances of play where one person is wearing the VR equipment, and other participants are located nearby without the ability to directly interact with the game. We first show how the active player using the VR equipment draws on talk and embodied activity to signal their presence in the shared physical environment, while simultaneously conducting actions in the virtual space, and thus creates spaces for the other participants to take part in gameplay. Second, we describe how other participants draw on the contextual configurations of the moment in displaying co-presence and position themselves as active and consequential co-players. The analysis demonstrates how gameplay can be communicatively constructed even in situations where the participants have differential rights and possibilities to act and influence the game.
This introduction summarizes general issues combining lexicography and neology in the context of the Globalex Workshop on Lexicography and Neology series. We present each of the six papers composing this Special Issue, featuring two Slavic languages (Czech and Slovak) and two Romance ones (Brazilian Portuguese and Spanish in its European and Latin American varieties) and their diverse lexicographic research and representation, in specialized dictionaries of neologisms or general language ones, in monolingual, bilingual and multilingual lexical resources, and in print and digital dictionaries.
We reflect on the affordances and challenges of interactional data in the analysis of long-term institutional change. To this end we draw on our studies of direct encounters between journalists and politicians in news interviews and presidential news conferences and in particular the use of question design as a window into the evolution of journalistic norms and press-state relations over time and the causal antecedents of such change. All analyses that incorporate a concern with environing contexts of interactional change impose certain burdens of empirical demonstration on the researcher. Here we consider three analytic issues that arise in the kind of historical-institutional analysis we have been pursuing: (a) controlling for the situational context, (b) pinpointing the locus of change, and (c) validating indicators of change. Data are in English.
Our paper examines how bodily behavior contributes to the local meaning of OKAY. We explore the interplay between OKAY as response to informings and narratives and accompanying multimodal resources in German multi-party interaction. Based on informal and institutional conversations, we describe three different uses of OKAY with falling intonation and the recurrent multimodal patterns that are associated with them and that can be characterized as ‘multimodal gestalts’. We show that: 1. OKAY as a claim to sufficient understanding is typically accompanied by upward nodding; 2. OKAY after change-of-state tokens exhibits a recurrent pattern of up- and downward nodding with distinctive timing; and 3. OKAY closing larger activities is associated with gaze-aversion from the prior speaker.
Corona- und andere Partys
(2021)
Coronaparty, Jo-jo-Lockdown und Mask-have – Wortschatzerweiterung während des Corona-Stillstands
(2021)
Making research data publicly available for evaluation or reuse is a fundamental part of good scientific practice. However, regulations such as copyright law can prevent this practice and thereby hamper scientific progress. In Germany, text-based research disciplines have for a long time been mostly unable to publish corpora made from material outside of the public domain, effectively excluding contemporary works. While there are approaches to obfuscate text material in a way that it is no longer covered by the original copyright, many use cases still require the raw textual context for evaluation or follow-up research. Recent changes in copyright now permit text and data mining on copyrighted works. However, questions regarding reusability and sharing of such corpora at a later time are still not answered to a satisfying degree. We propose a workflow that allows interested third parties to access customized excerpts of protected corpora in accordance with current German copyright law and the soon to be implemented guidelines of the Digital Single Market directive. Our prototype is a very lightweight web interface that builds on commonly used repository software and web standards.
cOWIDplus Analyse ist eine kontinuierlich aktualisierte Ressource zu der Frage, ob und wie stark sich der Wortschatz ausgewählter deutscher Online-Pressemeldungen während der Corona-Pandemie systematisch einschränkt und ob bzw. wann sich das Vokabular nach der Krise wieder ausweitet. In diesem Artikel erläutern die Autor*innen die hinter der Ressource stehende Forschungsfrage, die zugrunde gelegten Daten, die Methode sowie die bisherigen Ergebnisse.
The human ability to anticipate upcoming behavior not only enables smooth turn transitions but also makes early responses possible, as respondents use a variety of cues that provide for early projection of the type of action that is being performed. This article examines resources for projection in interaction in three unrelated languages—Finnish, Japanese, and Mandarin—in sequences where speakers make evaluative assertions on a topic. The focus is on independently agreeing responses initiated in early overlap. Our cross-linguistic analysis reveals that while projection based on the ongoing turn-constructional unit relies on language-specific grammatical constructions, projection based on the larger context seems to be less language-dependent. A crucial finding is that in the target sequences, stances taken toward the topic already during earlier talk, as well as other structural patterns, are among the resources that recipients use for projecting how and when the ongoing turn will end.
Das 1901er-Regelwerk wird in einem direkten Vergleich mit dem geltenden amtlichen Regelwerk gemeinhin als defizitär eingestuft. Diese Einschätzung basiert auf der Annahme eines Primats des Regelteils. Der vorliegende Beitrag setzt hieran an und bestimmt auf der Basis der Festlegungen zur Getrennt- und Zusammenschreibung Funktion und Verhältnis von Regelteil und Wörterverzeichnis des ersten gesamtdeutschen Regelwerks in seinem historischen Entstehungskontext. Dabei zeigt sich, dass das Regelwerk von 1901 einen anderen Weg in der Kodifikation beschreitet; während im Regelteil Regularitäten aufgezeigt und Kriterien zur Schreibungsfindung an die Hand gegeben werden, erfolgt die Kodifikation rechtschreibschwieriger Fälle über das Wörterverzeichnis.
Das Deutsche ist eine der am besten erforschten Sprachen der Welt; weniger bekannt ist, welche Gemeinsamkeiten es mit den europäischen Nachbarsprachen teilt und wo seine Besonderheiten liegen.
Die insgesamt acht Kapitel des Buches stellen prägnant und anhand von anschaulichen Beispielen Wortschatz und Grammatik des Deutschen vor. Dabei verhilft ein Vergleich mit den Optionen etwa im Englischen, Französischen, Polnischen, Ungarischen oder anderen europäischen Sprachen zu einem verschärften Blick. Ausgangspunkt ist dabei ein kurzer Abriss der Facetten von Sprache allgemein sowie die Herleitung der grundlegenden Sprachfunktionen aus einer handlungsbezogenen Perspektive. Die folgenden Kapitel stehen unter Motti wie: „Das Verb – Zeiten, Modi, Szenarios und Inszenierungen“, „Der nominale Bereich – die vielerlei Arten, Gegenstände zu konstruieren“ oder „Der Text – wenn wir kohärent und dabei narrativ oder argumentativ werden“. Das letzte Kapitel trägt den Titel: „Das Deutsche – auf dem Weg zu einem Sprachporträt“.
Das Buch soll Sprachinteressierten auch ohne linguistische Fachkenntnisse einen neuen Zugang zu unserer Muttersprache erschließen und die Sensibilität für die sprachliche Verbundenheit auf unserem Kontinent trotz aller Vielfalt stärken.
- Grammatik anschaulich und konkret
- Innovativer Blick auf das Deutsche im Kreis europäischer Sprachen
- Kurzweilige Einführung für Sprachinteressierte auch ohne linguistische Fachkenntnisse
Das vorliegende Dokument befasst sich mit der Evaluation des Basisformats des Deutschen Textarchivs (DTABf) als potenziellem Austausch- bzw. Zielformat für digitale Editionen. Der Text ist im Kontext des Projekts CLARIAH-DE entstanden und möchte die Fragen beantworten, wie und inwieweit das DTABf allgemein sinnvoll in der Editionsarbeit eingesetzt werden und in seiner aktuellen Fassung die Bedürfnisse von Edierenden bei der Textauszeichnung erfüllen kann. Ausgehend von bestehenden Editionsdaten, wird deren Auszeichnung auf ihre Interoperabilität und ihr Überführungspotenzial zum DTABf überprüft, damit gleichzeitig aber auch Kodierungsempfehlungen für die Neuanlage von Editionen abgeleitet. Im Bericht wird die angewandte Methodik erläutert, sowie die Ergebnisse der Evaluation zusammengefasst.
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) ist mit seinem Design bislang vornehmlich auf Nutzergruppen aus der sprachwissenschaftlichen Forschung ausgerichtet, prinzipiell aber auch hervorragend dafür geeignet, für die Nutzung im handlungsorientierten DaF- (und eventuell auch DaZ-)Unterricht fruchtbar gemacht zu werden. Lehrende und Lernende des Deutschen als Fremd- oder Zweitsprache bilden eine gesellschaftlich zunehmend relevante Zielgruppe und auch einen beträchtlichen Anteil der registrierten NutzerInnen des Korpus. Im vorliegenden Beitrag soll daher anhand eines exemplarischen Annotationsprojekts gezeigt werden, inwiefern die besonderen Ressourcen und Potentiale von FOLK für den DaF-Unterricht und dort speziell für den Aspekt des authentischen, kompetenten sprachlichen Handelns in Interaktion sinnvoll aufbereitet und schrittweise zugänglicher gemacht werden können.
Grammis ist eine Online-Plattform des Leibniz-Instituts für Deutsche Sprache, die Forschungsergebnisse, Erklärungen und Hintergrundwissen zur deutschen Grammatik präsentiert. Das Angebot zielt einerseits auf linguistische Laien, die sich für grammatische Phänomene interessieren; andererseits auf die Fachöffentlichkeit, indem es aktuelle wissenschaftliche Meilensteine des IDS dokumentiert. Für beide Nutzungsgruppen werden im Beitrag exemplarische Inhalte vorgestellt. Weiterhin sollen erste Ergebnisse einer explorativen Nutzungsstudie sowie jüngere technische Neuerungen vorgestellt werden.
Die geltende amtliche Regelung der deutschen Rechtschreibung geht auf einen Kompromiss aus dem Jahre 2006 zurück, der im Bereich der Kommasetzung bei Infinitivgruppen einen neuerlichen Paradigmenwechsel bedeutete: Während für die Vorreformregelung das Konzept des sog. erweiterten Infinitivs konstituierend war und die Reformregelung sich wesentlich auf schreibstilistische Kriterien gründete, bilden die Basis der aktuellen Regelung grammatisch beschreibbare Fallgruppen. Dieser Umstand schon allein, mehr aber der zentrale Auftrag einer Beobachtung des Schreibgebrauchs durch den Rat für deutsche Retschreibung waren der Rahmen für die vorliegende Pilotstudie, in der das freie Schreiben Grundlage einer differenzierten Analyse des Kommagebrauchs bei Infinitivgruppen ist.
Der vorliegende Beitrag skizziert in einem ersten Abschnitt Gegenstandsbereich und kodifizierte Regelung, bevor er im Weiteren das Studiendesign und die Ergebnisse vorstellt. Die Ergebnisse werden nach Fallgruppen sowie im Hinblick auf übergreifende Tendenzen und Beobachtungen besprochen. Sie sind Ausgangspunkt der im Ausblick formulierten Thesen.
Das ZDL-Regionalkorpus umfasst Zeitungsartikel aus Lokal- und Regionalressorts deutschsprachiger Tageszeitungen. Es dient als empirische Grundlage für die lexikografische Beschreibung der diatopischen Variation im Digitalen Wörterbuch der deutschen Sprache (DWDS). Darüber hinaus steht es allen angemeldeten Nutzern der DWDS-Korpusplattform für die Recherche zur Verfügung. Die Abfrage kann auf bestimmte diatopische Areale oder diachrone Zeiträume beschränkt werden. Die Verteilung der Treffer über Areale und Zeiträume lässt sich in verschiedener Form darstellen; dabei werden neben absoluten Trefferzahlen auch normalisierte PPM-Werte ausgegeben.
In this chapter, we overview the specificity of comparisons made within the perspective of Conversation Analysis (CA), and we position them in relation to other fields. We introduce the analytical mentality, methodology, and procedures of CA, and we show how we used it for the analysis of OKAY in this volume.
The automatic recognition of idioms poses a challenging problem for NLP applications. Whereas native speakers can intuitively handle multiword expressions whose compositional meanings are hard to trace back to individual word semantics, there is still ample scope for improvement regarding computational approaches. We assume that idiomatic constructions can be characterized by gradual intensities of semantic non-compositionality, formal fixedness, and unusual usage context, and introduce a number of measures for these characteristics, comprising count-based and predictive collocation measures together with measures of context (un)similarity. We evaluate our approach on a manually labelled gold standard, derived from a corpus of German pop lyrics. To this end, we apply a Random Forest classifier to analyze the individual contribution of features for automatically detecting idioms, and study the trade-off between recall and precision. Finally, we evaluate the classifier on an independent dataset of idioms extracted from a list of Wikipedia idioms, achieving state-of-the art accuracy.
Der Datensatz enthält 16.604 Korpusbelege aus Nominalphrasen mit Genitiv- und von-Attributen (die Ideen zahlreicher Kinder, die Ideen von zahlreichen Kindern), wobei die Genitivattribute prä- oder postnominal erscheinen können (Mannheims Sehenswürdigkeiten, die Sehenswürdigkeiten Mannheims).
Für jeden Beleg sind Informationen zu Land, Dekade und Medium enthalten. Hinzu kommen Angaben zu Kopf- und/oder Attributslemma (z. B. Namentyp, Flexionsklasse), Gesamtphrase (z. B. Definitheit, Kasus) und Attributsphrase (z. B. Kasusdistinktion, Länge). Zahlreiche Sonderfälle sind ebenfalls annotiert (z. B. Genitiv bei nichtflektiertem Adjektiv wie Gebäck Mannheimer Bäckereien, Phrasen mit adjektivisch flektierendem Attributsnomen wie die Ideen Jugendlicher, die Ideen von Jugendlichen).
Datensatz Nominalphrasen
(2021)
Der Datensatz Nominalphrasen enthält Belege zu nichtpronominalen (d.h. vollen, lexikalischen) Nominalphrasen (NPs) mit einem Substantiv oder einer Nominalisierung als Kopf. Jeder Beleg ist in Bezug auf eine Reihe linguistisch relevanter Merkmale annotiert. Insgesamt enthält der Datensatz 8.137 Belegstellen. Nach dem Aussortieren von Fehlbelegen (siehe Spalten „valide“ und „nicht-valide_Begründung“) bleiben noch 7.813 einschlägige Belege. Die Suchanfrage erfolgte über das Kopfnomen; für Details zur Datenerhebung siehe Weber (2021a). Das Kopfnomen erscheint in der Spalte „Kopf_der_NP“. In manchen Fällen besteht die NP nur aus dem Kopfnomen, in den meisten Fällen geht sie aber darüber hinaus; sie erstreckt sich dann auf einen Teil des vorangehenden Kontexts (Spalte „Satzkontext_vor_Beleg“) und/oder des nachfolgenden Kontexts („Satzkontext_nach_Beleg“). Der Datensatz dient der Untersuchung der syntaktischen Funktionen von NPs (Weber 2021a) und der Determination in der NP (Weber 2021b).
Der Datensatz enthält 409 Korpusbelege aus Nominalphrasen mit eingebetteten Genitivattributen, die wiederum ein eingebettetes Genitivattribut aufweisen (Petras Nachfolgers Beisein). Die Belege sind danach klassifiziert, ob die erste eingebettete Nominalphrase vor oder hinter dem Kopfnomen der Gesamtnominalphrase steht (Petras Nachfolgers Beisein vs. Beisein Petras Nachfolgers) und ob die erste eingebettete Nominalphrase neben einem Genitiv noch ein Adjektiv enthält (Beisein Petras direkten Nachfolgers). Für jeden Beleg werden zudem die Lemmas der drei Nomen in ihrer Einbettungsreihenfolge angegeben. Darüber hinaus sind Metadaten (Land, Jahr) enthalten.
Der Datensatz enthält die Gesamtheit der relevanten Belege aus dem KoGra-Untersuchungskorpus mit den im Folgenden aufgeführten Strukturen. Die Abfragen für die vier Strukturtypen führten zu 15.875 potenziellen Belegen, von denen sich bei manueller Durchsicht 409 als tatsächliche Nominalphrasen mit zweifach eingebetteten Genitivattributen erwiesen.
Der Datensatz dient der Untersuchung der Sonderfälle des Genitivattributs (Kopf 2021).
We discuss the modal uses of the Hausa exclusive particle sai (≈ only). We argue that the distribution of sai in modal environments provides evidence for the following claims on the composition of modal meaning that have been independently made in the literature: i) Future-oriented modality involves a prospective aspect operator that can be realized covertly in some languages (e.g. English, Kratzer 2012b) and overtly in others (e.g. Gitksan, Matthewson 2012, 2013). ii) Necessity interpretations arise from exhaustifying possibilities, i.e. an exhaustivity operator applying to existential modality (e.g. Kaufmann 2012 for the case of imperatives and Leffel 2012 for a relevant analysis of necessity meaning in Masalit). We show that future-oriented necessity in Hausa decomposes into EXH((PROSP)), with sai contributing exhaustivity.
Dieses Kapitel gibt einen Überblick über das Inventar der Ausdrücke, die zur Kategorie der Determinierer gezählt werden bzw. zumindest als Kandidaten für diese Kategorie gehandelt werden. Es untersucht ihre grammatischen Eigenschaften und überprüft ihren Determiniererstatus anhand einschlägiger morpho-syntaktischer Kriterien.
Der Beitrag behandelt das Thema Deutsch in Europa aus der Perspektive der internationalen Germanistik und ihrer Nachhaltigkeit. Ausgehend von der Geschichte des Fachs in Europa wird die Germanistik als ein „Ökosystem“ präsentiert, d. h. als ein dynamischer Komplex bildungsspezifischer Elemente,welcher auch heute – im Zeitalter von Big Data und Real-Time Artificial Intelligence – über die DaF-Vermittlung und die Lehrerausbildung hinaus eine insgesamt wichtige soziale Funktion ausüben kann. Welche Rolle das IDS dabei spielen könnte, wird im Schlussteil skizziert.
Dieser Beitrag beschreibt Varietäten des Deutschen, die in exterritorialen deutschen Gemeinschaften gesprochen werden. Viele dieser Gruppen gehen auf Wanderbewegungen im Mittelalter oder in der frühen Neuzeit zurück und haben spezifische Varietäten entwickelt, die durch Dialektmischung und Sprachkontakt mit den Umgebungssprachen gekennzeichnet sind. Eine weitere Gruppe sind sogenannte „Grenzminderheiten“, exterritoriale Gemeinschaften, die nach dem Ersten Weltkrieg entstanden sind und an deutschsprachige Länder angrenzen. Der Artikel gibt zunächst einen historischen Überblick über die verschiedenen deutschsprachigen Minderheiten. Anschließend werden die unterschiedlichen soziolinguistischen Rahmenbedingungen der jeweiligen Sprachgemeinschaften angesprochen und anhand von Beispielen von Gemeinschaften mit unterschiedlichem soziolinguistischem und sprachlichem Hintergrund illustriert.
Der Beitrag geht der Frage nach, welche Akteure die Stellung des Deutschen im heutigen Europa beeinflussen (können). Als Grundlage für die Untersuchung wird die Sprachmanagementtheorie gewählt, die sich mit dem Verhalten verschiedener Akteure gegenüber der Sprache beschäftigt. Diese metasprachlichen Aktivitäten definieren das Schlüsselkonzept Sprachmanagement. Auseinandergehende sprachenpolitische Interessen und Konflikte werden in Abhängigkeit von der Macht des jeweiligen Akteurs gelöst. Es werden konkrete Beispiele analysiert, die sich auf der EU Ebene, der Ebene eines EU-Mitgliedsstaates wie auch in Regionen abspielen.
Die deutsche Sprache hat sich innerhalb Europas als Teil einer europäischen Sprachengemeinschaft entwickelt. Von besonderem wissenschaftlichen Interesse ist die Frage, wie sich Sprachen untereinander beeinflussen, verändern und mit welchen methodischen Zugängen und Sprachressourcen das zu untersuchen ist. Der ständige Austausch zwischen diesen Sprachen und die politischen Rahmenbedingungen in der Europäischen Union werfen darüber hinaus konkrete sprach- und bildungspolitische Fragen auf.
Der Beitrag stellt zunächst einige allgemeine Überlegungen zu Kategorisierungen von Sprachen an. Dann werden die Sprachenvielfalt im Baltikum und Statistiken von Deutschsprechern vorgestellt, bevor verschiedene Studien zum Deutschen im Baltikum erläutert werden. Auf dieser Grundlage erfolgt eine Einordnung des Baltikums in Modelle der internationalen Stellung des Deutschen, mit deren Hilfe das Konzept Ergänzungssprache begründet wird. Schließlich werden einige Überlegungen dazu angestellt, welcher Nutzwert durch diese Konzeptualisierung entsteht.
Deutsch in Sprachkontakten
(2021)
Das vorliegende Heft vereint Beiträge zu Kontakten des Deutschen mit verschiedenen Sprachen nördlich, östlich und südlich des deutschsprachigen Kerngebietes. Sprachkontakt wird dabei aus unterschiedlichsten Perspektiven erfasst; die Aufsätze behandeln einzelne strukturelle Sprachebenen ebenso wie pragmalinguistische, historische, soziolinguistische und translatologische Themen. Die Ausgabe vereint damit Untersuchungen zu Sprachkontakten in der Vergangenheit (Saagpakk/Saar, Plaušinaitytė), zum Gebrauch in spezifischen Textsorten (Mencigar, Földes), bis hin zu Sprachgebrauchsphänomenen im Kontext von Covid-19 (Geyer). Andere Beiträge fokussieren auf die Entwicklung sprachlicher Kompetenzen in Abhängigkeit von Kontakteinflüssen (Tibaut, Ščukanec/Durbek) oder dem Einfluss der Medien (Mack/Vollstädt/Vujović) oder diskutieren das Zusammenwirken von Sprachpolitik und Sprachgebrauch (Marten). Das Heft schließt mit mehreren Rezensionen und Projektberichten ab; insgesamt wird damit ein wesentlicher Ausschnitt aus der Bandbreite der germanistischen Sprachkontaktforschung in der Region von Estland bis Montenegro aufgezeigt.
Mit der aktuellen politischen Kontroverse um ein Sprachgesetz, durch das das Gendern verboten würde, hat auch ein anderes Thema wieder an Brisanz gewonnen: die Aufnahme des Deutschen als Staatssprache ins Grundgesetz. Zwar ist die Diskussion darüber ähnlich polarisiert wie bei der gendergerechten Sprache, doch lohnt es sich auch hier, eine differenzierte Perspektive einzunehmen. Denn es gibt gute Gründe dafür.
Sprache ist ein zentraler Bestandteil menschlicher Kommunikation und dient, neben anderen Funktionen, der Etablierung und Gestaltung sozialer Beziehungen, dem Ausdruck von Macht, von Gruppenzugehörigkeit und Identität, aber auch von Ab- und Ausgrenzung, im Privaten wie im Öffentlichen und Politischen. In diesem Beitrag wird der Blick auf den Umgang mit Sprache im deutsch-kolonialen Kontext gerichtet: Es geht darum, wir durch Vorgaben zum Gebrauch von Sprache(n) und deren variable Umsatzung vor Ort das Deutsche Kaiserreich als Kolonialmacht in den Kolonialgebieten in Ozeanien präsent war und repräsentiert wurde.
Im Beitrag werden drei sprachwissenschaftliche Zugänge zu Diagnosen vorgestellt: In der Gesprächsanalyse wird die Diagnoseherstellung in der mündlichen Arzt-Patienten-Interaktion beleuchtet. Diagnosen entstehen kollaborativ,indem Gesprächsphasen durchlaufen und charakteristische Handlungen in bestimmten Äußerungsformaten vollzogen werden. Im Blickpunkt der Text- und Kommunikationsgeschichte steht hingegen das schriftsprachliche Handeln. Das Herstellen einer Diagnose erfordert hier die nachträgliche Bearbeitung vorgängiger mündlicher Interaktionen gemäß einer etablierten Textsorte: dem Erhebungsbogen. Von diesen Formen der Diagnoseherstellung unterscheidet sich, wie ein diskurslinguistischer Zugriff zeigt, die massenmediale Faktizitätsherstellung in Diskursen wie dem Impfdiskurs, die auch für ein medizinisches Laienpublikum relevant sind. Mit dem Beitrag soll nicht nur deutlich gemacht werden, in welchengem Zusammenhang mündliche Interaktion und schriftliche Fixierung stehen, sondern auch betont werden, dass das massenmedial vermittelte medizinische Lai*innen in relative Expert*innen verwandeln kann.
Die LeGeDe-Ressource: korpusbasierte lexikografische Einblicke und anwendungsorientierte Ausblicke
(2021)
Der Beitrag stellt die lexikografische Online-Ressource LeGeDe, den ersten korpusbasierten Prototypen für Besonderheiten der Lexik des Deutschen in der Interaktion vor. Dabei werden sowohl die Herausforderungen an das innovative Projekt thematisiert als auch Möglichkeiten für einen anwendungsorientierten Nutzen im DaF- und DaZ-Bereich diskutiert und als Ausblick Desiderata für die weitere Beschäftigung mit der lexikografischen Kodifizierung gesprochensprachlicher Spezifika des Deutschen aufgezeigt.
Die Macht des Definierens. Eine diskurslinguistische Typologie am Beispiel des Burnout-Phänomens
(2021)
Wo verläuft die Grenze zwischen psychischer Gesundheit und Krankheit, und wie wird diese im öffentlichen und fachlichen Diskurs ausgehandelt und definiert? Die vorliegende Arbeit untersucht am Beispiel des Burnout-Diskurses, mit welchen Sprachgebrauchsformen und kommunikativen Praktiken in Fach-, Medien- und Vermittlungstexten ein spezifikationsbedürftiges Phänomen des Bereichs psychischer Gesundheit und Krankheit definiert wird. Im Mittelpunkt der Analyse steht die Macht diskursiver Praktiken des Definierens und die These, dass sich diese Praktiken nicht nur punktuell in bewussten Definitionshandlungen einzelner Textautor/-innen zeigen, sondern dass Definieren in einem Diskurs auch als teilweise unbewusster, überindividueller, transtextueller Prozess begriffen und analysiert werden muss. Die Exemplifizierung dieser These mündet in ein 11-Punkte-Modell der diskursiven Praxis des Definierens. Durch den diskurslinguistisch-praxeologischen Ansatz eröffnet die Arbeit neue Perspektiven für die linguistische Terminologie- und Definitionsforschung.
This chapter discusses functions of the German language in the Linguistic Landscape (LL) of the Baltic states, with a focus on the Latvian capital Riga. For this end, it applies the "Spot German" approach (cf. Heimrath 2017) in the context of debates on the international role of German (cf. Ammon 2015). It argues that German is an "additional language of society" (cf. Marten 2017b), i.e. it is not a dominant language in the Baltics but can regularly be found in a variety of functions. These relate both to the historical role of German in the region (including its contemporary commodification) and to current relations between the Baltics and the German-speaking countries. These include tourism, business, or educational and political institutions, but also point to, e.g., discourses on the quality assigned to products from the German-speaking region. In this sense, the Baltic states are part of what may, in accordance with Kachru's (1985) 3-circle-model for English, be labelled as "extended circle" of German. At the same time, the chapter discusses how conclusions from Linguistic Landscape research can be used for understanding marketing both in and for the German language: On the one hand, German carries the potential of persuading customers to opt for a certain product. On the other hand, the abundance of situations where German can be "spotted" suggests that the LL may successfully be used for language-marketing purposes, as exemplified by a brochure and a poster created by the DAAD Information Centre for the Baltic states in Riga.
Digital humanities research under United States and European copyright laws. Evolving frameworks
(2021)
This chapter summarizes the current state of copyright laws in the United States and European Union that most affect Digital Humanities research, namely the fair use doctrine in the US and research exceptions in Europe, including the Directive on Copyright in the Digital Single Market, which has been finally adopted in 2019. This summary begins with a description of recent copyright advances most relevant to DH research, and finishes with an analysis of a significant remaining legal hurdle which DH researchers face: how do fair use and research exceptions deal with the critical issue of circumventing technological protection measures (TPM, a.k.a. DRM). Our discussion of the lawful means of obtaining TPM-protected material may contribute to both current DH research and planning decisions and inform future stakeholders and lawmakers of the need to allow TPM circumvention for academic research.
Digital research infrastructures can be divided into four categories: large equipment, IT infrastructure, social infrastructure, and information infrastructure. Modern research institutions often employ both IT infrastructure and information infrastructure, such as databases or large-scale research data. In addition, information infrastructure depends to some extent on IT infrastructure. In this paper, we discuss the IT, information, and legal infrastructure issues that research institutions face.
Directing, negotiating and planning: 'Aus Spiel' ('for play') in children's pretend joint play
(2021)
We are interested in how children organize joint pretend play. In this kind of play, children create an invented world by transforming matters of the real world into matters of a fictional world (e.g., pretending to be a 'giant' or treating a particular spatial area as a 'witch's kitchen'). Since there are no rules and no script, every next step in the game is an improvisation designed here and now. Children engaged in free play have equal rights to determine what should happen next. For that reason, they have to negotiate next steps. We are interested in a particular expression that children often use in joint play: aus Spaß/Spiel ('for fun' or 'for play', similar to 'let's pretend'). Based on a corpus of five hours of video recordings of two pairs of twins (the younger children are between 3 and 5 years old, the older ones are 8 years old), we show that children regularly use aus Spiel while playing as a method for shaping the activity. Inventing new events, children try to get their co-players to accept them and act accordingly. In that context, issues of (dis-)alignment and deontic rights become relevant. Here, we are interested in the interactional work that aus Spiel-('let's pretend')-turns do and how co-players respond.
This special issue investigates early responses—responsive actions that (start to) unfold while the production of the responded-to turn and action is still under way. Although timing in human conduct has gained intense interest in research, the early production of responsive actions has so far largely remained unexplored. But what makes early responses possible? What do such responses tell us about the complex interplay between syntax, prosody, and embodied conduct? And what sorts of actions do participants accomplish by means of such early responses? By addressing these questions, the special issue seeks to offer new advances in the systematic analysis of temporal organization in interaction, contributing to broader discussions in the language and cognitive sciences as to the social coordination of human conduct.
This special issue investigates early responses—responsive actions that (start to) unfold while the production of the responded-to turn and action is still under way. Although timing in human conduct has gained intense interest in research, the early production of responsive actions has so far largely remained unexplored. But what makes early responses possible? What do such responses tell us about the complex interplay between syntax, prosody, and embodied conduct? And what sorts of actions do participants accomplish by means of such early responses? By addressing these questions, the special issue seeks to offer new advances in the systematic analysis of temporal organization in interaction, contributing to broader discussions in the language and cognitive sciences as to the social coordination of human conduct. In this introductory article, we discuss the role of temporality and sequentiality in social interaction, specifically focusing on projective and anticipatory mechanisms and the interplay between multiple semiotic resources, which are crucial for making early responses possible.
Die Editionsmatrix EdMa ist ein Hilfsmittel zur Kategorisierung von Editionen, das als Ausgangspunkt für eigene Planungen von Editorinnen und Editoren und für eine gezielte Beratung genutzt werden kann.
Die vorliegende Handreichung bzw. Anleitung zur kriterienbasierten Erfassung und Kategorisierung digitaler Editionen ist im Kontext des Projekts CLARIAH-DE entstanden, welches in seiner ersten Phase von April 2019 bis März 2021 vom Bundesministerium für Bildung und Forschung gefördert wurde.
Der Beitrag beschreibt die Entwicklung und Anwendung des TEI-basierten ISO-Standards ISO 24624:2016 Transcription of spoken language, der seit einigen Jahren für gesprochensprachliche Forschungsdaten aus unterschiedlichen Kontexten eingesetzt wird. Ein standardisiertes Dateiformat ermöglicht Interoperabilität zwischen verschiedenen Werkzeugen und weiteren Angeboten von Datenzentren und Infrastrukturen. Durch die methodologisch fundierte Abwägung zwischen Standardisierung und Flexibilität kann der ISO/TEI-Standard zudem Forschungsdaten aus verschiedenen Forschungskontexten abbilden, und so interdisziplinäre Vorhaben erleichtern. Der Beitrag stellt einige Anwendungsbereiche aus dem Lebenszyklus gesprochensprachlicher Forschungsdaten vor, in denen auf dem ISO/TEI-Standard basierenden Erweiterungen existierender Softwarelösungen erfolgreich umgesetzt werden konnten, und zeigt weitere Beispiele für die zunehmende Verbreitung des Formats.
Early New High German N+N compounds are notoriously difficult to identify. This is mostly due to formally similar or identical pronominal genitive constructions. Furthermore, what looks like a noun at first glance might sometimes be an affixoid, an adjective or a verb stem. The precise identification of compounds is not only relevant for researchers concerned with word-formation. It has consequences for corpus lemmatisation, lexicography and our understanding of the noun phrase, to name just a few areas. Compound identification has been tackled before (mostly by Pavlov [1983] and NITTA [1987]), but modern corpus linguistics allows for a better assessment of all factors involved. This paper reevaluates and outlines strategies to identify Early New High German compounds, aiming to serve as an easily adaptable guideline for future research.
Einleitung
(2021)
Mit dem zweiten Band werden vier neue „Bausteine“ zu einer korpuslinguistisch fundierten Grammatik des Deutschen vorgelegt. Sie behandeln die Bereiche Determination, syntaktische Funktionen der Nominalphrase und Attribution. Dem Fachpublikum werden zugleich die analysierten Sprachdaten und vertiefende Zusatzuntersuchungen zugänglich gemacht.