Refine
Year of publication
- 2018 (212) (remove)
Document Type
- Part of a Book (212) (remove)
Language
Has Fulltext
- yes (212)
Keywords
- Deutsch (66)
- Korpus <Linguistik> (35)
- Syntax (14)
- Gesprochene Sprache (12)
- Semantik (12)
- Interaktion (11)
- Kognitive Linguistik (11)
- Konstruktionsgrammatik (11)
- Diskursanalyse (9)
- Grammatik (9)
Publicationstate
- Veröffentlichungsversion (90)
- Zweitveröffentlichung (78)
- Postprint (9)
Reviewstate
- (Verlags)-Lektorat (142)
- Peer-Review (46)
- Verlagslektorat (1)
Publisher
- de Gruyter (73)
- Narr Francke Attempto (24)
- European language resources association (ELRA) (11)
- Heidelberg University Publishing (11)
- De Gruyter (8)
- Znanstvena založba Filozofske fakultete Univerze v Ljubljani / Ljubljana University Press, Faculty of Arts (7)
- Benjamins (6)
- Hungarian Academy of Sciences (5)
- Lang (5)
- Hempen (4)
Präpositionale Wortverbindungen (PWVs) und präpositionale lexikalisch geprägte Muster - speziell der Typ der binären Konstruktionen - sind ein in der (kontrastiven) Mehrwortforschung bislang kaum beachteter Typ, wie bereits mehrfach betont. Wenn in den deutschen PWVs die interne Stelle zwischen der Präposition und dem Nomen überproportional häufig nicht mit einem Artikel besetzt ist, ist bei solchen Kombinationen mit einem potenziell hohen Lexikalisierungsgrad zu rechnen. Solche PWVs kann man als autonome Einheiten auffassen, und dementsprechend soll man sie auch als feste Wortverbindungen untersuchen. Die formale und inhaltliche Grundlage für das kontrastive Modell bildet das UWV-Modell (vgl. Steyer 2000, 2013) und das Konzept lexikalisch geprägter Muster (siehe Steyer in diesem Band). Im Folgenden wird diese Herangehensweise auf die Äquivalenzfindung im Sprachenpaar Deutsch (DE) - Slowakisch (SK) angewendet. Einen zentralen Stellenwert nimmt die Kontrastierung von Kollokationsfeldern, von rekurrenten lexikalischen Erweiterungsmustern und komplexeren Wortverbindungsmuster ein. Es handelt sich um ein monodirektional angelegtes Modell Deutsch -> Fremdsprache, die korpusbasierte kontrastive Aufbereitung und Beschreibung schließt jedoch eine Bi- oder auch Multidirektionalität nicht aus. Die komplexe Äquivalenzproblematik und die entsprechenden Konvergenzen und Divergenzen werden in diesem Beitrag anhand folgender ausgewählter Kontrastbereiche im Vergleich Deutsch -> Zielsprache Slowakisch diskutiert: a) Verhältnis des deutschen Lemmas zu seinem prototypischen Äquivalent bzw. den prototypischen Äquivalenten, b) Bedeutung(en) und Gebrauchsspezifika der PWVs, c) interne und externe Variabilität der zugrundeliegenden Muster der PWVs und ihrer äquivalenten PWV-Muster; d) typische Einbettungen der äquivalenten PWVs in Satzkonstruktionen und semantische Merkmale verbaler Satelliten.
In Beispielen wie
(1) Du hast scheints / Weiß Gott nichts begriffen.
(2) It cost £200, give or take.
(3) Qu’est ce qu’il a dit?
werden verbale Konstruktionen (kurz: VK, hier jeweils die fett gesetzten Teile) in einer Weise gebraucht, die der Grammatik verbaler Konstruktionen zuwiderläuft. In (1) und (2) wird die verbale Konstruktion wie ein Adverb/eine Partikel gebraucht bzw. wie ein Ausdruck in der Funktion eines (adverbialen) Adjunkts/ Supplements. In (3) ist die verbale Konstruktion zum Bestandteil einer periphrastischen interrogativen Konstruktion geworden. Wie sind solche ‘Umfunktionalisierungen’ – wie ich das Phänomen zunächst vortheoretisch bezeichnen möchte – einzuordnen? Handelt es sich um Lexikalisierung oder um Grammatikalisierung? Oder um ein Phänomen der dritten Art? Die Umfunktionalisierung verbaler Syntagmen bzw. Konstruktionen – ich gebrauche die Abkürzung UVK für ‘umfunktionalisierte verbale Konstruktion(en)’ – ist ein bisher weniger gut untersuchtes Phänomen, etwa gegenüber der Umfunktionalisierung von Präpositionalphrasen, die sprachübergreifend zu komplexen, „sekundären“ Präpositionen werden können (man vergleiche DEU auf Grund + Genitiv / von, ENG on top of, FRA à cause de).
Der Beitrag gliedert sich in drei Teile. In Abschnitt 2 führe ich zunächst den Begriff der Phraseoschablone ein und erläutere, inwiefern diese Untergruppe der Phraseologismen Eigenschaften von grammatischen Konstruktionen aufweist, deren konzise Erfassung eine notwendige Voraussetzung dafür ist, Beschränkungen bei der Produktivität und der semantischen Variabilität der Phraseologismen zu erklären. Daran anschließend werden in Abschnitt 3 Ergebnisse einer korpuslinguistischen Fallstudie nominaler Reduplikationen mit den Präpositionen an, in und über dargelegt und erörtert. Abschnitt 4 fasst schließlich die erzielten Ergebnisse im übergeordneten Zusammenhang zusammen und gibt einen Ausblick auf weitere Forschungsfragen.
Topologisches Satzmodell
(2018)
Many studies on dictionary use presuppose that users do indeed consult lexicographic resources. However, little is known about what users actually do when they try to solve language problems on their own. We present an observation study where learners of German were allowed to browse the web freely while correcting erroneous German sentences. In this paper, we are focusing on the multi-methodological approach of the study, especially the interplay between quantitative and qualitative approaches. In one example study, we will show how the analysis of verbal protocols, the correction task and the screen recordings can reveal the effects of intuition, language (learning) awareness, and determination on the accuracy of the corrections. In another example study, we will show how preconceived hypotheses about the problem at hand might hinder participants from arriving at the correct solution.
Die ansprechende und geeignete Visualisierung linguistischer Daten gewinnt analog zum steigenden Einfluss quantitativer Methoden in der Linguistik immer mehr an Bedeutung. R ist eine flexible und freie Entwicklungsumgebung zur Umsetzung von statistischen Analysen, die zahlreiche Optionen zur Datenvisualisierung bereithält und sehr gut für große Datensätze geeignet ist. Statistische Analysen und Visualisierungen von Daten werden auf diese Weise in einer Umgebung verzahnt. Durch die zahlreichen Zusatzpakete stehen auch weiterhin zeitgemäße Methoden zur Verfügung, um (linguistische) Daten zu analysieren und darzustellen.
Der Beitrag vermittelt einen stark anwendungsorientierten Einstieg in das Programm und legt mithilfe von vielen praktischen Übungen und Anwendungsbeispielen die Grundlagen für ein eigenständiges Weiterentwickeln der individuellen Fähigkeiten im Umgang mit der Software. Neben einer kurzen, eher theoretisch angelegten Einleitung zu explorativen und explanatorischen Visualisierungsstrategien von Daten werden verschiedene Pakete vorgestellt, die für die Visualisierung in R benutzt werden können.
The actual or anticipated impact of research projects can be documented in scientific publications and project reports. While project reports are available at varying level of accessibility, they might be rarely used or shared outside of academia. Moreover, a connection between outcomes of actual research project and potential secondary use might not be explicated in a project report. This paper outlines two methods for classifying and extracting the impact of publicly funded research projects. The first method is concerned with identifying impact categories and assigning these categories to research projects and their reports by extension by using subject matter experts; not considering the content of research reports. This process resulted in a classification schema that we describe in this paper. With the second method which is still work in progress, impact categories are extracted from the actual text data.
We present an approach for modeling German negation in open-domain fine grained sentiment analysis. Unlike most previous work in sentiment analysis, we assume that negation can be conveyed by many lexical units (and not only common negation words) and that different negation words have different scopes. Our approach is examined on a new dataset comprising sentences with mentions of polar expressions and various negation words. We identify different types of negation words that have the same scopes. We show that already negation modeling based on these types largely outperforms traditional negation models which assume the same scope for all negation words and which employ a window-based scope detection rather than a scope detection based on syntactic information.
We present the pilot edition of the GermEval Shared Task on the Identification of Offensive Language. This shared task deals with the classification of German tweets from Twitter. It comprises two tasks, a coarse-grained binary classification task and a fine-grained multi-class classification task. The shared task had 20 participants submitting 51 runs for the coarse-grained task and 25 runs for the fine-grained task. Since this is a pilot task, we describe the process of extracting the raw-data for the data collection and the annotation schema. We evaluate the results of the systems submitted to the shared task. The shared task homepage can be found at https://projects.cai. fbi.h-da.de/iggsa/
Negation is an important contextual phenomenon that needs to be addressed in sentiment analysis. Next to common negation function words, such as not or none, there is also a considerably large class of negation content words, also referred to as shifters, such as the verbs diminish, reduce or reverse. However, many of these shifters are ambiguous. For instance, spoil as in spoil your chance reverses the polarity of the positive polar expression chance while in spoil your loved ones, no negation takes place. We present a supervised learning approach to disambiguating verbal shifters. Our approach takes into consideration various features, particularly generalization features.
A syntax-based scheme for the annotation and segmentation of German spoken language interactions
(2018)
Unlike corpora of written language where segmentation can mainly be derived from orthographic punctuation marks, the basis for segmenting spoken language corpora is not predetermined by the primary data, but rather has to be established by the corpus compilers. This impedes consistent querying and visualization of such data. Several ways of segmenting have been proposed,
some of which are based on syntax. In this study, we developed and evaluated annotation and segmentation guidelines in reference to the topological field model for German. We can show that these guidelines are used consistently across annotators. We also investigated the influence of various interactional settings with a rather simple measure, the word-count per segment and unit-type. We observed that the word count and the distribution of each unit type differ in varying interactional settings and that our developed segmentation and annotation guidelines are used consistently across annotators. In conclusion, our syntax-based segmentations reflect interactional properties that are intrinsic to the social interactions that participants are involved in. This can be used for further analysis of social interaction and opens the possibility for automatic segmentation of transcripts.
In current corpuslinguistic investigations, especially the collection of linguistic data and the frequency of linguistic phenomena (i.e. in the "linguistic matter") is in the center of interest of morphological discussions. This paper argues in favor of taking also morphological "antimatter" in account, i.e. surveying the structure of words containing morphological restrictions which cannot be proven systematically. With recourse to Popper's falsificationism and starting with prominent restrictions in the morphology of German, the article discusses theoretical consequences and chances for morphological theory with special emphasis on morphological change, i.e. when antimatter becomes matter and vice versa.
Null subjects (NSs) have been a central research topic in generative syntax ever since the 1980s. This chapter considers the situation of German NSs both from a dialectological and from a diachronic perspective and attempts to reconstruct a direct line concerning the licensing conditions of pro-drop from Old High German (OHG) through Middle High German (MHG) and Early New High German (ENHG) to current dialects of New High German (NHG). Particularly, we will argue that German changed from a consistent, yet asymmetric pro-drop language to a partial, but symmetric one. In order to demonstrate that this development took place and the steps involved, we survey the existing empirical evidence and introduce new data.
This paper argues that there is a correlation between functional and purely grammatical patterning in language, yet the nature of this correlation has to be explored. This claim is based on the results of a corpus-driven study of the Slavic aspect, drawing on the socalled Distributional Hypothesis. According to the East-West Theory of the Slavic aspect, there is a broad east-west isogloss dividing the Slavic languages into an eastern group and a western group. There are also two transitional zones in the north and south, which share some properties with each group (Dickey 2000; Barentsen 1998, 2008). The East-West Theory uses concepts of cognitive grammar such as totality and temporal definiteness, and is based on various parameters of aspectual usage in discourse, including contexts such as habituals, general factuals, historical (narrative) present, performatives, sequenced events in the past etc. The purpose of the above-mentioned study is to challenge the semantic approach to the Slavic aspect by comparing the perfective and imperfective verbal aspect on the basis of purely grammatical co-occurrence patterns (see also Janda & Lyashevskaya 2011). The study focused on three Slavic languages: Russian, which, following the East-West Theory, belongs to the eastern group, Czech, which belongs to the western group, and Polish, which is considered as transitional in its aspectual patterning.
The present submission reports on a pilot project conducted at the Institute for the German Language (IDS), aiming at strengthening the connection between ISO TC37SC4 “Language Resource Management” and the CLARIN infrastructure. In terminology management, attempts have recently been made to use graph-theoretical analyses to get a better understanding of the structure of terminology resources. The project described here aims at applying some of these methods to potentially incomplete concept fields produced over years by numerous researchers serving as experts and editors of ISO standards. The main results of the project are twofold. On the one hand, they comprise concept networks dynamically generated from a relational database and browsable by the user. On the other, the project has yielded significant qualitative feedback that will be offered to ISO. We provide the institutional context of this endeavour, its theoretical background, and an overview of data preparation and tools used. Finally, we discuss the results and illustrate some of them.
This paper discusses changes in lexicographic traditions with respect to contrastive dictionary entries and dynamic, on-demand e-lexicographic descriptions. The new German online dictionary Paronyme - Dyna- misch im Kontrast is concerned with easily confused words (paronyms), such as effektivtefficient and sensibel/ sensitiv. New approaches to the empirical analysis and lexicographic presentation of words such as these are required, and this dictionary is committed to overcoming the discrepancy between traditional practice and insights from language use. As a corpus-guided reference work, it strives to adequately reflect not only authentic use in situations of actual communication, but also cognitive ideas such as conceptual structure, categorization and knowledge. Looking up easily confused lexical items requires contrastive entries where users can instantly compare meaning, contexts and reference. Adaptable access to lexicographic details and variable search options offer different foci and perspectives on linguistic information, and authentic examples reflect prototypical structures. These are essential in order to meet all the different interests of users. This paper will illustrate the contrastive structure of the new e-dictionary and demonstrate which information can be compared. It also focusses on various dynamic modes of dictionary consultation, which enable users to shift perspectives on paronyms accordingly.
Language shift after migration has been reported to occur within three generations. While this pattern holds in many cases there is also some counter evidence. In this paper, family documents from a German immigration community in Canada are investigated to trace individual decisions of language choice that contributed to an extended process of shift taking four generations and more than a century.
Die Polysemie satzeinbettender Prädikate spielt eine wichtige Rolle fur deren Einbettungsverhalten. Konkret wird gezeigt, dass Polysemie mit struktureller Ambiguität als Kontroll- vs. Anhebungsverb assoziiert sein kann (Beispiel drohen/versprechen) und dass NEG-Raising auf bestimmte Lesarten eines polysemen Verbs beschränkt sein kann. Des Weiteren wird beleuchtet, welche Faktoren die syntaktische Flexibilität satzeinbettender Prädikate, d.h. das Einbettungspotenzial bzgl. der wichtigsten Satzkomplementtypen des Deutschen, begünstigen und welche Rolle dabei Umdeutungen (z.B. von bedauern zu 'mit Bedauern äußern'), die Polysemie induzieren, spielen. Alle betrachteten Phänomene deuten darauf hin, dass sie S-Selektion (semantische Selektion) eine zentrale Rolle in der Satzeinbettung spielt.
Die Analyse sprachlicher Massendaten zeigt, wie zentral mehr oder weniger feste Wortverbindungen als Lexikoneinheiten für die Sprachkompetenz sind. Der Beitrag geht zunächst kurz auf aktuelle Entwicklungen in der Phraseologie ein: eine Abkehr von der starken Betonung des Idiosynkratischen einerseits und die Hinwendung zum Vorgeprägten andererseits. Wir führen hierzu den Terminus‚ lexikalisch geprägte Muster‘ (LGM) ein. In einer Detailanalyse beschäftigen wir uns mit satzwertigen Wortverbindungen im Spannungsfeld zwischen ausgeprägter Lexikalisierung, die auf eine gesonderte kognitive Verankerung hindeutet, und der Konstitution abstrakter Spruchmuster als LGM-Subtyp. Im zweiten Teil zeigen wir, wie usuelle Wortverbindungen innerhalb von Phrasenkomposita zur Lexembildung beitragen.
Vorwort
(2018)
German is a language with complex morphological processes. Its long and often ambiguous word forms present a bottleneck problem in natural language processing. As a step towards morphological analyses of high quality, this paper introduces a morphological treebank for German. It is derived from the linguistic database CELEX which is a standard resource for German morphology. We build on its refurbished, modernized and partially revised version. The derivation of the morphological trees is not trivial, especially for such cases of conversions which are morpho-semantically opaque and merely of diachronic interest. We develop solutions and present exemplary analyses. The resulting database comprises about 40,000 morphological trees of a German base vocabulary whose format and grade of detail can be chosen according to the requirements of the applications. The Perl scripts for the generation of the treebank are publicly available on github. In our discussion, we show some future directions for morphological treebanks. In particular, we aim at the combination with other reliable lexical resources such as GermaNet.
In diesem Beitrag werden Ergebnisse einer Studie präsentiert, die im Rahmen meines Habilitationsprojektes zu Somatismen des Deutschen mit der Konstituente Hand durchgeführt wurde. Das Projekt insgesamt ist korpusbasiert, qualitativ orientiert und verfolgt im Kern semantische Interessen. Empirische Grundlage für die Studien ist das Schriftspracharchiv W des IDS (Institut für Deutsche Sprache). Ziel der insgesamt über 20 Projektstudien ist jeweils die korpusbasierte Beschreibung der Bedeutungsentfaltung phraseologischer Einheiten in der Verwendungsbreite und nicht die Reduktion auf die Übersetzung einer als eine Bedeutung oder gar DIE Bedeutung wiedergebenden Paraphrase in formalsprachliche oder formalsymbolische Beschreibungsabstraktionen. In die Breite zu gehen bedeutet, die beschreibungsmäßig häufig verborgenen, aber im konkreten Sprachgebrauch jeweils sich zeigenden semantischen Feinheiten der untersuchten Einheiten ins Zentrum der Analyse zu stellen. Dafür ist es notwendig, die jeweilige Einheit zunächst überhaupt zu identifizieren (über welche Einheit wird geredet) und ihre formseitigen Manifestationen zu erfassen (welche strukturellen Verfestigungen liegen vor). Anschließend werden über die Beschreibung der Kotexte dieser Einheiten in Belegkorpora die an formseitige Ausprägungen gekoppelten Pfade der Bedeutungsentfaltung - ausgehend von einer ermittelten Ausgangsbedeutung - nachgezeichnet. Auf diese Weise können auch Bedeutungsaspekte eingeholt werden, die als bloße Konnotationen oder Modifikationen zu randständig, als Kernbedeutung zu unhandlich und als semantischer Mehrwert zu uneigenständig konzipiert sind. Es handelt sich um wesentliche Bedeutungszüge der untersuchten Einheiten und Aufgabe der Studien ist es, diese Aspekte durch Kopplung an verschiedene formseitige Ausprägungen gebrauchsangemessen erfassen und beschreiben zu können.
Pädiatrische Gespräche unterscheiden sich gegenüber anderen ärztlichen Gesprächen mit Patienten hinsichtlich der Gesprächsaufgaben und der Beteiligungskonstellationen. In einer triadischen Konstellation mit Arzt, Patient und Eltern(teil) müssen unterschiedliche Kenntnisse und Zuständigkeiten aller Beteiligten ausreichend abgeglichen und Verständigung und Gesprächsergebnisse gesichert werden. In diesem Beitrag wird zunächst die Forschungslage umrissen und das Handlungsschema pädiatrischer Erstkonsultationen kurz dargelegt. Daran anschließend werden anhand einer Fallanalyse die vielschichtigen und komplexen Aufgabenstellungen der Beteiligten bei der Herstellung und Durchführung der körperlichen Untersuchung beleuchtet.
Sprachpurismus ist eine Form der Sprachkritik, die sich die 'Reinhaltung‘ der Sprache zum obersten Ziel gesetzt hat. Unter Reinhaltung ist zunächst die Zurückdrängung fremdsprachlicher Einflüsse vor allem im Bereich der Lexik zu verstehen, aber auch Versuche der Herausbildung eines Standards und der Entwicklung einer Hochsprache bzw. Nationalsprache sind Gegenstände des Purismus. Sprachpurismus kann individuell als auch institutionell sein. Die ersten institutionellen Versuche zur Reinhaltung des Deutschen gehen auf die Sprachgesellschaften des 17. Jahrhunderts zurück. Diachron betrachtet hat sich der Fokus des Purismus auf unterschiedliche Aspekte der Sprache und der Sprachverwendung gerichtet; gemeinsam ist allen puristischen Bestrebungen, dass sie in der Regel gesellschaftlich an ein Erstarken des Nationalgefühls gekoppelt sind. Trotz institutioneller Bestrebung und im Gegensatz zu anderen Sprachen ist für das Deutsche der Purismus keine Form der Sprachpolitik, also nicht staatlich gelenkt.
Strengthening literal meanings of linguistic expressions appears central to communicative success. Weakening on the other hand would appear not to be viable given that literal meaning already grossly underdetermines reality, let alone possibility. We discuss productive weakening in fake-type adjectival modification and present evidence from event-related brain potentials that such weakening has neurophysiological consequences and is qualitatively different from other mechanisms of modification. Specifically, the processing of fake-type constructions (e.g., "a fake diamond") evokes a Late Positivity as characteristic of certain types of referential shift or reconceptualization. We argue that fake-type composition involves an intermediate representation that is semantically contradictory and that the Late Positivity reflects an interface repair mechanism that redresses the contradiction. In contrast, composition involving reputedly over-informative real-type adjectives evokes no comparable processing costs.
Nomen werden vermeintlich früher erworben als Verben, da sie dem Noun Bias zufolge konzeptuell einfacher sind. In Studien zum frühen Wortschatzerwerb spielen Verben folglich häufig keine prominente Rolle. Am Beispiel des Deutschen zeigt dieser Beitrag auf, wie sich die Verbbedeutung entwickelt. Dem hier vertretenen Ansatz des Event Structural Bootstrapping zufolge erschließen Kinder sich die Verbbedeutung durch eine Fokussierung auf den Endzustand. Daher spielen telische Verben fur den frühen Spracherwerb eine zentrale Rolle. Ergebnisse aus verschiedenen Spracherwerbsstudien zur Produktion und zur Interpretation von Verben bestätigen, dass deutschsprachige Kinder eine klare Endzustandsorientierung zeigen. Dass Verben und deren Semantik früher erworben werden als bis dato angenommen, spricht gleichzeitig gegen einen starken Noun Bias.
Deutsche Partikelverben repräsentieren eine äußerst produktive Klasse von komplexen Verben im Lexikon, die sich durch idiosynkratische Eigenschaften auf der Syntax-Semantik-Schnittstelle auszeichnet: Zum einen sind die abtrennbaren Partikeln extrem ambig. Zum anderen entstehen durch die Komposition von Partikel und Basisverb in Abhängigkeit von der semantischen Klasse des Basisverbs (reguläre) Verschiebungen bezüglich der Argumentstruktur und des Grades der Kompositionalität des Partikelverbs. In diesem Artikel stelle ich eine breite Auswahl von kognitiven und computerlinguistischen Studien vor, die verschiedene Perspektiven auf das Zusammenspiel von semantischen Verbklassen, Partikel-Bedeutungen sowie Argumentstruktur und Kompositionalität von Partikelverben ermöglichen.
The sentiment polarity of a phrase does not only depend on the polarities of its words, but also on how these are affected by their context. Negation words (e.g. not, no, never) can change the polarity of a phrase. Similarly, verbs and other content words can also act as polarity shifters (e.g. fail, deny, alleviate). While individually more sparse, they are far more numerous. Among verbs alone, there are more than 1200 shifters. However, sentiment analysis systems barely consider polarity shifters other than negation words. A major reason for this is the scarcity of lexicons and corpora that provide information on them. We introduce a lexicon of verbal polarity shifters that covers the entirety of verbs found in WordNet. We provide a fine-grained annotation of individual word senses, as well as information for each verbal shifter on the syntactic scopes that it can affect.
In this paper we use methods for creating a large lexicon of verbal polarity shifters and apply them to German. Polarity shifters are content words that can move the polarity of a phrase towards its opposite, such as the verb “abandon” in “abandon all hope”. This is similar to how negation words like “not” can influence polarity. Both shifters and negation are required for high precision sentiment analysis. Lists of negation words are available for many languages, but the only language for which a sizable lexicon of verbal polarity shifters exists is English. This lexicon was created by bootstrapping a sample of annotated verbs with a supervised classifier that uses a set of data- and resource-driven features. We reproduce and adapt this approach to create a German lexicon of verbal polarity shifters. Thereby, we confirm that the approach works for multiple languages. We further improve classification by leveraging cross-lingual information from the English shifter lexicon. Using this improved approach, we bootstrap a large number of German verbal polarity shifters, reducing the annotation effort drastically. The resulting German lexicon of verbal polarity shifters is made publicly available.
Europäische Biopolitik? Das Sport-für-alle-Paradigma des Europarats in den 1960er und 1970er Jahren
(2018)
Sport und körperliche Bewegung sind heute tief in die Lebensführung einzelner Menschen wie auch ganzer Bevölkerungsgruppen integriert. Das Streben nach Fitness ist ein Kennzeichen gegenwärtiger Gesellschaften, das Identifikationsraster bereitstellt und Inklusionswie auch Exklusionseffekte zeitigt. Der vorliegende Band geht diesen Phänomenen in historischer Perspektive nach. Erstmals wird dazu das von Michel Foucault geprägte Paradigma der Biopolitik - eine "moderne" Machtform, in der die Regulierung des individuellen wie kollektiven "Lebens" ins Zentrum politischer Strategien rückt - systematisch auf sporthistorische Untersuchungsgegenstände bezogen.
The paper describes preliminary studies regarding the usage of Example-Based Querying for specialist corpora. We outline an infrastructure for its application within the linguistic domain. Example-Based Querying deals with retrieval situations where users would like to explore large collections of specialist texts semantically, but are unable to explicitly name the linguistic phenomenon they look for. As a way out, the proposed framework allows them to input prototypical everyday language examples or cases of doubt, which are automatically processed by CRF and linked to appropriate linguistic texts in the corpus.
We present a study on gaps in spoken language interaction as a potential candidate for syntactic boundaries. On the basis of an online annotation experiment, we can show that there is an effect of gap duration and gap type on its likelihood of being a syntactic boundary. We discuss the potential of these findings for an automation of the segmentation process.
Dieser Beitrag setzt sich mit Gesprächskorpora als einem besonderen Typus von Korpora gesprochener Sprache auseinander. Es werden zunächst wesentliche Eigenschaften solcher Korpora herausgearbeitet und einige der wichtigsten deutschsprachigen Gesprächskorpora vorgestellt. Der zweite Teil des Beitrags setzt sich dann mit dem Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) auseinander. FOLK hat sich zum Ziel gesetzt, ein wissenschaftsöffentliches Korpus von Interaktionsdaten aufzubauen, das methodisch und technisch dem aktuellen Forschungsstand entspricht. Die Herausforderungen, die sich beim Aufbau von FOLK in methodischer und korpustechnologischer Hinsicht stellen, werden in abschließenden Abschnitt diskutiert.
Theater rehearsals have a characteristic temporal organization: They rely on fleeting (talk/embodied conduct) and endurable resources (e.g. manipulation of objects) to accomplish a stage play which has a defined shape. In doing this, participants have to bridge time gaps and they are therefore dependent on practices which are able to prefigure the future in a more sustainable way. Based on video recordings from theater rehearsals I will show the basic operation of these practices: While projections-by-arrangements anticipate the play world verbally, preparations produce material parts of the play world (e.g. attaching props). Finally, I consider more general implications of the differences between “verbalizing” (projections) and “materializing” (preparations) for the temporalities of interactional organization.
Dieser Beitrag liefert eine Skizze eines gebrauchsbasierten integrativen soziokognitiven Modells des dynamischen Lexikons. Das Modell besteht aus drei Kernkomponenten: Handlungen in der aktuellen Sprachverwendung, kognitiven Prozessen und sozialen Prozessen. Die Komponenten des Modells werden zunächst einzeln beschrieben und dann zusammengefügt. Es wird gezeigt und anhand von zwei Beispielen illustriert, wie das Modell durch die systematische Beschreibung der Interaktion zwischen diesen Komponenten gleichzeitig Stabilität und Struktur sowie Variation und Wandel im Lexikon vorhersagt.