Refine
Year of publication
- 2009 (229) (remove)
Document Type
- Part of a Book (97)
- Article (71)
- Conference Proceeding (23)
- Book (17)
- Part of Periodical (6)
- Review (5)
- Contribution to a Periodical (4)
- Doctoral Thesis (2)
- Other (2)
- Report (1)
Language
- German (171)
- English (49)
- French (2)
- Italian (2)
- Portuguese (2)
- Latvian (1)
- Multiple languages (1)
- Russian (1)
Keywords
- Deutsch (110)
- Korpus <Linguistik> (19)
- Sprachnorm (15)
- Konversationsanalyse (11)
- Sprachgebrauch (11)
- Grammatik (10)
- Verb (10)
- Wörterbuch (10)
- Computerlinguistik (9)
- Interaktion (9)
Publicationstate
- Veröffentlichungsversion (88)
- Zweitveröffentlichung (24)
- Postprint (12)
Reviewstate
Publisher
- Institut für Deutsche Sprache (42)
- de Gruyter (29)
- Lang (14)
- Narr (13)
- Niemeyer (6)
- Elsevier (3)
- Springer (3)
- Acta Universitatis Upsaliensis (2)
- Benjamins (2)
- Cornelsen Scriptor (2)
"damit sie mich verstehen" : Genese, Verfahren und recipient design einer narrativen Performance
(2009)
The purpose of this paper is to describe the functions of ‘where’-based relative elements' in six Balkan languages, paying particular attention to non-standard varieties.2 Relative elements based on an originally interrogative pronoun meaning ‘where’ are attested in all Balkan languages and, more generally, in all European languages. In accordance with the locative meaning of the original pronoun, ‘where’-based relative elements are primarily used to relativize locatives. However, it will be shown that in some Balkan languages, and especially in non-standard varieties, these elements have extended their functional domain. This process does not appear to be random, but rather to pattern with the following hierarchy: locative > unspecific connector > other syntactic positions (indirect/direct object, subject).3 Additionally, ‘where’-based relative elements will be compared with ‘what’-based ones in order to highlight common patterns of development.
Die sprachlichen Veränderungen der letzten 20 Jahre sind von zwei Zeitabschnitten gekennzeichnet, die in Bezug auf die Wortschatzentwicklung unterschiedlicher nicht hätten sein können: Der erste, kurze, ist von der Wendezeit – mit auffälligem, meist nur vorübergehendem Lexemwandel – und dem Beitritt der DDR zur Bundesrepublik – mit dem Verschwinden bzw. Austausch des größten Teils des DDR-typischen Wortschatzes – geprägt. Der zweite, wesentlich längere Abschnitt ist von der Entwicklung im vereinigten Deutschland mit einem im Vergleich unauffälligen, weil kontinuierlichen Wortschatzwandel bestimmt.
This introductory tutorial describes a strictly corpus-driven approach for uncovering indications for aspects of use of lexical items. These aspects include ‘(lexical) meaning’ in a very broad sense and involve different dimensions, they are established in and emerge from respective discourses. Using data-driven mathematical-statistical methods with minimal (linguistic) premises, a word’s usage spectrum is summarized as a collocation profile. Self-organizing methods are applied to visualize the complex similarity structure spanned by these profiles. These visualizations point to the typical aspects of a word’s use, and to the common and distinctive aspects of any two words.
This paper describes a new approach to improve the analysis and categorization of web documents using statistical methods for template based clustering as well as semantical analysis based on terminological ontologies. A domain-specific environment serves for prove of concept. In order to demonstrate the widespread practical benefit of our approach, we outline a combined mathematical and semantical framework for information retrieval on internet resources.
In this paper we present an evaluation of rule-based morphological components for German for use in an interactive editing environment. The criteria for the evaluation are deduced from the intended use of these components, namely availability, performance, programming interfaces, and analysis quality. We evaluated systems developed and maintained since decades as well as new systems. However, we note serious general shortcomings when looking closer at recent implementations and come to the conclusion that the oldest system is the only one that satisfies our requirements.
Ziel dieses Beitrags soll es sein, den Absentiv in seinen semantischen und syntaktischen Besonderheiten zu analysieren sowie ihn von anderen Konstruktionen, insbesondere dem Progressiv, abzugrenzen. Dabei beziehe ich mich unter anderem auf die Arbeiten von de Groot (2000), Krause (2002), Vogel (2007) und Abraham (2008), die die aktuellen Ansätze zu einer Analyse des deutschen Absentivs repräsentieren. Um über das empirische Material hinaus, welches das Internet sowie Hörbelege liefern, an Daten über den Absentiv und seinen Gebrauch zu gelangen, wurde eine Befragung von deutschen Muttersprachlern vorgenommen. Darin wurden anhand eines Fragebogens fünfzehn unterschiedliche Szenarien geschildert. Die Probanden (insgesamt 30 deutsche Muttersprachler im Alter zwischen 21 und 63) waren aufgefordert, entweder einen teilweise vorgegebenen Satz zu vervollständigen oder zwei Sätze dahingehend zu beurteilen, welcher ihnen plausibler erscheint. In wieder anderen Szenarien wurde erwartet, dass die Befragten die Reaktion schildern, mit der sie auf eine vorgegebene Situation reagieren würden. Desweiteren werden die Ergebnisse einer Korpusstudie eingebunden, die 2008 am Institut für Deutsche Sprache durchgeführt wurde. Im Rahmen dieser Untersuchung wurden sämtliche Progressivbelege aus dem COSMAS-II-Korpus extrahiert sowie alle Absentivbelege für eine 589 Verben umfassende Liste und in einer Datenbank gespeichert.
Altern und Identitätsarbeit
(2009)
The paper presents the results of a joint effort of a group of multimodality researchers and tool developers to improve the interoperability between several tools used for the annotation and analysis of multimodality. Each of the tools has specific strengths so that a variety of different tools, working on the same data, can be desirable for project work. However this usually requires tedious conversion between formats. We propose a common exchange format for multimodal annotation, based on the annotation graph (AG) formalism, which is supported by import and export routines in the respective tools. In the current version of this format the common denominator information can be reliably exchanged between the tools, and additional information can be stored in a standardized way.
Apresentação
(2009)
In this paper we address the question of what is needed, in terms of morphosyntactic encoding, to relate a so-called verb-specific modifier to a nominal head. For the purposes of this paper we shall assume that the notion of a verb-specific modifier includes adverbs and their phrasal or clausal projections, adpositional phrases, and noun phrases featuring a particular semantic case such as locative or instrumental. Noun-specific modifiers, in turn, are considered to be first and foremost adjectives and adjective phrases, next participles and their phrasal projections and, finally, relative clauses.1 The basic motivation underlying this distinction relates to markedness.
Auf der Kippe? Zweifelsfälle als Herausforderung(en) für Sprachwissenschaft und Sprachnormierung
(2009)
Auf der Basis einer spezifischen Definition des Begriffs „sprachlicher Zweifelsfall“ und einiger einführenden Bemerkungen zu potentiellen Entstehungsursachen wird im Text zunächst erläutert, in welchen Hinsichten sich die Sprachwissenschaft bisher mit diesen sprachlichen Einheiten beschäftigt hat. Dabei wird die These vertreten, dass die Zweifelsfälle aus verschiedenen Gründen traditionell eher marginalisiert wurden. Nachdem mit konditionierten und unkonditionierten Zweifelsfällen zwei Haupttypen unterschieden worden sind, widmet sich der Text der Sprachnormierung von Zweifelsfällen. Der Ausgangspunkt liegt darin, die geforderte Sprachberatung als argumentativ orientierten, rationalen Umgang mit sprachlichen Zweifelsfällen zu begreifen. Dazu wird eine systematische Entscheidungsprozedur entworfen, die als Grundlage für die Klärung von Zweifelsfällen fungiert. Mit dieser kleinen Theorie der Sprachnormierung von Zweifelsfällen wird auch das Ziel verfolgt, auf deskriptiver Basis empirisch legitimierte Sprachnormen zu formulieren und damit nicht zuletzt einen sprachwissenschaftlichen Beitrag zur Formung des öffentlichen Sprachbewusstseins zu leisten.
We present data-driven methods for the acquisition of LFG resources from two German treebanks. We discuss problems specific to semi-free word order languages as well as problems arising from the data structures determined by the design of the different treebanks. We compare two ways of encoding semi-free word order, as done in the two German treebanks, and argue that the design of the TiGer treebank is more adequate for the acquisition of LFG resources. Furthermore, we describe an architecture for LFG grammar acquisition for German, based on the two German treebanks, and compare our results with a hand-crafted German LFG grammar.
Bedeutung und Standardinterpretation von Äußerungen mit negierten negativ-bewertenden Adjektiven
(2009)
Thema dieses Beitrags ist der Unterschied zwischen der Bedeutung und der Standard- oder „Default“-Interpretation von Äußerungen mit negierten lexikalischen bzw. un-präfigierten Antonymen graduierbarer Adjektive wie intelligent (z.B. X ist nicht dumm vs. X ist nicht unintelligent). Ausgehend von der Darstellung der Bedeutung und der Standardinterpretation der entsprechenden nicht-negierten Formen dieser Äußerungen (z.B. X ist dumm vs. X ist unintelligent) wird zunächst gezeigt, dass Äußerungen wie X ist nicht dumm und X ist nicht unintelligent sich im Hinblick auf das, was mit ihnen kodiert ist, unterscheiden: Äußerungen mit negierten lexikalischen Antonymen (X ist nicht dumm) umfassen sowohl den positiven als auch den neutralen Mittelbereich der jeweils relevanten Skala, solche mit negierten un-präfigierten Antonymen (X ist nicht unintelligent) hingegen nur den positiven Bereich. Die beiden Typen von Äußerungen unterscheiden sich aber auch im Hinblick auf ihre Standardinterpretation: Obwohl sie beide überlicherweise als ‚eher X‘ oder ‚ziemlich X‘ (z.B. ‚eher intelligent‘ oder ‚ziemlich intelligent‘) interpretiert werden, wird die mit den negierten, un-präfigierten Formen ausgedrückte Bewertung von Muttersprachlern (des Deutschen) häufig als positiver eingeschätzt als die Bewertung, die mit den negierten nicht-abgeleiteten Formen ausgedrückt wird.
Bericht von der Dritten Internationalen Konferenz „Grammatik und Korpora“, Mannheim, 22. - 24.9.2009
(2009)
Beyond the stars: exploiting free-text user reviews to improve the accuracy of movie recommendations
(2009)
In this paper we show that the extraction of opinions from free-text reviews can improve the accuracy of movie recommendations. We present three approaches to extract movie aspects as opinion targets and use them as features for the collaborative filtering. Each of these approaches requires different amounts of manual interaction. We collected a data set of reviews with corresponding ordinal (star) ratings of several thousand movies to evaluate the different features for the collaborative filtering. We employ a state-of-the-art collaborative filtering engine for the recommendations during our evaluation and compare the performance with and without using the features representing user preferences mined from the free-text reviews provided by the users. The opinion mining based features perform significantly better than the baseline, which is based on star ratings and genre information only.
Migration wird oft sowohl mit einem Staats- als auch mit einem Sprachwechsel assoziiert. Es existieren aber auch mehrsprachige Länder, in denen eine interne Migration (Binnenwanderung), „nur“ einen Sprachwechsel erfordert. Ein Beispiel dafür ist die offiziell viersprachige Schweiz: Was passiert, wenn ein Tessiner in die Deutschschweiz oder ein deutschsprachiger Schweizer ins Tessin übersiedelt? Anhand des Begriffs vom „kommunikativen Raum“ wird im Beitrag die sprachliche Situation der schweizerischen Binnenwanderer näher beleuchtet; parallel dazu wird auf mögliche Probleme eingegangen, mit denen die Binnenwanderer zurechtkommen müssen.
Complex common names such as Indian elephant or green tea denote a certain type of entity, viz. kinds. Moreover, those kinds are always subkinds of the kind denoted by their head noun. Establishing such subkinds is essentially the task of classifying modifiers that are a defining trait of endocentrically structured complex common names. Examining complex common names of different lexico-syntactic types(NN compounds, N+N syntagmas, NP/PP syntagmas, A+N syntagmas) and from different languages (particularly English, German and French) it can be shown that complex common names are subject to language- independent formal and semantic constraints. In particular, complex common names qualify as name-like expressions in that they tend to be deficient in terms of formal complexity and semantic compositionality.
Concurrent standardization as a necessity: The genesis of the new official orthographic guidelines
(2009)
The new official orthographic guidelines were brought into force by the official state authorities on August 1st, 1998 and its principle goals were a standardized representation of the guidelines and a «gentle simplification in respect of content». This regulation was not supported by the public and in fact it was the starting point for a struggle for conceptual solutions and a quest for the achievement of' a consensus between different possible norms. Since orthography is an officially codified standard taking up a prominent position among linguistic standards, it is of particular socio-political importance. It was the foremost task of the Council for German Orthography (Rat für deutsche Rechtschreibung), instituted in December 2004, to elaborate a compromise in order to bring the «Orthographical war» (Die Zeit) to an end, which was led enthusiastically for more than a decade. - The concern of this article is to classify historically the agreement reached in 2006. Against this background, it can be stated that official guidelines will only be accepted, if they are based upon the usage in writing and if they take into account the interests of the reader. Both principles are characterizing the proposal made by the Council for German Orthography. An outlook on the Council's activities concerning orthographic standardization expected in the future will conclude this article.
Contrasting and turn transition: Prosodic projection with the parallel-opposition constructions
(2009)
The parallel-opposition construction has not yet been widely described as an independent construction type. This article reports on its realization in everyday British-English conversation. In particular, it focusses on prosodic projection in the lexically and syntactically unmarked first component of this syntactic pattern, and thus adds to the body of research investigating the organization of turn-taking in the context of bi-clausal constructions with which the first part lacks explicit lexical hints to their continuation. It is shown that the parallel-opposition construction, next to specific semantic–pragmatic, syntactic and lexical features, also exhibits a relatively fixed range of prosodic features in the first conjunct, among these narrow focus, continuing intonation and/or the avoidance of intonation-unit boundary signals. These are used to project continuation of an otherwise complete utterance and, thus, to secure the floor for the expression of contrast. In addition, the detailed analysis of apparently deviant cases, which takes into account the on-line production of syntax, shows that a lack of prosodically projective features in the first component of the parallel-opposition construction can be explained by the strategic, retrospective use of the construction to resolve problems in turn transition.
Le chevauchement, c’est-à-dire la prise de parole simultanée d'au moins deux locuteurs, est un phénomène omniprésent dans la conversation. Inscrit dans le cadre théorique de l'Analyse Conversationnelle et de la linguistique interactionnelle, notre travail se penche sur la parole simultanée considérée comme un phénomène systématique et ordonné qui appartient aux pratiques routinières de l'alternance des tours de parole. Nos analyses se fondent sur des transcriptions d'enregistrements vidéo de données interactionnelles naturelles, des conversations ordinaires en français et en allemand. Nous ne portons pas uniquement un regard sur le chevauchement en tant que phénomène audible, mais le concevons comme une pratique incarnée en interaction, qui est également implémentée par des ressources visibles. À l'analyse séquentielle s'ajoute donc une analyse multimodale, qui nous permet de tenir compte des constellations participatives dynamiques lors du chevauchement. Le travail analytique se focalise sur trois phénomènes spécifiques dans lesquels la parole simultanée intervient de manière significative : d'abord l'auto-répétition faisant suite au chevauchement, ensuite l'abandon de tour de parole d'un locuteur lors de la parole simultanée et enfin la complétion différée, la continuation retardée d'une prise de parole en chevauchement avec l'intervention d'un interlocuteur. Cette thèse contribue à une compréhension approfondie de ces trois phénomènes et démontre que l'organisation de la parole simultanée est étroitement liée à la gestion de trajectoires d'action complexes et de cadres participatifs dynamiques.
Spoken language corpora— as used in conversation analytic research, language acquisition studies and dialectology— pose a number of challenges that are rarely addressed by corpus linguistic methodology and technology. This paper starts by giving an overview of the most important methodological issues distinguishing spoken language corpus workfrom the work with written data. It then shows what technological challenges these methodological issues entail and demonstrates how they are dealt with in the architecture and tools of the EXMARaLDA system.
Das Lexikon der Sprachkritik
(2009)
Viele Überlegungen wurden zu einem Projekt Lexikon der Sprachkritik angestellt und vorläufige Konzepte dafür erdacht. Zu einer Konkretisierung dieser Bemühungen ist es aber bisher leider nicht gekommen. Dieser Beitrag stellt nun einen Versuch dar, ein vorläufiges Konzept für ein Lexikon der Sprachkritik vorzulegen. Es handelt sich hierbei um die Begründung für dieses Unternehmen, die Darstellung der Vorarbeiten zu einem Lexikon der Sprachkritik, die Explizierung der Konzeption und der Lemmaauswahl und die exemplarische Ausarbeitung von vier Artikeln.
Am Beispiel der "türkischen Powergirls", einer Mannheimer Gruppe von Mädchen und jungen Frauen, die noch in der Migrantengemeinschaft verwurzelt ist, sich aber auf dem Weg aus der Migrantenpopulation befindet, wird in diesem Band die Sprachkompetenz jugendlicher MigrantInnengruppen in Türkisch im grammatikalischen und lexikalischen Bereich untersucht. Die Arbeit gliedert sich in einen theoretischen und einen empirischen Teil. Zunächst folgt ein kurzer Einblick in die Einstellung türkischer Migranten zu Sprache, zum Spracherwerb und Spracherhalt der Herkunftssprache. Relevante Termini werden erläutert und die wichtigsten Studien zur Erstsprache türkischer Migrantenkinder in einem Literaturüberblick aufgeführt. Der empirische Teil stellt die Informantinnen und das Datenmaterial vor. Dem schließen sich die Analysen zum Türkisch in den Bereichen der Definitheit, des Numerus, der Fragepartikel und Pronomen, des Kasus, des Adjektiv- und Adverbiengebrauchs, der Partizipien sowie der Lexik an.
Die im Folgenden dargestellte korpusgesteuerte Methode "UWV-Analysemodell" wurde auf der Basis der Forschungen zu usuellen Wortverbindungen (UWV) (vgl. Steyer 2000, 2003, 2004, Steyer/Lauer 2007, Brunner/Steyer 2007, Steyer 2008, Steyer demn.) und zahlreicher, exhaustiver Analysen in den letzten Jahren entwickelt. Ziel war ein empirisches Vorgehensmodell, das es ermöglicht, die Differenziertheit und Vernetztheit von Wortverbindungen auf verschiedenen Abstraktionsebenen ausgehend von Kookkurrenzdaten angemessen darzustellen. Daher ging es in dieser Arbeitsphase nicht darum, usuelle Wortverbindungen des Deutschen möglichst umfassend und in großer Menge zu inventarisieren, sondern die "innere Natur" von Wortverbindungen zwischen Varianz und Invarianz mit unterschiedlichen Graden an lexikalischer Spezifiziertheit sowie ihre wechselseitigen Verbindungen im Detail zu erfassen und zu beschreiben.
Gegenstand des folgenden Beitrags ist die Darstellung der Konzeption eines transdisziplinären Vorhabens, an dem drei WGL-Institute, das Institut für Deutsche Sprache (Mannheim), das Institut für Zeitgeschichte (München) und das Herder-Institut (Marburg) beteiligt sind. Vorangestellt sind grundsätzliche methodische und theoretische Überlegungen zu einer transdisziplinären Forschungskonzeption in Bezug auf die gesellschaftlich-politischen Umbrüche des 20. Jahrhunderts. Es schließt sich die Konkretisierung dieser Überlegungen in Bezug auf das transdisziplinäre Forschungsprojekt an, das sich auf die frühe Weimarer Zeit bezieht. Dabei werden auch die drei unterschiedlichen Zugriffe aus den Perspektiven der drei Beteiligten skizziert. Eine Beispielanalyse demonstriert schließlich den methodischen Ansatz des Vorhabens exemplarisch.