Refine
Year of publication
Document Type
- Part of a Book (2536)
- Article (733)
- Book (259)
- Conference Proceeding (137)
- Review (64)
- Other (54)
- Working Paper (23)
- Part of Periodical (15)
- Report (5)
- Course Material (1)
Language
- German (3355)
- English (409)
- Russian (24)
- Multiple languages (13)
- French (10)
- Spanish (9)
- Portuguese (4)
- Italian (2)
- Dutch (1)
- Norwegian (1)
Keywords
- Deutsch (1650)
- Korpus <Linguistik> (402)
- Sprachgebrauch (186)
- Grammatik (180)
- Konversationsanalyse (163)
- Linguistik (152)
- Wörterbuch (152)
- Gesprochene Sprache (148)
- Kommunikation (129)
- Sprache (124)
Publicationstate
- Veröffentlichungsversion (2491)
- Zweitveröffentlichung (1159)
- Postprint (172)
- Erstveröffentlichung (3)
- Ahead of Print (1)
- Verlagsveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (3829) (remove)
Publisher
- de Gruyter (1005)
- Institut für Deutsche Sprache (304)
- Narr (279)
- Leibniz-Institut für Deutsche Sprache (IDS) (156)
- Narr Francke Attempto (126)
- Lang (120)
- Niemeyer (115)
- Stauffenburg (56)
- IDS-Verlag (51)
- Winter (50)
Trotz einer intensiven Forschungsgeschichte bleibt auf eigenartige Weise diffus, was es mit der Sprache im Faschismus auf sich hat. Der Beitrag versucht, ein doppeltes Defizit deutlich zu machen, das die Forschungsgeschichte kennzeichnet: Einerseits ist das Objekt strittig, wie die Kontroverse der Konzepte „Sprache des Faschismus“ vs. „Sprache im Faschismus“ zeigt; andererseits besteht ein - aus der Linguistikgeschichte dieses Jahrhunderts sich ergebendes - Defizit in der Methode. Um dieses zu verstehen, wird eine kritische Relektüre der ersten und folgenreichsten Arbeiten, Klemperers „LTI“ und des „Wörterbuchs des Unmenschen“, vorgeschlagen und an Beispielen vorgenommen. Es zeigt sich eine vertrackte Präsenz des Kritisierten in diesen frühen Kritiken, deren Hintergründen nachgegangen wird. Eine Grundlage wird im unzureichenden Umgang mit dem Sinnzusammenbruch des Zweiten Reiches gesehen. Als methodologische Konsequenz wird eine Pragmatisierung von Semantik vorgeschlagen, die sich die Rekonstruktion der Handlungsrelevanz von „Wörtern“ als Vermittlungen zwischen mentalen und gesellschaftlichen Prozessen zum Ziel setzt.
Von Januar bis Juli 2023 gestalten Grundschulkinder aus dem Mannheimer Vielfaltsquartier Neckarstadt-West zusammen mit der Kinderbuchautorin und Illustratorin Anke Faust in Kooperation mit dem Leibniz-Institut für Deutsche Sprache (IDS) ein Buch. Sie erzählen darin von den Abenteuern, die ihre Figuren in der Neckarstadt-West erleben, und welche Sprachschätze sie dabei finden können. Kooperationspartner des IDS für dieses Projekt sind unter anderem der Campus Neckarstadt-West, die Alte Feuerwache Mannheim gGmbH und der Verein Neckarstadt Kids e.V.
"Badeölgrüne Buchten", "kükengelbes Haar" und "tomatenrote Tomaten" - Vergleiche mit Farbadjektiven
(2014)
Der Beitrag zeigt, auf welch grundlegende Weise das Paradigma der Corpus-Driven-Linguistics (CDL) die linguistische Beschreibung sprachlichen Usus auf der Basis mathematisch-statistischer Clusteringverfahren bestimmt. Es soll deutlich werden, wie sich diese Prämissen im Forschungsschwerpunkt zur linguistischen Systematisierung und Interpretation von Kookkurrenzdaten manifestieren.
"Dialektverfall" und "Mundartrenaissance" in Westniederdeutschland und im Osten der Niederlande
(1997)
Speakers’ dialogical orientation to the particular others they talk to is implemented by practices of recipient-design. One such practice is the use of negation as a means to constrain interpretations of speaker’s actions by the partner. The paper situates this use of negation within the larger context of other recipient-designed uses of negation which negate assumptions the speaker makes about what the addressee holds to be true (second-order assumptions) or what the addressee assumes the speaker holds to be true (third- order assumptions). The focus of the study is on the ways in which speakers use negation to disclaim interpretations of their turns which partners have displayed or may possibly arrive at. Special emphasis is given to the positionally sensitive uses of negation, which may occur before, after or inserted between the nucleus actions whose interpretation is constrained by the negation. Interactional motivations and rhetorical potentials of the practice are pointed out, partly depending on the position of the negation vis-à-vis the nucleus action. The analysis shows that the concept of ‘recipient design’ is in need of distinctions which have not been in focus in prior research.
Seit dem Präsidentschaftswahlkampf in den USA sorgen „Fake News“ für eine lebhafte wissenschaftliche Debatte. Bisherige Definitionen sind allerdings weder einheitlich noch widerspruchsfrei und werden zudem nicht nachvollziehbar entwickelt, sondern meist einfach gesetzt. Unser Beitrag will dieses Theoriedefizit mittels einer Begriffsexplikation unter Rückgriff auf Literatur zu Desinformation, Lüge und (öffentliche) Kommunikation abstellen. Dabei ersetzen wir den Begriff „Fake News“ durch „aktuelle Desinformation“ und erörtern systematisch, welche Bedingungen notwendig sind, um von diesem Phänomen sprechen zu können. Wir definieren aktuelle Desinformation als Kommunikation wissentlich und empirisch falscher Informationen zu neuen und relevanten Sachverhalten mit dem Anspruch auf Wahrheit.
"Hey, was geht?". Beobachtungen zum Wandel und zur Differenzierung von Begrüßungsformen Jugendlicher
(2015)
Arbeitet man als muttersprachlicher Sprecher des Deutschen mit Corpora gesprochener oder geschriebener deutscher Sprache, dann reflektiert man in aller Regel nur selten über die Vielzahl von kulturspezifischen Informationen, die in solchen Texten kodifiziert sind - vor allem, wenn es sich bei diesen Daten um Texte aus der Gegenwart handelt. In den meisten Fällen hat man nämlich keinerlei Probleme mit dem in den Daten präsupponierten und als allgemein bekannt erachteten Hintergrundswissen. Betrachtet man dagegen Daten in Corpora, die andere - vor allem nicht-indoeuropäische - Sprachen dokumentieren, dann wird einem schnell bewusst, wieviel an kulturspezifischem Wissen nötig ist, um diese Daten adäquat zu verstehen. In meinem Beitrag illustriere ich diese Beobachtung an einem Beispiel aus meinem Corpus des Kilivila, der austronesischen Sprache der Trobriand-Insulaner von Papua-Neuguinea. Anhand eines kurzen Ausschnitts einer insgesamt etwa 26 Minuten dauernden Dokumentation, worüber und wie sechs Trobriander miteinander tratschen und klatschen, zeige ich, was ein Hörer oder Leser eines solchen kurzen Daten-Ausschnitts wissen muss, um nicht nur dem Gespräch überhaupt folgen zu können, sondern auch um zu verstehen, was dabei abläuft und wieso ein auf den ersten Blick absolut alltägliches Gespräch plötzlich für einen Trobriander ungeheuer an Brisanz und Bedeutung gewinnt. Vor dem Hintergrund dieses Beispiels weise ich dann zum Schluss meines Beitrags darauf hin, wie unbedingt nötig und erforderlich es ist, in allen Corpora bei der Erschließung und Kommentierung von Datenmaterialien durch sogenannte Metadaten solche kulturspezifischen Informationen explizit zu machen.
"Kaum [...] da, wird' ich gedisst!" Funktionale Aspekte des Banter-Prinzips auf dem Online-Prüfstand
(2016)
The article is to be considered as an attempt to enrich the theoretical approach of the Banter-Principle (Leech 1983) with an online point of view. Examples from Teamspeak- conversations and comments on the social network site Facebook reveal different user practices regarding the identifiability of the Banter-Principle: Nonverbal elements or emoticons in order to make sure that Banter is understood correctly in written language on the one hand; coping with assigned roles depending on dynamic group internal hierarchies in oral communication on the other hand. Nevertheless one question remains. Why should one disguise a cordial message rudely? My analysis shows two functions of Online Banter. Firstly, maximize the entertainment value of a conversation and secondly, establish an accepted online-identity.
Acht authentische Arbeitsbesprechungen aus Unternehmen bilden die Basis für eine detaillierte linguistische Analyse. Von Mikrosignalen bis hin zu rhetorischen Verfahren werden sprachliche Mittel im Hinblick auf steuernde und manipulative Funktionen beschrieben. Aus dem Gesprächsverhalten der Teilnehmer entfaltet sich in actu ein Spektrum sozialer Strukturen in unternehmerischen Organisationen.
Kultur ist nicht nur zu einem Schlüsselbegriff der Geisteswissenschaften geworden, sondern wird auch entterminologisiert als Alltagsbegriff benutzt. In diesem Beitrag wird untersucht, wie der Ausdruck Kultur (einschließlich Derivationen und Komposita) in der mündlichen Interaktion verwendet wird. Auf Basis von 82 Instanzen im Korpus FOLK des IDS Mannheim wurde festgestellt, dass der Ausdruck von SprecherInnen in zumeist semiformellen bis formellen Interaktionstypen benutzt wird. Es findet sich ein breites Spektrum unterschiedlicher, teils ineinander übergehender Bedeutungen, welches dem der wissenschaftlichen Literatur der Kulturtheorie ähnlich ist. Dabei lassen sich jeweils relevante Kernbedeutungen identifizieren, mit denen mehr oder weniger vage assoziierte Bedeutungen verbunden sind. Kultur zeigt sich als kontroverser Begriff: Die Referenz von Kultur, die Wertung und seine Relevanz als Erklärungsressource sind häufig umstritten.
Die Sprache der Literatur ist krisenfrei. Denn Dichtung ist bekanntlich - und bekanntlich heißt: das ist seit Hesiod und Platon uralteuropäisches Basiswissen - nicht auf Wahrheit verpflichtet. Ihre Betriebslizenz, wenn sie denn erteilt wird, ist vielmehr das Recht zur systematischen Lüge. Was auch zur Folge hat, daß es wenig sinnvoll ist, literarische Aussage mit Sätzen zu bestreiten wie „Hans Castorp war doch gar nicht in Davos“ oder „Madame Bovary hat ihren Mann doch gar nicht betrogen“. Schöne Literatur ist negations- und also ganz ungewöhnlich krisenimmun. Diese Einsicht in die Krisenimmunität der literarischen Sprache ist so alt und schlicht, daß sie ein wenig Brisanz erst gewinnt, wenn die elementare Verläßlichkeitskrise des Mediums Sprache so konstrastiv zum Modethema avanciert - also zu Beginn des 20. Jahrhunderts. Dichtung muß nämlich in gesteigerter Irritation erfahren, daß sie an dieser Krise nicht teilhat - gewissermaßen seit knapp dreitausendjähriger Wartezeit immer noch nicht an der so offen ausbrechenden Sprachkrise teilhat. Daß Dichtung lügt, ist seit ihren Anfängen unumstritten. Streiten kann man dann darüber, ob und ggf. unter welchen Rahmenbedingungen die systematische Lüge der Dichtung statthaft ist oder ob man die Dichtung, weil sie lügt, verbieten soll. Aber es wäre auch und gerade in der Zeit moderner Ausdifferenzierung von Funktionssystemen absurd, ausgerechnet vom fiktionalen Medium Literatur zu erwarten, daß es richtige Bezeichnungen oder gar wahre Namen für Dinge, Sachverhalte und Zusammenhänge bereithält. Die Sprache der Literatur folgt, um modern und also systemtheoretisch zu reden, nicht dem Code richtig/falsch, sie ist vielmehr dem Code stimmig/nicht- stimmig verpflichtet.
"Sprachschrott" [Leserforum]
(1988)
"Systemrelevant" - eine sprachwissenschaftliche Betrachtung des Begriffs aus aktuellem Anlass
(2020)
"Themengebundene Verwendung(en)" als neuer Angabetyp unter der Rubrik "Besonderheiten des Gebrauchs"
(2011)
"Verschlampung". Zur Glosse von B. Strecker "Wem die Sprache gehört" (SPRACHREPORT 2/89, S. 4)
(1989)
Die Textsorte Gebet hat zwar eine klare formale Struktur und auch aus sprech- akttheoretischer Perspektive lassen sich einige Aussagen treffen. Über den Inhalt von Gebeten liegen uns jedoch noch zu wenige Erkenntnisse vor. Dabei sehen sich Linguisten vor allem methodischen Problemen gegenüber. So ist der Wortlaut privater Gebete kaum zugänglich. Im vorliegenden Aufsatz wird eine als Pretest konzipierte Fragebogenstudie vorgestellt, die verschiedene Aspekte des Betens thematisiert. Es werden Tendenzen aufgezeigt, ob und wie Menschen im Gebet Emotionen verbalisieren. Auch über die Konzeptualisierung von Gott, die der Kommunikation zugrunde liegt, lassen sich Annahmen ableiten. In diesem Zusammenhang werden die Textsortenspezifika des Gebets diskutiert.
"wer ich bin? dein schlimmster alptraum, baby!" Cybermobbing - ein Thema für den Deutschunterricht
(2012)
Von Beginn der Mediengeschichte an verwenden Journalisten mehr oder weniger feste Fügungen, meist, um Angaben über die Quellen einer Nachricht, ihre Hintergründe und Übermittlung zu machen. Die Arbeit untersucht die kommunikativen, syntaktischen und lexikalischen Formen der Versprachlichung im Hinblick auf die Herausbildung und Tradierung fester Fügungen. Dabei wird unveröffentlichtes Material umfangreich dokumentiert und interpretiert.
"Wie Schule Sprache macht"
(2019)
"Wilde Pflanzen ohne nährende Frucht". Der politisch-soziale Wortschatz bei den Brüdern Grimm
(1990)
"Übergesetzliches Recht". Reflexionen nationalsozialistischen Unrechts in der frühen Nachkriegszeit
(2002)
Urteilsbegründungen sind zeit- und damit sprachgeschichtliche Dokumente. Sie sind Psychogramme der Gesellschaft eines Staates. In der ersten Nachkriegsdekade reflektieren sie die zwei Seinsformen des deutschen Gemeinwesens bis und ab 1949. Der Beitrag rekonstruiert vor diesem Hintergrund richterliche Selbstprofile, welche die Rechtsprechung der ersten Nachkriegsdekade bestimmen, um anschließend an drei Beispielen der Frage nachzugehen, wie es möglich ist, dass ein Richter im Rahmen einer konzisen Argumentation dasselbe Argument abweist, das ein anderer Richter, ebenso konzis argumentierend, akzeptiert. Die Theoretische Grundlegung dieser Untersuchung besteht – ihrem Erkenntnisinteresse und vor allem der Beschaffenheit der untersuchten Textsorte ,Gerichtsurteil‘ folgend – aus einem Ensemble argumentations- und konzeptanalytischer Aspekte: Urteilsbegründungen sind ihrem Zweck nach argumentierende Texte, die im Argumentieren Schuldkonzepte realisieren. Überlegungen hierzu sind der Untersuchung vorangestellt.
In diesem Beitrag werden Ergebnisse einer Studie präsentiert, die im Rahmen meines Habilitationsprojektes zu Somatismen des Deutschen mit der Konstituente Hand durchgeführt wurde. Das Projekt insgesamt ist korpusbasiert, qualitativ orientiert und verfolgt im Kern semantische Interessen. Empirische Grundlage für die Studien ist das Schriftspracharchiv W des IDS (Institut für Deutsche Sprache). Ziel der insgesamt über 20 Projektstudien ist jeweils die korpusbasierte Beschreibung der Bedeutungsentfaltung phraseologischer Einheiten in der Verwendungsbreite und nicht die Reduktion auf die Übersetzung einer als eine Bedeutung oder gar DIE Bedeutung wiedergebenden Paraphrase in formalsprachliche oder formalsymbolische Beschreibungsabstraktionen. In die Breite zu gehen bedeutet, die beschreibungsmäßig häufig verborgenen, aber im konkreten Sprachgebrauch jeweils sich zeigenden semantischen Feinheiten der untersuchten Einheiten ins Zentrum der Analyse zu stellen. Dafür ist es notwendig, die jeweilige Einheit zunächst überhaupt zu identifizieren (über welche Einheit wird geredet) und ihre formseitigen Manifestationen zu erfassen (welche strukturellen Verfestigungen liegen vor). Anschließend werden über die Beschreibung der Kotexte dieser Einheiten in Belegkorpora die an formseitige Ausprägungen gekoppelten Pfade der Bedeutungsentfaltung - ausgehend von einer ermittelten Ausgangsbedeutung - nachgezeichnet. Auf diese Weise können auch Bedeutungsaspekte eingeholt werden, die als bloße Konnotationen oder Modifikationen zu randständig, als Kernbedeutung zu unhandlich und als semantischer Mehrwert zu uneigenständig konzipiert sind. Es handelt sich um wesentliche Bedeutungszüge der untersuchten Einheiten und Aufgabe der Studien ist es, diese Aspekte durch Kopplung an verschiedene formseitige Ausprägungen gebrauchsangemessen erfassen und beschreiben zu können.
The paper attempts to bridge the gap between semantics and the conceptualization and teaching of grammar at secondary school exemplarily concerning German demonstratives dies- and jen-. I show that existing accounts of these demonstratives in reference grammars and school books are far from being satisfactory, whilst at least for dies-, if not for jen-, there exist comprehensive linguistic analyses. I adapt these to offer a semantic analysis for jen- using corpus data from modern German with pronominal and adnominal jen-, and propose a didactically applicable category of 'shared mental space' of the speaker and the hearer for the demonstratives: I argue that speakers use demonstrative reference to anchor the referent inside resp. outside their and the hearers' shared mental space.
Positioning analysis, a variant of discourse analysis, was used to explore the narratives of 40 psychiatric patients (11 females and 29 males; mean age = 40 years) who had manifest difficulties with engagement with statutory mental health services. Positioning analysis is a qualitative method that captures how people linguistically position the roles and identities of themselves and others in their day-to-day lives and narratives. The language of disengagement incorporated the passive positioning of self in relation to their lives and treatment through the use of metaphor, the passive voice and them and us attribution, while the discourse of engagement incorporated more active positioning of self, achieved through the use of the personal pronoun we and metaphoric references to balanced relationships. The findings corroborate previous thematic analysis that highlighted the importance of identity and agency in the ‘making or breaking’ of therapeutic relationships (Priebe et al. 2005). Implications are discussed in relation to how positioning analysis may help signal and emphasize important life and therapeutic experiences in spoken narratives as well as clinical consultations.
Jugend- und Szenensprachen sind wichtige Ressourcen für den lexikalischen Wandel der Standardsprache „von unten“, dessen letzte Etappe der Eingang in ein gesamtsprachiges Wörterbuch ist. Ziele dieses Beitrags sind es. den Verbreitungsprozess jugendsprachlicher lexikalischer Innovationen zu modellieren und die Rolle der Massenmedien im lexikalischen Wandel von unten zu klären. Die Diskussion verbindet die Mikroperspektive der soziolinguistischen Akkomodations- und Netzwerktheorie mit der Makroperspektive der Massenmedien als Indikatoren der gesellschaftlichen Reichweite sprachlicher Innovationen. Drei analytische Dimensionen werden aufeinander bezogen. Zunächst wird versucht, innovationsfreudige lexikalische Kategorien zu identifizieren. Der zweite Schritt gilt der sozialen Verbreitung lexikalischer Innovationen, wobei die individuelle sprachliche Akkomodation und Imitation genauso angesprochen wird wie die Rolle der Massenmedien im Verbreitungsprozess. Auf dieser Grundlage werden „Karrieren“ jugendsprachlicher Ausdrücke in der öffentlichen Kommunikation quantitativ und qualitativ untersucht. Die zunehmende Erscheinungshäufigkeit ausgewählter lexikalischer Einheiten wird im Zeitungskorpus des IDS verfolgt. Am Beispiel chillen wird ein Entwicklungspfad herausgearbeitet, der von der metasprachlichen Thematisierung über den Gebrauch als Zitat bis hin zum Eingang des Ausdrucks in die Eigenperspektive der Journalisten führt.
Die Ausgangsthese des Beitrags lautet, dass Sprachwandel, insbesondere lexikalischer Wandel, der Intention von Werbetextern einer auch sprachlich originellen Werbegestaltung zuwider läuft. Was Werbetexter an Sprachmaterial nutzen, ist also im Prinzip nicht für den alltagssprachlichen Gebrauch gedacht, weil sich dann kein Neuheits- und damit Überraschungseffekt mehr einstellen kann. Ziel von Werbetextern muss es daher sein, entweder Neues zu kreieren oder Altes und Bekanntes so zu verfremden, dass es neu wirkt. Um dies zu belegen, ist der Beitrag in zwei Teile gegliedert: Zuerst wird aus der Perspektive funktionaler Werbebausteine am Beispiel des Markennamens aufgezeigt, welche Möglichkeiten der Namenbildung existieren und in welcher Weise beim Markennamen die Tendenz zur Verfremdung zum Neuen sichtbar wird. In einem zweiten Teil werden die Ausgangsthesen dann ausgehend von sprachlichen Mitteln und ihrem Niederschlag in Elementen von Anzeigen und Werbetexten überprüft. Fokussiert wird dabei exemplarisch auf fremdsprachliches sowie fach- und jugendsprachliches Wortmaterial. Die Frage nach dem Einfluss der Werbesprache auf die Alltagssprache wird dabei an verschiedenen Stellen angeschnitten, kann aber mangels empirischer Studien nicht definitiv beantwortet werden. Abschließend wird mit Bezug auf die Ausgangsthesen ein Fazit zum Verhältnis von Werbesprache und Sprachwandel sowie zu sprachlichen Werbestrategien unter dem Blickwinkel der Verfremdung zum Neuen formuliert.
Fast 20 Jahre sind vergangen, seit ich für meine Dissertation Untersuchungen über Ein- und Verkaufsgespräche von Deutschen und Japanern in Deutschland und Japan durchführte. Dort wurden konkrete verbale und nonverbale Handlungen zwischen deutschen bzw. japanischen Verkäufern und deutschen bzw. japanischen Kunden beim Ein- und Verkaufen untersucht. Untersuchungsorte waren dabei Düsseldorf, wo die meisten Japaner in Deutschland ansässig sind, Tokio, wo die meisten Deutschen in Japan ansässig sind, Heidelberg, das von vielen japanischen Touristen besucht wird, und Nagano, wo deutsche Touristen damals bei der Olympiade waren. Anlässlich dieser Festschrift für meinen Doktorvater Prof. Dr. Gerhard Stickel versuchte ich, eine kleine Untersuchung durchzuführen, um sprachliche Veränderungen im Verlauf der Zeit und der sozialen Veränderung zu beobachten. In dieser Abhandlung werden die Veränderung der Gesellschaft und ihr Einfluss auf die Sprache behandelt. Im folgenden zweiten Abschnitt werden soziale Veränderungen in Düsseldorf thematisiert, im dritten Abschnitt werden die Ergebnisse der zwei Befragungen analysiert und zum Schluss wird eine Möglichkeit der Sprachverbreitung im Zusammenhang mit der heutigen Gesellschaft dargestellt.
This introductory tutorial describes a strictly corpus-driven approach for uncovering indications for aspects of use of lexical items. These aspects include ‘(lexical) meaning’ in a very broad sense and involve different dimensions, they are established in and emerge from respective discourses. Using data-driven mathematical-statistical methods with minimal (linguistic) premises, a word’s usage spectrum is summarized as a collocation profile. Self-organizing methods are applied to visualize the complex similarity structure spanned by these profiles. These visualizations point to the typical aspects of a word’s use, and to the common and distinctive aspects of any two words.
This manual introduces a conversation analytically informed coding scheme for episodes involving the direct social sanctioning of problem behavior in informal social interaction which was developed in the project Norms, Rules, and Morality across Languages (NoRM-aL) at the Leibniz-Institute for the German Language. It outlines the background for its development, delimits the phenomena to which the coding scheme can be applied and provides instructions for its use.
The scheme asks for basic information about the recording and the participants involved in the episode, before taking stock of different features of the sanctioning episode as a whole. This is followed by sets of specific coding questions about the sanctioning move itself (such as its timing and composition) and the reaction it engenders. The coding enables researchers to get a bird’s eye view on recurrent features of such episodes in larger quantities of data and allows for comparisons across different languages and informal settings.
The main objective of this article is to describe the current activities at the Mannheim Institute for German Language regarding the implementation of a domain-specific ontology for German grammar. We differentiate ontology bases from ontology management Systems, point out the benefits of database-driven Solutions, and go Step by Step through all phases of the ontology lifecycle. In Order to demonstrate the practical use of our approach, we outline the interface between our ontology and the grammis web Information System, and compare the ontology-based retrieval mechanism with traditional full text search.
The present paper reports the first results of the compilation and annotation of a blog corpus for German. The main aim of the project is the representation of the blog discourse structure and relations between its elements (blog posts, comments) and participants (bloggers, commentators). The data included in the corpus were manually collected from the scientific blog portal SciLogs. The feature catalogue for the corpus annotation includes three types of information which is directly or indirectly provided in the blog or can be construed by means of statistical analysis or computational tools. At this point, only directly available information (e.g. title of the blog post, name of the blogger etc.) has been annotated. We believe, our blog corpus can be of interest for the general study of blog structure or related research questions as well as for the development of NLP methods and techniques (e.g. for authorship detection).
Linguistic query systems are special purpose IR applications. We present a novel state-of-the-art approach for the efficient exploitation of very large linguistic corpora, combining the advantages of relational database management systems (RDBMS) with the functional MapReduce programming model. Our implementation uses the German DEREKO reference corpus with multi-layer linguistic annotations and several types of text-specific metadata, but the proposed strategy is language-independent and adaptable to large-scale multilingual corpora.
This paper describes a new approach to improve the analysis and categorization of web documents using statistical methods for template based clustering as well as semantical analysis based on terminological ontologies. A domain-specific environment serves for prove of concept. In order to demonstrate the widespread practical benefit of our approach, we outline a combined mathematical and semantical framework for information retrieval on internet resources.
This paper argues that a lectometric approach may shed light on the distinction between destandardization and demotization, a pair of concepts that plays a key role in ongoing discussions about contemporary trends in standard languages. Instead of a binary distinction, the paper proposes three different types of destandardization, defined as quantitatively measurable changes in a stratigraphic language continuum. The three types are illustrated on the basis of a case study describing changes in the vocabulary of Dutch in The Netherlands and Flanders between 1990 and 2010.
In this paper we present a new approach to lexicographical design for the description of German speech act verbs. This approach is based on an action-theoretical semantic conception. The several conditions for linguistic action provide the basis for the elaboration of the central semantic features. The systematic relationship of these features is reflected in the organization of a lexical database which allows various possibilities of access to different types of lexical information.
In the following paper we shall give an outline of the semantic framework for describing speech act verbs, i. e. verbs of communication, with the practical goal of a semantical database for a (dictionary of) synonymy of German speech act verbs which enables the user not only to find a list of synonymous verbs but also enables him to gain an insight into the semantic relations between the words.
The semantic framework is based on
(i) a set of conditions for performing speech acts as the relevant domain of reference
(ii) the introduction of a notion of situation, or better type of situation
The performative as well as the descriptive use of the verbs can be reduced to their fundamental dependency on the situations in which they are used: on the one hand with regard to the possibility of the action itself, and on the other hand with regard to the possibility of their designation. For both ways of use the relevant aspects of the situation constitute the necessary conditions.
One of the most popular techniques used in HPSG-based studies to describe linguistic phenomena is the raising mechanism. Besides ordinary raising verbs or adjectives, this tool has been applied for handling verbal complexes and discontinuous constituents, among other phenomena. In this paper, a new application for raising within the HPSG paradigm will be discussed, thereby investigating data from the prepositional domain. We will analyze linguistic properties of word combinations in German consisting of a preposition, a noun, and another preposition (such as auf Grund von (‘by virtue of’)), thus arguing that raising is the most appropriate method for satisfactorily describing the crucial syntactic features which are typical for those expressions. The objective of this paper is thus to demonstrate the efficiency of the raising mechanism as used in HPSG, and therefore, to emphasize the importance of designing a satisfactory uniform theory of raising within this grammar framework.
One of the most popular techniques used in HPSG-based studies to describe linguistic phenomena is the raising mechanism. Besides ordinary raising verbs or adjectives, this tool has been applied for handling verbal complexes and discontinuous constituents, among other phenomena. In this paper, a new application for raising within the HPSG paradigm will be discussed, thereby investigating data from the prepositional domain. We will analyze linguistic properties of word combinations in German consisting of a preposition, a noun, and another preposition (such as auf Grund von (‘by virtue of’)), thus arguing that raising is the most appropriate method for satisfactorily describing the crucial syntactic features which are typical for those expressions. The objective of this paper is thus to demonstrate the efficiency of the raising mechanism as used in HPSG, and therefore, to emphasize the importance of designing a satisfactory uniform theory of raising within this grammar framework.
This paper presents the current results of an ongoing research project on corpus distribution of prepositions and pronouns within Polish preposition-pronoun contractions. The goal of the project is to provide a quantitative description of Polish preposition-pronoun contractions taking into consideration morphosyntactic properties of their components. It is expected that the results will provide a basis for a revision of the traditionally assumed inflectional paradigms of Polish pronouns and, thus, for a possible remodeling of these paradigms. The results of corpus-based investigations of the distribution of prepositions within preposition-pronoun contractions can be used for grammar-theoretical and lexicographic purposes.
The present paper examines the relationship between pragmatics, semantics and grammar as subdisciplines of linguistics from three different perspectives. The first section gives a historical survey of their development during the 20th century and classifies linguistic schools according to their interest in different fields of research. The second part presents a systematic model of the field of objects to be investigated by linguistics, aiming at a more precise delimitation of its subdisciplines. Finally, in the third section, the division of labour between pragmatics, semantics and grammar is discussed in the light of the concrete example of verb valence.
Connectives are conjunctions, prepositions, adverbs and other particles which share the function of encoding semantic relations between sentences, or rather, between semantic objects some of which can be meanings of sentences. The relata linked by any such relation will fall into one of four distinct categories: they will be physical objects, states of affairs, propositions, or pragmatic options (the atoms of human interaction). Physical objects constitute the conceptual domain of space, states of affairs the domain of time, propositions the epistemic domain, and pragmatic options the deontic domain. The relations encodable in any of these domains can be divided into four basic types: similarity relations, situating relations, conditional relations, and causal relations. Conceptual domains and types of relations define the universe of possible connections between semantic objects.
Connectives differ as to the interpretations they permit in terms of conceptual domains and types of relations. Very few connectives are specialized on relata of one certain category and relations of one certain type. Possible examples in German are später (‘later on’) and zwischenzeitlich (‘in the meantime’), which encode situating relations between states of affairs. Other connectives are specialized on relata of one certain category, but are underspecified with respect to the type of relation. An example is German sobald (‘as soon as’), which can only connect states of affairs, but accepts situating, conditional and causal readings. Connectives of a third group are specialized on relations of a certain type, but are underspecified with respect to the category of the relata. Examples of this kind are German weil (‘because’) and trotzdem (‘nevertheless’), which encode causal relations, but accept states of affairs, propositions and pragmatic options as their relata. Connectives of a fourth group are underspecified both for the category of relata and the type of relation. An example is German da (‘there’), which accepts relata of any category and allows for situating, conditional and causal readings. Connectives like und (‘and’) and oder (‘or’) exhibit an even higher degree of under specification, in that they allow for all kinds of relations and relata.