Refine
Year of publication
Document Type
- Part of a Book (992)
- Article (429)
- Conference Proceeding (81)
- Book (58)
- Review (54)
- Report (11)
- Other (6)
- Master's Thesis (3)
- Doctoral Thesis (2)
- Part of Periodical (2)
Language
Keywords
- Deutsch (715)
- Korpus <Linguistik> (203)
- Sprachgebrauch (111)
- Rechtschreibung (92)
- Grammatik (87)
- Rezension (84)
- Interaktion (69)
- Gesprochene Sprache (67)
- Linguistik (66)
- Semantik (66)
Publicationstate
- Zweitveröffentlichung (1642) (remove)
Reviewstate
- (Verlags)-Lektorat (1161)
- Peer-Review (411)
- (Verlags-)lektorat (4)
- (Verlags-)Lektorat (3)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (3)
- Peer review (2)
- Peer-reviewed (2)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (2)
- (Verlags-)Lektoriat (1)
- Peer-review (1)
Publisher
- de Gruyter (463)
- Narr Francke Attempto (123)
- Narr (83)
- Erich Schmidt (60)
- IDS-Verlag (36)
- Niemeyer (32)
- Steiner (26)
- De Gruyter (23)
- Stauffenburg (23)
- Erich Schmidt Verlag (20)
Dieser Beitrag soll auf einen Verknüpfungsbereich von Grammatik und Pragmatik, speziell Gesprächsanalyse hinweisen, der sich in der Forschung der letzten fünfzehn Jahre als sehr fruchtbar erwiesen hat, zumindest für die Pragmatik und eine kommunikativ-funktional orientierte Grammatikkonzeption (vgl. dazu auch Zifonun et al. 1997). Äußerungsstrukturelle, insbesondere grammatische Gesichtspunkte spielen für die Verfahren des gesprächsanalytischen Spurenlesens im Umgang mit Dokumenten der Kommunikationswirklichkeit eine große Rolle, und die Systematisierung der dabei anfallenden Befunde macht Fortschritte. Für die folgenden Überlegungen beziehe ich mich auf die Verteilung von Redebeiträgen, das zentrale Arbeitsfeld der klassischen Konversationsanalyse. Dabei spielt die Frage der Vollständigkeit von Redebeiträgen bzw. Äußerungsstrukturen eine wichtige Rolle. Und hier gibt es eine fruchtbare Verknüpfungsstelle zwischen Gesprächsanalyse und Grammatik.
Eine am Gebrauch orientierte Sprachbeschreibung ist auch in der Grammatik mit sprachlicher Variation und mit Veränderungen des Gebrauchs konfrontiert. Anhand dreier Beispiele aus dem zentralen Bereich der deutschen Grammatik soll gezeigt werden, dass sich in der Variation, die man dort beobachtet, eine funktionale Nutzung des vorhandenen Inventars darstellt. Diese funktionale Nutzung ist dadurch gekennzeichnet, dass seltenere und daher synchron auffälligere Konstruktionen für spezifische Funktionen genutzt werden. Der Genitiv ist tatsächlich aus formalen Gründen seiner Morphologie auffällig. Er ist nicht vom Dativ unterschieden beim Femininum, doppelt markiert bei den starken Maskulina und Neutra und nur beschränkt bildbar im Plural. Diese Eigenheiten beschränken seine Nutzung als normaler Kasus. Gerade aber die auffällige Markierung mit dem Element {-(e)s} hat dazu geführt, dass der Genitiv nun zur Anzeige genereller Abhängigkeit genutzt wird, und zwar als Genitivattribut wie als unmarkierte Form bei einer Gruppe von Präpositionen (wie ‚dank‘, ‚trotz‘, ‚wegen‘, ‚entlang‘ usw.). Beim zweiten Fall, dem Verhältnis von starken und schwachen Verben, zeigt sich, dass der Übergang von der starken zur schwachen Flexion, die erkennbar den Normalfall im morphologischen System darstellt, gerade häufige und in ihrer Bedeutung grundlegende Verben (wie ‚geben‘, ‚nehmen‘ usw.) nicht betrifft, so dass die starke Flexion als Markierung für solch einen zentralen Status gelten kann. Der dritte Punkt hängt damit zusammen: das Ausgreifen der ‚würde‘-Form als Konjunktiv II (auch bei gut markierten starken Verben) ist so im größeren Zusammenhang der Nutzung von Klammerformen zu sehen.
Das Konzept von Dominanz bezieht sich auf soziale Beziehungen, die entweder auf bereits etablierten Machtverhältnissen basieren oder solche herzustellen versuchen. Dominanz im Gespräch kann sich in bestimmten Interaktionseigenschaften manifestieren, z.B. in der ständigen Beanspruchung von Rederecht, der konsistenten thematischen und perspektivischen Steuerung, der Kontrolle von Partneraktivitäten oder dem Verhindern von Initiativen anderer u.ä..
Im Folgenden werde ich mich auf eine der Möglichkeiten konzentrieren, auf das Herstellen von Dominanz durch das Dominantsetzen von Perspektiven. Durch das konsistente Dominantsetzen der eigenen Perspektive auf einen thematischen Gegenstand oder Aspekte davon ist es möglich, zumindest in Bezug auf diesen Gegenstand Dominanz über die anderen Gesprächspartner zu etablieren.
Formelhaftes Sprechen gehört zu den Konstituenten des kommunikativen sozialen Stils von Angehörigen einer sozialen Welt „kleiner Leute“ aus der Mannheimer Innenstadt. Nach einem Überblick über die verwendeten Formeltypen wird dargestellt, welche Formeln welchen Typs in welcher Funktion beim Prozess der sozialen Kategorisierung und bei der Beziehungsregulierung eingesetzt werden. Die beiden Verwendungsbereiche sind wesentlich für die Ausprägung des sozialen Stils.
In this paper, I present some aspects of a youth group’s construction of a communicative style and show how the group’s stylistic repertoire changes over the course of their growing into adulthood. My paper is based on an ethnographic case study of a group of Turkish girls, the ‘Powergirls’, who grew up in a typical Turkish migrant neighborhood in the inner city of Mannheim, Germany. The aim of the case study was, on the basis of biographical interviews with group members and long-term observation of group interactions, to reconstruct the formation of an ethnically defined ‘ghetto’-clique and its style of communication and to describe the group’s development into educated, modern, German-Turkish young women. In this process, a change in the group’s stylistic repertoire could be observed.
In diesem Beitrag wird das Redewiedergabe-Korpus (RW-Korpus) vorgestellt, ein historisches Korpus fiktionaler und nicht-fiktionaler Texte, das eine detaillierte manuelle Annotation mit Redewiedergabeformen enthält. Das Korpus entsteht im Rahmen eines laufenden DFG-Projekts und ist noch nicht endgültig abgeschlossen, jedoch ist für Frühjahr 2019 ein Beta-Release geplant, welches der Forschungsgemeinschaft zur Verfügung gestellt wird. Das endgültige Release soll im Frühjahr 2020 erfolgen. Das RW-Korpus stellt eine neuartige Ressource für die Redewiedergabe-Forschung dar, die in dieser Detailliertheit für das Deutsche bisher nicht verfügbar ist, und kann sowohl für quantitative linguistische und literaturwissenschaftliche Untersuchungen als auch als Trainingsmaterial für maschinelles Lernen dienen.
This paper describes a rule-based approach to detect direct speech without the help of any quotation markers. As datasets fictional and non-fictional texts were used. Our evaluation shows that the results appear stable throughout different datasets in the fictional domain and are comparable to the results achieved in related work.
Konstanze Marx/Axel Schmidt (Mannheim) folgen in ihrem Beitrag „Making Let’s Plays watchable - Praktiken des stellvertretenden Erlebbar-Machens von Interaktivität in vorgeführten Video-spielen“ einem - angesichts der Datenqualität multimodal erweiterten - interaktionsanalytischen Ansatz. Dabei wird der Frage nachgegangen, wie die für das Genre konstitutive Ent-Interaktivisierung entschärft wird. Hierfür wird in Sing-le-Let’s Plays die begleitende Moderation zentral gesetzt, in Multi-Let’s Plays die Interaktion zwischen den Beteiligten.
Interaktionsanalytische Zugänge zu medienvermittelter Kommunikation. Zur Einleitung in diesen Band
(2019)
Die Kategorie „Shitstorm“ ist eine Zuschreibung, die aus dem Diskurs unter den Interagierenden einerseits und den boulevardjournalistischen Berichten andererseits heraus entsteht. Die nachweislich heterogene Konstitution des diskursiven Phänomens scheint bei den Shitstorm-Etikettierungen vernachlässigt zu werden, vielmehr rücken die gezeigten negativen Emotionen in den Fokus. Im vorhegenden Aufsatz wird zunächst anhand einiger exemplarischer Shitstorms gezeigt, dass diese aus verschiedenen sprachlichen Handlungen und unterschiedlichen Werturteilen bestehen. Im Anschluss wird auf die mediale Berichterstattung eingegangen, die Äußerungen mit hohem Beleidigungspotenzial pars pro toto für den Diskurs behandelt und es werden mögliche Auswirkungen dieser Vorgehensweise skizziert, etwa im Hinblick auf die Wahrnehmung berechtigter Kritik.
Aus der etwas apophtegmatischen Formulierung des Titels lässt sich die Behauptung ableiten, eine Grammatik der politischen Sprache gebe es nicht. Das kann nun dreierlei heißen: Zum ersten könnte gemeint sein, es gebe keine politische Sprache - womit sich die Frage nach ihrer Grammatik a fortiori erübrigt. Weniger voraussetzungsreich und daher unmittelbar plausibler erscheint ein Verständnis, nach der es zwar eine politische Sprache gebe, diese aber keine eigene Grammatik habe. Vielleicht ist auch die dritte Lesart nur eine spezifischere Interpretation dieser zweiten Lesart: Es sei gar nicht so wichtig, was der Terminus „politische Sprache“ genau bedeute und was ihm in einer wahrscheinlichen Wirklichkeit entspreche. Auf jeden Fall sei sprachliches Interagieren im politischen Raum ein Spezialfall öffentlichen Agierens (unter spezifischen gesellschaftlichen/politischen Konstellationen) insgesamt und zeige daher entsprechende grammatische Präferenzen. Wir wollen in diesem Beitrag Argumente für diese letzte Position versammeln.
Bild-Makros bzw. 4Memes sind ein präsentes Internetphänomen im Social Web. In sozialen Netzwerken wie Facebook werden diese multimodalen, kulturell geprägten Kommunikate nicht nur veröffentlicht und verbreitet, sondern zudem von NutzerInnen u.a. in Form von Kommentaren rezipiert und interaktiv ausgehandelt. Diese kommunikative Einheit aus einem einerseits eindimensionalen, statischen Kommunikat mit einer andererseits dynamischen, interaktiven Aushandlung stellt dabei eine interdisziplinäre Herausforderung für eine differenzierte (medien-)linguistische Betrachtung dar, der mit einer Kombination von Sehflächenanalyse, Gattungsanalyse sowie Konversations- bzw. Gesprächsanalyse begegnet wird. In dieser Arbeit wird anhand erhobener Daten von Facebook-Gemeinschaftsseiten gezeigt, welche formalen, syntaktisch-semantischen und pragmatisch-funktionalen Mechanismen bei der Kombination der Zeichenressourcen Text und Bild zur Bedeutungskonstitution des (humoristischen) Medienprodukts zusammenspielen, dessen Verständnis auch auf intertextuellem, kulturellem (Kontext- und Gattungs)Wissen basiert. Im Anschluss daran wird dargelegt, wie sich über geteiltes Wissen verfügende RezipientInnen mit technischen und sprachlichen Folgehandlungen auf ein Bild-Makro beziehen und welche sprachlichen Mittel und kommunikativen Verfahren wie Fokussierungsaufforderung und -bestätigung, Bewertung und Übertragung auf die gemeinsame Lebenswelt Anwendung finden.
Graphenbasierte Ansätze spielen in der digitalen Lexikografie eine immer stärkere Rolle. Essentiell für die Erstellung, Verwaltung und Nutzung graphenbasierter lexikografischer Ressourcen ist jedoch eine leistungsfähige und zugleich einfach zu handhabende Zugriffsstruktur, die Suchen nach komplexen Konstellationen in solchen Graphen ermöglicht. Für heutige Graphendatenbanken stehen zahlreiche Abfragesprachen zur Verfügung, deren Verwendung jedoch verhältnismäßig voraussetzungsreich ist.
Das Poster stellt einen webbasierten, frei konfigurierbaren Query Builder vor, der die Formulierung semantisch sehr komplexer Suchabfragen an eine (mit dem Tinkerpop-Standard kompatible) Property-Graphendatenbank ermöglicht. Die Abfrage erfolgt durch einfaches visuell-interaktives Zusammenstellen hierarchisch angeordneter Abfrageelemente und liefert Antworten in Echtzeit. Dabei wird von den Komplexitäten der verwendeten Low-level-Abfragesprache Gremlin abstrahiert. Der Query Builder ist ein zentrales Modul eines derzeit entwickelten Open-Source-Softwaresystems zur Verwaltung und Online-Publikation graph-erweiterter lexikografischer Ressourcen.
Der Gegenstand der folgenden Untersuchung eröffnet Wege, die in (mindestens) drei Richtungen führen. Literatur-, Geschichts- und Sprachwissenschaft sind diejenigen Professionen, deren Pfade nicht beschritten werden k ö n n e n, sondern m ü s s e n. Wie Akzente gesetzt werden, verraten Untertitel. Politische Sprache einer literarischen Gattung zeigt: Es handelt sich um eine sprachwissenschaftlich ausgerichtete Studie über die literarische Gattung des politischen Liedes aus der historisch bedeutsamen Zeit um 1848, wobei sprachwissenschaftlich heißt, die Sprache ausgewählter Lieder unter spezifischen Fragestellungen und Konzepten textlinguistisch zu analysieren und zu beschreiben.
„[…] die Partei soll weg. Aber sonst soll sich nicht viel am Regierungssystem ändern. Man hat an sich nichts gegen das Hakenkreuz und auch nichts gegen Hitler, wiewohl die Kritik jetzt Hitler keineswegs noch immer ausnimmt. Oft heißt es: ,Er hats a net zusammenbracht.‘" (Deutschlandberichte II, 896)
Dieser Bericht vom August 1935 gibt die Haltung der Bevölkerung zum NS-Regime mit in diesem Fall dialektal gefärbter Alltagssprache wieder. Unter anderem Texte wie dieser sind Grundlage eines Projekts, dessen Konzeption im Folgenden vorgestellt wird. Der Projektplan sieht eine kulturlinguistische Verortung des Gegenstands ‚Sprachliche Sozialgeschichte 1933 bis 1945‘ vor. Die Umsetzung des kulturlinguistischen Zugangs richtet sich auf zwei Kernideen, die eine Idee ist die der Perspektivendifferenz - wir werden unsere Analysen nach Akteuren unterschieden anlegen. Die zweite Kernidee orientiert die Analysen an dem anthropologischen Leitkonzept des Authentischen. Dieses Forschungskonzept werde ich im Folgenden erläutern.
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), zugänglich über die Datenbank für Gesprochenes Deutsch (DGD), strebt den Status eines Referenzkorpus für den aktuellen mündlichen Sprachgebrauch im deutschen Sprachraum an. Es enthält einen wachsenden Bestand von Audio- und Videoaufnahmen authentischer Gespräche aus verschiedenen Bereichen des gesellschaftlichen Lebens. Die Dokumentation und Repräsentation von Interaktions- und Sprecherinformationen sind bereits seit den Anfängen des Korpusaufbaus integrale Bestandteile von FOLK. Allerdings lag bislang kein ausgearbeitetes, empirisch erprobtes und vollständig in die Korpusinfrastruktur integrierbares Stratifikationskonzept vor. Mit dem vorliegenden Artikel wird ein solches Konzept vorgeschlagen. Es knüpft an frühere Konzeptionen an und wurde anhand der vorhandenen Daten überprüft, korrigiert und erweitert. Dieser Prozess verlief parallel zur Überarbeitung des XML-Schemas zur Metadatendokumentation, um die konkrete Implementierung vorzubereiten. Im Anschluss an eine Skizzierung genereller Aspekte des Korpusdesigns werden die stratifikationsleitenden und ergänzenden Parameter vorgestellt und erläutert. Abschließend werden Ansätze und Strategien zum Korpusausbau diskutiert.
Einleitung
(2018)
Innerhalb der für das Paronymprojekt aufgestellten Stichwortliste lassen sich zahlreiche Wortbildungsmuster erkennen. Deren Übereinstimmung von theoretischer Wortbildung und praktischem Sprachgebrauch soll in diesem Beitrag anhand von zehn auf -freit-los endender Paronympaare untersucht werden. Es wird gezeigt, dass diese Wortbildungsgruppe in vielfacher Hinsicht in sich heterogen ist. So lässt sich weder eine Präferenz für eine Endung ausmachen, noch entsprechen die Endungen einer einheitlichen Bedeutung. Auch werden die Paronyme mal synonym, mal teil-synonym und mal semantisch gänzlich unabhängig voneinander verwendet. In diesem Beitrag wird anhand von konkreten Korpusbeispielen gezeigt, wie unterschiedlich sich die einzelnen, mit gleichen Endungen gebildeten Paronympaare kontextuell verhalten.
Der Beitrag führt in das Sonderheft „Paronymie im deutschen Sprachgebrauch“ ein und bündelt gewonnene Einblicke in die lexikologische, korpusanalytische sowie lexikografische Arbeit des Projektes „Paronymwörterbuch“. Er stellt wichtige Erkenntnisse zu Paronymen, ihrem Vorkommen, ihrer Ermittlung und Darstellung, aber auch zu den Methoden der Bedeutungsanalyse, ihren diskursiven Funktionen und dem Umgang mit Verwechslungspotenzial zusammenfassend dar. Vorgestellt werden Forschungsergebnisse, die sich vor allem auf die Verwendung von Paronymen in der öffentlichen Gebrauchssprache beziehen. Aber auch explorative Korpusverfahren werden erläutert sowie innovative, dynamische e-lexikografische Darstellungen präsentiert. Ausgewählte Probleme, die sowohl im Kontext der theoretischen Auseinandersetzung als auch mit der redaktionellen Erfassung von Paronymen auftreten, werden hier diskutiert. Das Sonderheft verbindet dabei theoretische und praktische lexikografische Herangehensweisen an ein bisher linguistisch wenig dokumentiertes Phänomen, das Muttersprachler/innen und Fremdsprachenlernende gleichermaßen verunsichert. Neben den Rückblicken werden ebenso die Ausblicke auf die kommenden Jahre und die damit verbundenen Fragestellungen des Projektes skizziert.
Das Phänomen der Paronymie hat bisher weder aus Sicht der Korpuslinguistik noch aus Sicht der kognitiven Linguistik große Beachtung gefunden. Bisherige Untersuchungen und erste Definitionsversuche stützten sich nicht auf empirische Analysen, sondern auf ein differenziertes strukturalistisches Modell, das, wenn nicht ausschließlich so doch primär, mit morphologischen Kriterien operiert (vgl. Läzärescu 1999). Sprachgebrauchsbasierte Befunde blieben bislang hingegen unberücksichtigt. Hier setzt dieser Artikel an: Er skizziert aus korpusbasierter und sprachgebrauchsorientierter Perspektive erste Ergebnisse zur Bestimmung und Unterscheidung von Arten der Paronymie hinsichtlich ihrer kommunikativen Funktion, ihrer Diskurszugehörigkeit sowie ihrer semantischen Eigenschaften. Ausgangspunkt ist eine kurze Darstellung des einzigen bisher vorliegenden Klassifikationsmodells von Läzärescu. Anschließend werden unterschiedliche Typen von Paronymen vorgestellt, die im Zuge der empirischen Analysen herausgearbeitet werden konnten. Der Beitrag plädiert für eine differenzierte Betrachtung des komplexen Phänomens, denn die eindimensionale, morphologisch motivierte Klassifikation wird dem Untersuchungsgegenstand nicht gerecht, da zudem sprachgebrauchs- sowie kognitiv-orientierte Parameter für eine Definition bzw. Typologisierung herangezogen werden müssen.
This paper asks whether and in which ways managing coordination tasks in traffic involve the accomplishment of intersubjectivity. Taking instances of coordinating passing an obstacle with oncoming traffic as the empirical case, four different practices were found.
1. Intersubjectivity can be presupposed by expecting others to stick to the traffic code and other mutually shared expectations.
2. Intersubjective solutions emerge step by step by mutual responsive-anticipatory adaptation of driving decisions.
3. Intersubjectivity can be accomplished by explicit interactive negotiation of passages.
4. Coordination problems can be solved without relying on intersubjectivity by unilateral, responsive-anticipatory adaptation to others’ behaviors.
We present a technique called event mapping that allows to project text representations into event lists, produce an event table, and derive quantitative conclusions to compare the text representations. The main application of the technique is the case where two classes of text representations have been collected in two different settings (e.g., as annotations in two different formal frameworks) and we can compare the two classes with respect to their systematic differences in the event table. We illustrate how the technique works by applying it to data collected in two experiments (one using annotations in Vladimir Propp’s framework, the other using natural language summaries).
Wir diskutieren in diesem Beitrag Implikationen, mit denen man zu tun bekommt, wenn man kleinste Formen situativer Vergesellschaftung – wir sprechen von kommunikativen Minimalformen – untersucht. Kommunikative Minimalformen sind kurzzeitige, nur wenige Sekunden dauernde, gemeinsam konstituierte Interaktionsereignisse. Ungeachtet ihrer Kürze weisen sie zum einen eine komplexe Interaktionsstruktur auf. Zum anderen besitzen sie auch eine klare soziale Implikation und eigene Wertigkeit. In dem hier untersuchten Fall, bei dem Passanten durch ein offenes Fenster in einen Privatraum blicken und dabei ertappt werden, zeigt sich diese soziale Implikativität als moralische Kommunikation im Sinne der interaktiven Bearbeitung eigenen Fehlverhaltens.
We explore the feasibility of contextual healthiness classification of food items. We present a detailed analysis of the linguistic phenomena that need to be taken into consideration for this task based on a specially annotated corpus extracted from web forum entries. For automatic classification, we compare a supervised classifier and rule-based classification. Beyond linguistically motivated features that include sentiment information we also consider the prior healthiness of food items.
Im Jahr 2015 ist die 7. Auflage des Duden-Aussprachewörterbuchs erschienen, für deren Bearbeitung erstmals die MitarbeiterInnen des IDS Projekts „Gesprochenes Deutsch“ verantwortlich zeichneten. Im vorliegenden Beitrag werden die konzeptionellen und inhaltlichen Veränderungen beschrieben, die in der Neuauflage umgesetzt wurden. Sie lassen sich im Wesentlichen unter dem Motto „Hinwendung zur Deskriptivität“ zusammenfassen. Neben den üblichen lexikografischen Prozeduren wie der Streichung veralteter Lemmata und der Erweiterung des Lemmabestands um bisher nicht dokumentierte Wörter sind zunächst im Einleitungsteil Kapitel ergänzt, vollständig überarbeitet oder völlig neu erstellt worden. Systematische Veränderungen wurden bei verschiedenen Transkriptionskonventionen vorgenommen (z.B. bei der Notation der Diphthonge). Die wesentlichste Neuerung ist jedoch die Einbeziehung von empirischen Daten zum deutschen Gebrauchsstandard vor allem aus dem Projektkorpus „Deutsch heute“, die es ermöglicht haben, fundierte Angaben zur regionalen Verbreitung von Aussprachevarianten zu machen.
Rechtschreibreform
(1996)
In dem Beitrag wird über die Prozeduren der Reformvorbereitung nach der Wiener Konferenz 1994 und öffentliche Reaktionen darauf berichtet, werden die letzten Änderungen genannt sowie Termine und Modalitäten der Reformeinführung und geplante Aktivitäten in der Übergangszeit bis zum Jahr 2005 erläutert.
Bei den vom Vorsitzenden der Kommission für Fragen der Sprachentwicklung des Instituts für deutsche Sprache zur Eröffnung der Tagung „Bewertungskriterien für die Sprachbewertungen” vorgetragenen allgemeinen Überlegungen geht es um die Notwendigkeit der Sprachkritik, um Maßstabe für die Sprachberatung, um die Rolle der Schule, der Medien und der sprachberatenden Institutionen und um anzustrebende Qualifikationen von Sprachkritikern und Sprachberater.
One problem of data-driven answer extraction in open-domain factoid question answering is that the class distribution of labeled training data is fairly imbalanced. In an ordinary training set, there are far more incorrect answers than correct answers. The class-imbalance is, thus, inherent to the classification task. It has a deteriorating effect on the performance of classifiers trained by standard machine learning algorithms. They usually have a heavy bias towards the majority class, i.e. the class which occurs most often in the training set. In this paper, we propose a method to tackle class imbalance by applying some form of cost-sensitive learning which is preferable to sampling. We present a simple but effective way of estimating the misclassification costs on the basis of class distribution. This approach offers three benefits. Firstly, it maintains the distribution of the classes of the labeled training data. Secondly, this form of meta-learning can be applied to a wide range of common learning algorithms. Thirdly, this approach can be easily implemented with the help of state-of-the-art machine learning software.
Theories of lexical decomposition assume that lexical meanings are complex. This complexity is expressed in structured meaning representations that usually consist of predicates, arguments, operators, and other elements of propositional and predicate logic. Lexical decomposition has been used to explain phenomena such as argument linking, selectional restrictions, lexical-semantic relations, scope ambiguities, and the inference behavior of lexical items. The article sketches the early theoretical development from noun-oriented semantic feature theories to verb-oriented complex decompositions. It also deals with a number of theoretical issues, including the controversy between decompositional and atomistic approaches to meaning, the search for semantic primitives, the function of decompositions as definitions, problems concerning the interpretability of decompositions, and the debate about the cognitive status of decompositions.
Neuer Wortschatz
(2019)
Neues von KorAP
(2019)
In Adjektivreihungen ohne Determinierer ('in neuem korpuslinguistisch-em/-en Licht') und in Fügungen aus Pronominaladjektiv und attributivem Adjektiv ('mancher ausbildend-er/-e Betrieb') treten Schwankungen zwischen Parallel- und Wechselflexion auf, die von einem komplexen Zusammenspiel verschiedener grammatischer und außergrammatischer Faktoren beeinflusst werden. Auf der Basis einer explorativen Korpusstudie werden im vorliegenden Beitrag zunächst einschlägige Einflussgrößen identifiziert und deren Effektstärken geschätzt. Im Anschluss wird gezeigt, dass entgegen bisherigen Annahmen nach Pronominaladjektiven keine allgemeine Tendenz zur schwachen Flexion vorliegt, sondern mit Ausnahme des Kontextes Dat. Sg. Mask./Neutr. diachron eine Ausbreitung der Parallelflexion (stark/stark) beobachtbar ist.
Im vorliegenden Beitrag werden Sagbarkeitsphänomene aus dem Social Web vorgestellt, die als brisante Daten eingestuft werden. Dabei werden intraterritoriale Selbstoffenbarungsphänomene von extraterritorialen Phänomenen unterschieden, die dazu beitragen, andere Personen zu diskreditieren und zu verleumden. Angesicht der spezifischen Kommunikationsbedingungen im World Wide Web wird der Sagbarkeitsraum kontinuierlich erweitert. Dabei spielt die Diffusion der beiden Aktionsräume Handlungsraum und Zeigeraum eine prominente Rolle. Als Aufgabe für die Linguistik wird herausgearbeitet, die Konturen dieser Räume für die Wahrnehmung der Sprachbenutzer*innen zu schärfen.
Diachrone Wortschatzveränderungen werden in der Regel exemplarisch anhand bestimmter Phänomene oder Phänomenbereiche untersucht. Wir widmen uns der Frage, ob und wie Wandelprozesse auch auf globaler Ebene, also ohne sich auf bestimmte Wortschatzausschnitte festzulegen, messbar sind. Zur Untersuchung dieser Frage nutzen wir das Spiegel-Korpus, in dem alle Ausgaben der Wochenzeitschrift seit 1947 enthalten sind. Dabei gehen wir auf grundlegende Herausforderungen ein, die es dabei zu lösen gilt, wie die Verteilung sprachlicher Daten und die Folgen unterschiedlicher Subkorpusgrößen, d.h. im konkreten Fall die variierende Größe des Spiegelkorpus über die Zeit hinweg. Wir stellen ein Verfahren vor, mit dem wir in der Lage sind, flankiert von einem „Lackmustest“ zur Überprüfung der Ergebnisse, Wortschatzwandelprozesse bis auf die Mikroebene, d.h. zwischen zwei Monaten oder gar Wochen, quantitativ nachzuvollziehen.
Thema des Beitrags ist die Frage, wie in einer quantitativen Herangehensweise die Spracheinstellungen von linguistischen Laien erfasst werden können. Das IDS hat 2017/18 im Rahmen des Sozio-oekonomischen Panels (SOEP) des Deutschen Instituts für Wirtschaftsforschung (DIW) eine neue bundesweite Repräsentativerhebung zu Spracheinstellungen durchgeführt. Im Beitrag präsentieren wir erste Ergebnisse dieser Erhebung und verknüpfen sie mit früheren Erhebungen. In drei Abschnitten befassen wir uns mit der Bewertung von regionalen Varietäten des Deutschen und der Bewertung des Standards, mit Meinungen zu sprachlichem Gendern sowie, aus einer methodischen Perspektive, mit der Erhebung von sprachlichen Daten im deutschen Mikrozensus.
Der Beitrag untersucht das Zusammenspiel von funktionaler Spezialisierung und phonetischer Reduktion bei pragmatischen Markern aus komplexen Syntagmen. Im Fokus steht die Reduktionsform [ˈzɐmɐ], die potenziell auf die Marker <ich sag mal> oder <sagen wir (mal)> zurückgeführt werden konnte. Anhand einer Analyse ihrer phonetischen Reduktionsformen und Interaktionsfunktionen wird gezeigt, dass eine Rückführung auf <sagen wir (mal)> plausibler ist. Im Anschluss werden Realisierungen der Wortverbindung ‚sagen wir‘ als kompositioneller Matrixsatz mit Verwendungen als pragmatischer Marker verglichen. Die Befunde deuten auf einen Einfluss der Funktion der Zielstruktur auf ihre lautliche Realisierung hin, was sich als Indiz für einen unabhängigen Zeichenstatus der reanalysierten Markerverwendung interpretieren lasst.