Refine
Year of publication
- 2017 (149) (remove)
Document Type
- Part of a Book (66)
- Article (39)
- Conference Proceeding (19)
- Part of Periodical (12)
- Book (7)
- Doctoral Thesis (2)
- Other (2)
- Report (1)
- Working Paper (1)
Is part of the Bibliography
- no (149) (remove)
Keywords
- Deutsch (56)
- Korpus <Linguistik> (16)
- Sprachvariante (14)
- Grammatik (10)
- Linguistik (10)
- Corpus linguistics (8)
- Sprachgebrauch (8)
- Englisch (7)
- Sprache (7)
- Germanistik (6)
Publicationstate
- Zweitveröffentlichung (61)
- Veröffentlichungsversion (60)
- Postprint (8)
Reviewstate
Publisher
- Institut für Deutsche Sprache (36)
- de Gruyter (24)
- Narr Francke Attempto (22)
- Narr (9)
- Synchron (4)
- Stauffenburg (3)
- iudicum (3)
- Leibniz-Institut für Deutsche Sprache (IDS) (2)
- Linguistic Society of Papua New Guinea (2)
- Springer (2)
Fast 20 Jahre sind vergangen, seit ich für meine Dissertation Untersuchungen über Ein- und Verkaufsgespräche von Deutschen und Japanern in Deutschland und Japan durchführte. Dort wurden konkrete verbale und nonverbale Handlungen zwischen deutschen bzw. japanischen Verkäufern und deutschen bzw. japanischen Kunden beim Ein- und Verkaufen untersucht. Untersuchungsorte waren dabei Düsseldorf, wo die meisten Japaner in Deutschland ansässig sind, Tokio, wo die meisten Deutschen in Japan ansässig sind, Heidelberg, das von vielen japanischen Touristen besucht wird, und Nagano, wo deutsche Touristen damals bei der Olympiade waren. Anlässlich dieser Festschrift für meinen Doktorvater Prof. Dr. Gerhard Stickel versuchte ich, eine kleine Untersuchung durchzuführen, um sprachliche Veränderungen im Verlauf der Zeit und der sozialen Veränderung zu beobachten. In dieser Abhandlung werden die Veränderung der Gesellschaft und ihr Einfluss auf die Sprache behandelt. Im folgenden zweiten Abschnitt werden soziale Veränderungen in Düsseldorf thematisiert, im dritten Abschnitt werden die Ergebnisse der zwei Befragungen analysiert und zum Schluss wird eine Möglichkeit der Sprachverbreitung im Zusammenhang mit der heutigen Gesellschaft dargestellt.
This paper presents a survey on hate speech detection. Given the steadily growing body of social media content, the amount of online hate speech is also increasing. Due to the massive scale of the web, methods that automatically detect hate speech are required. Our survey describes key areas that have been explored to automatically recognize these types of utterances using natural language processing. We also discuss limits of those approaches.
Im September 1522 erschien in Wittenberg „Das newe Testament Deutzsch“ mit einer Auflage von über 3.000 Stück und war binnen einer Woche ausverkauft. Martin Luther, der auf dem Titelblatt auf eigenen Wunsch nicht erwähnt wird, hatte die Übersetzung auf der Wartburg in nur elf Wochen angefertigt und wenig später fünf Wochen lang mit seinem Kollegen und Freund, dem Gräzisten Philipp Melanchthon, insbesondere im Hinblick auf die griechische Urfassung bearbeitet. Die Geschichte der Revisionen der Lutherbibel beginnt im gleichen Jahr – schon für den Nachdruck im Dezember hat Luther dieses so genannte „Septemberevangelium“ an vielen Stellen revidiert. In Teilen erschien danach seine Übersetzung des Alten Testaments, 1534 die vollständige Übersetzung der Bibel. Luther korrigierte den Bibeltext unablässig weiter bis zur Ausgabe von 1545, der Lutherbibel „letzter Hand“.
The Manatee corpus management system on which the Sketch Engine is built is efficient, but unable to harness the power of today’s multiprocessor machines. We describe a new, compatible implementation of Manatee which we develop in the Go language and report on the performance gains that we obtained.
In German there are about twenty-five elements (like gemäß, nahe, voll) that seem to be used as a preposition along with their use as an adjective. In former approaches the preposition is interpreted as the product of grammaticalizing (and/or reanalyzing) the adjective. It is argued that the two criteria these approaches rely on, namely change of linear position and change of case government, are insufficient. In this paper, seven criteria for distinguishing adjectives form prepositions in German are put forward. What is most important is that these criteria have to be evaluated on the token level as well as on the level of type and word class/syntactic category. It can be shown that the individual ‘adjective-prepositions' as types possess a specific mixture of adjective-like and preposition-like features. On the token level, occurring as part of a postnominal restrictive attribute is indicative for preposition-like status in German. The comparison of German with English and Italian adjective-prepositions (like near, far, due and vicino, lontano) reveals a lot of differences, which counts as evidence for the language-specific nature of word classes. Nevertheless, Lehmanns functional-typological approach uncovers a fundamental functional similarity between complement governing adjectives and prepositions: the primary function of the phrases, i.e., adjective/preposition + complement, is to modify a nominal or a verbal concept, respectively. This insight explains why adjective-prepositions can be found cross-linguistically. The question whether we should propose one type or two types for gemäß and its cognates is of minor importance only.
Der vorliegende Artikel untersucht die Frage, wie sich die Angebote im Bereich von Social Media heute darstellen und wie sie sich in den nächsten Jahren voraussichtlich entwickeln werden. Der Fokus liegt dabei auf der Entwicklung der technischen Infrastruktur und deren Einfluss auf die verschiedenen Aspekte wissenschaftlicher Kommunikation. Einen Schwerpunkt bilden dabei einerseits die Auswirkungen der Automatisierung, im Bereich der Wissenschaftskommunikation die Entwicklung von spezifischen Scores und Altmetriken, andererseits die Etablierung neuartiger Vermittlungskanäle für wissenschaftliche Themen.
Alles verstehen heißt alles verzeihen ist ein Satz, der im Deutschen den Charakter eines Spruchs, eines geflügelten Wortes angenommen hat, und der wahrscheinlich auf einem Zitat aus „Corinne ou l‘Italie“ von Madame de Staël (1807) (tout) comprendre c‘est (tout) pardonner basiert. Dieser Satz wurde ins Deutsche übersetzt und als Alles verstehen heißt alles verzeihen tradiert. Die Form eines Spruchs, eines geflügelten Wortes ist im Allgemeinen sehr konstant. Die Tendenz zur grammatischen Variation ist auch dann gering, wenn sie nach gängigen grammatischen Regeln möglich wäre.
Am Anfang ist das Wort
(2017)
Our paper describes an experiment aimed to assessment of lexical coverage in web corpora in comparison with the traditional ones for two closely related Slavic languages from the lexicographers’ perspective. The preliminary results show that web corpora should not be considered ― inferior, but rather ― different.
Der Beitrag thematisiert einen in der Forschung bislang kaum beachteten Parameter für grammatische Variation im Standard: die Arealität. Im ersten Teil folgen Begriffsklärungen, zunächst zum Terminus areal (mit einer Stellungnahme zur Debatte um das Deutsche als plurizentrische bzw. pluriareale Sprache), dann zu der Frage, wie Standard als Gebrauchsstandard definiert werden kann und in welcher Relation dazu der Terminus Kodex steht. Danach wird mit Blick auf das Projekt „Variantengrammatik des Deutschen“ aufgezeigt, wie areale grammatische Variation im Deutschen empirisch zu beschreiben ist. Der letzte Teil präsentiert Fallbeispiele, anhand derer sich das Erfassen von Varianten - von der Recherche in einem areal ausgewogenen Korpus bis zu ihrer Kodifikation in den Gebrauchsstandards des Deutschen - nachzeichnen lässt.
Argumentation nicht erwünscht – Einstellungen zum Argumentativen im Japanischen und Deutschen
(2017)
Dieser Beitrag behandelt Erscheinungsweisen des Argumentativen im Japanischen und Deutschen. Diesbezügliche Unterschiede und ihre Hintergründe werden je nach alltäglichen und institutionalisierten Situationen dargestellt. Im ersten teil werden Relationen von schwer bemerkbaren Normalitäten verbaler Interaktion und Kooperationsstilen dargestellt. Unterschiedliche Orientierung an Gleichheit bzw. Andersartigkeit entspricht jeweils positiver oder negativer Einstellung zur Argumentation. Die Grundzüge argumentativer Handlungen im Japanischen und Deutschen, die sich vorwiegend in Alltagsinteraktionen manifestieren, werden skizziert. Anhand deutschsprachiger Beispiele wird gezeigt, wie in (halb-)öffentlichen Diskursen eine positive Einstellung zur Argumentation reflexiv ausgedrückt wird. Krasse Differenzen zum Japanischen sind zu erwarten. Im zweiten Teil werden zuerst Hinweise auf historische Prozesse der Modernisierung Japans als Hintergrund der negativen Einstellung zur Argumentation gegeben. Anschließend werden in Anlehnung an kritische Untersuchungen öffentlicher Diskurse Beobachtungen über die gegenwärtige Situation vorgestellt. Der dritte Teil behandelt zur Erörterung der oben erwähnten Umstände sprachlich- interaktionale Eigenschaften des stigmatisierenden Worts hühyö ('Gerücht'). Dabei geht es um eine Herausarbeitung von Strategien zum Vorbeugen und Außerkraftsetzen der prototypischen Form der Argumentation. Zum Schluss wird nach der Zusammenfassung der Ausführungen auf den Sinn der Argumentation als allgemeines Werkzeug der Konfliktbewältigung hingewiesen.
We present an event-related potentials (ERP) study that addresses the question of how pieces of information pertaining to semantic roles and event structure interact with each other and with the verb’s meaning. Specifically, our study investigates German verb-final clauses with verbs of motion such as fliegen ‘fly’ and schweben ‘float, hover,’ which are indeterminate with respect to agentivity and event structure. Agentivity was tested by manipulating the animacy of the subject noun phrase and event structure by selecting a goal adverbial, which makes the event telic, or a locative adverbial, which leads to an atelic reading. On the clause-initial subject, inanimates evoked an N400 effect vis-à-vis animates. On the adverbial phrase in the atelic (locative) condition, inanimates showed an N400 in comparison to animates. The telic (goal) condition exhibited a similar amplitude like the inanimate-atelic condition. Finally, at the verbal lexeme, the inanimate condition elicited an N400 effect against the animate condition in the telic (goal) contexts. In the atelic (locative) condition, items with animates evoked an N400 effect compared to inanimates. The combined set of findings suggest that clause-initial animacy is not sufficient for agent identification in German, which seems to be completed only at the verbal lexeme in our experiment. Here non-agents (inanimates) changing their location in a goal-directed way and agents (animates) lacking this property are dispreferred and this challenges the assumption that change of (locational) state is generally a defining characteristic of the patient role. Besides this main finding that sheds new light on role prototypicality, our data seem to indicate effects that, in our view, are related to complexity, i.e., minimality. Inanimate subjects or goal arguments increase processing costs since they have role or event structure restrictions that animate subjects or locative modifiers lack.
Für die sprachbasierte Forschung in den Geistes- und Sozialwissenschaften stellt CLARIN eine Forschungsinfrastruktur bereit, die auf die hochgradig heterogenen Forschungsdaten in diesen Wissenschaftsbereichen angepasst ist. Mit Werkzeugen zum Auffinden, zur standardkonformen Aufbereitung und zur nachhaltigen Aufbewahrung von Daten sowie mit der Bereitstellung von virtuellen Forschungsumgebungen zur kollaborativen Erstellung und Auswertung von Forschungsdaten unterstützt CLARIN alle wesentlichen Aspekte des Datenmanagements und der Datenarchivierung. Diese CLARIN-Angebote werden durch Beratungs- und Schulungsmaßnahmen begleitet.
Most research on ethnicity has focused on visual cues. However, accents are strong social cues that can match or contradict visual cues. We examined understudied reactions to people whose one cue suggests one ethnicity, whereas the other cue contradicts it. In an experiment conducted in Germany, job candidates spoke with an accent either congruent or incongruent with their (German or Turkish) appearance. Based on ethnolinguistic identity theory, we predicted that accents would be strong cues for categorization and evaluation. Based on expectancy violations theory we expected that incongruent targets would be evaluated more extremely than congruent targets. Both predictions were confirmed: accents strongly influenced perceptions and Turkish-looking German-accented targets were perceived as most competent of all targets (and additionally most warm). The findings show that bringing together visual and auditory information yields a more complete picture of the processes underlying impression formation.
Creating CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes - The National Corpus of Contemporary Welsh)
(2017)
CorCenCC is an interdisciplinary and multiinstitutional project that is creating a large-scale, open-source corpus of contemporary Welsh. CorCenCC will be the first ever large-scale corpus to represent spoken, written and electronicallymediated Welsh (compiling an initial data set of 10 million Welsh words), with a functional design informed, from the outset, by representatives of all anticipated academic and community user groups.
Ein Teildiskurs der Digital Humanities dreht sich um die Frage, wie tradierte Wissensressourcen der Geisteswissenschaften sinnvoll mit digitalen Technologien und Tools verbunden werden können. Auch bei der Neubearbeitung des Deutschen Wörterbuchs von Jacob Grimm und Wilhelm Grimm (DWB) ist dieser Diskurs spürbar, denn mit der Ende 2016 abgeschlossenen Arbeit des traditionsreichen Unternehmens liegt ein konzeptuell einzigartiges Referenzwerk der historischen Lexikografie des Deutschen vor, das in ‘traditioneller’ Printform entstanden, dessen Umsetzung in ein digitales Format jedoch bereits beschlossen ist. Im Laufe der Arbeit am DWB sind überdies zwei Datensammlungen entstanden, die mittlerweile digitalisiert wurden und öffentlich zugänglich sind: das (digitale) Quellenverzeichnis und die Kartei Literatur zur Wortforschung (LW-Kartei). Ihre Einbindung in die Wörterbucharbeit und -benutzung trägt auf unterschiedliche Weise zum Verständnis des DWB bei; weiterhin verweisen sie als digitale Werkzeuge auf grundlegende Möglichkeiten zur Aufbereitung von lexikografischen Daten. Im Folgenden werden beide Projekte, die sich ursprünglich als innerbetriebliche lexikografische Werkzeuge aus der Wörterbuchpraxis ergaben, vorgestellt. Anschließend wird anhand mehrerer ausgewählter Beispielwörter demonstriert, inwiefern sich die LW-Kartei und das Quellenverzeichnis für ein breites Spektrum von Forschungsfragen nutzen lassen. Am Ende werden Überlegungen zur Erweiterung der Datenbanken, d. h. der jeweiligen Systeme zur elektronischen Datenverwaltung, und ihrer Vernetzung mit den jeweiligen DWB-Artikeln diskutiert – Themen, denen u. a. bei der anstehenden Retrodigitalisierung des DWB besondere Beachtung zukommen sollte.
Ein Teildiskurs der Digital Humanities dreht sich um die Frage, wie tradierte Wissensressourcen der Geisteswissenschaften sinnvoll mit digitalen Technologien und Tools verbunden werden können. Auch bei der Neubearbeitung des Deutschen Wörterbuchs von Jacob Grimm und Wilhelm Grimm (DWB) ist dieser Diskurs spürbar, denn mit der Ende 2016 abgeschlossenen Arbeit des traditionsreichen Unternehmens liegt ein konzeptuell einzigartiges Referenzwerk der historischen Lexikografie des Deutschen vor, das in ‘traditioneller’ Printform entstanden, dessen Umsetzung in ein digitales Format jedoch bereits beschlossen ist. Im Laufe der Arbeit am DWB sind überdies zwei Datensammlungen entstanden, die mittlerweile digitalisiert wurden und öffentlich zugänglich sind: das (digitale) Quellenverzeichnis und die Kartei Literatur zur Wortforschung (LW-Kartei). Ihre Einbindung in die Wörterbucharbeit und -benutzung trägt auf unterschiedliche Weise zum Verständnis des DWB bei; weiterhin verweisen sie als digitale Werkzeuge auf grundlegende Möglichkeiten zur Aufbereitung von lexikografischen Daten.
Im Folgenden werden beide Projekte, die sich ursprünglich als innerbetriebliche lexikografische Werkzeuge aus der Wörterbuchpraxis ergaben, vorgestellt. Anschließend wird anhand mehrerer ausgewählter Beispielwörter demonstriert, inwiefern sich die LW-Kartei und das Quellenverzeichnis für ein breites Spektrum von Forschungsfragen nutzen lassen. Am Ende werden Überlegungen zur Erweiterung der Datenbanken, d. h. der jeweiligen Systeme zur elektronischen Datenverwaltung, und ihrer Vernetzung mit den jeweiligen DWB-Artikeln diskutiert – Themen, denen u. a. bei der anstehenden Retrodigitalisierung des DWB besondere Beachtung zukommen sollte.
Skatesticker sind grafisch gestaltete Aufkleber, die von Skatelabels – den Herstellern von Skateboards und Zubehör – distribuiert werden. Ursprünglich zu reinen Werbezwecken produziert, haben sich Skatesticker als Symbole der Szene etabliert: Befragte Skater bekennen, dass Skatesticker ein „Ausdruck eines Lebensgefühls“, ein „visueller Eindruck unserer Gefühle“ und eine „[e]infache Möglichkeit[,] sich einer Gruppe zuzuordnen“ sind. Sie werden von Skatern gesammelt, gehandelt und wertgeschätzt. Die vorliegende Arbeit verfolgt einen bildwissenschaftlich orientierten Forschungsansatz, der es ermöglicht, die komplexen – oftmals bildende Kunst adaptierenden – Bildmotive dieser Grafikdesignobjekte und ihre zunehmend autonomisierten Funktionen als visuelle Medien einer Szene zu analysieren und anzuerkennen.
Die Diskurslinguistik als relativ neue Teildisziplin der germanistischen Linguistik beschäftigt sich mit der Frage, wie soziale Wirklichkeiten in transtextuell organisierten Einheiten konstruiert werden. Bisher finden dabei noch kaum Texte aus digitalen Medien (z. B. aus Facebook, Twitter oder Wikipedia) Berücksichtigung. Das Netzwerk vereint die unten genannten WissenschaftlerInnen, die in ihren Projekten an der Analyse digitaler Diskurse arbeiten und dabei digitale Methoden der Korpuslinguistik bzw. Digital Methods nutzen.
In the NLP literature, adapting a parser to new text with properties different from the training data is commonly referred to as domain adaptation. In practice, however, the differences between texts from different sources often reflect a mixture of domain and genre properties, and it is by no means clear what impact each of those has on statistical parsing. In this paper, we investigate how differences between articles in a newspaper corpus relate to the concepts of genre and domain and how they influence parsing performance of a transition-based dependency parser. We do this by applying various similarity measures for data point selection and testing their adequacy for creating genre-aware parsing models.
Data sets of publication meta data with manually disambiguated author names play an important role in current author name disambiguation (AND) research. We review the most important data sets used so far, and compare their respective advantages and shortcomings. From the results of this review, we derive a set of general requirements to future AND data sets. These include both trivial requirements, like absence of errors and preservation of author order, and more substantial ones, like full disambiguation and adequate representation of publications with a small number of authors and highly variable author names. On the basis of these requirements, we create and make publicly available a new AND data set, SCAD-zbMATH. Both the quantitative analysis of this data set and the results of our initial AND experiments with a naive baseline algorithm show the SCAD-zbMATH data set to be considerably different from existing ones. We consider it a useful new resource that will challenge the state of the art in AND and benefit the AND research community.
In den letzten Jahren ist der konzessive Konnektor verstärkt in den Fokus der Gesprochene-Sprache-Forschung (GSF) geraten. Diese hat an authentischen Hörbeispielen eine Grammatikalisierungstendenz von dessen konzessiver, einräumender Bedeutung zur korrektiven Diskursmarkierung nachgewiesen. Im Anschluss insbesondere an die Forschungsergebnisse von Günthner (1999, 2000a, 2002, 2005, 2008) hat dann Moraldo (2012a, 2012b) zum einen versucht nachzuweisen, dass auch in schriftbasierten neumedialen Kommunikationsplattformen (z.B. Twitter) diese Hauptsatzwortstellung nach obwohl mittlerweile vorkommt. Zum anderen, dass Korrektivsätze vereinzelt auch in standardschriftsprachlichen Texten auftreten. (vgl. Moraldo 2012c). Der folgende Beitrag will nun die Entwicklung der Subjunktion obwohl zum Diskursmarker nachvollziehen. Ausgehend von seiner konzessiven Bedeutung (Kap. 2) soll korrektives obwohl zuerst anhand gesprochensprachlicher Beispiele illustriert, dann in konzeptionell mündlichen aber medial schriftlichen Kontexten analysiert und schließlich in standardschriftsprachlichen Texten nachgewiesen werden (Kap. 3), bevor abschließend seine Mutation von subordinierendem Konnektor zum Diskursmarker (Kap. 4) diskutiert wird.
Dieser Beitrag vergleicht die Ansätze ,Linguistic Landscapes' (LL) und ,Spot German' (SG) in Hinblick auf ihr Potenzial für die Untersuchung des Vorkommens und der Funktionen der deutschen Sprache in Regionen außerhalb des deutschsprachigen Kerngebietes. Als Beispiele wurden eine LL-Studie im Baltikum sowie eine SG-Untersuchung auf Zypern gewählt. Der Vergleich zeigt, dass beide Methoden - trotz ihrer unterschiedlichen Präzision - ähnliche Aussagen zur Rolle des Deutschen erlauben: In beiden Ländern erscheint Deutsch als „Ergänzungssprache“ zu den gesellschaftlichen Hauptsprachen in bestimmten Nischen, z.B. im Tourismus und in Verbindung mit bestimmten Firmen und Produkten.
In der vorliegenden Studie wird der Versuch unternommen, diese Kriterienkomplexität auf das Problem der Stellung der deutschen Sprache unter anderen Sprachen zu applizieren. Dieses Ziel ist mit der Würdigung des Beitrags des Geehrten zur Popularisierung der deutschen Sprache und Bewusstmachung ihrer Weltgeltung im internationalen Ausmaß durchaus affin. Dabei werden sprachinterne („organologische") und sprachexterne (soziokulturelle) Faktoren nach Möglichkeit in ihrer Wechselbeziehung bzw. Wechselwirkung dargestellt. Das Hauptziel dieser Darstellung besteht in einer Modellierung von linguistisch relevanten Parametern, die eine wissenschaftlich angemessene Basis für die adäquate Zuordnung der deutschen Sprache unter definitivem Ausschluss vor- bzw. pseudowissenschaftlicher Kriterien wie die subjektiven, wissenschaftsfernen Axiologien und Präferenzen schaffen können.
Deutsch in Finnland
(2017)
In meinem Artikel behandele ich den Umfang des Deutschunterrichtes an Schulen und Universitäten sowie die Verwendung des Deutschen in Wissenschaft und Wirtschaft in Finnland, vor allem im 20. und 21. Jahrhundert. Zunächst aber will ich die Geschichte der deutschen Kontakte und die Rolle der deutschen Sprache in bestimmten finnischen Städten sowie den Anteil Deutschsprachiger in der modernen finnischen Gesellschaft beleuchten. Nicht behandelt werden kann in diesem Zusammenhang die Lektüre und Übersetzung deutscher Belletristik, obwohl beide bedeutenden Einfluss auf die finnische Gedankenwelt und die literarische Bildung gehabt haben.
Die Migration in die Türkei stellt für viele junge Menschen einen Wendepunkt in ihrem Leben dar. Sie kann verschiedene Gründe haben.
In der biografie- und interaktionsanalystischen Pilotstudie wird die Darstellung der narrativen Identitätsentwürfe von drei deutsch-türkischen Germanistikstudentinnen in Instanbul untersucht. Sie zeigt, wie die Informantinnen aus der Retrospektive ihre sprachlichen und sozialen Erfahrungen in Deutschland und nach der Migration in die Türkei konstituieren und welche Rolle ihre sprachlichen Ressourcen beim Ausdruck von sozialer Zugehörigkeit spielen.
In diesem Beitrag wird die phonologische Variation angesprochen. Ein großer Teil des Artikels widmet sich der Allophonie der Frikative in den hessischen Dialekten. Es wird gezeigt, dass die standarddeutsche Allophonie zwischen den beiden dorsalen Frikativen - der palatalen Variante [c] und der velaren Variante [x] - durch eine Allophonie der alveo-palatalen Varianten ersetzt wird. Hier alterniert die gerundete Variante [∫] mit der ungerundeten Variante [ɕ]. Die palatale Variante [ç] ist weitgehend verschwunden, und der dorsale Frikativ [x] hat dieselbe Distribution wie in der Standardsprache.
Die Behandlung der Euro-Krise in der deutschen Presse ist typisch für die Art und Weise, wie sich die Beschreibung komplexer Phänomene der Wirtschaft im letzten Jahrzehnt entwickelt hat: Fachberichte schwinden allmählich zugunsten von neuen Erzählformen, in denen rhetorische Figuren die Oberhand gewinnen. Darunter sind vor allem Metaphern zu finden, die hauptsächlich konventioneller Natur sind, aber auch gern kreativ fortgesetzt werden. Sie spielen meist eine zentrale Rolle auf der Textebene, indem sie wesentlich zur Kohärenz eines Abschnitts bzw. eines ganzen Artikels beitragen. Diese innovativen Kommunikationsformen mögen zwar das Interesse des breiten Publikums an wirtschaftlichen Debatten wecken, aber sie führen oft zu einer groben Vereinfachung, die den technischen Aspekt der Euro-Krise völlig beiseite lässt. Außerdem sind die benutzten Bilder in der Regel sehr negativ gefärbt, was die Angst der Öffentlichkeit vor einem weltweiten Zusammenbruch der Finanzmärkte sicherlich noch verstärkt und dem Vertrauen der Bürger in Europa nicht gerade dient. Die Vorliebe der Massenmedien für düstere Szenarien enthüllt somit eine bewusste Strategie der Dramatisierung, die immer mehr zum „Storytelling“ tendiert.
Wie die meisten westgermanischen Varietäten kennen auch die niederdeutschen Dialekte eine Konstruktion, in der das Verb 'tun' (niederdeutsch meist 'doon') als Hilfsverb fungiert und einen Infinitiv regiert - die sog. 'tun'-Periphrase ('Lesen tut sie gerne', 'Sie tut gerne lesen'). Allerdings weicht die niederdeutsche 'tun'-Periphrase sehr deutlich von den aus anderen Sprachen bekannten Mustern ab: Viele niederdeutsche Dialekte zeigen eine auffällige und erklärungsbedürftige Tendenz, die Periphrase auf Nebensätze mit Verbletztstellung zu beschränken ('dass sie lesen tut'). Zudem unterscheiden sich niederdeutsche Dialekte z.T. erheblich darin, wie weit die Periphrase obligatorisiert ist bzw. welche Faktoren bei der Variation zwischen der Periphrase und der einfachen Form ('dass sie liest') ausschlaggebend sind.
In dieser Monographie werden diese und andere grammatische Eigenschaften der Konstruktion auf der Grundlage von umfangreichen Korpusrecherchen und eigenen Erhebungen herausgearbeitet. Die Befunde werden mit dem Instrumentarium der Grammatiktheorie erklärt und in einen typologischen und diachronen Zusammenhang gestellt.
This paper provides insights into the ongoing international research project Unserdeutsch (Rabaul Creole German): Documentation of a highly endangered creole language in Papua New Guinea, based at the University of Augsburg, Germany. It elaborates on the different stages of the project, ranging from fieldwork to corpus development, thereby outlining the methods and software background used for the intended purposes. In doing so, we also give some approaches to solving specific problems, which have arisen in the course of practical work until now.
Une e-Université est une université qui utilise les nouvelles technologies de l'information et de la communication (NTIC) pour remplir ses missions traditionnelles : la production, la préservation et la transmission du savoir. Ses activités consistent donc à collecter et analyser les données de recherche, à diffuser les écrits scientifiques et à fournir des ressources pédagogiques numériques. Or ces biens immatériels font souvent l'objet de droits de propriété littéraire et artistique, notamment le droit d'auteur et le droit sui generis des producteurs de bases de données. Ceci oblige les e-Universités soit à obtenir des autorisations nécessaires des titulaires des monopoles, soit à avoir recours aux exceptions légales. La recherche et l'enseignement font l'objet d'exceptions légales (cf. art. L. 122-5, 3°, e) du Code de la propriété intellectuelle (CPI) et dans les art. 52a et 53 de la Urheberrechtsgesetz (UrhG)). Toutefois, celles-ci s'avèrent manifestement insuffisantes pour accommoder les activités des e-Universités. Ainsi, les législateurs nationaux ont très récemment introduit de nouvelles exceptions visant plus spécifiquement l'utilisation des NTIC dans la recherche et l'enseignement (art. L. 122-5, 10° et art. L. 342-3, 5° du CPI et les futurs art. 60a-60h de la UrhG). Une réforme en ce sens a également été proposée par la Commission Européenne (art. 3 et 4 de la proposition de la Directive sur le droit d'auteur dans le marche unique numérique). Dans ce contexte, il est souhaitable de mener le débat sur l'introduction d'une norme ouverte (de type fair use) en droit européen. Malgré cette incertitude juridique qui entoure la matière, les e-Universités n'ont pas cessé de remplir leurs missions. En effet, la communauté académique a depuis un certain temps entrepris des efforts d'autorégulation (private ordering). Le concept d'Open Science, inspiré des valeurs traditionnelles de l'éthique scientifique, a donc émergé pour promouvoir le libre partage des données de recherche (Open Research Data), des écrits scientifiques (Open Access) et des ressources pédagogiques (Open Educational Resources). Le savoir est donc perçu comme un commun (commons), dont la préservation et le développement durable sont garantis par des standards acceptés par la communauté académique. Ces standards se traduisent en langage juridique grâce aux licences publiques, telles que les Creative Commons. Ces dernières années les universités, mais aussi les organismes finançant la recherche et même les législateurs nationaux se sont activement engagés dans la promotion des communs du savoir. Ceci s'exprime à travers des "mandats" Open Access et l'instauration d'un nouveau droit de publication secondaire, d'abord en droit allemand (art. 38(4) de la UrhG) et récemment aussi en droit français (art. L. 533-4, I du Code de la recherche).
Mit diesem Bild beschreibt Hermann Unterstöger in einem „Sprachlabor“- Artikel der Süddeutschen Zeitung vom 23.3.2013 die Erfolgsgeschichte, die das Substantiv (das) Narrativ in den letzten 30 Jahren vorgelegt hat. Während Unterstöger feinsinnig den intertextuellen Bezug zum „Narrenschiff“ des Sebastian Brant oder dem gleichnamigen Roman von Katherine Ann Porter bemüht, wird Matthias Heine, der Autor von „Seit wann hat geil nichts mehr mit Sex zu tun? 100 deutsche Wörter und ihre erstaunlichen Karrieren“ in einem Artikel in der WELT vom 13.11.2016, wie nach diesem Buchtitel zu erwarten, eher grob: Dort heißt es: „Hinz und Kunz schwafeln heutzutage vom ,Narrativ‘“.
Einleitung
(2017)
Ungefähr 5,8 Mio. Menschen in der Welt sprechen heute die dänische Sprache - die meisten davon in Dänemark. Dänisch hat seine Wurzeln im Germanischen und begann sich zwischen den Jahren 800 und 1000 aus dem Urnordischen als selbständige Sprache zu entwickeln. Noch heute weist Dänisch viele gemeinsame Züge mit dem Norwegischen und Schwedischen auf. Besonders für Deutsche sollte die dänische Schriftsprache eigentlich leicht verständlich sein. Durch die vielen politischen, wirtschaftlichen und kulturellen Kontakte zwischen den beiden Nachbarländern, vermittelt z.B. durch die Hanse im Ostseeraum, haben sich viele deutsche, insbesondere niederdeutsche Wörter und Redewendungen in der dänischen Sprache eingebürgert, und man kann noch heute dänische Sätze bilden, in denen alle inhaltstragende Wörter aus dem Deutschen entliehen sind. Im Folgenden wird eine Untersuchung des aktuellen Wortschatzes anhand eines dänischen Wörterbuchs aufgezeigt. Anschließend wird ein Blick auf das offizielle nationale dänische Sprachinstitut geworfen und deren empirische Grundlagen der offiziellen Rechtschreibung genauer geschildert.
Entlehnungen aus dem Englischen sind weder erst ein Phänomen der Nachkriegsjahre noch die Folge der Globalisierung, in der das Englische als die neue lingua franca nur eines der Ergebnisse dieses Prozesses, zugleich aber sein Vehikel darstellt. In den Ergebnissen der Zeitungs- und Repräsentativerhebungen zu Einstellungen der Deutschen zu ihrer Sprache spiegelt sich der in der Tat seit über 60 Jahren fortschreitende deutsch-englische Sprachkontakt, den die deutsche Sprachgemeinschaft erfährt. Kommunikation zwischen Trägern verschiedener Sprachen begünstigt Übernahmen aus nicht nur genetisch verwandten Sprachen. So finden sich unter dem entlehnten Sprachgut auch Formen, die in der Geber- und Nehmersprache auf eine gemeinsame Wurzel zurück gehen. In dieser Arbeit werden Überlegungen zu fair und fegen in ihrem historische, genetischen und morphologischen Kontext gemacht und auf die Begriffe des Lehnworts und Erbes hin untersucht.
Was in Märkten sich künftig ereignen wird, kann man nicht wissen, nur erwarten. Was man erwartet, wird in der Ökonomik probabilistisch eingearbeitet: als Risikoentscheidungen. Elena Esposito zufolge besteht unter Ökonomen aber ein fundamentales Missverständnis bezüglich der Prognosefähigkeit der Wahrscheinlichkeitstheorie. Die Wahrscheinlichkeitstheorie werde statt zur Berechnung von Unsicherheit zur Erzeugung von Sicherheit verwendet und so in ihren Grundzügen missverstanden (Esposito 2007, 2010, 2014; ähnlich Morgan 2012). Indem man eine (subjektive) Wahrscheinlichkeit von 80% des Ereigniseintrittes schätzt, wird sie epistemisch verbucht als ‘fast sicher’ / ‘so gut wie sicher’. Dabei ist nur – subjektiv – das Risiko genauer spezifiziert, aber es wird geglaubt, man wisse, was kommt. Das riskante, nur wahrscheinliche Ereignis als irgendwie durch diesen Prozess bemessen angeben zu können, ist eine operative Fiktion. Man lasse sich nicht verführen durch den mathematischen Modus der Modellaussagen: es sind fingierte, d.h. fiktionale Aussagen (sie entstammen z.B. keiner häufigkeits- bzw. frequenzstatistischen Ausmessung).
Die tief greifenden Reformen der Arbeitsmarkt- und Sozialpolitik in der Bundesrepublik Deutschland in den 2000er Jahren gingen einher mit kontroversen Debatten, in deren Kontext „Wirklichkeitserzählungen“ (Klein/Martínez (Hg.) 2009), wie sie für ökonomische Kontexte charakteristisch sind, eine relevante Ressource der Persuasion darstellten. Der vorliegende Beitrag behandelt derartige Formate auf der Ebene des Managements von Organisationen. Im Mittelpunkt des theoretischen Teils steht eine Weiterentwicklung des Konzepts der Wirklichkeitserzählung im Blick auf eine semiologische Klärung der Frage, wie in derartigen Narrationen der charakteristische Wirklichkeitsbezug hergestellt wird. Im empirischen Teil werden Daten aus einem Projekt über Mitarbeiterzeitungen aus dem Untersuchungszeitraum unter der Perspektive der Wirklichkeitserzählungen reanalysiert: Untersucht werden charakteristische narrative Formate und deren „Sitz im Leben“ (Gunkel 1906/2004), und es wird nach den ästhetischen und pragmatischen Kosten gefragt, die mit derartigen Funktionalisierungen des Erzählens in Organisationen möglicherweise verbunden sind.
This paper analyses the XVIII century German translations of 'Les aventures de Télémaque' (1699) by François de Salignac de la Mothe Fénelon. In that century, Fénelon's masterpiece was translated into German mainly by four authors (August Bohse, Benjamin Neukirch, Josef Anton Ehrenreich, Ludwig Ernst Faramond), who adapted the text according not only to the historical period, but also to their own purpose, creating completely different works. They transformed the original text in different text genres, from a utopian novel with political and pedagogical aims to a text in verse form for didactic purposes, or to an epic poem with pedagogical functions. To investigate the differences between the translations the paper will focus especially on the macrostructural and the paratextual elements in order to make preliminary hypothesis on 1) the text genre, 2) the functions of the text and 3) the expected audience. Examples and final conclusions will end the article.
Emoticons erfreuen sich auf der ganzen Welt großer Beliebtheit, vor allem in der alltäglichen elektronischen Kommunikation wie E-Mail, SMS, Forumsdiskussionen, Instant Messaging, Facebook oder Twitter. Zum ersten Mal in der Geschichte wurde 2015 von den Sprachbeobachtern der britischen Oxford Dictionaries ein Emoticon zum Wort des Jahres gewählt: das Grinsegesicht, dem die Freudentränen aus den Augen spritzen (vgl.<www.sueddeutsche.de/kultur/britisches-wortdes-jahres-was-haben wir-gelacht-1.2740952>, Stand: 8.11.2017). Die Jury begründete ihre Wahl wie folgt: „[E]moji have come to embody a core aspect of living in a digital world that is visually driven, emotionally expressive, and obsessively immediate.“
This paper outlines the broad research context and rationale for a new international comparable corpus (ICC). The ICC is to be largely modelled on the text categories and their quantities the International Corpus of English with only a few changes. The corpus will initially begin with nine European languages but others may join in due course. The paper reports on those and other agreements made at the inaugural planning meeting in Prague on 22-23 June 2017. It also sets out the project’s goals for its first two years.
The present paper examines the rise and fall of Modern High German loanwords in English from 1600 until 2000, principally making use of the record of borrowing documented by the Oxford English Dictionary (OED) in its Third Edition (online version, in revision 2000-). Groups of loanwords are analysed by century, with reference to the changing social and cultural landscape characterising relationships between the relevant nations over this period. This is not a simple picture: each language grows over the period in different ways, and the speakers of English look to German at different times for different types of borrowing, as the political and intellectual balance alters.
The present paper explores the change in distribution and potential function as well as the interplay of two phenomena that occur at the internal boundaries of nominal compounds, namely linking elements and hyphenation. About 40% of present-day German compounds contain a linking element, most prominently -s- (e.g. Geburt-s-ort ‘birth place’). Numerous theories have been brought forward to explain its function, two of which are examined here: It will be shown that the linking-s tends to mark morphologically complex constituents while the assumption that it prefers marked phonological words cannot be corroborated.
Linked compounds in present-day German use hyphenation, a strategy that is mostly employed with graphematically or phonologically marked constituents, at a much smaller rate than unlinked compounds. In Early New High German (ENHG, 1350-1650), when the linked type arose by reanalyzing prenominal genitive attributes as first constituents of compounds, the reverse held true: Linked compounds underwent a gradual graphematic integration from separate writing into directly connected words which was partly reversed by a century of hyphenation (1650-1750). While hyphenation also occurred with unlinked compounds, the linked compounds show a striking preference with hyphenation rates reaching a peak at around 90%. It will be argued that ENHG hyphenation had the same function it has today, namely structuring constituents that are perceived as marked: The change in spelling between ENHG and today reflects the integration of a formerly syntactic and thereby marked pattern into word-formation.
Genau tritt im aktuellen Sprachgebrauch nicht nur in seiner klassischen Bedeutung als Adjektiv oder Adverb auf, sondern wird auch als Fokus- bzw. Gradpartikel sowie Gesprächspartikel verwendet. Bisherige Beschreibungen haben sich nur in geringem Maße und unter Verwendung heterogener Begriffe mit seinem interaktionalen Gebrauch auseinandergesetzt. In diesem Beitrag werden mit Hilfe eines sequenziellen und multimodalen Ansatzes verschiedene interaktionale Verwendungen von genau in Videoaufnahmen deutscher Alltagsgespräche untersucht. Ausgehend von seiner Funktion als Gradpartikel wird genau sowohl als redebeitragsinterne Bestätigungspartikel in Wortfindungsprozessen als auch als responsive Bestätigungspartikel eingesetzt. Da genau häufig das Ende eines Verstehensprozesses bzw. einer Wissensverhandlung markiert, könnte allgemeiner die Bezeichnung des Intersubjektivitätsmarkers in Erwägung gezogen werden. Aus dem responsiven, bestätigenden Gebrauch heraus entsteht eine stärker sequenzschließende und sequenzstrukturierende Funktion von genau, woraus sich auch der zunehmende Gebrauch dieses Lexems als rein diskursstrukturierende Partikel innerhalb eines Redezugs erklären könnte.
Traditionell wird das Genus der Nomina im Lexikon verortet. Die beiden anderen Erscheinungen des Genus, nämlich syntaktische Integration bei der Kongruenz sowie pragmatische Identifikation von Partizipanten im Diskurs, werden als Folgeerscheinungen der lexikalischen Verankerung des Genus betrachtet.
Wir wollen der lexikalistischen Theorie eine Alternative gegenüberstellen, bei der das Genus in der Syntax und Pragmatik verwurzelt ist. Erst in der Produktion einer Nominalphrase greift der Sprecher auf das Genusmerkmal (GM) für die morphologische Gestaltung der Phrase zurück. Dabei ist die Genuskodierung von Einzellexemen im Lexikon nur eine von vielen Quellen für die Gewinnung der Merkmale.
Vorgestellt werden unterschiedliche Auslösertypen für das Genus. Unter anderem werden Merkmale diskutiert, die durch den Referenten, durch morphologische und syntaktische Prozesse oder auch durch ein Begriffsfeld im Lexikon bedingt sind. Genusvariation ergibt sich demnach aus der Konkurrenz zwischen verschiedenen Auslösertypen, die auf die gleiche NP (und deren nominalen Kopf) zielen.
Grammatik und Variation im Spannungsfeld von Sprachwissenschaft und öffentlicher Sprachreflexion
(2017)
Der Beitrag bezieht systematische und funktionale Faktoren zur Erklärung grammatischer Variation aufeinander, indem er ausgehend von der Annahme eines rekursiven Systems mit konfligierenden Teilsystemen ‚System‘ als Möglichkeitsraum für (funktional ausdifferenzierte) Variation versteht. Inwiefern die vom System bereitgestellten Möglichkeiten grammatischer Variation im Sprachgebrauch genutzt werden, diskutiert der Beitrag anhand der lexikographischen Praxis der Erfassung von grammatischer Variation im Dudenband 9 „Richtiges und gutes Deutsch“. Mit diesem Material werden nicht nur zentrale Bereiche grammatischer Variation rekonstruiert, sondern auch Zentralbereiche grammatischer Variation mit diasystematischen Variationsdimensionen korreliert.
Für die mediale Dimension grammatischer Variation spielt die Unterscheidung von Gespräch und Text eine wichtige Rolle. Implizit wird dabei die Kategorie Text mit schriftlich realisierter Sprache und die Kategorie Gespräch mit mündlich realisierter Sprache identifiziert. Diese Zuordnung wird in Anbetracht der mediatisierten, hypermedialen Präsentations- und Kommunikationsformen im Internet zunehmend fragwürdig. Der Beitrag zeichnet die Diskussion um die varietätenlinguistische Einordnung der internetbasierten Kommunikation nach und führt das Oppositionspaar „textorientiert“ vs. „interaktionsorientiert“ ein, das es ermöglicht, auf der schriftlichen (medial graphischen) Ebene zwischen zwei Konstellation zu unterscheiden, in denen nähesprachliche Sprachmerkmale gehäuft auftreten: (1) Das interaktionsorientierte Schreiben in der internetbasierten Kommunikation und (2) die fingierte Mündlichkeit in literarischen Texten, die dem textorientierten Schreiben zuzuordnen ist. Am Fallbeispiel der interaktiven Einheit HM wird illustriert, wie frei verfügbare Korpusressourcen genutzt werden können, um die Gemeinsamkeiten, Unterschiede und Interferenzen zwischen der Verwendungen interaktiver Einheiten in Gespräch, Text und internetbasierter Kommunikation zu untersuchen.
In diesem Beitrag argumentiere ich, dass das grammatische Regelwerk „Lücken“ hat und dass „realistische“ Grammatikschreibung das in Theorie und Praxis berücksichtigen muss; insbesondere sind eventuelle Äußerungen in Lückensituationen außergrammatisch zu modellieren. Diese Konzeption wird anhand morphologischer und syntaktischer so genannter Zweifelsfälle intuitiv plausibilisiert und ihr Nutzen für die Grammatikschreibung in vergleichender Auseinandersetzung mit prominenten „lücken-losen“ Analysen von zwei Beispielen - ‚Right Node Raising‘- und gewissen Ersatzinfinitiv-Strukturen - nachgewiesen.
Das Wort als das wichtigste und ureigenste Element des Sprachsystems wird in der modernen Linguistik als linguistische Einheit unter phonetisch/phonologischem, orthographischem, morphologischem, syntaktischem und semantischem Kriterium untersucht und beschrieben. Wenn man jedoch der Frage nachgeht, wie ein Wort rein physikalisch entsteht und besteht, wird man feststellen, dass alles auf die Energie zurückgeht. Unter diesen Gesichtspunkten wäre es daher angebracht, unseren linguistischen Blickwinkel zu ändern und das Wort nicht nur als linguistische Einheit sondern auch als Energieträger aufzufassen und die energietragende Funktion des Wortes bzw. der Sprache im Zusammenhang mit der heutigen Wissenschaft und den religiösen und mystischen Betrachtungen zu untersuchen.
An der Börse sind zwei und zwei nie vier, sondern fünf ‒ minus eins. Es kommt schließlich zur Vier, aber nie direkt.1 Das geflügelte Wort André Kostolanys unterliegt einer narrativen Schemabildung: Kontinuität wird nicht nach dem Muster der aufsteigenden Zahlenreihe hergestellt, sondern gleichsam epizyklisch, also auf Umwegen. Wie seine berühmtere Metapher vom Spaziergänger (Wirtschaft) mit Hund (Börse), so beschreibt auch die Zahlenversion derselben die Vorstellung einer letztlich doch linearen Aufwärtsbewegung, in der der Mensch Herr und behaust bleiben kann. Das neue Jahrtausend stellt diese Beherrschbarkeitsnarratio offenbar in Frage. Der Beitrag untersucht drei narrative Modelle im Bereich der Wirtschaftskommunikation: das lineare Modell des „homo oeconomicus“, das nichtlineare Modell des „Schwarzen Schwans“ und den synthetischen Versuch der „Antifragilität“ nach Nassim Taleb.
In this paper we present work in developing a computerized grammar for the Latin language. It demonstrates the principles and challenges in developing a grammar for a natural language in a modern grammar formalism. The grammar presented here provides a useful resource for natural language processing applications in different fields. It can be easily adopted for language learning and use in language technology for Cultural Heritage like translation applications or to support post-correction of document digitization.
Interview mit Ulrich Engel
(2017)
Many (modernist) works of literature can be understood by their associativeness, be it constructed or “free”. This network-like character of (modernist) literature has often been addressed by terms like “free association”, connotation”, “context” or “intertext”. This paper proposes an experimental and exemplary approach to intraconnect a literary corpus of the Austrian writer Ilse Aichinger with semantic web-technologies to enable interactive explorations of word-associations.
Die Emigration nach Palästina von deutschsprachigen Juden („Jeckes“) in den 1930er Jahren ist als „Fünfte Alija“ in die zionistische Geschichtsschreibung eingegangen. Seit einigen Jahren zeigt sich ein reges historisches Interesse für die Jeckes und deren Beitrag zum Aufbau Israels. Diese neue Jeckes-Historiografie findet zeitgleich mit einer Hinterfragung der „großen zionistischen Erzählung“ in Israel statt. Besonders soll auf den wirtschaftlichen Aspekt dieser Meistererzählung eingegangen werden. Der Artikel stützt sich auf Lebenserzählungen und lebensgeschichtliche Interviews mit deutschsprachigen Israelis. Auffällig ist in diesen Selbstzeugnissen die Anzahl von Erfolgsgeschichten, die eine (männlich konnotierte) Figur des pionierhaften Entrepreneurs narrativ konturieren. Retrospektive Narrative von individuellem Wirtschaftserfolg des Israel Style-Unternehmers mit Pioniergeist und Entrepreneurqualitäten dienen also zur kollektiven (Wieder-)Erlangung eines jeckischen Stolzes. Dies soll mit der historischen Realität der Wirtschaftslage im Mandatsgebiet Palästina bzw. in Israel verglichen und kulturwissenschaftlich und kulturgeschichtlich mit Repräsentationen des „Neuen Juden“ verglichen werden.
Corpus researchers, along with many other disciplines in science are being put under continual pressure to show accountability and reproducibility in their work. This is unsurprisingly difficult when the researcher is faced with a wide array of methods and tools through which to do their work; simply tracking the operations done can be problematic, especially when toolchains are often configured by the developers, but left largely as a black box to the user. Here we present a scheme for encoding this ‘meta data’ inside the corpus files themselves in a structured data format, along with a proof-of-concept tool to record the operations performed on a file.
Es muss Ende der 1980er/Anfang der 1990er Jahre gewesen sein, dass Gerhard Stickel seiner Umgebung erklärt hat, ein Projekt sei per definitionem etwas, das ein Ende hat. Damals begann das Denken in Projekten und ihren zeitlichen Limitierungen die sprachwissenschaftliche Forschung zu dominieren. Heute nun wollen wir beweisen, dass Projekte ihr Ende überleben können. Dies gilt insbesondere für das deutsch-litauisch-lettisch-estnische Projekt KoGloss (Kollaboratives korpusbasiertes Konstruktions-Glossar), das von Januar 2011 bis Dezember 2012 von der EU im Programm Lifelong Learning gefördert wurde. Gerhard Stickel hat es als Experte begleitet. Das Weiterleben des Projekts über sein Finanzierungsende hinaus wird in diesem Beitrag beschrieben.
Die Idee hinter dem Projekt – einen schnellen und einfachen Einstieg in die Analyse großer Korpusdaten mittels CorpusExplorer geben. Diese frei verfügbare Software bietet aktuell über 45 Analysen/Visualisierungen für vielfältige korpuslinguistische Zwecke und ist durch ihre Nutzerfreundlichkeit auch für den Einsatz in der universitären Lehre geeignet. Als Beispiel dient das EuroParl-Korpus, man kann aber auch eigenes Textmaterial (z. B. Textdateien, eBooks, Xml, Twitter, Blogs, etc.) mit dem CorpusExplorer annotieren, analysieren und visualisieren. Die Videos zeigen Schritt-für-Schritt die einzelnen Funktionen.
Überspannt werden die Videos von einer kleinen zweistufigen Aufgabe: Zuerst sollten ein paar Fragen/Thesen/Annahmen überlegt werden, die sich mit den Plenarprotokollen des EuroParl auswerten lassen – einige Videos geben auch explizite Anregungen oder man nutzt die Inspiration der anderen Beiträge im Issue #3. Die einfachsten Fragen/Thesen lassen sich bereits mit den hier vorgestellten Videos beantworten. Sobald es komplexer wird, betritt man den zweiten – reflexiven Teil der überspannenden Aufgabe: Es ist zu überlegen, wie durch (mehrfache) Kombination der einzelnen Video-/Wissensbausteine das Ziel erreicht werden kann (ein Beispiel – siehe Script). Im Zweifelsfall stehen außerdem ein Handbuch und ein E-Mail Support zur Verfügung.
While good results have been achieved for named entity recognition (NER) in supervised settings, it remains a problem that for low resource languages and less studied domains little or no labelled data is available. As NER is a crucial preprocessing step for many natural language processing tasks, finding a way to overcome this deficit in data remains of great interest. We propose a distant supervision approach to NER that is both language and domain independent where we automatically generate labelled training data using gazetteers that we previously extracted from Wikipedia. We test our approach on English, German and Estonian data sets and contribute further by introducing several successful methods to reduce the noise in the generated training data. The tested models beat baseline systems and our results show that distant supervision can be a promising approach for NER when no labelled data is available. For the English model we also show that the distant supervision model is better at generalizing within the same domain of news texts by comparing it against a supervised model on a different test set.
Language of Responsibility. The Influence of Linguistic Abstraction on Collective Moral Emotions
(2017)
Two experiments investigated the effects of linguistic abstractness on the experience of collective moral emotions. In Experiment 1 participants were presented with two scenarios about ingroup misbehavior, phrased using descriptive action verbs, interpretative action verbs, adjectives or nouns. The results show that participants experienced slightly more negative moral emotions with higher levels of linguistic abstractness. In Experiment 2 we also tested for the influence of national identification on the relationship between linguistic abstractness and emotional reactions. Additionally, we expanded the number of scenarios. Experiment 2 replicated the earlier pattern, but found larger differences between conditions. The strength of national identification did not moderate the observed effects. The results of this research are discussed within the context of the linguistic category model and psychology of collective moral emotions.
Im folgenden Beitrag, der im Bereich der Politolinguistik und der Diskursanalyse angesiedelt ist, wird auf der Grundlage der deutschen Berichterstattung des Sommers 2015 die brisante Problematik der griechischen Euro-Währungskrise, die das ganze Europa wochenlang in Atem hält, unter die Lupe genommen. Die Debatte über die bis dahin „schwerste Krise der europäischen Integration" verläuft als äußerst emotional geführter gesamteuropäischer Meinungsaustausch. Obwohl man annehmen könnte, dass die nervenaufreibenden Auseinandersetzungen über die Euro-Währungskrise eigentlich nur auf Staaten der Euro-Zone begrenzt sein sollten, beweist die europäische Berichterstattung, dass man in der heutigen EU nicht mehr aus der Beobachter-, sondern eigentlich aus der Teilnehmerperspektive berichtet, weil die Probleme eines Landes genauso Schwierigkeiten für andere, die sogar selbst nicht unbedingt in der Euro-Zone sein müssen, bedeuten können. Im Jahr 2015 wird die griechische Euro-Krise zum Auslöser für Fragen nach der Zukunft Europas. Sie betreffen in erster Linie die Problematik der weiteren Integration und der europäischen Identität.
Welche Sprachen sehen wir auf Schildern, Plakaten, Graffiti in der Öffentlichkeit? Wovon hängt es ab, an welchen Orten und in welchen Funktionen bestimmte sprachliche Varietäten zu finden sind? Wie spiegeln sich Mehrsprachigkeit in der Gesellschaft, Prestige von Sprachen und Machtverhältnisse von Sprechergruppen in den Texten im öffentlichen Raum?
Dieser Band widmet sich derartigen Fragen, die in der Sprachwissenschaft heute unter dem Schlagwort der Linguistic Landscapes untersucht werden, aus einer Perspektive der deutschen Sprache außerhalb des deutschsprachigen Kerngebietes. Welches – z. T. unerwartete – Auftreten des Deutschen lässt sich in Ländern wie Malta, Estland, Dänemark oder Tschechien beobachten? Was für Geschichten stehen dahinter und wie spiegeln sich in deutschen Texten und Symbolen historische Ereignisse und heutige Verbindungen zu den deutschsprachigen Ländern?
Gleichzeitig berichten die Beiträge des Bandes über Erfahrungen, die Präsenz der deutschen Sprache in der Öffentlichkeit zu Unterrichtszwecken und zum Sprachmarketing einzusetzen. Ob in Schule, Universität oder in der Werbung für Deutsch in der allgemeinen Öffentlichkeit – dieser in Anlehnung an ein Projekt auf Malta Spot German genannte Ansatz veranschaulicht nicht nur die Vielfalt der Rollen des Deutschen, er zeigt vor allem, dass Projekte zur deutschen Sprache Spaß machen und auf einfache Weise zur Nachahmung einladen können.
Loblied auf Gerhard Stickel
(2017)
Forms of committed relationships, including formal marriage arrangements between men and women, exist in almost every culture (Bell, 1997). Yet, similarly to many other psychological constructs (Henrich et al., 2010), marital satisfaction and its correlates have been investigated almost exclusively in Western countries (e.g., Bradbury et al., 2000). Meanwhile, marital relationships are heavily guided by culturally determined norms, customs, and expectations (for review see Berscheid, 1995; Fiske et al., 1998). While we acknowledge the differences existing both between- and within-cultures, we measured marital satisfaction and several factors that might potentially correlate with it based on self-report data from individuals across 33 countries. The purpose of this paper is to introduce the raw data available for anybody interested in further examining any relations between them and other country-level scores obtained elsewhere. Below, we review the central variables that are likely to be related to marital satisfaction.
Mit dem Fokus auf Medienpraktiken bündelt dieses Heft aktuelle Positionen zur empirischen Erforschung von Medien. Die Beiträge gehen davon aus, dass Medien erst durch ihren Gebrauch zu Medien werden. Medienpraktiken zu erforschen, bedeutet jedoch nicht nur herauszufinden, was Menschen mit Medien tun, sondern auch was Medien mit Menschen machen. Diese für die Medienpraktikenforschung zentrale Einsicht lösen die interdisziplinären Beiträge des Bandes ein, indem sie aus den jeweiligen Positionen und Konstellationen verdeutlichen, wie Medien und Praktiken sich gegenseitig bedingen. Medienpraktikenforschung erfordert erstens, medienpraktische Phänomene in einem hohen Detailgrad zu fassen, um die Relation der beteiligten menschlichen und medialen Akteure zueinander in situ und in actu nachzuvollziehen. Erst durch die analytische Durchdringung dieser situativen Vollzugsmomente lässt sich zweitens der Status von Medien klären: was durch Praktiken zu einem Medium wird und wie die Praktiken unter Berücksichtigung der an ihnen konstitutiv beteiligten Medien beschaffen sind. Dadurch lassen sich ebenso übersituative Bezüge zur Praxis herstellen, durch die die Praktiken zur situativen Entfaltung kommen. Drittens muss dabei berücksichtigt werden, inwiefern die eigenen Medienpraktiken der Erforschung in ihren jeweiligen situativen Stadien die (Analyse der) Medienpraktik zurichten. Die Beiträge dieses Bandes lösen diese Forderungen in unterschiedlicher Gewichtung ein. Sie befassen sich aus medienethnologischer, kultursoziologischer, literaturwissenschaftlicher, historischer, soziologischer und medienwissenschaftlicher Perspektive damit, was jeweils als situierte Medienpraktik verstanden werden kann. Gemeinsam ist damit allen Beiträgen, dass sie erst aus ihren jeweiligen Untersuchungen und Perspektiven heraus bestimmen, was genau als Medienpraktik und Medien, die in ihnen zum Tragen kommen, gefasst werden kann.
Seit 2015 ist die Zahl der Migranten, die aus Bürgerkriegsländern des Nahen und Mittleren Ostens sowie aus Afrika nach Deutschland kommen, bis in die ersten Monate 2016 rasant gestiegen – auf knapp 1 Million in einem Jahr, zeitweise ohne Grenzkontrolle und Registrierung. Nach der auch von den Oppositionsparteien im Bundestag weitgehend unterstützten Positionierung der Bundeskanzlerin Merkel, Deutschland für die überwiegend als „Flüchtlinge“ bezeichneten Migranten politisch, rechtlich und gesellschaftlich zu öffnen, entwickelt sich bald ein Gegendiskurs, der nicht von den Oppositionsparteien im Deutschen Bundestag, sondern vor allem von der Führung der – an der Bundesregierung beteiligten – CSU getragen wurde, unterstützt von einigen Verfassungsrechtlern. Begriffe wie „Willkommenskultur“, „Obergrenze“, „humanitäre Katastrophe“, „Grundrecht auf Asyl“, „kulturelle Identität“, „Herrschaft des Unrechts“ etc. beginnen die öffentliche und private Kommunikation über Politik zu beherrschen.
Mögliche Erklärungshorizonte für grammatische Variation in Übersetzungen können durch kontrastive Unterschiede sowie Textsortenkonventionen für die involvierten Sprachen hergeleitet werden. Weiterhin ausschlaggebend sind die vom Übersetzer verwendeten Übersetzungsstrategien, wie Simplifizierung und Explizierung, die mit Methoden der Korpuslinguistik und der Translationsprozessforschung untersucht werden können. Letztere betreffend liefert das Eyetracking Hinweise auf Problemstellen im Ausgangstext; das Keylogging lässt Rückschlüsse auf die Problemlösestrategien im Zieltext zu. Durch die Triangulation der gewonnenen Produkt- und Prozessdaten kann einerseits der ganzheitliche Übersetzungsprozess und andererseits die Produktion der grammatischen Variation empirisch aufgearbeitet werden.
Zeitungsartikel mit wirtschaftlichem Inhalt sind nicht immer nach dem Textmuster „Bericht“ geschrieben, sie können auch erzähltechnische Elemente enthalten. Die Autorinnen untersuchen wirtschaftliche Krisenberichterstattungen aus deutschen, schweizerischen und österreichischen (Wochen-)Zeitungen; sie postulieren, dass Bericht und Erzählung nicht dichotomische Textmuster darstellen, sondern Pole einer Skala, auf der die konkreten Texte verortet werden können. Sie differenzieren vier Grade der Narrativität: nicht /schwach/mittel/stark narrativ. Es zeigt sich, dass der Anteil der schwach und mittel narrativen Texte zwischen 1973 und 2010-12 stark zunimmt. Außerdem werden die Positionen der Gesamtnarration „Krise“ ebenfalls je nach Untersuchungszeitraum bzw. Zeitung verschieden besetzt. Insgesamt dient der Einsatz narrativer Techniken dazu, durch eine textuelle Umsetzung der Krankheitsmetapher zunehmend abstraktere Prozesse zu veranschaulichen.
This chapter investigates policies which shape the role of the German language in contemporary Estonia. Whereas German played for many centuries an important role as the language of the economic and cultural elite in Estonia, it severely declined in importance throughout the twentieth century. Mirrored on this historical background, the paper provides an overview of the current functions of German and attitudes towards it and it discusses how these functions and attitudes are influenced by policies of various actors from inside and outside Estonia. The paper argues that German continues to play a significant role: while German is no longer a lingua franca, it still enjoys a number of functions and prestige in clearly defined niches involving communication within German-speaking circles or between Estonians and Germans. The interplay of language policies of the Estonian and the German-speaking states as well as by semi-state and private institutions succeed in maintaining German as an additional language in contemporary Estonia.
Vor 30 Jahren gab es in Westdeutschland nur ganz wenige Lexikologen und Lexikografen, die sich mit Neologismen befassten. Infolgedessen hatte man damals kein richtiges Neologismenwörterbuch: Heute sieht es ganz anders aus. Allein am Institut für Deutsche Sprache sind zwei Neologismenwörterbücher in Printausgabe entstanden, nämlich „Neuer Wortschatz. Neologismen der 90er Jahre im Deutschen" und „Neuer Wortschatz. Neologismen im Deutschen 2001-2010". Hinzu kommt OWID, auf dem ihre Online-Version und jüngste Neologismen den Benutzern zur Verfügung stehen. Parallel dazu gibt es zahlreiche Aufsätze bzw. Beiträge über Neologie (Neologismenlexikologie) und Neographie (Neologismenlexikographie). In dieser Arbeit werden die Termine des Wortschatz- und Sprachwandels, hinsichtlich der Neologismen und Archaismen in der deutschen Sprache näher untersucht. Dabei erfolgt zu den letzteren beiden Phänomenen eine genauere Betrachtung.
In conversation, turn-taking is usually fluid, with next speakers taking their turn right after the end of the previous turn. Most, but not all, previous studies show that next speakers start to plan their turn early, if possible already during the incoming turn. The present study makes use of the list-completion paradigm (Barthel et al., 2016), analyzing speech onset latencies and eye-movements of participants in a task-oriented dialogue with a confederate. The measures are used to disentangle the contributions to the timing of turn-taking of early planning of content on the one hand and initiation of articulation as a reaction to the upcoming turn-end on the other hand. Participants named objects visible on their computer screen in response to utterances that did, or did not, contain lexical and prosodic cues to the end of the incoming turn. In the presence of an early lexical cue, participants showed earlier gaze shifts toward the target objects and responded faster than in its absence, whereas the presence of a late intonational cue only led to faster response times and did not affect the timing of participants' eye movements. The results show that with a combination of eye-movement and turn-transition time measures it is possible to tease apart the effects of early planning and response initiation on turn timing. They are consistent with models of turn-taking that assume that next speakers (a) start planning their response as soon as the incoming turn's message can be understood and (b) monitor the incoming turn for cues to turn-completion so as to initiate their response when turn-transition becomes relevant.
This article describes a series of ongoing efforts at the Stanford Literary Lab to manage a large collection of literary corpora (~40 billion words). This work is marked by a tension between two competing requirements – the corpora need to be merged together into higher-order collections that can be analyzed as units; but, at the same time, it’s also necessary to preserve granular access to the original metadata and relational organization of each individual corpus. We describe a set of data management practices that try to accommodate both of these requirements – Apache Spark is used to index data as Parquet tables on an HPC cluster at Stanford. Crucially, the approach distinguishes between what we call “canonical” and “combined” corpora, a variation on the well-established notion of a “virtual corpus” (Kupietz et al., 2014; Jakubíek et al., 2014; van Uytvanck, 2010).
This paper reports about current practice in a staged approach to the introduction of NLP principles and techniques for students of information science (IIM) and of international communication and translation (ICT) as part of their curricula. As most of these students are rather not familiar with computer science or, in the case of IIM students, linguistics, we see them as comparable with students of the humanities. We follow a blended learning strategy with lectures, online materials, tutorials, and screencasts. In the first two terms, we focus on linguistics and its formalisation, NLP tools and applications are then introduced from the third term on. The lectures are combined with tutorials and - since the summer term 2017 - with a set of screencasts.
Interindividuelle Unterschiede bei der Verarbeitung sprachlicher Strukturen haben bei experimentellen Untersuchungen zur Sprachverarbeitung mittels neurobasierter Verfahren lange Zeit keine oder bestenfalls eine untergeordnete Rolle gespielt. Während individuelle Verarbeitungsstrategien in Abhängigkeit von experimentellen Faktoren (z.B. Aufgabenstellung) relativ gut belegt sind (z.B. probandenspezifisches strategisches Verhalten bei der Verarbeitung von semantischen Relationen; Roehm et al. 2007), wurde der Einfluss von Variation in der Grammatik des Standarddeutschen in Korrelation zu Hirnprozessen bisher kaum berücksichtigt. In diesem Beitrag werde ich auf der Basis dreier EEG-Experimente aus unterschiedlichen Bereichen (Synästhesie, semantische Relationen, Auxiliarselektion bei intransitiven Verben) Beispiele für Verarbeitungskorrelate interindividueller Variation vorstellen und diskutieren.