Refine
Year of publication
- 2017 (149) (remove)
Document Type
- Part of a Book (66)
- Article (39)
- Conference Proceeding (19)
- Part of Periodical (12)
- Book (7)
- Doctoral Thesis (2)
- Other (2)
- Report (1)
- Working Paper (1)
Is part of the Bibliography
- no (149) (remove)
Keywords
- Deutsch (56)
- Korpus <Linguistik> (16)
- Sprachvariante (14)
- Grammatik (10)
- Linguistik (10)
- Corpus linguistics (8)
- Sprachgebrauch (8)
- Englisch (7)
- Sprache (7)
- Germanistik (6)
Publicationstate
- Zweitveröffentlichung (61)
- Veröffentlichungsversion (60)
- Postprint (8)
Reviewstate
Publisher
- Institut für Deutsche Sprache (36)
- de Gruyter (24)
- Narr Francke Attempto (22)
- Narr (9)
- Synchron (4)
- Stauffenburg (3)
- iudicum (3)
- Leibniz-Institut für Deutsche Sprache (IDS) (2)
- Linguistic Society of Papua New Guinea (2)
- Springer (2)
Mit diesem Bild beschreibt Hermann Unterstöger in einem „Sprachlabor“- Artikel der Süddeutschen Zeitung vom 23.3.2013 die Erfolgsgeschichte, die das Substantiv (das) Narrativ in den letzten 30 Jahren vorgelegt hat. Während Unterstöger feinsinnig den intertextuellen Bezug zum „Narrenschiff“ des Sebastian Brant oder dem gleichnamigen Roman von Katherine Ann Porter bemüht, wird Matthias Heine, der Autor von „Seit wann hat geil nichts mehr mit Sex zu tun? 100 deutsche Wörter und ihre erstaunlichen Karrieren“ in einem Artikel in der WELT vom 13.11.2016, wie nach diesem Buchtitel zu erwarten, eher grob: Dort heißt es: „Hinz und Kunz schwafeln heutzutage vom ,Narrativ‘“.
In German there are about twenty-five elements (like gemäß, nahe, voll) that seem to be used as a preposition along with their use as an adjective. In former approaches the preposition is interpreted as the product of grammaticalizing (and/or reanalyzing) the adjective. It is argued that the two criteria these approaches rely on, namely change of linear position and change of case government, are insufficient. In this paper, seven criteria for distinguishing adjectives form prepositions in German are put forward. What is most important is that these criteria have to be evaluated on the token level as well as on the level of type and word class/syntactic category. It can be shown that the individual ‘adjective-prepositions' as types possess a specific mixture of adjective-like and preposition-like features. On the token level, occurring as part of a postnominal restrictive attribute is indicative for preposition-like status in German. The comparison of German with English and Italian adjective-prepositions (like near, far, due and vicino, lontano) reveals a lot of differences, which counts as evidence for the language-specific nature of word classes. Nevertheless, Lehmanns functional-typological approach uncovers a fundamental functional similarity between complement governing adjectives and prepositions: the primary function of the phrases, i.e., adjective/preposition + complement, is to modify a nominal or a verbal concept, respectively. This insight explains why adjective-prepositions can be found cross-linguistically. The question whether we should propose one type or two types for gemäß and its cognates is of minor importance only.
Emoticons erfreuen sich auf der ganzen Welt großer Beliebtheit, vor allem in der alltäglichen elektronischen Kommunikation wie E-Mail, SMS, Forumsdiskussionen, Instant Messaging, Facebook oder Twitter. Zum ersten Mal in der Geschichte wurde 2015 von den Sprachbeobachtern der britischen Oxford Dictionaries ein Emoticon zum Wort des Jahres gewählt: das Grinsegesicht, dem die Freudentränen aus den Augen spritzen (vgl.<www.sueddeutsche.de/kultur/britisches-wortdes-jahres-was-haben wir-gelacht-1.2740952>, Stand: 8.11.2017). Die Jury begründete ihre Wahl wie folgt: „[E]moji have come to embody a core aspect of living in a digital world that is visually driven, emotionally expressive, and obsessively immediate.“
Loblied auf Gerhard Stickel
(2017)
Die kontinental-westgermanischen Sprachen und Dialekte zeichnen sich durch das Vorkommen von mehrteiligen Verbformen in einem satzfinalen Verbalkomplex (im Folgenden VK) aus. Charakteristisch für diesen VK ist sein hohes Maß an Stellungsvariation, wie sie sich bei drei oder mehr Verben bereits innerhalb des Standarddeutschen zeigt (vgl. Duden 2005, 481-482, § 684). Im vorliegenden Beitrag werden Aspekte des VKs im Ostpommerschen untersucht, jenem ostniederdeutschen Dialekt, der bis 1945 östlich der Oder im heutigen Polen gesprochen wurde. Dies geschieht anhand spontansprachlicher Aufnahmen aus der Mitte des 20. Jahrhunderts; der Beitrag ist also als eine sprachhistorische Untersuchung zu verstehen.
Wie die meisten westgermanischen Varietäten kennen auch die niederdeutschen Dialekte eine Konstruktion, in der das Verb 'tun' (niederdeutsch meist 'doon') als Hilfsverb fungiert und einen Infinitiv regiert - die sog. 'tun'-Periphrase ('Lesen tut sie gerne', 'Sie tut gerne lesen'). Allerdings weicht die niederdeutsche 'tun'-Periphrase sehr deutlich von den aus anderen Sprachen bekannten Mustern ab: Viele niederdeutsche Dialekte zeigen eine auffällige und erklärungsbedürftige Tendenz, die Periphrase auf Nebensätze mit Verbletztstellung zu beschränken ('dass sie lesen tut'). Zudem unterscheiden sich niederdeutsche Dialekte z.T. erheblich darin, wie weit die Periphrase obligatorisiert ist bzw. welche Faktoren bei der Variation zwischen der Periphrase und der einfachen Form ('dass sie liest') ausschlaggebend sind.
In dieser Monographie werden diese und andere grammatische Eigenschaften der Konstruktion auf der Grundlage von umfangreichen Korpusrecherchen und eigenen Erhebungen herausgearbeitet. Die Befunde werden mit dem Instrumentarium der Grammatiktheorie erklärt und in einen typologischen und diachronen Zusammenhang gestellt.
Interview mit Ulrich Engel
(2017)
Ausgangspunkt der Überlegungen ist die Beobachtung, dass bestimmte Verwendungsweisen der deutschen Sprache zwar grammatisch und lexikalisch richtig sind, aber dennoch in einem bestimmten Kontext für einen Muttersprachler merkwürdig klingen und gewöhnlich nicht gebraucht werden. Man findet diese Formen der Variation zum Beispiel bei sehr fortgeschrittenen Lernern des Deutschen und auch in Übersetzungen, die sich der Originaltreue verpflichtet sehen. In dem Beitrag soll gezeigt werden, dass Abweichungen dieser Art auf eine Komponente unseres sprachlichen Wissens verweisen, die man als Prinzipien der Informationsorganisation bezeichnen kann. Es wird argumentiert, dass solche sprachspezifischen Prinzipien, die sich u.a. auf Informationswahl, Perspektivensetzung und Kohärenzmuster beziehen, aus Eigenschaften der einzelsprachlichen Grammatik abzuleiten sind. Gezeigt werden soll dies am Beispiel von empirischen Daten zum Ausdruck von Bewegungsereignissen und zum Textaufbau in unterschiedlichen Sprachen und in Lernersprachen.
Corpus researchers, along with many other disciplines in science are being put under continual pressure to show accountability and reproducibility in their work. This is unsurprisingly difficult when the researcher is faced with a wide array of methods and tools through which to do their work; simply tracking the operations done can be problematic, especially when toolchains are often configured by the developers, but left largely as a black box to the user. Here we present a scheme for encoding this ‘meta data’ inside the corpus files themselves in a structured data format, along with a proof-of-concept tool to record the operations performed on a file.
Die Behandlung der Euro-Krise in der deutschen Presse ist typisch für die Art und Weise, wie sich die Beschreibung komplexer Phänomene der Wirtschaft im letzten Jahrzehnt entwickelt hat: Fachberichte schwinden allmählich zugunsten von neuen Erzählformen, in denen rhetorische Figuren die Oberhand gewinnen. Darunter sind vor allem Metaphern zu finden, die hauptsächlich konventioneller Natur sind, aber auch gern kreativ fortgesetzt werden. Sie spielen meist eine zentrale Rolle auf der Textebene, indem sie wesentlich zur Kohärenz eines Abschnitts bzw. eines ganzen Artikels beitragen. Diese innovativen Kommunikationsformen mögen zwar das Interesse des breiten Publikums an wirtschaftlichen Debatten wecken, aber sie führen oft zu einer groben Vereinfachung, die den technischen Aspekt der Euro-Krise völlig beiseite lässt. Außerdem sind die benutzten Bilder in der Regel sehr negativ gefärbt, was die Angst der Öffentlichkeit vor einem weltweiten Zusammenbruch der Finanzmärkte sicherlich noch verstärkt und dem Vertrauen der Bürger in Europa nicht gerade dient. Die Vorliebe der Massenmedien für düstere Szenarien enthüllt somit eine bewusste Strategie der Dramatisierung, die immer mehr zum „Storytelling“ tendiert.
Am Anfang ist das Wort
(2017)
Unlike traditional text corpora collected from trustworthy sources, the content of web based corpora has to be filtered. This study briefly discusses the impact of web spam on corpus usability and emphasizes the importance of removing computer generated text from web corpora.
The paper also presents a keyword comparison of an unfiltered corpus with the same collection of texts cleaned by a supervised classifier trained using FastText. The classifier was able to recognize 71% of web spam documents similar to the training set but lacked both precision and recall when applied to short texts from another data set.
Für die mediale Dimension grammatischer Variation spielt die Unterscheidung von Gespräch und Text eine wichtige Rolle. Implizit wird dabei die Kategorie Text mit schriftlich realisierter Sprache und die Kategorie Gespräch mit mündlich realisierter Sprache identifiziert. Diese Zuordnung wird in Anbetracht der mediatisierten, hypermedialen Präsentations- und Kommunikationsformen im Internet zunehmend fragwürdig. Der Beitrag zeichnet die Diskussion um die varietätenlinguistische Einordnung der internetbasierten Kommunikation nach und führt das Oppositionspaar „textorientiert“ vs. „interaktionsorientiert“ ein, das es ermöglicht, auf der schriftlichen (medial graphischen) Ebene zwischen zwei Konstellation zu unterscheiden, in denen nähesprachliche Sprachmerkmale gehäuft auftreten: (1) Das interaktionsorientierte Schreiben in der internetbasierten Kommunikation und (2) die fingierte Mündlichkeit in literarischen Texten, die dem textorientierten Schreiben zuzuordnen ist. Am Fallbeispiel der interaktiven Einheit HM wird illustriert, wie frei verfügbare Korpusressourcen genutzt werden können, um die Gemeinsamkeiten, Unterschiede und Interferenzen zwischen der Verwendungen interaktiver Einheiten in Gespräch, Text und internetbasierter Kommunikation zu untersuchen.
Forms of committed relationships, including formal marriage arrangements between men and women, exist in almost every culture (Bell, 1997). Yet, similarly to many other psychological constructs (Henrich et al., 2010), marital satisfaction and its correlates have been investigated almost exclusively in Western countries (e.g., Bradbury et al., 2000). Meanwhile, marital relationships are heavily guided by culturally determined norms, customs, and expectations (for review see Berscheid, 1995; Fiske et al., 1998). While we acknowledge the differences existing both between- and within-cultures, we measured marital satisfaction and several factors that might potentially correlate with it based on self-report data from individuals across 33 countries. The purpose of this paper is to introduce the raw data available for anybody interested in further examining any relations between them and other country-level scores obtained elsewhere. Below, we review the central variables that are likely to be related to marital satisfaction.
The present paper examines the rise and fall of Modern High German loanwords in English from 1600 until 2000, principally making use of the record of borrowing documented by the Oxford English Dictionary (OED) in its Third Edition (online version, in revision 2000-). Groups of loanwords are analysed by century, with reference to the changing social and cultural landscape characterising relationships between the relevant nations over this period. This is not a simple picture: each language grows over the period in different ways, and the speakers of English look to German at different times for different types of borrowing, as the political and intellectual balance alters.
Wenn wir unseren persönlichen Kanon, die Bücher, die für uns wichtig sind oder gewesen sind, durchgehen, kommt sicher ein schönes, gattungsreiches, multikulturelles, individuelles Sammelsurium zusammen. Wenn man sich vor die Aufgabe gestellt sieht, Goethe zu kommentieren und zu übersetzen, sollte man sich auf folgende Überlegungen einlassen: Wie steht es heute um bestimmte Figuren aus dem tradierten Kanon? Wie steht es zum Beispiel um Goethe? Auf ihn möchte ich mich jetzt sozusagen exemplarisch beschränken. Welche Position hat Goethe in Spanien? Gehört er zum eigenen, persönlichen Kanon eines (nicht einmal) wichtigen Teils der Leser? Kann er das überhaupt? Wer liest noch Die Leiden des jungen Werther, zum Beispiel, wenn es nicht gerade Pflicht in der Schule oder im Germanistikstudium ist? Oder gar Wilhelm Meisters Wanderjahre, die nirgendwo Pflichtlektüre sind? Baut heute noch jemand Goethes Werke in seine Identitätskonstruktion ein?
An der Börse sind zwei und zwei nie vier, sondern fünf ‒ minus eins. Es kommt schließlich zur Vier, aber nie direkt.1 Das geflügelte Wort André Kostolanys unterliegt einer narrativen Schemabildung: Kontinuität wird nicht nach dem Muster der aufsteigenden Zahlenreihe hergestellt, sondern gleichsam epizyklisch, also auf Umwegen. Wie seine berühmtere Metapher vom Spaziergänger (Wirtschaft) mit Hund (Börse), so beschreibt auch die Zahlenversion derselben die Vorstellung einer letztlich doch linearen Aufwärtsbewegung, in der der Mensch Herr und behaust bleiben kann. Das neue Jahrtausend stellt diese Beherrschbarkeitsnarratio offenbar in Frage. Der Beitrag untersucht drei narrative Modelle im Bereich der Wirtschaftskommunikation: das lineare Modell des „homo oeconomicus“, das nichtlineare Modell des „Schwarzen Schwans“ und den synthetischen Versuch der „Antifragilität“ nach Nassim Taleb.
Sprachwissenschaft geht logozentrisch vor, konzentriert sich also aufs geschriebene und seit einigen Jahrzehnten auch aufs gesprochene Wort. Das ist verständlich und sinnvoll (Schuster, bleib bei deinen Leisten!), setzt sich aber auch Scheuklappen auf und übersieht bedeutsame Erscheinungen am Rande.
This paper presents a survey on hate speech detection. Given the steadily growing body of social media content, the amount of online hate speech is also increasing. Due to the massive scale of the web, methods that automatically detect hate speech are required. Our survey describes key areas that have been explored to automatically recognize these types of utterances using natural language processing. We also discuss limits of those approaches.
Ungefähr 5,8 Mio. Menschen in der Welt sprechen heute die dänische Sprache - die meisten davon in Dänemark. Dänisch hat seine Wurzeln im Germanischen und begann sich zwischen den Jahren 800 und 1000 aus dem Urnordischen als selbständige Sprache zu entwickeln. Noch heute weist Dänisch viele gemeinsame Züge mit dem Norwegischen und Schwedischen auf. Besonders für Deutsche sollte die dänische Schriftsprache eigentlich leicht verständlich sein. Durch die vielen politischen, wirtschaftlichen und kulturellen Kontakte zwischen den beiden Nachbarländern, vermittelt z.B. durch die Hanse im Ostseeraum, haben sich viele deutsche, insbesondere niederdeutsche Wörter und Redewendungen in der dänischen Sprache eingebürgert, und man kann noch heute dänische Sätze bilden, in denen alle inhaltstragende Wörter aus dem Deutschen entliehen sind. Im Folgenden wird eine Untersuchung des aktuellen Wortschatzes anhand eines dänischen Wörterbuchs aufgezeigt. Anschließend wird ein Blick auf das offizielle nationale dänische Sprachinstitut geworfen und deren empirische Grundlagen der offiziellen Rechtschreibung genauer geschildert.
Die Idee hinter dem Projekt – einen schnellen und einfachen Einstieg in die Analyse großer Korpusdaten mittels CorpusExplorer geben. Diese frei verfügbare Software bietet aktuell über 45 Analysen/Visualisierungen für vielfältige korpuslinguistische Zwecke und ist durch ihre Nutzerfreundlichkeit auch für den Einsatz in der universitären Lehre geeignet. Als Beispiel dient das EuroParl-Korpus, man kann aber auch eigenes Textmaterial (z. B. Textdateien, eBooks, Xml, Twitter, Blogs, etc.) mit dem CorpusExplorer annotieren, analysieren und visualisieren. Die Videos zeigen Schritt-für-Schritt die einzelnen Funktionen.
Überspannt werden die Videos von einer kleinen zweistufigen Aufgabe: Zuerst sollten ein paar Fragen/Thesen/Annahmen überlegt werden, die sich mit den Plenarprotokollen des EuroParl auswerten lassen – einige Videos geben auch explizite Anregungen oder man nutzt die Inspiration der anderen Beiträge im Issue #3. Die einfachsten Fragen/Thesen lassen sich bereits mit den hier vorgestellten Videos beantworten. Sobald es komplexer wird, betritt man den zweiten – reflexiven Teil der überspannenden Aufgabe: Es ist zu überlegen, wie durch (mehrfache) Kombination der einzelnen Video-/Wissensbausteine das Ziel erreicht werden kann (ein Beispiel – siehe Script). Im Zweifelsfall stehen außerdem ein Handbuch und ein E-Mail Support zur Verfügung.
The Manatee corpus management system on which the Sketch Engine is built is efficient, but unable to harness the power of today’s multiprocessor machines. We describe a new, compatible implementation of Manatee which we develop in the Go language and report on the performance gains that we obtained.
Interindividuelle Unterschiede bei der Verarbeitung sprachlicher Strukturen haben bei experimentellen Untersuchungen zur Sprachverarbeitung mittels neurobasierter Verfahren lange Zeit keine oder bestenfalls eine untergeordnete Rolle gespielt. Während individuelle Verarbeitungsstrategien in Abhängigkeit von experimentellen Faktoren (z.B. Aufgabenstellung) relativ gut belegt sind (z.B. probandenspezifisches strategisches Verhalten bei der Verarbeitung von semantischen Relationen; Roehm et al. 2007), wurde der Einfluss von Variation in der Grammatik des Standarddeutschen in Korrelation zu Hirnprozessen bisher kaum berücksichtigt. In diesem Beitrag werde ich auf der Basis dreier EEG-Experimente aus unterschiedlichen Bereichen (Synästhesie, semantische Relationen, Auxiliarselektion bei intransitiven Verben) Beispiele für Verarbeitungskorrelate interindividueller Variation vorstellen und diskutieren.
Verstehen und Motivieren: semantische Fluchtpunkte deutscher und italienischer Lexeme mit -log-
(2017)
In diesem Beitrag argumentiere ich, dass das grammatische Regelwerk „Lücken“ hat und dass „realistische“ Grammatikschreibung das in Theorie und Praxis berücksichtigen muss; insbesondere sind eventuelle Äußerungen in Lückensituationen außergrammatisch zu modellieren. Diese Konzeption wird anhand morphologischer und syntaktischer so genannter Zweifelsfälle intuitiv plausibilisiert und ihr Nutzen für die Grammatikschreibung in vergleichender Auseinandersetzung mit prominenten „lücken-losen“ Analysen von zwei Beispielen - ‚Right Node Raising‘- und gewissen Ersatzinfinitiv-Strukturen - nachgewiesen.
In the NLP literature, adapting a parser to new text with properties different from the training data is commonly referred to as domain adaptation. In practice, however, the differences between texts from different sources often reflect a mixture of domain and genre properties, and it is by no means clear what impact each of those has on statistical parsing. In this paper, we investigate how differences between articles in a newspaper corpus relate to the concepts of genre and domain and how they influence parsing performance of a transition-based dependency parser. We do this by applying various similarity measures for data point selection and testing their adequacy for creating genre-aware parsing models.
Syntactic theory has tended to vacillate between implausible methodological extremes. Some linguists hold that our theories are accountable solely for the corpus of attested utterances; others assume our subject matter is unobservable intuitive feelings about sentences. Both extremes should be rejected. The subject matter of syntax is neither past utterance production nor the functioning of inaccessible mental machinery; it is normative - a system of tacitly grasped constraints defining correctness of structure. There are interesting parallels between syntactic and moral systems, modulo the key difference that linguistic systems are diverse whereas morality is universal. The appropriate epistemology for justifying formulations of normative systems is familiar in philosophy: it is known as the method of reflective equilibrium.
Was in Märkten sich künftig ereignen wird, kann man nicht wissen, nur erwarten. Was man erwartet, wird in der Ökonomik probabilistisch eingearbeitet: als Risikoentscheidungen. Elena Esposito zufolge besteht unter Ökonomen aber ein fundamentales Missverständnis bezüglich der Prognosefähigkeit der Wahrscheinlichkeitstheorie. Die Wahrscheinlichkeitstheorie werde statt zur Berechnung von Unsicherheit zur Erzeugung von Sicherheit verwendet und so in ihren Grundzügen missverstanden (Esposito 2007, 2010, 2014; ähnlich Morgan 2012). Indem man eine (subjektive) Wahrscheinlichkeit von 80% des Ereigniseintrittes schätzt, wird sie epistemisch verbucht als ‘fast sicher’ / ‘so gut wie sicher’. Dabei ist nur – subjektiv – das Risiko genauer spezifiziert, aber es wird geglaubt, man wisse, was kommt. Das riskante, nur wahrscheinliche Ereignis als irgendwie durch diesen Prozess bemessen angeben zu können, ist eine operative Fiktion. Man lasse sich nicht verführen durch den mathematischen Modus der Modellaussagen: es sind fingierte, d.h. fiktionale Aussagen (sie entstammen z.B. keiner häufigkeits- bzw. frequenzstatistischen Ausmessung).
We present an event-related potentials (ERP) study that addresses the question of how pieces of information pertaining to semantic roles and event structure interact with each other and with the verb’s meaning. Specifically, our study investigates German verb-final clauses with verbs of motion such as fliegen ‘fly’ and schweben ‘float, hover,’ which are indeterminate with respect to agentivity and event structure. Agentivity was tested by manipulating the animacy of the subject noun phrase and event structure by selecting a goal adverbial, which makes the event telic, or a locative adverbial, which leads to an atelic reading. On the clause-initial subject, inanimates evoked an N400 effect vis-à-vis animates. On the adverbial phrase in the atelic (locative) condition, inanimates showed an N400 in comparison to animates. The telic (goal) condition exhibited a similar amplitude like the inanimate-atelic condition. Finally, at the verbal lexeme, the inanimate condition elicited an N400 effect against the animate condition in the telic (goal) contexts. In the atelic (locative) condition, items with animates evoked an N400 effect compared to inanimates. The combined set of findings suggest that clause-initial animacy is not sufficient for agent identification in German, which seems to be completed only at the verbal lexeme in our experiment. Here non-agents (inanimates) changing their location in a goal-directed way and agents (animates) lacking this property are dispreferred and this challenges the assumption that change of (locational) state is generally a defining characteristic of the patient role. Besides this main finding that sheds new light on role prototypicality, our data seem to indicate effects that, in our view, are related to complexity, i.e., minimality. Inanimate subjects or goal arguments increase processing costs since they have role or event structure restrictions that animate subjects or locative modifiers lack.
Skatesticker sind grafisch gestaltete Aufkleber, die von Skatelabels – den Herstellern von Skateboards und Zubehör – distribuiert werden. Ursprünglich zu reinen Werbezwecken produziert, haben sich Skatesticker als Symbole der Szene etabliert: Befragte Skater bekennen, dass Skatesticker ein „Ausdruck eines Lebensgefühls“, ein „visueller Eindruck unserer Gefühle“ und eine „[e]infache Möglichkeit[,] sich einer Gruppe zuzuordnen“ sind. Sie werden von Skatern gesammelt, gehandelt und wertgeschätzt. Die vorliegende Arbeit verfolgt einen bildwissenschaftlich orientierten Forschungsansatz, der es ermöglicht, die komplexen – oftmals bildende Kunst adaptierenden – Bildmotive dieser Grafikdesignobjekte und ihre zunehmend autonomisierten Funktionen als visuelle Medien einer Szene zu analysieren und anzuerkennen.
Genau tritt im aktuellen Sprachgebrauch nicht nur in seiner klassischen Bedeutung als Adjektiv oder Adverb auf, sondern wird auch als Fokus- bzw. Gradpartikel sowie Gesprächspartikel verwendet. Bisherige Beschreibungen haben sich nur in geringem Maße und unter Verwendung heterogener Begriffe mit seinem interaktionalen Gebrauch auseinandergesetzt. In diesem Beitrag werden mit Hilfe eines sequenziellen und multimodalen Ansatzes verschiedene interaktionale Verwendungen von genau in Videoaufnahmen deutscher Alltagsgespräche untersucht. Ausgehend von seiner Funktion als Gradpartikel wird genau sowohl als redebeitragsinterne Bestätigungspartikel in Wortfindungsprozessen als auch als responsive Bestätigungspartikel eingesetzt. Da genau häufig das Ende eines Verstehensprozesses bzw. einer Wissensverhandlung markiert, könnte allgemeiner die Bezeichnung des Intersubjektivitätsmarkers in Erwägung gezogen werden. Aus dem responsiven, bestätigenden Gebrauch heraus entsteht eine stärker sequenzschließende und sequenzstrukturierende Funktion von genau, woraus sich auch der zunehmende Gebrauch dieses Lexems als rein diskursstrukturierende Partikel innerhalb eines Redezugs erklären könnte.
Deutsch in Finnland
(2017)
In meinem Artikel behandele ich den Umfang des Deutschunterrichtes an Schulen und Universitäten sowie die Verwendung des Deutschen in Wissenschaft und Wirtschaft in Finnland, vor allem im 20. und 21. Jahrhundert. Zunächst aber will ich die Geschichte der deutschen Kontakte und die Rolle der deutschen Sprache in bestimmten finnischen Städten sowie den Anteil Deutschsprachiger in der modernen finnischen Gesellschaft beleuchten. Nicht behandelt werden kann in diesem Zusammenhang die Lektüre und Übersetzung deutscher Belletristik, obwohl beide bedeutenden Einfluss auf die finnische Gedankenwelt und die literarische Bildung gehabt haben.
Data sets of publication meta data with manually disambiguated author names play an important role in current author name disambiguation (AND) research. We review the most important data sets used so far, and compare their respective advantages and shortcomings. From the results of this review, we derive a set of general requirements to future AND data sets. These include both trivial requirements, like absence of errors and preservation of author order, and more substantial ones, like full disambiguation and adequate representation of publications with a small number of authors and highly variable author names. On the basis of these requirements, we create and make publicly available a new AND data set, SCAD-zbMATH. Both the quantitative analysis of this data set and the results of our initial AND experiments with a naive baseline algorithm show the SCAD-zbMATH data set to be considerably different from existing ones. We consider it a useful new resource that will challenge the state of the art in AND and benefit the AND research community.
We present a supervised machine learning AND system which tackles semantic similarity between publication titles by means of word embeddings. Word embeddings are integrated as external components, which keeps the model small and efficient, while allowing for easy extensibility and domain adaptation. Initial experiments show that word embeddings can improve the Recall and F score of the binary classification sub-task of AND. Results for the clustering sub-task are less clear, but also promising and overall show the feasibility of the approach.
In den letzten Jahren ist der konzessive Konnektor verstärkt in den Fokus der Gesprochene-Sprache-Forschung (GSF) geraten. Diese hat an authentischen Hörbeispielen eine Grammatikalisierungstendenz von dessen konzessiver, einräumender Bedeutung zur korrektiven Diskursmarkierung nachgewiesen. Im Anschluss insbesondere an die Forschungsergebnisse von Günthner (1999, 2000a, 2002, 2005, 2008) hat dann Moraldo (2012a, 2012b) zum einen versucht nachzuweisen, dass auch in schriftbasierten neumedialen Kommunikationsplattformen (z.B. Twitter) diese Hauptsatzwortstellung nach obwohl mittlerweile vorkommt. Zum anderen, dass Korrektivsätze vereinzelt auch in standardschriftsprachlichen Texten auftreten. (vgl. Moraldo 2012c). Der folgende Beitrag will nun die Entwicklung der Subjunktion obwohl zum Diskursmarker nachvollziehen. Ausgehend von seiner konzessiven Bedeutung (Kap. 2) soll korrektives obwohl zuerst anhand gesprochensprachlicher Beispiele illustriert, dann in konzeptionell mündlichen aber medial schriftlichen Kontexten analysiert und schließlich in standardschriftsprachlichen Texten nachgewiesen werden (Kap. 3), bevor abschließend seine Mutation von subordinierendem Konnektor zum Diskursmarker (Kap. 4) diskutiert wird.
This study investigates the interrelations between bilingual development (German/Russian), immigration and integration in the host society. Participants are Russian-Germans, that is, ethnic Germans who have repatriated to Germany from the former Soviet Union. They were part of a longitudinal study dedicated to the integration of multi-generation Russian-German families in Germany. The paper focuses on eight Russian-Germans who moved to Germany between the ages of five and eight and are now young adults. The analysis is based on interviews conducted in the twentieth year of their life in Germany in German and Russian, A semi-structured questionnaire was used to elicit information on the main stages of integration, the use of the languages, the attitudes towards German and Russian, and an assessment of the current situation. The obtained data were used to make an initial assessment of the oral language competencies of the participants and as sources of information about the objective facts and subjective attitudes that determined linguistic and social integration.