Refine
Year of publication
- 2017 (221) (remove)
Document Type
- Part of a Book (95)
- Article (62)
- Book (26)
- Conference Proceeding (24)
- Other (5)
- Working Paper (5)
- Report (3)
- Part of Periodical (1)
Is part of the Bibliography
- yes (221) (remove)
Keywords
- Deutsch (98)
- Korpus <Linguistik> (48)
- Gesprochene Sprache (29)
- Grammatik (12)
- Wörterbuch (11)
- Diskursanalyse (10)
- Interaktion (10)
- Konversationsanalyse (9)
- Rezension (9)
- Computerunterstützte Lexikographie (8)
Publicationstate
- Veröffentlichungsversion (103)
- Zweitveröffentlichung (26)
- Postprint (12)
- Erstveröffentlichung (1)
- Preprint (1)
Reviewstate
- Peer-Review (71)
- (Verlags)-Lektorat (60)
- Peer-review (11)
- (Verlags-)Lektorat (2)
- Peer-Revied (2)
- (Verlags-)lektorat (1)
Publisher
- de Gruyter (26)
- Institut für Deutsche Sprache (20)
- De Gruyter (17)
- Narr Francke Attempto (17)
- Narr (10)
- Verlag für Gesprächsforschung (10)
- Hempen (9)
- Stauffenburg (7)
- TUDpress (6)
- Heidelberg University Publishing (5)
Begegnungen mit neuen Wörtern: Zu lexikografischen Praktiken im Neologismenwörterbuch des IDS
(2017)
Das von der Leibniz-Gemeinschaft geförderte Projekt „Lexik des gesprochenen Deutsch“(LeGeDe, Leibniz-Wettbewerb 2016, Förderlinie I: „Innovative Vorhaben“) nahm im September 2016 am Institut für Deutsche Sprache (IDS) seine Arbeit auf.1 Das Hauptziel ist die Erstellung einer korpusbasierten lexikografischen Online-Ressource zur Lexik des gesprochenen Deutsch auf der Grundlage von lexikologischen und gesprächsanalytischen Untersuchungen authentischer gesprochensprachlicher Daten. Als Kooperationsprojekt der Abteilungen Lexik und Pragmatik arbeiten Mitarbeiter/innen aus der Lexikologie, Lexikografie, Interaktionalen bzw. Gesprächslinguistik, Korpus- und Computerlinguistik und den Empirischen Methoden zusammen, wodurch sowohl aus der Sicht der Gesprochene- Sprache-Forschung als auch aus lexikografischer Perspektive eine innovative Form der Sprachbeschreibung entstehen soll.
Der Auftaktworkshop "Lexik des gesprochenen Deutsch: Forschungsstand, Erwartungen und Anforderungen an die Entwicklung einer innovativen lexikografischen Ressource" fand am 16. und 17. Februar 2017 am Institut fur Deutsche Sprache (IDS) in Mannheim statt. Das von der Leibniz-Gemeinschaft geforderte Projekt "Lexik des gesprochenen Deutsch" (=LeGeDe, Leibniz-Wettbewerb 2016, Forderlinie "Innovative Vorhaben") nahm im September 2016 am IDS seine Arbeit auf. Das Hauptziel ist die Erstellung einer korpusbasierten elektronischen Ressource zur Lexik des gesprochenen Deutsch auf der Grundlage von lexikologischen und gesprachsanalytischen Untersuchungen authentischer gesprochensprachlicher Daten.
Sound units play a pivotal role in cognitive models of auditory comprehension. The general consensus is that during perception listeners break down speech into auditory words and subsequently phones. Indeed, cognitive speech recognition is typically taken to be computationally intractable without phones. Here we present a computational model trained on 20 hours of conversational speech that recognizes word meanings within the range of human performance (model 25%, native speakers 20–44%), without making use of phone or word form representations. Our model also generates successfully predictions about the speed and accuracy of human auditory comprehension. At the heart of the model is a ‘wide’ yet sparse two-layer artificial neural network with some hundred thousand input units representing summaries of changes in acoustic frequency bands, and proxies for lexical meanings as output units. We believe that our model holds promise for resolving longstanding theoretical problems surrounding the notion of the phone in linguistic theory.
We present a method to identify and document a phenomenon on which there is very little empirical data: German phrasal compounds occurring in the form of as a single token (without punctuation between their components). Relying on linguistic criteria, our approach implies to have an operational notion of compounds which can be systematically applied as well as (web) corpora which are large and diverse enough to contain rarely seen phenomena. The method is based on word segmentation and morphological analysis, it takes advantage of a data-driven learning process. Our results show that coarse-grained identification of phrasal compounds is best performed with empirical data, whereas fine-grained detection could be improved with a combination of rule-based and frequency-based word lists. Along with the characteristics of web texts, the orthographic realizations seem to be linked to the degree of expressivity.
In this paper we present the results of an automatic classification of Russian texts into three levels of difficulty. Our aim is to build a study corpus of Russian, in which a L2 student is able to select texts of a desired complexity. We are building on a pilot study, in which we classified Russian texts into two levels of difficulty. In the current paper, we apply the classification to an extended corpus of 577 labelled texts. The best-performing combination of features achieves an accuracy of 0,74 within at most one level difference.
The paper reviews the results of work done in the context of TEI-Lex0, a joint ENeL / DARIAH / PARTHENOS initiative aimed at formulating guidelines for the encoding of retrodigitized dictionaries by streamlining and simplifying the recommendations of the “Print Dictionaries” chapter of the TEI Guidelines. TEI-Lex0 work is performed by teams concentrating on each of the main components of dictionary entries. The work presented here concerns proposals for constraining TEI-based encoding of orthographic, phonetic, and grammatical information on written and spoken forms of the lemma (headword), including auxiliary inflected forms. We also adduce examples of handling various types of orthographic and phonetic variants, as well as examples of handling the representation of inflectional paradigms, which have received less attention in the TEI Guidelines but which are nonetheless essential for properly exposing data content to the various uses that digitized lexica may have.
CoMParS is a resource under construction in the context of the long-term project German Grammar in European Comparison (GDE) at the IDS Mannheim. The principal goal of GDE is to create a novel contrastive grammar of German against the background of other European languages. Alongside German, which is the central focus, the core languages for comparison are English, French, Hungarian and Polish, representing different typological classes. Unlike traditional contrastive grammars available for German, which usually cover language pairs and are based on formal grammatical categories, the new GDE grammar is developed in the spirit of functionalist typology. This implies that, instead of formal criteria, cognitively motivated functional domains in terms of Givón (1984) are used as tertia comparationis. The purpose of CoMParS is to document the empirical basis of the theoretical assumptions of GDE-V and to illustrate the otherwise rather abstract content of grammar books by as many as possible naturally occurring and adequately presented multilingual examples, including information on their use in specific contexts and registers. These examples come from existing parallel corpora, and our presentation will focus on the legal aspects and consequences of this choice of language data.
In this chapter, a conversation-analytic approach is used to study medical recommendations as an essential part of medical advice. Tlte analyses are based on renal treatment planning conversations in which physicians inform patients about an upcoming dialysis therapy. The data reveals that medical recommendations are marked throughout by their strikingly tentative and relativistic phrasing in which the conflict between physicians duty of care and the patient’s autonomy is obvious. The observed discrepancy between what should be said and what patients and physicians want to be said - and heard - not only gives reason to challenge the ethical and legal requirements concerning medical recommendations and their implications for medical practice, but also to rethink the current models of decision-making in medical communication.
Reden über Geld
(2017)
The paper presents best practices and results from projects dedicated to the creation of corpora of computer-mediated communication and social media interactions (CMC) from four different countries. Even though there are still many open issues related to building and annotating corpora of this type, there already exists a range of tested solutions which may serve as a starting point for a comprehensive discussion on how future standards for CMC corpora could (and should) be shaped like.
The paper reports on the results of a scientific colloquium dedicated to the creation of standards and best practices which are needed to facilitate the integration of language resources for CMC stemming from different origins and the linguistic analysis of CMC phenomena in different languages and genres. The key issue to be solved is that of interoperability – with respect to the structural representation of CMC genres, linguistic annotations metadata, and anonymization/pseudonymization schemas. The objective of the paper is to convince more projects to partake in a discussion about standards for CMC corpora and for the creation of a CMC corpus infrastructure across languages and genres. In view of the broad range of corpus projects which are currently underway all over Europe, there is a great window of opportunity for the creation of standards in a bottom-up approach.
This survey describes the practice of dictionary criticism in German philological periodicals. It focuses on reviews of general dictionaries of contemporary German as well as of historical dictionaries of German. Our results show that only a few reference works are reviewed by only a small group of reviewers, and different volumes of dictionaries are not necessarily reviewed systematically. On the criteria for the selection of the reviewed dictionaries one can only speculate. All in all, this rather unsystematic review practice can be interpreted as a disregard of the work of lexicographers, as a neglect of the interests of potential dictionary users, and as a sad disinterest of philologists in lexicographic work.
Die pfälzische Sprachinsel am Niederrhein, deren Gründung auf das Jahr 1641 zurückgeht, ist die letzte deutsche Binnensprachinsel. Sie steht unter einem akuten Assimilationsdruck, der sich im funktionellen Wandel des autochthonen dialektalen Systems bemerkbar macht; verstärkt wird dieser Prozess durch den deutschlandweit vielerorts beobachtbaren Rückgang der Dialektkompetenz auf basisdialektaler Ebene. In der vorliegenden Arbeit werden einerseits die Entwicklung in der Struktur des Sprachinseldialekts und andererseits die Rolle des Gebrauchs von sprachlichen Varianten als identitätsmarkierende Mittel untersucht. Dazu werden Sprachproben aus zwei Generationen variablenanalytisch ausgewertet und die Ergebnisse gegenübergestellt. Dabei zeigt sich, dass die dialektkompetenten Sprecher der jüngeren Generation einzelne (ehemals) dialektale Merkmale verstärkt realisieren, um ihre Identität als pfälzische Sprachinsulaner zu markieren.
This contribution aims to shed light on the structural development of Luxembourgish German in the 19th Century. The fact that it is embedded in a multilingual context raises many research questions. The evidence comprises predominantly bilingual German/French public notices issued by the City of Luxembourg in this period. The analysis of two conjunctions suggests that processes of replication and interlingual transfer are sources for Variation. It shows that the influence of French was particularly acute during the “French period” (1795-1814). However, rather than working in isolation, the language contact phenomena operate on the basis of similar constructions existing in the borrowing language. In addition, ancient German forms quickly disappeared, despite showing similarity to forms in the local dialect.
Eine reichhaltige Auszeichnung mit Metadaten ist für alle Arten von Korpora für die linguistische Forschung wünschenswert. Für große Korpora (insbesondere Webkorpora) müssen Metadaten automatisch erzeugt werden, wobei die Genauigkeit der Auszeichnung besonders kritisch ist. Wir stellen einen Ansatz zur automatischen Klassifikation nach Themengebiet (Topikdomäne) vor, die auf dem lexikalischen Material in Texten basiert. Dazu überführen wir weniger gut interpretierbare Ergebnisse aus einer so genannten Topikmodellierung mittels eines überwachten Lernverfahrens in eine besser interpretierbare Kategorisierung nach 13 Themengebieten. Gegenüber (automatisch erzeugten) Klassifikationen nach Genre, Textsorte oder Register, die zumeist auf Verteilungen grammatischer Merkmale basieren, erscheint eine solche thematische Klassifikation geeigneter, um zusätzliche Kontrollvariablen für grammatische Variationsstudien bereitzustellen. Wir evaluieren das Verfahren auf Webtexten aus DECOW14 und Zeitungstexten aus DeReKo, für die jeweils getrennte Goldstandard-Datensätze manuell annotiert wurden.
In diesem Aufsatz werden Diskursmarker als Operatoren definiert, die Skopus über Sprechakte nehmen, d.h. Sprechakte modifizieren oder miteinander verknüpfen. Als Sprechakte in diesem Sinne kommen neben perlokutionären und illokutionären auch lokutionäre Akte in Betracht. Die Operation eines Diskursmarkers wird als Zuordnung thematischer Rollen konzeptualisiert. Dafür muss der Diskursmarker zu seinem Operanden im syntaktischen Verhältnis eines Kopfes zu seinem Komplement oder eines Adjunktes zu seinem Wirt stehen, oder er muss ein syntaktisch unabhängiger referentieller Ausdruck sein, der seinen Operanden als Verweisziel nimmt. Linear stehen Diskursmarker typischerweise peripher zu ihren Operanden. In satzförmigen Operanden können adverbiale Diskursmarker auch Binnenstellungen einnehmen.
Zur Einführung
(2017)
Der Aufsatz beschreibt Grundlinien der Diskursmarkerforschung von ihren Anfängen bis in die Mitte der 2010er Jahre. Der Schwerpunkt liegt auf einer fachgeschichtlichen und systematischen Rekonstruktion des Diskursmarkerbegriffs. Im ersten Schritt werden Herausbildung und Entwicklung des Terminus nachgezeichnet und zu verwandten Termini wie Partikel, Gesprächswort und (pragmatischer) Operator in Beziehung gesetzt. Dabei werden unterschiedliche Forschungstraditionen in Germanistik, angelsächsischer Linguistik und Romanistik sowie ihre wechselseitigen Verflechtungen berücksichtigt. Im zweiten Schritt werden inhaltliche Bestimmungen des Diskursmarkerbegriffs in morphologischer, prosodischer, syntaktischer, semantischer, pragmatischer und sprachgeschichtlicher Hinsicht zusammengestellt und gewichtet. Zum Schluss werden unterschiedliche Richtungen der Diskursmarkerforschung in einen systematischen Zusammenhang gestellt, der die notorischen Unschärfen des Diskursmarkerbegriffs verständlich macht und ihre Überwindung absehbar erscheinen lässt.
Vorwort
(2017)
Das 18. Jahrhundert war wissenschaftlich von großen Umbrüchen geprägt, auch im Bereich der Anatomie und Physiologie des Menschen. Die hierauserwachsende lebhafte Diskussion erstreckte sich auch auf das noch sehr junge Gebiet der (mechanischen) Sprachsynthese und ihrer Grundlagen. Das Sprachsynthesekonzept Wolfgang von Kempelens (1734–1804) ist hierbei ein besonders eindrückliches Beispiel dafür, dass eine grundlegende wissenschaftliche Erkenntnis womöglich durch technologische Limitationen nicht notwendigerweise auch praktisch umgesetzt werden kann. Grundsätzlich waren Kempelens Erkenntnisse zur Anatomie und Physiologie des Menschen und damit auch zur Spracherzeugung weitestgehend zutreffend. Die praktische Umsetzung hingegen wirkt aus heutiger Sicht recht kurios. Kempelens Vokaltrakt-Konzept soll exemplarisch dem nur wenig früher entstandenen Prototypen zur Sprachsynthese Christian Gottlieb Kratzensteins (1723–1795) gegenübergestellt werden. Dessen „Erkenntnisse“ müssen heute vielfach als falsch bezeichnet werden; sein Modell zur Vokalsynthese weist einerseits auffällige Parallelen zu demjenigen KEMPELENS auf, geht hinsichtlich der Physiologie jedoch von vielfach irrigen Annahmen aus.
There are a number of recent replicas of Wolfgang von Kempelen's speaking machine. Although all of them are explicitly based on Kempelen's own description nearly none of them are identical in construction and sound. In this paper we want to illustrate some of these differences and their reasons for five replicas built by ourselves.
Wolfgang von Kempelen's book "The Mechanism of Human Speech" from 1791 is a famous milestone in the history of speech communication research. It has an enormous relevance for the phonetic sciences and it marks an important turning point for the development of the (mechanical) speech synthesis. So far no English version of this work was available, which excludes many interested researchers. Access to the original versions in German and French is restricted for various reasons. For example the blackletter script of the German version is troublesome for most of today's readers. We report here on a new edition of Kempelen's book which unites a better readable German version and its English translation. It will now also be in a searchable electronic format and has been enriched with many commentaries, which aid in the understanding of details of the late 18th century that are little known or unknown to many researchers today.
Researchers interested in the sounds of speech or the physical gestures of Speakers make use of audio and video recordings in their work. Annotating these recordings presents a different set of requirements to the annotation of text. Special purpose tools have been developed to display video and audio Signals and to allow the creation of time-aligned annotations. This chapter reviews the most widely used of these tools for both manual and automatic generation of annotations on multimodal data.
Deutschland sieht sich in den nächsten Jahren vor enormen Herausforderungen gegen-übergestellt. Mit der Fluchtmigration von knapp 1,5 Mio. Menschen alleine zwischen 2014 und 2017 stehen nahezu in jedem gesellschaftlichen Bereich und hier insbesonde-re in den Sektoren Bildung und Arbeit große Integrationsaufgaben an. Steven Vertovec, der Leiter des Max-Planck-Instituts zur Erforschung multireligiöser und multiethnischer Gesellschaften bezeichnet die Fluchtmigration von 2015 auch deshalb als die „zweite Wende“ (Vertovec 2015) für Deutschland, die das Land nachhaltig verändern wird. Nach seiner Einschätzung werden die gesellschaftlichen Transformationen dermaßen tiefgrei-fend sein, dass die Formulierung „seit der Flüchtlingskrise“ eine ebenso geläufige Rede-wendung sein wird wie die Formulierung „seit der Wende“.
Berufliche Qualifizierungsmaßnahmen wie „GASTRO“ im Rhein-Neckar-Raum sind in diesem Kontext sehr wichtige Anstrengungen im Hinblick auf die strukturelle Integrati-on der Fluchtmigranten. Im gesamtgesellschaftlichen Kontext sind sie unverzichtbare Bestandteile der neuen Willkommenskultur, die seit den 2010ern versucht wird, in Deutschland zu etablieren. Als Einwanderungsland kann Deutschland mit Hilfe solcher Initiativen gezielt für Arbeitsbereiche und Berufsgruppen werben, in denen es an Nach-wuchs mangelt. Den Neuzugewanderten bieten sie die Chance sich in der hiesigen Ar-beitswelt zu orientieren und möglicherweise Berufsfelder zu erkunden, die ihnen bis-lang noch nicht oder nur in anderer Form bekannt waren.
Qualifizierungsmaßnahmen wie „Perspektive für Flüchtlinge Plus“ (PerFPlus) können als wichtige Bestandteile der neuen Willkommenskultur in Deutschland betrachtet werden. Deutschland als Einwanderungsland kann mit Hilfe solcher Initiativen gezielt für Arbeitsbereiche und Berufsgruppen werben, in denen es an Nachwuchs mangelt. Den Neuzugewanderten bieten sie die eine Chance sich in der hiesigen Arbeitswelt zu orientieren und Berufsfelder zu erkunden, die ihnen bislang noch nicht oder nur in anderer Form bekannt waren. Auf der anderen Seite bergen solche Maßnahmen aber auch ihr Risiko: Wenn sie ihr Ziel verfehlen und Frustrationen auf beiden Seiten erzeugen, sind lange Warteschleifen, Arbeitslosigkeit und möglicherweise politische Polarisierung und Radikalisierung die Folge. Insofern ist eine schnelle Intervention hinsichtlich der Verbesserung solcher Maßnahmen essentiell. Der vorliegende Bericht soll die konzeptionell-arbeitenden Teams bei der Bundesagentur für Arbeit (BA) sowie bei Bildungsanbietern die mit der BA kooperieren bei ihren wichtigen Aufgaben unterstützen. Alle Partner bleiben im Bericht anonym.
Ziel des vorliegenden Aufsatzes ist die Betrachtung der lexikalischen Begegnung des Rumänischen und des Deutschen vor dem Hintergrund des Bildes des deutschen Siedlers im rumänischen Paradigma. Ausgangspunkt der Überlegungen sind zum einen den Allgemeinplatz bildende Fragen zu Sprechern, Kontakt-Konstellationen, zu Auswirkungen ihres Sprach- und Kulturkontaktes, denn Wörter werden erstmal von einzelnen Sprechern übernommen, nicht von der Sprache selbst.
"What makes this so complicated?" On the value of disorienting dilemmas in language instruction
(2017)
To improve grammatical function labelling for German, we augment the labelling component of a neural dependency parser with a decision history. We present different ways to encode the history, using different LSTM architectures, and show that our models yield significant improvements, resulting in a LAS for German that is close to the best result from the SPMRL 2014 shared task (without the reranker).
We propose a new type of subword embedding designed to provide more information about unknown compounds, a major source for OOV words in German. We present an extrinsic evaluation where we use the compound embeddings as input to a neural dependency parser and compare the results to the ones obtained with other types of embeddings. Our evaluation shows that adding compound embeddings yields a significant improvement of 2% LAS over using word embeddings when no POS information is available. When adding POS embeddings to the input, however, the effect levels out. This suggests that it is not the missing information about the semantics of the unknown words that causes problems for parsing German, but the lack of morphological information for unknown words. To augment our evaluation, we also test the new embeddings in a language modelling task that requires both syntactic and semantic information.
Die ältesten schriftlichen Rezepte in deutscher Sprache sind uns im Buoch von guoter Spise aus der Zeit um 1350 überliefert (<http://digital.slub-dresden.de/werkansicht/dlf/2518/1/>, 10.7.2017). Schon damals hatten Rezepte wie heute außer der Kochanleitung einen Namen. Denn um über etwas reden zu können, geben wir allem einen Namen. Im Buoch von guoter Spise heißen die Gerichte Ain mandel suppen oder Ein gebraten gefültes ferhelin.
Slogans
(2017)
Schriften
(2017)
Vorwort
(2017)
Este artículo expone a partir de una serie de ejemplos diferentes situaciones de uso del diccionario bilingüe que evidencian la importancia de llevar a cabo una adecuada adquisición y desarrollo de las competencias lexicográficas en el contexto de enseñanza-aprendizaje de lenguas extranjeras y, en este caso en concreto, del alemán como lengua extranjera. Con este propósito se parte de tres competencias básicas: la selección de la obra lexicográfica adecuada según la situación comunicativa, la desambiguación pertinente en el contexto de la recepción en L2 y traducción de L2 a L1 y la selección y uso del equivalente en el contexto de la producción y traducción en la L2. El objetivo de esta aportación es poner de manifiesto la necesidad de identificar adecuadamente por parte del usuario de un recurso lexicográfico bilingüe la información lexicológica pertinente a la forma, contenido y uso de los lemas consultados tanto en la situación de recepción y producción en L2 como en el contexto de la traducción de y a L2.
Gesprochene Alltagssprache
(2017)
Eine am Gebrauch orientierte Sprachbeschreibung ist auch in der Grammatik mit sprachlicher Variation und mit Veränderungen des Gebrauchs konfrontiert. Anhand dreier Beispiele aus dem zentralen Bereich der deutschen Grammatik soll gezeigt werden, dass sich in der Variation, die man dort beobachtet, eine funktionale Nutzung des vorhandenen Inventars darstellt. Diese funktionale Nutzung ist dadurch gekennzeichnet, dass seltenere und daher synchron auffälligere Konstruktionen für spezifische Funktionen genutzt werden. Der Genitiv ist tatsächlich aus formalen Gründen seiner Morphologie auffällig. Er ist nicht vom Dativ unterschieden beim Femininum, doppelt markiert bei den starken Maskulina und Neutra und nur beschränkt bildbar im Plural. Diese Eigenheiten beschränken seine Nutzung als normaler Kasus. Gerade aber die auffällige Markierung mit dem Element {-(e)s} hat dazu geführt, dass der Genitiv nun zur Anzeige genereller Abhängigkeit genutzt wird, und zwar als Genitivattribut wie als unmarkierte Form bei einer Gruppe von Präpositionen (wie ‚dank‘, ‚trotz‘, ‚wegen‘, ‚entlang‘ usw.). Beim zweiten Fall, dem Verhältnis von starken und schwachen Verben, zeigt sich, dass der Übergang von der starken zur schwachen Flexion, die erkennbar den Normalfall im morphologischen System darstellt, gerade häufige und in ihrer Bedeutung grundlegende Verben (wie ‚geben‘, ‚nehmen‘ usw.) nicht betrifft, so dass die starke Flexion als Markierung für solch einen zentralen Status gelten kann. Der dritte Punkt hängt damit zusammen: das Ausgreifen der ‚würde‘-Form als Konjunktiv II (auch bei gut markierten starken Verben) ist so im größeren Zusammenhang der Nutzung von Klammerformen zu sehen.
Ende des 18. Jahrhunderts ist eine Form der deutschen Sprache ausgebildet und verbreitet, die für die verschiedenartigen Anforderungen einer bürgerlich geprägten öffentlichen Diskurswelt brauchbar ist. Sie lässt sich in einem historischen Konzept „Standardsprache“ deuten. In diesem Konzept werden verschiedene Ausgleichs- und Differenzierungsbemühungen – und -richtungen – des 17. Jahrhunderts aufgehoben, die entwickelten Möglichkeiten neu funktionalisiert. Von dieser Basis aus gesehen ist in der Gegenwart die kommunikative Praxis mit Anspruch auf öffentliche Geltung stark von Variation geprägt. Durch die dabei auftretenden Muster wird allmählich ein Modell kontextbezogener Variabilität etabliert, bei dem so etwas wie „Standard“ in einer Bandbreite von Konstellationen der Interaktion, sprachlichen Modellen und Ausdrucksweisen besteht. Um dieses normative Gefüge modellieren zu können, muss man, wie beispielhaft angedeutet wird, zunächst die Tatbestande und Bedingungen der Varianten genau untersuchen.
The modernization of society and changing norms are reflected in linguistic developments. This leads to an enlargement of vocabulary as well as to the emergence of new ways of linguistic acting. In grammar, in addition to longer-term developments, the current changes in the media situation play an important role.
Was macht Stickel?
(2017)
Lexikalische Dekomposition
(2017)
In the lexicon of pidgin and creole languages we can see an important part of these languages’ history of origin and of language contact. The current paper deals with the lexical sources of Tok Pisin and, more specifically, with words of German origin found in this language. During the period of German colonial domination of New Guinea and a number of insular territories in the Pacific (ca. 1885–1915), German words entered the emerging Tok Pisin lexicon. Based on a broad range of lexical and lexicographic data from the early 20th century up until today, we investigate the actual or presumed German origin of a number of Tok Pisin words and trace different lexical processes of integration that are linked to various, often though not always colonially determined, contact settings and sociocultural interactions.
Einleitung
(2017)
Das Handbuch Europäische Sprachkritik Online (HESO) liefert eine vergleichende Perspektive auf Sprachkritik in europäischen Sprachkulturen. Das Handbuch ist eine periodische und mehrsprachige Online-Publikation. Zu ausgewählten Konzepten der Sprachkritik werden sukzessiv enzyklopädische Artikel veröffentlicht, die ein sprachkritisches Schlüsselkonzept betreffen und die für die europäische Perspektive von kultureller Bedeutung sind. Das Ziel ist demnach, eine Konzeptgeschichte der europäischen Sprachkritik zu präsentieren. Zum einen liefert das Handbuch einen spezifischen Blick auf die jeweiligen Sprachkulturen. Zum anderen werden diese vergleichend in den Blick genommen.
Sprachnormen und Sprachnormierungsprozesse hängen unmittelbar mit Sprachreflexion und Sprachkritik zusammen. Entweder werden Sprachnormen und Sprachnormierungsprozesse linguistisch be- schrieben oder linguistisch / laienlinguistisch bewertet. In der linguistisch begründeten Sprachkritik der 1980er Jahre wird unter dem Paradigma der Sprachnormenkritik der Prozess der Sprachnormierung beobachtet und beschrieben. Sprachnormen und Sprachnormierungsprozesse werden in sprachhistorischer Perspektive aber bereits viel früher in intellektuel- len Kreisen reflektiert und kritisiert. Auch in gegenwärtiger Perspektive sind im laienlinguistischen Bereich Bestrebungen zu verzeichnen, mittels Sprachkritik Einfluss auf Sprachnormen und Sprachnormierungsprozesse zu nehmen. Seit den 2000er Jahren setzen sich wiederum Linguistinnen und Linguisten zum Ziel, Sprachnormen und Sprachnormierung zunächst zu beschreiben und dann nach linguistischen Kriterien zu bewerten. In dem Artikel wird ein Sprachnormenkritikbegriff vertreten, der auf einem Kontinuum von eher Ausdrucksmöglichkeiten abwägenden bis hin zu eindeutig positionsbezogenen Sprachbetrachtungen zu verorten ist, und sowohl die linguistische als auch die laienlinguistische Perspektive mit einbezieht. Unter Sprachnormenkritik wird hier also eine Reflexion der Sprachnormen und Sprachnormierungsprozesse verstanden, in der die Kriterien explizit (eher beschreibend oder eher bewertend) formuliert oder implizit praktiziert werden.
Der Artikel beschäftigt sich mit einem ganz spezifischen Blick auf Sprachnormen: Ausgehend von der Sprachnormenkritik der Germanistik fokussiert der Artikel die sozio-politischen Implikationen sprachlicher Normfragen. Der Terminus Sprachnormenkritik hat weder im Englischen noch im Französischen oder Italienischen und auch nicht im Kroatischen eine ausdrucksseitige Entsprechung. Das Konzept der ›Sprachnormenkritik‹ bzw. bestimmte Teilkomponenten sind dessen ungeachtet im Englischen, Französischen, Italienischen und Kroatischen seit Jahrhunderten in der Diskussion. Aus vergleichend europäischer Perspektive ist besonders interessant, dass nicht in jedem nationalsprachlichen Diskurs über Sprachnormen der unmittelbare Zusammenhang von sprachlichen Normen einerseits und sozio-ökonomischer Macht bzw. politischer Handlungsfähigkeit andererseits als korrelierende Phänomene diskutiert wird – und genau dies ist der Kern der ursprünglichen Sprachnormenkritik im Deutschen. Besonders eindrücklich lässt sich der politische Charakter der Sprachnormenkritik im Kroatischen demonstrieren. In den 1960er Jahren ist die Sprachnormenkritik im Kroatischen nicht nur eine Kritik, die degressiv erscheinende Zustände aufzudecken versucht, sondern vor allem eine progressive Kritik, die als Vorreiter der politischen Bewegung für die Unabhängigkeit Kroatiens angesehen werden kann.
Ausgehend von einer alten These des Essayisten und Literaturhistorikers Giulio Natali (1917), die eine grundsätzliche „antideutsche Haltung" der Italiener postulierte, wird in diesem Beitrag zuerst der Frage nachgegangen, ob es in Italien historisch begründete, herkömmliche Stereotype gibt, die das heutige Deutschlandbild zu beeinflussen vermögen (Kap. 1). Den Hauptteil dieser Arbeit bildet ein Exkurs über historisch belegte Meinungen der Italiener im Laufe der Geschichte der deutsch-italienischen Beziehungen (Kap. 2). Der Exkurs zielt darauf, ein besseres Verständnis für die heutige Situation zu gewinnen. Diese wird schließlich an den Ergebnissen einer kleinen Umfrage dargestellt, die zeigt, wie die jüngere „Erasmus"-Generation von heute, die sich in Italien für ein Deutschstudium entschieden hat, über die deutsche Sprache denkt (Kap. 3). Die Untersuchung ist u.a. durch die Vorstellung motiviert, dass Einstellungen über die deutsche Sprache Einfluss darauf haben, ob etwa ein Germanistik- oder DaF-Studium aufgenommen wird. Demgemäß könnte man sich die Frage stellen, woher bei jungen Italiener/inne/n der Bedarf entstehen soll, eine - wie Boccaccio sagte - „abscheuliche Sprache" zu lernen, welche vielleicht für Tiere und Teufel besser geeignet ist als für Menschen.
This paper discusses the categorial status of nominalized adjectives, which share formal properties with both adjectives and nouns, in present-day German. Based on a corpus study conducted in the Deutsches Referenzkorpus (DeReKo), it is shown that different types of deadjectival nouns do not behave uniformly with respect to pronoun choice in attributive relative clauses. While nominalized positives (in the neuter gender) preferably combine with the regular relative pronoun das ‘that’, superlatives strongly favor relativization by means of the corresponding wh-form was ‘what’. The contrasts are taken to reflect structural differences in the internal make-up of the respective categories that give rise to different degrees of ‘nouniness’.
Language Change
(2017)
The present chapter outlines a research program for historical linguistics based on the idea that the object of the formal study of language change should be defined as grammar change, that is, a set of discrete differences between the target grammar and the grammar acquired by the learner (Hale 2007). This approach is shown to offer new answers to some classical problems of historical linguistics (Weinreich et al. 1968), concerning, specifically, the actuation of changes and the observation that the transition from one historical state to another proceeds gradually. It is argued that learners are highly sensitive to small fluctuations in the linguistic input they receive, making change inevitable, while the impression of gradualness is linked to independent factors (diffusion in a speech community, and grammar competition). Special attention is paid to grammaticalization phenomena, which offer insights into the nature of functional categories, the building blocks of clause structure.
In diesem Beitrag werden zunächst zwei Perspektiven auf sprachliche Variabilität diskutiert: Im Fokus stehen zum einen die Variation der Form und zum anderen die Variation der Funktion. Im Anschluss daran werden im Bereich der formalen Variation zwei Fälle eingehender untersucht: die Acl-Konstruktion mit ihren Kovarianten und die Relativsatzeinleitung mittels das oder was. Dabei wird der zuvor modellhaft entworfene methodische Rahmen auf die differenzierte Praxis linguistischer Forschung angewendet und das heuristische Potenzial des Prinzips der „Variationsreduktion“ genauer illustriert.
Schülerduden Grammatik
(2017)
Das Deutsche gehört zu den besonders gut erforschten Sprachen der Welt. Neue Erkenntnisse über seine Grammatik sind am ehesten durch eine Ausweitung der Perspektive über den traditionellen Ansatz hinaus zu erwarten. Im vorliegenden Handbuch zur Nominalgrammatik geschieht dies auf dem Weg des Sprachvergleichs mit anderen europäischen Sprachen, in erster Linie den Kontrastsprachen Englisch, Französisch, Polnisch und Ungarisch. Die Grammatik schließt an die typologische Forschung an und orientiert den Vergleich an allgemeinen semantisch-pragmatischen Funktionsbereichen, so genannten ,funktionalen Domänen‘ wie Referenz, Identifikation, Modifikation. Behandelt werden nominale Wortklassen (wie Substantiv, Adjektiv, Pronomen), das nominale Klassifikationssystem (mit Genus, Numerus und Kasus), die nominale Flexionsmorphologie sowie nominale Syntagmen mit dem Schwerpunkt der NP-Syntax. Der Vergleich stellt die Optionen im Vergleichsspektrum heraus, von denen das Deutsche Gebrauch macht, zeigt aber auch, welche Möglichkeiten nicht realisiert sind, und lässt somit das typologische Profil dieser Sprache im Detail erkennen.
Das Deutsche gehört zu den besonders gut erforschten Sprachen der Welt. Neue Erkenntnisse über seine Grammatik sind am ehesten durch eine Ausweitung der Perspektive über den traditionellen Ansatz hinaus zu erwarten. Im vorliegenden Handbuch zur Nominalgrammatik geschieht dies auf dem Weg des Sprachvergleichs mit anderen europäischen Sprachen, in erster Linie den Kontrastsprachen Englisch, Französisch, Polnisch und Ungarisch. Die Grammatik schließt an die typologische Forschung an und orientiert den Vergleich an allgemeinen semantisch-pragmatischen Funktionsbereichen, so genannten ,funktionalen Domänen‘ wie Referenz, Identifikation, Modifikation. Behandelt werden nominale Wortklassen (wie Substantiv, Adjektiv, Pronomen), das nominale Klassifikationssystem (mit Genus, Numerus und Kasus), die nominale Flexionsmorphologie sowie nominale Syntagmen mit dem Schwerpunkt der NP-Syntax. Der Vergleich stellt die Optionen im Vergleichsspektrum heraus, von denen das Deutsche Gebrauch macht, zeigt aber auch, welche Möglichkeiten nicht realisiert sind, und lässt somit das typologische Profil dieser Sprache im Detail erkennen.
Standardisierte statistische Auswertungen von Korpusdaten im Projekt "Korpusgrammatik" (KoGra-R)
(2017)
Wir zeigen anhand dreier Beispielanalysen, wie das im IDS-Projekt „Korpusgrammatik“ entwickelte Auswertungstool KoGra-R in der quantitativlinguistischen Forschung zur Analyse von Frequenzdaten auf mehreren linguistischen Ebenen eingesetzt werden kann. Wir demonstrieren dies anhand regionaler Präferenzen bei der Selektion von Genitivallomorphen, der Variation von Relativpronomina sowie der Verwendung bestimmter anaphorischer Ausdrucke in Abhängigkeit davon, ob sich das Antezedens im gleichen Satz befindet oder nicht. Die in KoGra-R implementierten statistischen Tests sind für jede dieser Ebenen geeignet, um mindestens einen ersten statistisch abgesicherten Eindruck der Datenlage zu erlangen.
This paper explores the syntax of agreement in Insular Scandinavian in copular clauses with two potential goals for agreement. Data from three production experiments - one in Faroese and two in Icelandic - establish several new facts. First, in both languages agreement with the second nominal (DP2) is possible/preferred. Second, there is considerable variation (both within and between languages, and indeed speakers) in the patterns observed. Third, Icelandic shows a surprising pattern of “partial” agreement with DP2 - agreement in number but not person. We discuss the implications for current theorising about agreement, proposing that in these languages, at least, agreement is downwards, and that the available agreement options depend in part on the syntactic position of DPI when agreement is established.
Wir setzen mit diesem Text unsere gemeinsamen Analysen des Zusammenhangs von Gottesdienst und Kirchenraum fort. Methodologisch entwickeln wir mit der sozial-räumlichen Positionierung ein Konzept, bei dem Interaktionsarchitektur-, Sozialtopographie- und Interaktionsraumanalyse zusammenkommen. Es handelt sich um einen ersten systematischen Versuch, fallbasiert das Konzept "Positionierung" zu entmetaphorisieren und es im engsten Wortsinne erstmalig und primär im Raum zu verankern. Das zentrale Argument für die Ent-Metaphorisierung des Konzeptes besteht in der Tatsache, dass bereits lange bevor das erste Wort gesprochen wird, Personen im institutionellen Funktionsraum (hier Kirche) durch die Einnahme bestimmter Positionen soziale Ansprüche stellen und ihre Präsenz sozial aufladen. Es ist zudem empirisch evident, dass in dem von uns analysierten Fall die Beteiligten durch ihr Positionierungsverhalten (und zwar ausschließlich darüber!) neben der gemeinsamen verbalen Bearbeitung thematisch-pragmatischer Relevanzen jeweils eigene und durchaus konkurrenzielle Ziele auf der "Beziehungsebene" verfolgen.
Multinomial processing tree (MPT) models are a class of measurement models that account for categorical data by assuming a finite number of underlying cognitive processes. Traditionally, data are aggregated across participants and analyzed under the assumption of independently and identically distributed observations. Hierarchical Bayesian extensions of MPT models explicitly account for participant heterogeneity by assuming that the individual parameters follow a continuous hierarchical distribution.We provide an accessible introduction to hierarchical MPT modeling and present the user-friendly and comprehensive R package TreeBUGS, which implements the two most important hierarchical MPT approaches for participant heterogeneity—the beta-MPT approach (Smith & Batchelder, Journal of Mathematical Psychology 54:167-183, 2010) and the latent-trait MPT approach (Klauer, Psychometrika 75:70-98, 2010). TreeBUGS reads standard MPT model files and obtains Markov-chain Monte Carlo samples that approximate the posterior distribution. The functionality and output are tailored to the specific needs of MPT modelers and provide tests for the homogeneity of items and participants, individual and group parameter estimates, fit statistics, and within- and between-subjects comparisons, as well as goodness-of-fit and summary plots. We also propose and implement novel statistical extensions to include continuous and discrete predictors (as either fixed or random effects) in the latent-trait MPT model.
Modeling the properties of German phrasal compounds within a usage-based constructional approach
(2017)
This paper discusses phrasal compounds in German (e.g.“Man-muss-doch-überalles-reden-können”-Credo, ‘one-should-be-able-to-talk-about-everything motto’). It provides the first empirically based investigation and description of this wordformation type within the theoretical framework of construction grammar. While phrasal compounds pose a problem for “traditional” generative approaches, I argue that a usage-based constructional model (e.g. Langacker 1987; Goldberg 2006) which takes into consideration aspects of frequency provides a suitable approach to modeling and explaining their properties. For this purpose, a large inventory of phrasal compounds was extracted from the German Reference Corpus (DeReKo) and modeled as pairings of form and meaning at different levels of specificity and abstractness within a bottom-up process.
Overall, this paper not only presents a new and original approach to phrasal compounds, but also offers interesting perspectives for dealing with composition in general.
Analepses with topic-drop are frequent structures in German interaction. While hitherto the focus on analepses was a rather syntactic one, this paper deals with analeptic structures from a semantic perspective. It particularly concentrates on the semantic relations between the referents of the analepses and the prior interactional context. This analysis shows that even for rather simple analepses which just omit a constituent from the prior utterance, conceptual processes are more decisive for its interpretation than syntactic features of the antecedent constituents. This is even more the case for complex analepses that are only indirectly linked to the prior context, and for the interpretation of which hearers need to draw inferences. The paper argues that theoretical approaches like Conversation Analysis and Interactional Linguistics can profit from adopting a semantic and conceptual perspective for the interpretation of interactional structures.
Der vorliegende Beitrag beschäftigt sich mit ICH WEIß NICHT und der Frage danach, ob einige der Verwendungen als Diskursmarker bezeichnet werden können oder nicht. Es wird zunächst ein Überblick über die Kriterien gegeben, die in der interaktionalen Linguistik für die Diskursmarkerdefinition diskutiert wurden. Dabei wird versucht, definitorische Kriterien von empirischen Befunden abzugrenzen. Es folgt eine Analyse verschiedener Verwendungen von ICH WEIß NICHT. Ein Schwerpunkt liegt dabei auf Verwendungen als epistemischer und pragmatischer Marker, die sowohl mit prospektiver Orientierung als auch mit retrospektiver Orientierung vorkommen. Abschließend wird der Unterschied zwischen definitorischen und empirischen Kriterien für die Diskursmarkerdefinition systematisiert. Auf dieser Basis argumentieren wir dafür, dass alle Verwendungen von ICH WEIß NICHT, die diskursfunktionale Eigenschaften haben und syntaktisch desintegriert sind, Diskursmarkerverwendungen sind. Einige davon sind prototypischer, während andere Fälle eher marginal sind, da sie einige Merkmale, die die meisten Diskursmarker kennzeichnen, nicht aufweisen.
Vorwort
(2017)
The German Historical Institute Washington (GHI) is in the development phase of German History Digital (GH-D), a transatlantic digital initiative to meet the scholarly needs of historians and their students facing new historiographical and technological challenges. In the proposed paper we will discuss the research goals, methodology, prototyping, and development strategy of GH-D as infrastructure to facilitate transnational historical knowledge co-creation for the large community of researchers and students already relying on digital resources of the GHI and for the growing constituency of citizen scholars.
We use a convolutional neural network to perform authorship identification on a very homogeneous dataset of scientific publications. In order to investigate the effect of domain biases, we obscure words below a certain frequency threshold, retaining only their POS-tags. This procedure improves test performance due to better generalization on unseen data. Using our method, we are able to predict the authors of scientific publications in the same discipline at levels well above chance.
Körperliche wie seelische Gesundheit ist ein hohes individuelles und gesellschaftliches Gut und Grundrecht. Häufig wird die Gesundheit durch ihr Gegenteil, d. h. in der Verständigung über Krankheit, thematisiert. Der gesellschaftliche Austausch über Krankheiten, Gesundheitsrisiken und Behandlungsmethoden ist untrennbar mit Sprache verknüpft (Busch/Spranz-Fogasy 2015); die Sprache ist „[…] das zentrale Medium, um medizinisches Wissen herzustellen, zu systematisieren, zu tradieren und auszutauschen.“ (Busch/Spranz-Fogasy 2015: 336). Ausgehend von dieser Prämisse wurde das Netzwerk „Linguistik und Medizin“ gegründet, um die Forschungstätigkeiten der verschiedenen linguistischen Disziplinen, die an den Verbindungslinien von „Sprache – Wissen – Medizin“ arbeiten, zu bündeln: Forschungsdesiderate sollen kooperierend bearbeitet und die interdisziplinäre Anschlussfähigkeit zwischen linguistischen und medizinischen, psychiatrischen sowie salutogenetischen Forschungsbereichen auf- und ausgebaut werden.
Modalverben gehören zu den hochfrequenten Verben des Deutschen und weisen in der gesprochenen Sprache eine hohe grammatische, semantische und funktionale Flexibilität auf. Die Studie befasst sich aus interaktionslinguistischer Sicht mit dem Verwendungsspektrum von Konstruktionen, in denen Modalverben “absolut”, das heißt hier: ohne infinites Vollverb, gebraucht werden. Es wird untersucht, welche Bedeutungen die Modalverben in Interaktionen haben bzw. welche Faktoren ihre Interpretation beeinflussen und inwiefern die jeweiligen Konstruktionen für spezifische sprachliche Handlungen und in speziellen interaktiven Kontexten verwendet werden.
Als entscheidend für die Analyse zeigen sich neben der signifikanten Medialitätsdifferenz auch Interaktivität, Online-Produktion und Gattungs- bzw. Registermerkmale wie Informalität. Die Studie demonstriert außerdem, dass die Modalverbkonstruktionen sehr unterschiedliche Grade von Schematizität, Spezifizität und (Nicht-) Kompositionalität aufweisen.
The possibilities of re-use and archiving of spoken and written corpora are affected by personality rights (depending on legal tradition also called: the right of publicity), copyright law and data protection / privacy laws. These recommendations include information about legal aspects which should be considered while creating corpora to ensure the greatest archivability and re-usability possible in compliance with current laws.
The information compiled here shall serve researchers who plan to create corpora or who are involved in evaluation of such measures as a guideline. This information is not exhaustive or to be considered as legal advice. Researchers should consult institutional legal departments and management before making legally relevant decisions. That said, further legal expertise should be sought if possible as early as project planning phases.
Einleitung
(2017)
The Google Ngram Corpora seem to offer a unique opportunity to study linguistic and cultural change in quantitative terms. To avoid breaking any copyright laws, the data sets are not accompanied by any metadata regarding the texts the corpora consist of. Some of the consequences of this strategy are analyzed in this article. I chose the example of measuring censorship in Nazi Germany, which received widespread attention and was published in a paper that accompanied the release of the Google Ngram data (Michel et al. (2010): Quantitative analysis of culture using millions of digitized books. Science, 331(6014): 176–82). I show that without proper metadata, it is unclear whether the results actually reflect any kind of censorship at all. Collectively, the findings imply that observed changes in this period of time can only be linked directly to World War II to a certain extent. Therefore, instead of speaking about general linguistic or cultural change, it seems to be preferable to explicitly restrict the results to linguistic or cultural change ‘as it is represented in the Google Ngram data’. On a more general level, the analysis demonstrates the importance of metadata, the availability of which is not just a nice add-on, but a powerful source of information for the digital humanities.
Recently, a claim was made, on the basis of the German Google Books 1-gram corpus (Michel et al., Quantitative Analysis of Culture Using Millions of Digitized Books. Science 2010; 331: 176–82), that there was a linear relationship between six non-technical non-Nazi words and three ‘explicitly Nazi words’ in times of World War II (Caruana-Galizia. 2015. Politics and the German language: Testing Orwell’s hypothesis using the Google N-Gram corpus. Digital Scholarship in the Humanities [Online]. http://dsh.oxfordjournals.org/cgi/doi/10.1093/llc/fqv011 (accessed 15 April 2015)). Here, I try to show that apparent relationships like this are the result of misspecified models that do not take into account the temporal aspect of time-series data. The main point of this article is to demonstrate why such analyses run the risk of incorrect statistical inference, where potential effects are both meaningless and can potentially lead to wrong conclusions.
In the first volume of Corpus Linguistics and Linguistic Theory, Gries (2005. Null-hypothesis significance testing of word frequencies: A follow-up on Kilgarriff. Corpus Linguistics and Linguistic Theory 1(2). doi:10.1515/ cllt.2005.1.2.277. http://www.degruyter.com/view/j/cllt.2005.1.issue-2/cllt.2005. 1.2.277/cllt.2005.1.2.277.xml: 285) asked whether corpus linguists should abandon null-hypothesis significance testing. In this paper, I want to revive this discussion by defending the argument that the assumptions that allow inferences about a given population – in this case about the studied languages – based on results observed in a sample – in this case a collection of naturally occurring language data – are not fulfilled. As a consequence, corpus linguists should indeed abandon null-hypothesis significance testing.
In this paper, an exploratory data-driven method is presented that extracts word-types from diachronic corpora that have undergone the most pronounced change in frequency of occurrence in a given period of time. Combined with statistical methods from time series analysis, the method is able to find meaningful patterns and relationships in diachronic corpora, an idea that is still uncommon in linguistics. This indicates that the approach can facilitate an improved understanding of diachronic processes.