Refine
Year of publication
- 2016 (347) (remove)
Document Type
- Part of a Book (136)
- Article (104)
- Conference Proceeding (51)
- Book (33)
- Part of Periodical (12)
- Working Paper (5)
- Doctoral Thesis (3)
- Other (2)
- Preprint (1)
Keywords
- Deutsch (113)
- Korpus <Linguistik> (47)
- Gesprochene Sprache (31)
- Konversationsanalyse (24)
- Wörterbuch (22)
- Interaktion (20)
- Computerunterstützte Lexikographie (19)
- Linguistik (17)
- Diskursanalyse (16)
- Kommunikation (15)
Publicationstate
- Veröffentlichungsversion (169)
- Zweitveröffentlichung (35)
- Postprint (17)
- Erstveröffentlichung (1)
Reviewstate
Publisher
- Institut für Deutsche Sprache (45)
- de Gruyter (34)
- De Gruyter (23)
- Winter (19)
- European Language Resources Association (ELRA) (13)
- Narr Francke Attempto (12)
- Retorika (8)
- Peter Lang (7)
- Linssen Druckcenter (6)
- Association for Computational Linguistics (5)
Die Preußische Akademie der Wissenschaften zu Berlin hat im Jahr 1906 auf Bitte der deutschen Regierung die Verantwortung für die Arbeiten zur Vollendung des Deutschen Wörterbuchs von Jacob Grimm und Wilhelm Grimm übernommen. Im Jahr 1929/30 hat sie die Berliner Arbeitsstelle gegründet. Nach dem Zweiten Weltkrieg wurde dieses lexikographische Grundlagenwerk in den Jahrzehnten der Spaltung Deutschlands, aber in enger Gemeinschaft einer Berliner und einer Göttinger Arbeitsstelle zum Abschluss gebracht. Schon in den fünfziger Jahren entschlossen sich die Akademien in Berlin und Göttingen, „zunächst“ die völlige Neubearbeitung der ältesten Teile des Werks, die die Brüder Grimm zwischen 1852 und 1863 noch selbst erarbeitet hatten, vorzunehmen. Diese Neubearbeitung ist inzwischen nahezu abgeschlossen. Umso deutlicher zeigt sich aber nun, dass auch die übrigen Teile dringend der Neubearbeitung bedürfen. Das Jahrhundertwerk der Brüder Grimm, ihre wichtigste gemeinsame sprachwissenschaftliche Leistung, heute in der ganzen Welt täglich von Tausenden im Internet benutzt, Fundament der gesamten neueren deutschen Wortforschung, kann seine Aufgabe nur erfüllen, wenn es nicht als Museumsstück bewundert, sondern in gründlich erneuerter Form als aktuelles Auskunftsmittel fortgeführt wird. In dieser Situation war die Schließung der Berliner Arbeitsstelle im Dezember 2012 das falsche Signal.
Having found their way onto the computer screens, comics soon branched into webcomics. These kept a lot of the characteristics of print comic books, but gradually adapted new unexplored modes of representation. Three relatively new ‘enhancements’ to the medium of comics are presented in this article: webcomics enhanced through the use of the infinite canvas, as proposed by Scott McCloud, those enhanced with videos and/or sound, and lastly those enhanced with interactive and ludic elements. All of the mentioned push the medium of comics into new waters, and by doing so they add new layers of meaning and modify their structure based on the make-up of the implemented features. Infinite canvas manages to lift some limitations of print comics without changing the overall feel too drastically, while animated and voiced webcomics, as well as interactive or game comics, have a much higher inclination to transgress into domains of other media and transform themselves in order to accommodate and integrate these novel foreign features.
The present paper reports the first results of the compilation and annotation of a blog corpus for German. The main aim of the project is the representation of the blog discourse structure and relations between its elements (blog posts, comments) and participants (bloggers, commentators). The data included in the corpus were manually collected from the scientific blog portal SciLogs. The feature catalogue for the corpus annotation includes three types of information which is directly or indirectly provided in the blog or can be construed by means of statistical analysis or computational tools. At this point, only directly available information (e.g., title of the blog post, name of the blogger etc.) has been annotated. We believe, our blog corpus can be of interest for the general study of blog structure or related research questions as well as for the development of NLP methods and techniques (e.g. for authorship detection).
The present paper reports the first results of the compilation and annotation of a blog corpus for German. The main aim of the project is the representation of the blog discourse structure and relations between its elements (blog posts, comments) and participants (bloggers, commentators). The data included in the corpus were manually collected from the scientific blog portal SciLogs. The feature catalogue for the corpus annotation includes three types of information which is directly or indirectly provided in the blog or can be construed by means of statistical analysis or computational tools. At this point, only directly available information (e.g. title of the blog post, name of the blogger etc.) has been annotated. We believe, our blog corpus can be of interest for the general study of blog structure or related research questions as well as for the development of NLP methods and techniques (e.g. for authorship detection).
Medialität und Sozialität sind grundlegende Kategorien einer medienlinguistischen Perspektive auf Sprache und Kommunikation und sollen im Folgenden die Ausgangspunkte einer Auseinandersetzung mit der Operativität digitaler Schriftzeichen bilden. Nach einer kurzen Einleitung wird dazu der Operativitätsbegriff erläutert und dieser dann anhand eines Postings im Microblog Twitter exemplifiziert.
Many applications in Natural Language Processing require a semantic analysis of sentences in terms of truth-conditional representations, often with specific desiderata in terms of which information needs to be included in the semantic analysis. However, there are only very few tools that allow such an analysis. We investigate the representations of an automatic analysis pipeline of the C&C parser and Boxer to determine whether Boxer’s analyses in form of Discourse Representation Structure can be successfully converted into a more surface oriented event semantic representation, which will serve as input for a fusion algorithm for fusing hard and soft information. We use a data set of synthetic counter intelligence messages for our investigation. We provide a basic pipeline for conversion and subsequently discuss areas in which ambiguities and differences between the semantic representations present challenges in the conversion process.
Brown clustering has been used to help increase parsing performance for morphologically rich languages. However, much of the work has focused on using clustering techniques to replace terminal nodes or as a feature for parsing. Instead, we choose to examine how effectively Brown clustering is for unlexicalized parsing by creating data-driven POS tagsets which are then used with the Berkeley parser. We investigate cluster sizes as well as on what information (e.g. words vs. lemmas) clustering will yield the best parser performance. Our results approach the current state of the art results for the German T¨uBa-D/Z treebank when using parser internal tagging.
We present the IUCL system, based on supervised learning, for the shared task on stance detection. Our official submission, the random forest model, reaches a score of 63.60, and is ranked 6th out of 19 teams. We also use gradient boosting decision trees and SVM and merge all classifiers into an ensemble method. Our analysis shows that random forest is good at retrieving minority classes and gradient boosting majority classes. The strengths of different classifiers wrt. precision and recall complement each other in the ensemble.
Dieser Beitrag stellt nach einer kurzen allgemeinen Einführung die Datenbank für Gesprochenes Deutsch (DGD) und das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) als Instrumente speziell für gesprächsanalytisches Arbeiten vor. Anhand des Beispiels sprich als Diskursmarker für Reformulierungen werden Schritt für Schritt die Ressourcen und Tools für systematische korpus- und datenbankgesteuerte Recherchen illustriert: Nutzungsmöglichkeiten der Token-, Kontext-, Metadaten- und Positionssuche werden gezeigt, jeweils in Bezug auf und im wechselseitigen Verhältnis mit qualitativen Fallanalysen, auch mit Belegannotationen nach analyserelevanten (strukturellen und funktionalen) Kategorien. Schließlich wird das heißt als weiterer Reformulierungsindikator für eine vergleichende Analyse herangezogen. Dieser Beitrag stellt eine detailliertere Ausarbeitung einer kürzeren, eher technisch-didaktischen Online-Handreichung (Kaiser/ Schmidt 2016) zu diesem Thema dar, und hat einen stärker inhaltlich-analytischen Fokus.
Weihnachten erzählen
(2016)
Editorial
(2016)
Co-development of action, conceptualization and social interaction mutually scaffold and support each other within a virtuous feedback cycle in the development of human language in children. Within this framework, the purpose of this article is to bring together diverse but complementary accounts of research methods that jointly contribute to our understanding of cognitive development and in particular, language acquisition in robots. Thus, we include research pertaining to developmental robotics, cognitive science, psychology, linguistics and neuroscience, as well as practical computer science and engineering. The different studies are not at this stage all connected into a cohesive whole; rather, they are presented to illuminate the need for multiple different approaches that complement each other in the pursuit of understanding cognitive development in robots. Extensive experiments involving the humanoid robot iCub are reported, while human learning relevant to developmental robotics has also contributed useful results.
Disparate approaches are brought together via common underlying design principles. Without claiming to model human language acquisition directly, we are nonetheless inspired by analogous development in humans and consequently, our investigations include the parallel co-development of action, conceptualization and social interaction. Though these different approaches need to ultimately be integrated into a coherent, unified body of knowledge, progress is currently also being made by pursuing individual methods.
Deutsches Fremdwörterbuch
(2016)
Konnexion in argumentativen Texten. Gebrauchsunterschiede in Deutsch als L2 vs. Deutsch als L1
(2016)
Für die Kodierung interpropositionaler semantischer Relationen wie Additivität, Adversativität, Kausalität etc. steht im Deutschen wie in vielen anderen Sprachen ein reichhaltiges Inventar von Konnektoren unterschiedlicher syntaktischer Kategorien zur Verfügung. Einige semantische Relationen müssen jedoch nicht explizit kodiert werden, da sie auf der Basis übereinzelsprachlicher Erwartungen an „normale“ Sachverhaltszusammenhänge aus dem Kontext erschließbar sind. Ob diese Relationen dann auch von Schreibern ausbuchstabiert werden, ist einzelsprach-spezifisch unterschiedlich. Der Beitrag untersucht vor diesem Hintergrund die Kodierung interpropositionaler Relationen bei Lernern des Deutschen als Fremdsprache. Die Analyse eines Lernerkorpus mit Essays fortgeschrittener Deutschlerner aus Schweden, China und Weißrussland (KobaltDaF-Korpus) und eines muttersprachlichen Kontrollkorpus zeigt, dass Lerner von den Mustern der Muttersprachler quantitativ und qualitativ abweichen. Der Beitrag beschreibt diese Abweichungen und diskutiert mögliche Erklärungen.
Journal for language technology and computational linguistics. Corpus linguistic software tools
(2016)
With the growing availability and importance of (large) corpora in all fields of linguistics, the role of software tools is gradually moving from useful, possibly intelligent informationtechnological “helpers” towards scientific instruments that are as integral parts of the research process as data, methodology and interpretations. Both aspects are present in this special issue of JLCL on corpus linguistic software tools.
This paper is about the workflow for construction and dissemination of FOLK (Forschungs - und Lehrkorpus Gesprochenes Deutsch – Research and Teaching Corpus of Spoken German), a large corpus of authentic spoken interaction data, recorded on audio and video. Section 2 describes in detail the tools used in the individual steps of transcription, anonymization, orthographic normalization, lemmatization and POS tagging of the data, as well as some utilities used for corpus management. Section 3 deals with the DGD (Datenbank für Gesprochenes Deutsch - Database of Spoken German) as a tool for distributing completed data sets and making them available for qualitative and quantitative analysis. In section 4, some plans for further development are sketched.
Der Beitrag stellt ein interdisziplinär durchgeführtes Lehr-Lern-Projekt als Best-Practice-Beispiel vor. Ziel des vom Lehrinnovationspool der Universität Passau geförderten Projekts war es, Studierende der Sprachwissenschaft und Geographie sowie Schülerinnen und Schüler der FOS/BOS an digitales, selbstständiges und forschendes Lernen im thematischen Kontext der „Sprachdynamik im deutsch-österreichischen Grenzraum“ heranzuführen. Der Aufsatz zeigt, wie Studierenden verschiedene Rollen als Lernende, Forschende und auch als Lehrende einnehmen, indem sie die Schülerinnen und Schüler als Lernpaten bei der Planung, Durchführung und Auswertung von gemeinsamen Forschungsvorhaben unterstützen. Exemplarisch wird ein Projekt für Schülerinnen und Schüler näher vorgestellt. Weiterhin reflektiert der Beitrag das Lehrhandeln der Dozierenden.
Bericht über die 19. Arbeitstagung zur Gesprächsforschung vom 16. bis 18. März 2016 in Mannheim
(2016)
Dependenzrelation
(2016)
Dependens
(2016)
zentripetal
(2016)
Plexus
(2016)
Regens
(2016)
Nektion
(2016)
Nexus
(2016)
Sprachkritik
(2016)
The article investigates the ways in which organic-medical metaphors were used to set the boundary of discourse between the economy and politics. The successful establishment of organic-medical metaphors for the economy is mainly explained by their connectivity to different political views. Concepts such as ‘Wirtschaftsleben’ or perceptions of the economy as an ‘organism’ laid the foundation for diagnosing sick or healthy conditions. From the end of the 19th to beyond the mid-20th century typical statements illustrate that the use of such metaphors supported the naturalization and stabilization of the boundary-setting discourse, insofar as it seemed natural that the relation between the two spheres should be formulated in terms of health and disease. Within liberal economic discourse in particular, politics was on the one hand targeted as a potential cause for economic disease, while on the other, it was claimed that politics had the task of keeping economic forces healthy.
Unterschiede bei Dialektübersetzungen in Abhängigkeit von schriftlichen und mündlichen Stimuli
(2016)
When collecting linguistic data using translation tasks, stimuli can be presented in written or in oral form. In doing so, there is a possibility that a systematic source of error can occur that can be traced back to the selected survey method and which can influence the results of the translation tasks. This contribution investigates whether and to what extent both of the aforementioned survey methods result in divergent results when using translation tasks. For this investigation, 128 informants provided linguistic data; each informant had to translate 25 Wenker sentences from Standard German into either East Swabian, Lechrain or West Central Bavarian dialect, as the case may be. The results show two tendencies. First, written stimuli lead to a slightly higher number of dialectal translation in segmental variables. Second, when oral stimuli are used, syntactic and lexical variables are translated significantly more often in such a manner that they diverge from the template. The results can be explained in terms of varying cognitive processing operations and the constraints of human working memory. When collecting data in the future, these tendencies should be taken into account.
Der vorliegende Aufsatz untersucht die Syntax und Semantik sogenannter Postponierer, d.h. konjunktionaler Konnektoren, die den von ihnen eingeleiteten Nebensatz dem Hauptsatz stets nachstellen. Anhand von sodass und zumal werden die Kerneigenschaften solcher Konnektoren im Deutschen vorgestellt. Am Beispiel der italienischen Konjunktionen cosicché, tanto più che und perché wird diskutiert, ob der Begriff des Postponierers für den Sprachvergleich genutzt werden kann. In einem nächsten Schritt werden die Postponierer des Deutschen unter Beiziehung sprachgeschichtlicher Argumente präziser beschrieben und im Übergangsfeld zwischen Adverbkonnektoren und Subjunktoren verortet. Es zeigt sich, dass die untersuchten Konnektoren sich letztlich sehr unterschiedlich verhalten, sodass es fraglich erscheint, ob ihre Zusammenfassung zu einer gemeinsamen Klasse gerechtfertigt ist.
Ausgehend von fundamentalen Einsichten konversationsanalytischer
Interaktionsforschung zum zentralen Stellenwert, den leibliche Kopräsenz und wechselseitige Wahrnehmung für die Ausgestaltung unserer interaktiven Praktiken besitzen, untersucht der Beitrag deiktische Praktiken in der Kommunikation von Angesicht zu Angesicht. Deixis – verbales und gestisches Zeigen für einen Anderen – kann phylo- und ontogenetisch (Tomasello 2003, 2006, 2008) als privilegierte Schnittstelle zwischen Interaktion und Grammatik, zwischen Sprache, menschlichen Körpern, Objekten, Wahrnehmung und Raum betrachtet werden. Auf der Grundlage eines breit angelegten Videokorpus unterschiedlicher Genres werden deiktische Zeigehandlungen als situierte, körpergebundene Praktiken analysiert und systematisch auf transsituative Gemeinsamkeiten und Unterschiede befragt. Die Ergebnisse der empirischen Analysen zur demonstratio ad oculos (dem Zeigen auf Sichtbares, Bühler 1965) und zur Deixis am Phantasma (dem Zeigen auf Unsichtbares, ebd.) werden in einen übergreifenden theoretischen Modell integriert. In dem multimodalen Modell wird Deixis als situierte, die interaktiven, kognitiven und perzeptorischen Ressourcen aller Beteiligten mobilisierende Praxis gemeinsamer Aufmerksamkeitsfokussierung begriffen (Stukenbrock 2015b).
Der Aufsatz knüpft an die Diskussion zur Verwendung von formalen grammatischen Kategorien im Sprachvergleich an (vgl. insbesondere Haspelmath 2007, 2010a, b und Newmeyer 2007, 2010). Es wird dabei nicht danach gefragt, ob sprachübergreifende grammatische Kategorien (oder genauer gesagt Kategorienausprägungen) existieren oder nicht bzw. ob einzelsprachliche grammatische Kategorien im Sprachvergleich sinnvoll einsetzbar sind, sondern wie ähnlich bzw. unterschiedlich einzelsprachliche Kategorien bzw. Kategorisierungen sind. Das Ziel ist damit, eine Methode zur Messung des Äquivalenzgrades von grammatischen Kategorien in verschiedenen Sprachen zu präsentieren; dies wird am Beispiel des IMPERATIVS im Deutschen, Englischen, Polnischen und Tschechischen illustriert.
The IFCASL corpus is a French-German bilingual phonetic learner corpus designed, recorded and annotated in a project on individualized feedback in computer-assisted spoken language learning. The motivation for setting up this corpus was that there is no phonetically annotated and segmented corpus for this language pair of comparable of size and coverage. In contrast to most learner corpora, the IFCASL corpus incorporate data for a language pair in both directions, i.e. in our case French learners of German, and German learners of French. In addition, the corpus is complemented by two sub-corpora of native speech by the same speakers. The corpus provides spoken data by about 100 speakers with comparable productions, annotated and segmented on the word and the phone level, with more than 50% manually corrected data. The paper reports on inter-annotator agreement and the optimization of the acoustic models for forced speech-text alignment in exercises for computer-assisted pronunciation training. Example studies based on the corpus data with a phonetic focus include topics such as the realization of /h/ and glottal stop, final devoicing of obstruents, vowel quantity and quality, pitch range, and tempo.
The aim of this study is to select and formulate criteria for the assessment of tools and exercises that are using computer-assisted pronunciation training (CAPT). We examined ten different CAPT tools selected on the basis of an informal questionnaire among 10 colleagues working in a German-French CAPT project. Although the applied assessment must still be regarded as informal, and although the selected CAPT tools might not be an optimal sample for representing the state of the art, the results clearly show that there is a lot to improve regarding the clarity of instruction, the quality of exercises, the robustness of the diagnosis, the clarity and appropriateness of scoring, the diversity of feedback methods, the assumed benefit for various types of users as well as the usage of ASR. Despite various good approaches regarding graphics and game-like exercises there are obviously missing links between the pedagogical expertise in phonetic training on the one hand, and software development including usability engineering on the other.
This study investigates high vowel laxing in the Louisiana French of the Lafourche Basin. Unlike Canadian French, in which the high vowels /i, y, u/ are traditionally described as undergoing laxing (to [I, Y, U]) in word-final syllables closed by any consonant other than a voiced fricative (see Poliquin 2006), Oukada (1977) states that in the Louisiana French of Lafourche Parish, any coda consonant will trigger high vowel laxing of /i/; he excludes both /y/ and /u/ from his discussion of high vowel laxing. The current study analyzes tokens of /i, y, u/ from pre-recorded interviews with three older male speakers from Terrebonne Parish. We measured the first and second formants and duration for high vowel tokens produced in four phonetic environments, crossing syllable type (open vs. closed) by consonant type (voiced fricative vs. any consonant other than a voiced fricative). Results of the acoustic analysis show optional laxing for /i/ and /y/ and corroborate the finding that high vowels undergo laxing in word-final closed syllables, regardless of consonant type. Data for /u/ show that the results vary widely by speaker, with the dominant pattern (shown by two out of three speakers) that of lowering and backing in the vowel space of closed syllable tokens. Duration data prove inconclusive, likely due to the effects of stress. The formant data published here constitute the first acoustic description of high vowels for any variety of Louisiana French and lay the groundwork for future study on these endangered varieties.
Ob es um die Rechtschreibreform geht, um Anglizismen im Deutschen oder um den Umgang mit Migranten- oder Minderheitensprachen - Debatten und Meinungen zu Sprache(n) und Sprachformen sind Teil unseres Alltages. Dass Sprache auch Gegenstand der Politik ist, also Sprache und das Verhältnis von Sprachen in der Gesellschaft bewusst oder unbewusst gesteuert werden, wird dagegen in deutschsprachigen Kontexten eher selten thematisiert. Diese Einführung gibt einen Überblick über Ansätze, Praktiken, Theorien und Perspektiven auf wichtige Bereiche der Sprach(en)politik. Der erste Teil erläutert den theoretischen Hintergrund, der zweite Teil stellt eine Reihe von Ländern vor, die beispielhaft für wichtige Ansätze der sprachpolitischen Praxis stehen, aber auch nach ihrer Bedeutung für die größten philologischen Fächer (Germanistik, Anglistik, Romanistik) ausgewählt wurden. Damit liegt die erste systematische deutschsprachige Einführung in ein Thema vor, das international seit langem ein großes Maß an Aufmerksamkeit erhält. Sie richtet sich an Studierende und Lehrende sprachwissenschaftlicher Fächer und Nachbardisziplinen ebenso wie an Akteure der sprachpolitischen Praxis.
The current paper presents a corpus containing 35 dialogues of spontaneously spoken southern German, including half an hour of articulography for 13 of the speakers. Speakers were seated in separate recording chambers, mimicking a telephone call, and recorded on individual audio channels. The corpus provides manually corrected word boundaries and automatically aligned segment boundaries. Annotations are provided in the Praat format. In addition to audio recordings, speakers filled out a detailed questionnaire, assessing among others their audio-visual consumption habits.
Vorgestellt werden kontrastive Analysen zur Besetzung und Häufigkeitsverteilung von Vorfeldern im Deutschen und ihren französischen, italienischen, norwegischen, polnischen und ungarischen Äquivalenten in morphosyntaktisch annotierten Wikipedia-Korpora. Im Rahmen der Untersuchung wurden mit korpusanalytischen Methoden quantitative Zusammenhänge bei den sprachspezifischen Ausprägungen von Vorfeldern nachgewiesen, die im Einklang mit typischen Struktureigenschaften der untersuchten Kontrastsprachen stehen. Die Ergebnisse legen aber nahe, dass die untersuchten Vorfeldstrukturen ‒ trotz der beträchtlichen Größe und thematischen Vielfalt der Wikipedia-Korpora ‒ nicht hinreichend repräsentativ sind, um uneingeschränkt Rückschlüsse auf allgemeine Struktureigenschaften der sechs Kontrastsprachen zu ziehen. Hierfür verantwortlich ist insbesondere die ausgeprägte Textsortenspezifizität der Mediengattung (Online-)Enzyklopädie, was mithilfe weiterer Vergleichskorpora aufgezeigt werden konnte.
This thesis investigates temporal and aspectual reference in the typologically unrelated African languages Hausa (Chadic, Afro–Asiatic) and Medumba (Grassfields Bantu). It argues that Hausa is a genuinely tenseless language and compares the interpretation of temporally unmarked sentences in Hausa to that of morphologically tenseless sentences in Medumba, where tense marking is optional and graded. The empirical behavior of the optional temporal morphemes in Medumba motivates an analysis as existential quantifiers over times and thus provides new evidence suggesting that languages vary in whether their (past) tense is pronominal or quantificational (see also Sharvit 2014). The thesis proposes for both Hausa and Medumba that the alleged future tense marker is a modal element that obligatorily combines with a prospective future shifter (which is covert in Medumba). Cross-linguistic variation in whether or not a future marker is compatible with non-future interpretation is proposed to be predictable from the aspectual architecture of the given language.
Languages vary in whether or not their future markers are compatible with non-future modal readings (Tonhauser, 2011b). The present paper proposes that this Variation is determined by the aspectual architecture of a given language, more precisely if and how aspects can be stacked. Building on recent accounts of the temporal interpretation of modals (Matthewson, 2012, 2013; Kratzer, 2012; Chen et al., ta), the paper first sketches an analysis of the temporal readings of the English future marker will and then provides cross-linguistic comparison with a selected, typologically diverse set of languages (Medumba, Hausa, Gitksan, and Greek).
The compilation of terminological vocabularies plays a central role in the organization and retrieval of scientific texts. Both simple keyword lists as well as sophisticated modellings of relationships between terminological concepts can make a most valuable contribution to the analysis, classification, and finding of appropriate digital documents, either on the Web or within local repositories. This seems especially true for long-established scientific fields with various theoretical and historical branches, such as linguistics, where the use of terminology within documents from different origins is sometimes far from being consistent. In this short paper, we report on the early stages of a project that aims at the re-design of an existing domain-specific KOS for grammatical content grammis. In particular, we deal with the terminological part of grammis and present the state-of-the-art of this online resource as well as the key re-design principles. Further, we propose questions regarding ramifications of the Linked Open Data and Semantic Web approaches for our re-design decisions.
American English and German AI, AU observed in cognates such as Wein, wine, Haus, house are usually treated on a par, represented with the same initial vowel (cf. [ai], [au] for Am. Engl, and German [1]). Yet, acoustic measurements indicate differences as the relevant trajectories characteristically cross in Am. Engl, but not in German. These data may indicate consistency with the same initial target for these diphthongs in German, supporting the choice of the same Symbol /a/ in phonemic representation, as opposed to distinct targets (and distinct initial phonemes) in American English.
Current theories of the syntax-semantics interface associate aspects of meaning that cannot be traced to visible structure with empty projecting heads or constructions as wholes. We present an alternative compositional analysis of the hidden aspectual-temporal, modal or comparative meaning of inchoative, middle, excessive and directional complement constructions. Accord-ingly, the hidden meaning results from a repair mechanism that passes on a locally problematic meaning component to the next higher derivational cycle. The meaning component in question is one half of the logical form of Difference as contributed by certain functional elements or by syntactically transitive (nominative-accusative) configurations.
The present investigation targets the phenomenon commonly called control. Many languages including German and Polish employ non-finite clauses (besides finite clauses) as propositional complements. The subject of these complement clauses is left unexpressed and must generally be interpreted co-referentially with the subject or object of the matrix clause (subject or object control). However. there are also infinitive-selecting verbs that do not allow for a co- referential interpretation of the embedded subject - semantically, the embedded infinitives of these anti-control verbs are thus less dependent on or less unifiable with the matrix proposition. In Polish anti-control constructions, non-finite complements are overtly marked with the complementizer zeby, suggesting that they are structurally more complex (namely. containing a C-projection) than the non-finite complements in control constructions lacking zeby (modulo special contexts. viz. 'control switch'). In a comparative perspective, the paper brings corpuslinguistic and experimental evidence to bear on the question whether surface appearances notwithstanding, the infinitival complements of anti-control verbs in German should similarly be analyzed as truly sentential, i.e., C-headed structures.
Variation ist ein wesentliches Merkmal von Sprachen und auf allen Ebenen der linguistischen Beschreibung zu finden. In der Forschungsliteratur wird allgemein angenommen, dass Variation – sofern es nicht zur funktionalen oder semantischen Ausdifferenzierung kommt – langfristig zu Verdrängungsprozessen und damit zu Sprachwandel führt. Als empirische Evidenz wird zumeist die Seltenheit lexikalischer Synonyme genannt. Der vorliegende Band bietet eine kritische Betrachtung dieser Annahme am Beispiel morphologisch-syntaktischer Konkurrenzen im Deutschen und Niederländischen. Konkreter Untersuchungsgegenstand sind Adjektiv-Nomen-Komposita (z.B. Kaltmiete), die gleichermaßen als Benennungen dienenden Phrasen (z.B. kaltes Büfett) sowie die zugrunde liegenden strukturellen Bildungsmuster Komposition und Phrasenbildung. Anhand historischer Fallstudien wird die Entwicklung beider Muster seit 1700 beschrieben und untersucht, ob von einem Verdrängungsprozess ausgegangen werden kann, der zur Unproduktivität eines der beiden Muster führt. Der Sprachvergleich erlaubt dabei die Identifikation einzelsprachlicher Präferenzen sowie verschiedener Faktoren, die zu Divergenz- und Konvergenzprozessen zwischen dem Deutschen und Niederländischen führen.
The Perceptual Effect of L1 Prosody Transplantation on L2 Speech: The Case of French Accented German
(2016)
Research has shown that language learners are not only challenged by segmental differences between their native language (L1) and the second language (L2). They also have problems with the correct production of suprasegmental structures, like phone/syllable duration and the realization of pitch. These difficulties often lead to a perceptible foreign accent. This study investigates the influence of prosody transplantation on foreign accent ratings. Syllable duration and pitch contour were transferred from utterances of a male and female German native speaker to utterances of ten French native speakers speaking German. Acoustic measurements show that French learners spoke with a significantly lower speaking rate. As expected, results of a perception experiment judging the accentedness of 1) German native utterances, 2) unmanipulated and 3) manipulated utterances of French learners of German suggest that the transplantation of the prosodic features syllable duration and pitch leads to a decrease in accentedness rating. These findings confirm results found in similar studies investigating prosody transplantation with different L1 and L2 and provide a beneficial technique for (computer-assisted) pronunciation training.
Evaluation of Phonatory Behavior of German and French Speakers in Native and Non-native Speech
(2016)
Phonatory behavior of German speakers (GS) and French speakers (FS) in native (L1) and non-native (L2) speech was instrumentally examined. Vowel productions of the two groups were analyzed using a parametrization of phonatory behaviour and phonatory quality properties in the acoustic signal. The behavior of GS is characterized by more strained adduction of the vocal folds whereas FS show more incomplete glottal closure. Furthermore, GS change their phonatory behavior in the foreign language (=French) by adapting phonatory strategies of FS, whereas FS do not show this tendency. In addition, German beginners (BEG) and partly German advanced learners (ADV) are already orientated on production characteristics of the L2. French BEG however retain their phonatory behavior in L2 (=German) by showing less vocal fold adduction in comparison to their L1. French ADV show the opposite behavior. Finally, ADV of the two speaker groups generally show more strained behavior in L2 productions than BEG. The results provide evidence that GS and FS apply different laryngeal phonatory settings and that they altered their settings in L2 differently. Perceptual evaluation of voice quality of the speech material and a correlation analysis between acoustic and perceptual results are suggested for future research.
The following paper is aimed to demonstrate that a grammar from above („Grammatik von oben“), i.e. a top-down grammar is better suited for the purposes of contrastive linguistic descriptions than the contrary approach, i.e. a bottom-up grammar. Furthermore, it will be argued that sentences should be understood and explained from a textual point of view.
In diesem Beitrag liegt der Fokus auf der Vorfeldbesetzung des deutschen Satzes, insofern das Vorfeld einerseits aus einem Satzglied oder mehreren Satzgliedern und einem infiniten Teil des Verbalkomplexes oder andererseits nur aus dem infiniten Teil des Verbalkomplexes besteht. Bei diesen Formen der Vorfeldbesetzung werden Varianten und deren informationsstrukturelle Besonderheiten betrachtet. Des Weiteren soll der Frage nachgegangen werden, ob – entgegen einer haufig vorgebrachten Regel, dass das Vorfeld des deutschen Satzes nur einfach besetzt werden kann – eindeutige und auch akzeptable Belege in den Wikipedia-Korpora auffindbar sind, die darauf hinweisen, dass im Deutschen durchaus eine Vorfeldbesetzung mit mehr als einem Satzglied auftreten kann.
When translating narrative texts from French into German, translators mostly choose the German simple tense “Präteritum” as an equivalent for French simple tenses and the German perfect tense “Plusquamperfekt” as an equivalent for French perfect tenses. There are common cases
however when the translator expresses anteriority where French is underspecified. On the other hand, sometimes the translator (or the editor) decides not to express anteriority by a verb tense
even if there is a perfect tense in the French source text. This is the surprising result of this study based on a small corpus of contemporary novel translations.
Die Rolle der antizipatorischen Verstehensdokumentation erweist sich in den Interviews aus dem Israelkorpus m. E. als besonders wichtig. Es wird von der Tatsache ausgegangen, dass es sich bei den Informanten um Personen mit besonders delikaten biographischen Hintergründen handele. Die Interviewerinnen müssen demzufolge mit der starken emotionalen Belastung rechnen, der die Interviewten während der Rekonstruktion ihrer Lebensgeschichte ausgesetzt sind. Ein sehr direkter Frage-Antwort-Stil könnte wegen dieser emotionalen Belastung als unangenehm empfunden werden. Der Einsatz von Verfahren antizipatorischer Verstehensdokumentation weist stattdessen m. E. eindeutig darauf hin, wie sich die Interviewerinnen offensichtlich um Empathie bemühen und im Sinne einer intersubjektiven Inreraktionskonstitution mit den Interviewten kooperieren. Ziel dieses Beitrages ist es zu zeigen, wie solche Verfahren der antizipatorischen Verstehensdokumentation durch den systematischen Einsatz der Konnektoren und, also, dann realisiert werden können.
Zum Geleit
(2016)
Dieser Band ist in mehrerlei Hinsicht außergewöhnlich. Einerseits ist er die diesjährige und damit 21. Ausgabe des seit 1994 erscheinenden Jahrbuches Triangulum und steht damit in der Tradition, der Germanistik im Baltikum ein Sprachrohr zu geben. Im Gegensatz zu früheren Jahren ist dieser Band jedoch noch viel mehr: Als Dokumentation des 10. Nordisch-Baltischen Germanistentreffens (NBGT), das vom 10. bis zum 13. Juni 2015 von der Germanistik der Universität Tallinn ausgerichtet wurde, bündelt er eine Vielzahl der Vorträge, die im Rahmen der Tagung gehalten wurden.
This paper discusses how the regional language of Latgalian in Latvia has benefitted from societal discourse on the antagonism between speakers of Latvian and Russian in Latvia. Triggered by the 2012 referendum on Russian as a possible second state language of Latvia, Latvian politics (exemplified by politicians' statements since 2012 as well as by 2014 election manifestoes) as well as society at large (displayed by e.g. increased attention in the educational sector and the media) have started to devote considerably more attention to the region of Latgale, including its cultural and linguistic heritage. The paper thereby argues that speakers of Latgalian have gained a noteworthy increase in voice, even though the future of the variety is still considered to be uncertain.
Dieses Buch schließt eine Lücke in der Konnektorenforschung, indem es den Gebrauch von Konnektoren im gesprochenen Deutsch untersucht. Die Fragestellung bringt Elemente aus dem traditionellen grammatischen Ansatz und aus der pragmatisch basierten Forschung zur gesprochenen Sprache zusammen. In Anlehnung an die Methode der Interaktionalen Linguistik analysiert der Autor den Gebrauch der Konjunktoren «und», «aber» und der Adverbkonnektoren «also», «dann» in zwei Korpora von autobiographischen Interviews. Die Untersuchung zeigt, wie Konnektoren zur Bewältigung von verschiedenartigen kommunikativen Aufgaben zur Stiftung von Intersubjektivität und zur Gesprächsorganisation eingesetzt werden können.
Dieser Beitrag fasst die wesentlichen Aussagen und Ergebnisse eines Workshops zusammen, der sieben Perspektiven auf die Untersuchung der Rolle des Deutschen im öffentlichen Raum zusammengebracht hat. Einige der vorgestellten Studien folgten dem seit Beginn der 2000er Jahre rasant an Popularität gewonnenen Ansatz der ‚Linguistic Landscapes‘. In anderen Beiträgen standen praktische Überlegungen zum Suchen von Beispielen der deutschen Sprache im Mittelpunkt, um diese im Kontext von DaF und Auslandsgermanistik sowie der Werbung für die deutsche Sprache einzusetzen. Ziel des Workshops war es, Gemeinsamkeiten und Perspektiven von diesen unter dem Schlagwort ‚Spot German‘ verorteten Studien mit der Linguistic Landscape-Tradition zu eruieren. Länder, aus denen Studien vorgestellt wurden, waren Estland, Lettland, Dänemark, Tschechien, Deutschland, Zypern und Malta.
Linguistic Landscapes (LL) sind in der internationalen Soziolinguistik und verwandten Disziplinen in aller Munde. Seit Mitte der 2000er Jahre sind Studien, die sich als Teil dieses Ansatzes verstehen, wie Pilze aus dem Boden geschossen. Seit 2008 hat es in fast jährlichem Rhythmus gut besuchte Tagungen gegeben, die sich ausschließlich mit Linguistic Landscapes beschäftigen - sowohl mit Fallstudien aus aller Welt als auch mit theoretischen und methodologischen Fragen. Folgerichtig sind nicht nur eine Vielzahl von Einzelaufsätzen erschienen, es hat auch mehrere Sammelveröffentlichungen gegeben, und seit 2015 erscheint ein eigenes Journal unter dem Titel „Linguistic Landscapes“ (vgl. Gorter 2013 für einen Überblick über die Entwicklung des Ansatzes).
Obwohl auch Wissenschaftler, die im deutschsprachigen Raum tätig sind, sich in den letzten Jahren den Linguistic Landscapes gewidmet haben, hat die Methode in deutschsprachigen Publikationen jedoch bisher nur einen vergleichsweise geringen Stellenwert eingenommen. Dieser Beitrag möchte somit zum einen Grundlagenarbeit leisten, indem er die Idee der Linguistic Landscapes noch einmal vorstellt und seine Entwicklung der vergangenen Jahre nachzeichnet. Zum anderen soll im Kontext dieses Bandes der Nutzen des Ansatzes für die Analyse von Sprachen von Migrantengruppen diskutiert werden. Schließlich wird der Beitrag durch einige Bemerkungen dazu abgerundet, in welchem Maße die Untersuchung von LL einen Nutzwert haben kann, der über wissenschaftliche Kreise hinausgeht. Grundlage für diesen Beitrag sind internationale Veröffentlichungen der letzten Jahre, vor allem aber gehen Erfahrungen aus eigenen Studien mit ein, die wir seit 2007 mit unterschiedlichen Zielsetzungen im Baltikum und in Deutschland durchgeführt haben.
Die Beschreibung und Modellierung grammatischer Variation, d.h. von Instanzen, in denen eine Funktion oder Bedeutung durch mehrere, miteinander konkurrierende Formtypen ausgedrückt werden kann, stellt eine Herausforderung sowohl für Grammatikografie als auch Grammatiktheorie dar. Die vorliegende Doppelstudie zur starken Genitivflexion und ihrem Wegfall entwickelt neue korpusorientierte Zugänge zu dieser Problematik. Quantitative und inferenzstatistische Methoden ermöglichen nicht nur eine detaillierte und empirisch fundierte Beschreibung der Distribution der einschlägigen Markierungsvarianten (-s, -es, -ens, -Ø, Apostroph). Sie sind auch das geeignete Rüstzeug, die Hypothesen der bisherigen Forschung zu evaluieren und die sehr zahlreichen sprachlichen und außersprachlichen Einflussfaktoren präzise zu hierarchisieren, um einem konsistenten Gesamtmodell der Variation in diesem Teilbereich der Grammatik näher zu kommen.
Deutsch-russisches Neologismenwörterbuch. Neuer Wortschatz im Deutschen, 1991-2010. Bd. 1 - 2 (A-Z)
(2016)
Dieses Wörterbuch, das auf dem ersten größeren Neologismenwörterbuch für das Deutsche fußt, schließt eine Lücke in der deutsch-russischen Wörterbuchlandschaft: Es präsentiert dem Benutzer den neuen deutschen Wortschatz, den er in anderen Wörterbüchern meist vergeblich sucht. Enthalten sind fast 2000 neue Wörter (z.B. Kletterwald, scrollen), neue feste Wortverbindungen (z.B. etw. in die Tonne treten, der Drops ist gelutscht) und neue Bedeutungen etablierter Wörter (z.B. halbrund, Stolperstein), von denen rund 1350 umfassend lexikografisch beschrieben sind. Die vielen Verknüpfungen zwischen den Stichwörtern ermöglichen Einblicke in die Vernetztheit des neuen Wortschatzes und leisten so einen wichtigen Beitrag für den Wortschatzerwerb.
Sprache in postkolonialen Kontexten I. Kolonialrevisionistische Diskurse in der Weimarer Republik
(2016)
Wenn wir an Sprache denken, dann meist an Grammatiken, Rechtschreibung und Lexika. Sprache scheint demnach in der Form von Regeln und Wissen zu existieren. Dieser Band, der aus der Jahrestagung des IDS 2015 hervorgegangen ist, vertritt eine andere Vorstellung von Sprache: Sprache ist Werkzeug und Lebensform im sozialen und leiblichen Kontext. Sprechen und Schreiben bestehen aus routinisierten Praktiken, die an konkrete körperliche, sequenzielle, mediale und materielle Kontexte gebunden sind und bestimmten Zwecken dienen. Der Bezug auf Objekte und mediale Oberflächen und die leibliche Verfasstheit der Akteure und ihre Situiertheit im Raum sind unhintergehbare Bestimmungsstücke der Verwendung von Sprache. Sprache ist eingelassen in zwischenmenschliche Interaktionen, die sie selbst prägt, aus denen sie ihre Bedeutung bezieht und innerhalb derer sie sich wandelt und neue Verwendungen und Ausprägungen gewinnt.
Die in diesem Band versammelten Beiträge zeigen Anwendungen und Nutzen des Praktikenkonzepts in unterschiedlichen Feldern der Linguistik, wie der interaktionalen Linguistik, der Sozio-, Text- und Medienlinguistik, der synchronen und historischen Pragmatik und der Literalitätsforschung. Dabei rücken über die Perspektive der Praktiken auch die Schnittstellen der Linguistik zu ihren sozialwissenschaftlichen Nachbarwissenschaften, insbesondere zu Soziologie und Medienwissenschaft, in den Fokus.
Medien, Macht, Diskurs. Zur historischen Rekonstruktion hegemonialer Diskurse und ihrer Objekte
(2016)
Diskursive Historizität
(2016)
Der Band dokumentiert die Multidisziplinarität von Diskursanalyse in sprach-, literatur- und sozialwissenschaftlichen Beiträgen zur Geschichtlichkeit von Diskursen. Die historische Relativität von Sprachgebrauch, kommunikativen Intentionen und ihren Effekten in geisteswissenschaftlicher Theoriebildung werden dabei ebenso behandelt wie historische Dimensionen politischer Kommunikation und die Diskursivität literarischer Formen.
Der Sammelband zur typologisch und kontrastiv vergleichenden grammatischen Erforschung und Beschreibung des Satzanfangs des Deutschen und vier seiner Kontrastsprachen ist ein Ergebnis eines Forschungsnetzwerks, bestehend aus dem Institut für Deutsche Sprache (Mannheim) und Forschergruppen verschiedener europäischer Universitäten. Unter Berücksichtigung insbesondere morphosyntaktischer und informationsstruktureller Aspekte werden die satztopologischen Unterschiede der typologisch recht heterogenen Sprachen bzw. Sprachfamilien unter verschiedenen Gesichtspunkten beleuchtet. Die Untersuchungen werden korpusbasiert durchgeführt, wobei sich die Hälfte der Beiträge auf aufbereitete POS-getaggte Wikipedia-Korpora stützt. Die quantitativ ausgerichteten Korpusanalysen ermöglichen einen genauen Einblick in die unterschiedlichen Strukturmerkmale der betreffenden Sprachen sowie in sprachübergreifende Textmerkmale, und die qualitativen Untersuchungen zeigen Ähnlichkeiten und Abweichungen bei bestimmten Verfahren, die sich morphosyntaktisch iederschlagen und besonders am Satzanfang relevant sind. Insgesamt erlauben die Beiträge Hypothesen zu topologisch und informationsstrukturell markierten Satzanfängen und zu Präferenzen in den jeweiligen Sprachen, aber auch zu möglichen Konstanten und Gemeinsamkeiten, was – auf differenziertere Korpora erweitert – für die Bereiche Sprache und Kognition sowie computergestützte Übersetzung ein großer Gewinn sein dürfte.
In order to demonstrate why it is important to correctly account for the (serial dependent) structure of temporal data, we document an apparently spectacular relationship between population size and lexical diversity: for five out of seven investigated languages, there is a strong relationship between population size and lexical diversity of the primary language in this country. We show that this relationship is the result of a misspecified model that does not consider the temporal aspect of the data by presenting a similar but nonsensical relationship between the global annual mean sea level and lexical diversity. Given the fact that in the recent past, several studies were published that present surprising links between different economic, cultural, political and (socio-)demographical variables on the one hand and cultural or linguistic characteristics on the other hand, but seem to suffer from exactly this problem, we explain the cause of the misspecification and show that it has profound consequences. We demonstrate how simple transformation of the time series can often solve problems of this type and argue that the evaluation of the plausibility of a relationship is important in this context. We hope that our paper will help both researchers and reviewers to understand why it is important to use special models for the analysis of data with a natural temporal ordering.
Die Beiträge des vorliegenden Bandes sind das Ergebnis eines interdisziplinären Workshops, der zum Abschluss des Projekts unter dem Titel „Varianz und Vielfalt interdisziplinär: Wörter und Strukturen“ im Dezember 2012 in Darmstadt stattfand. Dabei wurden Erkenntnisse und Erfahrungen aus der Untersuchung von „Wechselwirkungen zwischen linguistischen und bioinformatischen Verfahren, Methoden und Algorithmen für die Modellierung und Abbildung von Varianz in Sprache und Genomen“ zusammengefasst. Ein Schwerpunkt lag hierbei auf elektronischen Wörterbüchern, ihrer Heterogenität, der in ihnen dokumentierten Varianz sowie auf den Werkzeugen und Methoden, die zu ihrer Erschließung und Analyse dienen. Weitere sprachwissenschaftlich motivierte Themenbereiche umfassten z.B. die synchrone und diachrone Varianz, die quantitative Linguistik, Morphologie und Sprachwandelprozesse, Varianz in Wortfamilien wie auch die Erschließung von Varianz. Anschließend konnte das Phänomen der Varianz aus verschiedensten Perspektiven beleuchtet werden und ein Beitrag zur Konstituierung einer disziplinübergreifenden Abstraktionsebene geleistet werden. Der vorliegende Band enthält einige der Vorträge und führt heterogene Forschungsgegenstände zusammen, die zwischen Lexikografie, Computerlinguistik, (historischer) Sprachwissenschaft und den digitalen Geisteswissenschaften transzendieren.
In their analysis of methods that participants use to manage the realization of practical courses of action, Kendrick and Drew (2016/this issue) focus on cases of assistance, where the need to be addressed is Self’s, and Other lends a helping hand. In our commentary, we point to other forms of cooperative engagement that are ubiquitously recruited in interaction. Imperative requests characteristically expect compliance on the grounds of Other’s already established commitment to a wider and shared course of actions. Established commitments can also provide the engine behind recruitment sequences that proceed nonverbally. And forms of cooperative engagement that are well glossed as assistance can nevertheless be demonstrably oriented to established commitments. In sum, we find commitment to shared courses of action to be an important element in the design and progression of certain recruitment sequences, where the involvement of Other is best defined as contribution. The commentary highlights the importance of interdependent orientations in the organization of cooperation. Data are in German, Italian, and Polish.