Refine
Year of publication
- 2014 (462) (remove)
Document Type
- Part of a Book (207)
- Article (141)
- Conference Proceeding (52)
- Book (35)
- Part of Periodical (12)
- Working Paper (7)
- Other (6)
- Preprint (2)
Keywords
- Deutsch (149)
- Korpus <Linguistik> (50)
- Institut für Deutsche Sprache <Mannheim> (36)
- Linguistik (29)
- Germanistik (25)
- Computerunterstützte Lexikographie (23)
- Wörterbuch (19)
- Gesprochene Sprache (18)
- Institut für Deutsche Sprache (18)
- Konversationsanalyse (16)
Publicationstate
- Veröffentlichungsversion (173)
- Zweitveröffentlichung (23)
- Postprint (11)
Reviewstate
- (Verlags)-Lektorat (140)
- Peer-Review (64)
- Verlags-Lektorat (7)
- Peer-review (6)
- Review-Status-unbekannt (2)
- (Verlags)Lektorat (1)
- (Verlags-)Lektorat (1)
- Peer-Revied (1)
- Preprint (1)
Publisher
- Institut für Deutsche Sprache (98)
- De Gruyter (88)
- de Gruyter (36)
- Stauffenburg (12)
- European Language Resources Association (ELRA) (11)
- Lang (10)
- Benjamins (6)
- Springer (6)
- Winter (6)
- Cambridge Scholars Publ. (5)
Twitter Analytics
(2014)
Die Online-Forschung setzt sich in den letzten Jahren zunehmend mit Mikro-Blogs, insbesondere dem weltweit populärsten Anbieter Twitter, auseinander. Verschiedenste Disziplinen beschäftigen sich aus ihren jeweiligen Perspektiven mit der Analyse von kommunikativen Prozessen und Strukturen von Twitter und nutzen dabei eine Vielzahl an methodischen Zugängen. In diesem Artikel werden zunächst die grundlegenden Funktionen, Möglichkeiten des Zugangs zur Datenstruktur sowie Methoden der Datenerhebung und -auswertung dargelegt. Im Anschluss werden Ansätze verschiedener Fachdisziplinen vorgestellt.
Content analysis provides a useful and multifaceted, methodological framework for Twitter analysis. CAQDAS tools support the structuring of textual data by enabling categorising and coding. Depending on the research objective, it may be appropriate to choose a mixed-methods approach that combines quantitative and qualitative elements of analysis and plays out their respective advantages to the greatest possible extent while minimising their shortcomings. In this chapter, we will discuss CAQDAS speech act analysis of tweets as an example of software-assisted content analysis. We start with some elementary thoughts on the challenges of the collection and evaluation of Twitter data before we give a brief description of the potentials and limitations of using the software QDA Miner (as one typical example for possible analysis programmes). Our focus will lie on analytical features that can be particularly helpful in speech act analysis of tweets.
Wie selbstbestimmt können wir das Internet nutzen? Wie viel wissen wir darüber,welche digitalen Spuren wir setzen und wer diesen hinterher spürt?
Wie werden die beim Surfen erzeugten Daten von Dritten weiter verwendet – mit und ohne unser Wissen? Und ist die gefühlte Nacktheit in Zeiten der digital ausspähbaren, scheinbaren Transparenz wirklich akut oder durch traditionelle analoge Denk- und Erfahrungsstrukturen geprägt?
Dieser Artikel gibt einen Einblick in das GeoBib-Projekt und die Problematik der Verwendung von historischen Karten und der daraus abgeleiteten Geodaten in einem WebGIS. Das GeoBib-Projekt hat zum Ziel, eine annotierte und georeferenzierte Online-Bibliographie der frühen deutsch- bzw. polnischsprachigen Holocaust- und Lagerliteratur von 1933 bis 1949 bereitzustellen. Zu diesem Zeitraum werden historische Karten und Geodaten gesammelt, aufbereitet und im zugehörigen WebGIS des GeoBib-Portals visualisiert. Eine Besonderheit ist die aufwendige Recherche von Geodaten und Kartenmaterial für den Zeitraum zwischen 1933 und 1949. Die Problematiken bezüglich der Recherche und späteren Visualisierung historischer Geodaten und des Kartenmaterials sind ein Hauptaugenmerk in diesem Artikel. Weiterhin werden Konzepte für die Visualisierung von historischem, unvollständigem Kartenmaterial präsentiert und ein möglicher Lösungsweg für die bestehenden Herausforderungen aufgezeigt.
Schreiben nach Engelbart
(2014)
Douglas Engelbart hat 1968 mit seinem On-Line System das erste Mal gezeigt, wie ein Computer als interaktives Schreibwerkzeug genutzt werden kann. Der Beitrag zeichnet diese Urszene der Textverarbeitung nach, beschreibt die wesentlichen Entwicklungslinien, die das digitale Schreiben seitdem genommen hat, und erläutert die zentralen Konzepte, die es zunehmend prägen: Hybridität, Multimedialität und Sozialität.
Der folgende Artikel ist ein bearbeiteter Auszug aus Henning Lobins “Engelbarts Traum. Wie der Computer uns Lesen und Schreiben abnimmt” Frankfurt am Main / New York: Campus, 2014.
We investigate how the granularity of POS tags influences POS tagging, and furthermore, how POS tagging performance relates to parsing results. For this, we use the standard “pipeline” approach, in which a parser builds its output on previously tagged input. The experiments are performed on two German treebanks, using three POS tagsets of different granularity, and six different POS taggers, together with the Berkeley parser. Our findings show that less granularity of the POS tagset leads to better tagging results. However, both too coarse-grained and too fine-grained distinctions on POS level decrease parsing performance.
“My Curiosity was Satisfied, but not in a Good Way”: Predicting User Ratings for Online Recipes
(2014)
In this paper, we develop an approach to automatically predict user ratings for recipes at Epicurious.com, based on the recipes’ reviews. We investigate two distributional methods for feature selection, Information Gain and Bi-Normal Separation; we also compare distributionally selected features to linguistically motivated features and two types of frameworks: a one-layer system where we aggregate all reviews and predict the rating vs. a two-layer system where ratings of individual reviews are predicted and then aggregated. We obtain our best results by using the two-layer architecture, in combination with 5 000 features selected by Information Gain. This setup reaches an overall accuracy of 65.60%, given an upper bound of 82.57%.
Einleitung
(2014)
Dependenzstruktur
(2014)
Im Zuge der Mediatisierung unserer alltäglichen Lebenswelt ergeben sich neue Möglichkeiten der Partizipation an gesellschaftlichen Prozessen. Insbesondere digitale Medien begünstigen das gemeinsame Aushandeln, Mitbestimmen und Gestalten unseres Alltags, der Politik, Wirtschaft und Kultur. Die Autorinnen und Autoren in diesem Band gehen der Frage nach, welche spezifischen Partizipationskulturen sich in den einzelnen Bereichen wie der Unternehmenskommunikation, dem Journalismus, der Politik oder bei Jugendlichen herausbilden und auf welche Weise sich diese Tendenzen als kennzeichnend für eine digitale Gesellschaft beschreiben lassen. Ziel des vorliegenden Bandes ist es, einen Beitrag zur Konturierung der Anwendungsmöglichkeiten und -grenzen des Partizipationsegriffs im Bereich der Forschung zur digitalen Medienkommunikation zu leisten.
Nektiv
(2014)
Translativ
(2014)
Auf dem Weg in die Digitalkultur: Wir Menschen sind heute nicht mehr die Einzigen, die lesen und schreiben - Computer tun es auch. Nach Jahrtausenden des Monopols über die Schrift mussten wir diese Bastion im 21. Jahrhundert räumen. Douglas Engelbart, der Erfinder der Computermaus, hatte die Automatisierung der Schrift und des Schreibens bereits 1968 vorhergesehen.
Dieses Buch zeigt, wie sich Lesen und Schreiben verändern, wenn der Computer uns diese Kulturtechniken immer mehr abnimmt. Bücher, Bibliotheken und Verlage, Schule und Universität, Presse und Zensur befinden sich bereits tief im Umbruch - und nicht zuletzt unser Denken selbst. Henning Lobin schildert die Auswirkungen computergestützter Techniken auf unseren Alltag und gibt einen Ausblick auf die Institutionen, Praktiken und Werte einer zukünftigen "Digitalkultur".
The annotation of parts of speech (POS) in linguistically annotated corpora is a fundamental annotation layer which provides the basis for further syntactic analyses, and many NLP tools rely on POS information as input. However, most POS annotation schemes have been developed with written (newspaper) text in mind and thus do not carry over well to text from other domains and genres. Recent discussions have concentrated on the shortcomings of present POS annotation schemes with regard to their applicability to data from domains other than newspaper text.
We continue the study of the reproducibility of Propp’s annotations from Bod et al. (2012). We present four experiments in which test subjects were taught Propp’s annotation system; we conclude that Propp’s system needs a significant amount of training, but that with sufficient time investment, it can be reliably trained for simple tales.
This paper presents challenges and opportunities resulting from the application of geographical information systems (GIS) in the (digital) humanities. First, we provide an overview of the intersection and interaction between geography (and cartography), and the humanities. Second, the “GeoBib” project is used as a case study to exemplify challenges for such collaborative, interdisciplinary projects, both for the humanists and the geoscientists. Finally, we conclude with an outlook on further applications of GIS in the humanities, and the potential scientific benefit for both sides, humanities and geosciences.
Uncertain about Uncertainty: Different ways of processing fuzziness in digital humanities data
(2014)
The GeoBib project is constructing a georeferenced online bibliography of early Holocaust and camp literature published between 1933 and 1949 (Entrup et al. 2013a). Our immediate objectives include identifying the texts of interest in the first place, composing abstracts for them, researching their history, and annotating relevant places and times. Relations between persons, texts, and places will be visualized using digital maps and GIS software as an integral part of the resulting GeoBib information portal. The combination of diverse data from varying sources not only enriches our knowledge of these otherwise mostly forgotten texts; it also confronts us with vague, uncertain or even conflicting information. This situation yields challenges for all researchers involved – historians, literary scholars, geographers and computer scientists alike. While the project operates at the intersection of historical and literary studies, the involved computer scientists are in charge of providing a working environment (Entrup et al. 2013b) and processing the collected information in a way that is formalized yet capable of dealing with inevitable vagueness, uncertainty and contradictions. In this paper we focus on the problems and opportunities of encoding and processing fuzzy data.
We present a technique called event mapping that allows to project text representations into event lists, produce an event table, and derive quantitative conclusions to compare the text representations. The main application of the technique is the case where two classes of text representations have been collected in two different settings (e.g., as annotations in two different formal frameworks) and we can compare the two classes with respect to their systematic differences in the event table. We illustrate how the technique works by applying it to data collected in two experiments (one using annotations in Vladimir Propp’s framework, the other using natural language summaries).
This study investigates cross-language differences in pitch range and variation in four languages from two language groups: English and German (Germanic) and Bulgarian and Polish (Slavic). The analysis is based on large multi-speaker corpora (48 speakers for Polish, 60 for each of the other three languages). Linear mixed models were computed that include various distributional measures of pitch level, span and variation, revealing characteristic differences across languages and between language groups. A classification experiment based on the relevant parameter measures (span, kurtosis and skewness values for pitch distributions for each speaker) succeeded in separating the language groups.
We present a novel NLP resource for the explanation of linguistic phenomena, built and evaluated exploring very large annotated language corpora. For the compilation, we use the German Reference Corpus (DeReKo) with more than 5 billion word forms, which is the largest linguistic resource worldwide for the study of contemporary written German. The result is a comprehensive database of German genitive formations, enriched with a broad range of intra- und extralinguistic metadata. It can be used for the notoriously controversial classification and prediction of genitive endings (short endings, long endings, zero-marker). We also evaluate the main factors influencing the use of specific endings. To get a general idea about a factor’s influences and its side effects, we calculate chi-square-tests and visualize the residuals with an association plot. The results are evaluated against a gold standard by implementing tree-based machine learning algorithms. For the statistical analysis, we applied the supervised LMT Logistic Model Trees algorithm, using the WEKA software. We intend to use this gold standard to evaluate GenitivDB, as well as to explore methodologies for a predictive genitive model.
In diesem Beitrag wird an einigen Beispielen aus der nominalen Morphologie bzw. der Morphosyntax der deutschen Substantivgruppe gezeigt, wie sich in den Veränderungen in diesem Bereich, die sich über das 20. Jahrhundert hin beobachten lassen, Fragen eines langfristigen Systemwandels mit Regularitäten des Sprachgebrauchs überlagern. Im Mittelpunkt soll die Frage der Markierung der Kasus – insbesondere in den allgemein als „kritisch“ angesehenen Fällen von Genitiv und Dativ – stehen. Wenn man die Daten dazu betrachtet, sieht man, dass in den meisten Fällen schon zum Anfang des 20. Jahrhunderts eine weitgehende Anpassung an die Regularitäten der Monoflexion erfolgt war, auch, dass dieser Prozess über das Jahrhundert hin fortschreitet. Bemerkenswert ist, dass insgesamt die als „alt“ angesehenen Fälle in den untersuchten Korpora geschriebener Sprache (sehr) selten auftauchen, dass aber in zunehmendem Ausmaß die daraus folgende Markiertheit in der einen oder anderen Weise funktional genutzt wird. Einen Fall eigener Art stellt in diesem Zusammenhang der Genitiv dar, der sich bei den starken Maskulina und Neutra bekanntlich dem Trend zur „Einmalmarkierung“ der Kasus an den flektierten, das Substantiv begleitenden Elementen widersetzt. Das führt zu der bekannten Orientierung dieser Formen auf die Nicht-Objekt-Verwendungen und auch zu einem auffälligen Maß an Variation in der Nutzung der entsprechenden Flexionsformen.
Designing a Bilingual Speech Corpus for French and German Language Learners: a Two-Step Process
(2014)
We present the design of a corpus of native and non-native speech for the language pair French-German, with a special emphasis on phonetic and prosodic aspects. To our knowledge there is no suitable corpus, in terms of size and coverage, currently available for the target language pair. To select the target L1-L2 interference phenomena we prepare a small preliminary corpus (corpus1), which is analyzed for coverage and cross-checked jointly by French and German experts. Based on this analysis, target phenomena on the phonetic and phonological level are selected on the basis of the expected degree of deviation from the native performance and the frequency of occurrence. 14 speakers performed both L2 (either French or German) and L1 material (either German or French). This allowed us to test, recordings duration, recordings material, the performance of our automatic aligner software. Then, we built corpus2 taking into account what we learned about corpus1. The aims are the same but we adapted speech material to avoid too long recording sessions. 100 speakers will be recorded. The corpus (corpus1 and corpus2) will be prepared as a searchable database, available for the scientific community after completion of the project.
In dem Beitrag diskutieren die Autoren die deutschdidaktische Behauptung (u. a. Dürscheid 2007), dass ein zusätzliches Angebot von Grammatikunterricht im Fach Deutsch der Sekundarstufe II zu besseren und langfristig anhaltenden expliziten Grammatikkenntnissen des Deutschen führt. Laut curricularen Vorgaben ist für die Klassen neun bis zwölf kein Grammatikunterricht vorgesehen. Ob ein solches Angebot tatsächlich zu entsprechend besseren Ergebnissen führt, ist empirisch nicht belegt. Die Autoren konzipieren daher eine longitudinale Untersuchung zur Leistungserhebung, in der zwei Vergleichsgruppen jährlich einmal Aufgaben, aufbauend auf den VERA-8-Arbeiten, in den Klassen acht bis zwölf bearbeiten. Nur eine der beiden Gruppen hat ab Klasse neun am expliziten Grammatikunterricht in Form einer kontrollierten Selbstlerneinheit teilgenommen. Es sollen hierbei dieselben 1000 Schüler befragt werden. Die Befragung erfolgt in den Schuljahren 2014 bis 2018. Das Projekt „Grammatische Kenntnisse in der Sekundarstufe II (GramKidSII)“ wird finanziert vom Institut für Deutsche Sprache in Mannheim.
The article investigates the conditions under which the w-relativizer was appears instead of the d-relativzer das in German relative clauses. Building on Wiese 2013, we argue that was constitutes the elsewhere case that applies when identification with the antecedent cannot be established by syntactic means via upward agreement with respect to phi-features. Corpuslinguistic results point to the conclusion that this is the case whenever there is no lexical nominal in the antecedent that, following Geach 1962 and Baker 2003, supplies a criterion of identity needed to establish sameness of reference between the antecedent and the relativizer.
Endungsvariation
(2014)
Der Aufsatz befasst sich mit den Besonderheiten der Struktur, der Funktion, der Selektion und des Gebrauchs von Subjektsätzen im Deutschen und Rumänischen. Am Beispiel der Argumentrealisierung bei Psych-Verben wird erkundet, inwiefern sprachübergreifende semantische Bedingungen diese Besonderheiten erklären und in welchem Maße sie von einzelsprachlichen und lexikalischen Besonderheiten gesteuert sind. Im Fokus der Studie stehen dabei (i) die Einordnung des Deutschen und des Rumänischen hinsichtlich der zu beobachtenden typologischen Varianz bei Subjektsätzen, (ii) die Besonderheiten der Aufteilung von Argumenten von Psych-Verben auf zwei Satzglieder durch Argumentdoppelung und Argumentspaltung und (iii) die Ermittlung verbidiosynkratischer, sprachspezifischer und sprachübergreifender Präferenzen bei der Realisierung der Argumente von Psych-Verben über eine quantitative Korpusstudie.
This contribution offers a fine-grained analysis of German and Romanian ditransitive and prepositional transfer constructions. The transfer construction (TC) is shown to be realised in German by 26 argument structure patterns (ASPs), which are conceived of as form-meaning pairings which differ only minimally. The mainstream constructionist view of the different types of TCs being related by polysemy links is rejected, the ASPs being argued instead to be related by family relationships. All but six of the ASPs identified for German are shown to possess a Romanian counterpart. For some ditransitive structures, German is shown to possess two prepositional variants, one with an (‘at’) and one with zu (‘to’) or auf (‘on’), while Romanian has only one. Due to the lack of a Romanian counterpart for the German zu and auf variants, Romanian lacks some of the dative alternations found in German. However, Romanian as well as German permits the double object pattern to interact with take-verbs, verbs of removal and add-verbs, which do not allow the ditransitive construction in English. Since these verb classes also permit at least one prepositional pattern in both languages, Romanian and German show a larger number of dative alternation types than English.
Der vorliegende Beitrag besteht aus zwei größeren Teilen: Zum einen (vgl. Abschnitt 2) werden strukturelle Eigenschaften des Infinitivs, oder vielmehr der Infinitive, im Deutschen und Rumänischen erörtert und miteinander verglichen. Leitthema ist dabei die Frage nach dem Verhältnis von Verbalität und Nominalität der Formen. Berücksichtigt werden die Beschreibungsbereiche Morphologie, externe und interne Syntax. Dieser empirischen Erörterung vorausgeschickt (vgl. Abschnitt 1) wird der Versuch einer Begriffsbestimmung: Wie kann, wenn überhaupt, ‘Infinitiv’ übereinzelsprachlich definiert werden? Auf dieser Basis wird zum anderen (vgl. Abschnitt 3) eine prototypische syntaktische Funktion von Infinitiven, die Subjektfunktion, einer vergleichenden Analyse unterzogen. Strukturelle und semantische Beschränkungen für Infinitive in Subjektfunktion in den beiden Vergleichssprachen werden untersucht. Speziell im Falle kausativer Verben als Prädikatsverben lassen sich relevante Unterschiede zwischen dem Deutschen und Rumänischen feststellen. Die Verwendungsrestriktionen für die Subjektfunktion der deutschen und rumänischen Infinitive werden in Beziehung gesetzt zu Eigenschaften der „Orientierung“ bzw. „Kontrolle“ der Infinitivformen. Ausgehend davon lassen sich tendenziell auch feine Gebrauchsunterschiede für den verbalen und nominalen Infinitiv im Deutschen ausmachen.
In diesem Beitrag wird das internationale Forschungsnetzwerk EuroGr@mm' und die kontrastive Komponente der Internetplattform ProGr@mm1 des Instituts für Deutsche Sprache in Mannheim vorgestellt. In Kap. 2 wird auf die unterschiedlichen universitären und außeruniversitären Zielgruppen eingegangen. Die damit verbundenen Anwendungsmöglichkeiten werden in Kap. 3 gezeigt. Sie stützen sich dabei auf die mit der Lernplattform gewonnenen Erfahrungen aus der eigenen Praxis in der universitären Lehre. Danach wird in Kap. 4 exemplarisch ein zentraler Bereich der Grammatik - die Wortstellung - kontrastiv aus deutsch-ungarischer Perspektive betrachtet. Der Beitrag schließt mit der Zusammenfassung und einer kurzen Weiterführung zur Typologie (Kap. 5).
Ebenen der Verknüpfung
(2014)
Der Blick zurück nach vorn
(2014)
This paper investigates the syntactic behaviour of adverbial clauses in contemporary German and Italian. It focuses on three main questions: (i) How many degrees of syntactic integration of adverbial clauses are there to be distinguished by an adequate grammatical description of the two languages? (ii) Which linear and hierarchical positions in the structure of the matrix sentence can be occupied by adverbial clauses? (iii) Which is the empirical distribution of adverbial clauses introduced by the conjunctions als, während, wenn, obwohl and weil in German, as well as quando, mentre, se, sebbene and perché in Italian?
Responding to question (i), a distinction is drawn between strongly integrated, weakly integrated and syntactically disintegrated adverbial clauses. There are further degrees on the gradient of syntactic integration, which are not examined in this paper. Responding to question (ii), eight classes of structural positions in the matrix sentence are identified that can be occupied by adverbial clauses. Five of them are positions of syntactic integration, three are positions of disintegration. Responding to question (iii), the distribution of the ten classes of adverbial clauses is described on the basis of a corpus of internet data. Strongly integrated, weakly integrated and disintegrated adverbial clauses show clearly different distributions within the structure of the matrix sentence. Also the semantic classes of adverbial clauses (temporal, adversative, conditional, concessive, causal) are distributed differently.
The variation of the strong genitive marker of the singular noun has been treated by diverse accounts. Still there is a consensus that it is to a large extent systematic but can be approached appropriately only if many heterogeneous factors are taken into account. Over thirty variables influencing this variation have been proposed. However, it is actually unclear how effective they can be, and above all, how they interact. In this paper, the potential influencing variables are evaluated statistically in a machine learning approach and modelled in decision trees in order to predict the genitive marking variants. Working with decision trees based exclusively on statistically significant data enables us to determine what combination of factors is decisive in the choice of a marking variant of a given noun. Consequently the variation factors can be assessed with respect to their explanatory power for corpus data and put in a hierarchized order.
Der Aufsatz untersucht das syntaktische Verhalten nicht-satzförmiger Adverbialia im Deutschen und im brasilianischen Portugiesisch in vergleichender Perspektive. Behandelt werden Adverbialia aus sechs Klassen, deren semantische Funktionen von der Sachverhaltsbeschreibung bis zur Beschreibung von Handlungsabsichten des Sprechers reichen. Insgesamt zeigen sich große Ähnlichkeiten zwischen den Vergleichssprachen. Im Deutschen scheint eine etwas stärkere Tendenz zu bestehen, Adverbialia syntaktisch zu integrieren, während es im Portugiesischen mehr Möglichkeiten gibt, sie desintegriert zu verwenden.
Das Konzept,Textgrammatik' wird einer kritischen Prüfung unterzogen. Die Hypothese, für die argumentiert wird, ist, dass eine strikte Auslegung im Sinne der Annahme, Texte hätten eine spezifische Grammatik, wie Sätze eine spezifische Grammatik haben, nicht aufrecht erhalten werden kann. Grundlegende Eigenschaften, nämlich die Existenz eines hierarchisch aufgebauten Regelsystems, eine spezifische Form von Gegliedertheit und Formbezogenheit, sind anders als auf Satzebene beim Text nicht gegeben. Exemplarisch werden die Phänomene Anaphorik sowie, ausführlicher, Erscheinungsformen der Ellipse bzw. aus dem elliptischen Formenkreis diskutiert. Das Fazit ist: ,Textgrammatik‘ sollte - wenn überhaupt gebraucht - nur als Verweis auf die Textsensibilität der Satzgrammatik dienen.
On ancient grammars of space
(2014)
This volume presents new research by the Topoi group "The Conception of Spaces in Language" on the expression of spatial relations in ancient languages. The six articles in this volume discuss static and dynamic aspects of the spatial grammars of Ancient to Medieval Greek, Akkadian, Hittite, and Hieroglyphic Ancient Egyptian, as well as field data on eight modern languages (Arabic, Hebrew, English, German, Russian, French, Italian, and Spanish). Among the grams discussed are spatial particles, motion verbs, case and, most prominently, spatial prepositions. All ancient language data are fully explained in linguistic word-by-word glosses and are therefore accessible to scholars who are not themselves experts on the respective languages. Taken together, these contributions extend the scope of research on spatial grammar back to the third millennium BCE.
"Badeölgrüne Buchten", "kükengelbes Haar" und "tomatenrote Tomaten" - Vergleiche mit Farbadjektiven
(2014)
Following a welcome in Lithuanian and English to the guests and members on the occa- sion of the 10"’ anniversary of EFNIL, the history of this European language Organization is sketched. A brief survey of the sociolinguistic themes treated at previous Conferences and the state of the inajor projects is given, followed by an introduction (in German) to the general topic of the present Conference. The importance that translation and interpretation have for European language diversity and the individual national languages beside foreign language education of all Europeans is being stressed.
Vorwort
(2014)
This paper describes a first version of an integrated e-dictionary translating possessive constructions from English to Zulu. Zulu possessive constructions are difficult to learn for non-mother tongue speakers. When translating from English into Zulu, a speaker needs to be acquainted with the nominal classification of nouns indicating possession and possessor. Furthermore, (s)he needs to be informed about the morpho-syntactic rules associated with certain combinations of noun classes. Lastly, knowledge of morpho-phonetic changes is also required, because these influence the orthography of the output word forms. Our approach is a novel one in that we combine e-lexicography and natural language processing by developing a (web) interface supporting learners, as well as other users of the dictionary to produce Zulu possessive constructions. The final dictionary that we intend to develop will contain several thousand nouns which users can combine as they wish. It will also translate single words and frequently used multiword expressions, and allow users to test their own translations. On request, information about the morpho-syntactic and morpho-phonetic rules applied by the system are displayed together with the translation. Our approach follows the function theory: the dictionary supports users in text production, at the same time fulfilling a cognitive function.
Post-field syntax and focalization strategies in National Socialist political speech. This paper deals with a syntactic feature of spoken German, i.e. post-field filling, and with its occurrence in one specific discourse type – political speech – throughout one significant period of the history of German language – National Socialism. This paper aims at pointing out the communicative pragmatic function of right dislocation in the NS political speech on the basis of some collected examples.
This paper seeks to apply the principles of the famous 3-Circle-Model devised for the description of the ecolinguistic position of English world-wide to the position of German around the world.
On the one hand, the 3-Circle-Model for English with its "Inner", "Outer" and "Extended/Expanding" Circles was invented by Kachru in the 1980s and has since then been adopted, refined and criticised by numerous authors. The situation of German world-wide, on the other hand, has only been scarcely discussed in the past 20 years. While the global extension of German is obviously by far weaker than that of English, there are also a number of noteworthy similarities in terms of historical spread and the current position of these two languages.
This paper therefore discusses the analogies of global English and German by establishing three circles for German: the Inner Circle for the core German-speaking area, i.e. Germany, Austria and Switzerland; the Outer Circle including a number of German minority areas (mostly in Europe), and finally the Extended Circle which may be denoted as "Crumbling" rather than "Expanding". The latter comprises traditional German diaspora communities in different parts of the world which either result from migration, but also reflect the previous functions of German as a language of culture and as a lingua franca in regions like Eastern Europe. The paper argues that there are some striking structural similarities, but also shows the limits of this comparison.
In the present-day Germanic languages, free relatives (FRs) share formal properties with indirect question in that both constructions are introduced by w-pronouns. However, at least in German (and historical stages of a larger set of languages, including English), there is an additional pattern which involves the use of d-pronouns such as German der/die/das ‘that.masc./fem./neut.’, which typically introduce headed relative clauses. Focusing on presentday German, this paper shows that d-FRs are set apart from w-FRs by a number of properties including syntactic distribution in the matrix clause, behavior with respect to matching effects, inventory of pronominal forms, and semantic interpretation. From these observations, it is concluded that d-FRs should not be analyzed on a par with w-FRs. More precisely, we argue that d-FRs are in fact regular headed (restrictive) relative clauses where the relative pronoun has been deleted under identity with a demonstrative antecedent. This apparent instance of syntactic haplology is then analyzed as resulting from the same mechanism that eliminates copies/traces in movement dependencies.
So far, there have been few descriptions on creating structures capable of storing lexicographic data, ISO 24613:2008 being one of the latest. Another one is by Spohr (2012), who designs a multifunctional lexical resource which is able to store data of different types of dictionaries in a user-oriented way. Technically, his design is based on the principle of a hierarchical XML/OWL (eXtensible Markup Language/Web Ontology Language) representation model. This article follows another route in describing a model based on entities and relations between them; MySQL (usually referred to as: Structured Query Language) describes a database system of tables containing data and definitions of relations between them. The model was developed in the context of the project "Scientific eLexicography for Africa" and the lexicographic database to be built thereof will be implemented with MySQL. The principles of the ISO model and of Spohr's model are adhered to with one major difference in the implementation strategy: we do not place the lemma in the centre of attention, but the sense description — all other elements, including the lemma, depend on the sense description. This article also describes the contained lexicographic data sets and how they have been collected from different sources. As our aim is to compile several prototypical internet dictionaries (a monolingual Northern Sotho dictionary, a bilingual learners' Xhosa–English dictionary and a bilingual Zulu–English dictionary), we describe the necessary microstructural elements for each of them and which principles we adhere to when designing different ways of accessing them. We plan to make the model and the (empty) database with all graphical user interfaces that have been developed, freely available by mid-2015.
Eine syntaktische Besonderheit der kontinentalwestgermanischen Sprachen ist die Bildung satzfinaler Verbalkomplexe (" ... dass sie das Buch gelesen haben muss"), für die ein hohes Maß an sprach- bzw. dialektübergreifender und idiolektaler Verbstellungsvariation charakteristisch ist. Der niederdeutsche Verbalkomplex gilt in Überblicksdarstellungen als streng kopffinal, wobei bisher – anders als für niederländische und hochdeutsche (besonders: oberdeutsche) Mundarten – kaum empirische Studien vorliegen. Der Aufsatz präsentiert eine deskriptive Analyse des zweigliedrigen Verbalkomplexes im Märkisch-Brandenburgischen, dem südöstlichsten der niederdeutschen Dialektverbände.
Im Gegensatz zum Standarddeutschen und anderen niederdeutschen Mundarten wie dem Nordniederdeutschen, weist das Brandenburgische selbst bei nur zwei verbalen Elementen in der rechten Satzklammer Variation auf ("dass sie lesen kann/kann lesen"). Anhand von Tonaufnahmen aus dem bisher kaum erschlossenen DDR-Korpus wird folgenden Fragen nachgegangen: Welche Verbstellungsvarianten sind in welchen Syntagmen möglich bzw. werden präferiert? Welche Unterschiede bestehen zwischen Haupt- und Nebensatzkomplexen? Wie verhält sich der brandenburgische Verbalkomplex in Bezug auf nicht-verbale Intervenierer (sog. Verb Projection Raising)? Wie verhalten sich Modal- und andere infinitivregierende Verben unter Perfekteinbettung (d.h. in stddt. Ersatzinfinitivkontexten)?
Am Ende steht eine erste typologische Einordnung des brandenburgischen Verbalkomplexes im Vergleich mit anderen kontinentalwestgermanischen Varietäten, wobei sich areallinguistisch interessante Ähnlichkeiten mit dem südlich angrenzenden Ostmitteldeutschen zeigen.
German lexical items with similar or related morphological roots and similar meaning potential are easily confused by native speakers and language learners. These include so-called paronyms such as effektiv/effizient , sensitive/sensibel, formell/formal/förmlich . Although these are generally not regarded as synonyms, empirical studies suggest that in some cases items of a paronym set have undergone meaning change and developed synonymous notions. In other cases, they remain similar in meaning, but show subtle differences in definition and restrictions of usage. Whereas the treatment of synonyms has received attention from corpus-linguists (cf. Partington 1998; Taylor 2003), the subject of paronyms has not been revisited with empirical, data-driven methods neither in terms of semantic theory nor in terms of practical lexicography. As a consequence, we also need to search for suitable corpus methods for detailed semantic investigation. Lexicographically, some German paronyms have been documented in printed dictionaries (e.g. Müller 1973; Pollmann & Wolk 2010). However, there is no corpus-assisted reference guide describing paronyms empirically and enabling readers to find the correct contemporary usage. Therefore, solutions to some lexicographic challenges are required.
We start by trying to answer a question that has already been asked by de Schryver et al. (2006): Do dictionary users (frequently) look up words that are frequent in a corpus. Contrary to their results, our results that are based on the analysis of log files from two different online dictionaries indicate that users indeed look up frequent words frequently. When combining frequency information from the Mannheim German Reference Corpus and information about the number of visits in the Digital Dictionary of the German Language as well as the German language edition of Wiktionary, a clear connection between corpus and look-up frequencies can be observed. In a follow-up study, we show that another important factor for the look-up frequency of a word is its temporal social relevance. To make this effect visible, we propose a de-trending method where we control both frequency effects and overall look-up trends.
Sprachverfall? Einleitung
(2014)
This paper reports on an ongoing lexicographical project that investigates Polish loanwords from German that were further borrowed into the East Slavic languages Russian, Ukrainian, and Belorussian. The results will be published as three separate dictionaries in the Lehnwortportal Deutsch, a freely available web portal for loanword dictionaries having German as their common source language. On the database level, the portal models lexicographical data as a cross-resource directed acyclic graph of relations between individual words, including German ‘metalemmata’ as normalized representations of diasystemic variants of German etyma. Amongst other things, this technology makes it possible to use the web portal as an ‘inverted loanword dictionary’ to find loanwords in different languages borrowed from the same German etymon. The different possible pathways of German loanwords that went through Polish into the East Slavic languages can be represented directly as paths in the graph. A dedicated in-house dictionary editing software system assists lexicographers in producing and keeping track of these paths even in complex cases where, e.g, only a derivative of a German loanword in Polish has been borrowed into Russian. The paper concludes with some remarks on the particularities of the dictionary/portal access structure needed for presenting and searching borrowing chains.
Communication of stereotypes in the classroom: biased language use of German and Turkish adolescents
(2014)
Little is known about the linguistic transmission and maintenance of mutual stereotypes in interethnic contexts. This field study, therefore, investigated the linguistic expectancy bias (LEB) and the linguistic intergroup bias (LIB) among German and Turkish adolescents (13 to 20 years) in the school context. The LEB refers to the general phenomenon of describing stereotypes more abstractly. The LIB is the tendency to use language abstraction for in-group protective reasons. Results revealed an unmoderated LEB, whereas the LIB only occurred when foreigners were in the numerical majority, the classroom composition was perceived as a learning disadvantage, or the interethnic conflict frequency was high. These findings provide first evidence for the use of both LEB and LIB in an interethnic classroom setting.
Der Semantik-Band des Handbuchs der deutschen Konnektoren beschreibt erstmals umfassend die Bedeutung der deutschen Konnektoren und etabliert eine theoretisch begründete semantische Klassifikation dieser Satzverknüpfer, die auf der syntaktischen Klassifikation des ersten Bandes des Handbuchs von Pasch et al. (2003) aufbaut. Der Semantik-Band richtet sich in erster Linie an ein linguistisches Fachpublikum. Durch die Darstellung der spezifischen Gebrauchsbedingungen satzverknüpfender Einheiten ist es darüber hinaus für Bereiche relevant, in denen das Verfassen und Verstehen von Texten Thema ist, wie Deutsch als Fremdsprache, Deutschdidaktik, Computerlinguistik, Übersetzungswissenschaft und angewandte Sprachforschung.
Der Semantik-Band des Handbuchs der deutschen Konnektoren beschreibt erstmals umfassend die Bedeutung der deutschen Konnektoren und etabliert eine theoretisch begründete semantische Klassifikation dieser Satzverknüpfer, die auf der syntaktischen Klassifikation des ersten Bandes des Handbuchs von Pasch et al. (2003) aufbaut. Der Semantik-Band richtet sich in erster Linie an ein linguistisches Fachpublikum. Durch die Darstellung der spezifischen Gebrauchsbedingungen satzverknüpfender Einheiten ist es darüber hinaus für Bereiche relevant, in denen das Verfassen und Verstehen von Texten Thema ist, wie Deutsch als Fremdsprache, Deutschdidaktik, Computerlinguistik, Übersetzungswissenschaft und angewandte Sprachforschung.
In diesem Wörterbuch finden sich von App bis Zickenalarm mehr als 570 Stichwörter, die die aktuelle Wortschatzerweiterung im Deutschen als Ausdruck der Anpassung des Wortschatzes an neue Gegebenheiten und Sachverhalte spiegeln. Erfasst und in umfangreichen Wortartikeln beschrieben und dokumentiert sind die Neulexeme und Neubedeutungen, die im Zeitraum von 2001 bis 2010 aufgekommen sind und sich weitgehend im allgemeinsprachlichen Teil des Wortschatzes der deutschen Standardsprache etabliert haben.
Gegenstand der Arbeit sind Illustrationen in Onlinewörterbüchern. Untersucht wurde, wie sie Wörterbuchartikel sinnvoll ergänzen und wie ihre Rezeption für den Benutzer erleichtert werden kann. Dazu wurden spezielle Methoden zur Erforschung dieser Fragen entwickelt und zwei empirische Studien durchgeführt: Zum einen wurden Wörterbuchbenutzer zu ihren Bedürfnissen und Gewohnheiten befragt, um beispielsweise mehr über die Auswahl zu illustrierender Lemmata und die optimale Bildgestaltung herauszufinden. Zum anderen wurden durch eine Blickbewegungsstudie Erkenntnisse zum Rezeptionsverhalten der Benutzer bei Text-Bild-Verknüpfungen im Wörterbuch gewonnen. Abschließend wurde der Untersuchungsgegenstand neu geordnet und eine Best-Practice-Anleitung zur Illustrierung von Onlinewörterbüchern entwickelt.
In diesem Wörterbuch finden sich von App bis Zickenalarm mehr als 570 Stichwörter, die die aktuelle Wortschatzerweiterung im Deutschen als Ausdruck der Anpassung des Wortschatzes an neue Gegebenheiten und Sachverhalte spiegeln. Erfasst und in umfangreichen Wortartikeln beschrieben und dokumentiert sind die Neulexeme und Neubedeutungen, die im Zeitraum von 2001 bis 2010 aufgekommen sind und sich weitgehend im allgemeinsprachlichen Teil des Wortschatzes der deutschen Standardsprache etabliert haben.