Refine
Year of publication
- 2019 (138) (remove)
Document Type
- Article (48)
- Part of a Book (30)
- Review (19)
- Conference Proceeding (14)
- Book (12)
- Part of Periodical (11)
- Other (2)
- Doctoral Thesis (1)
- Working Paper (1)
Language
- German (97)
- English (38)
- Ukrainian (2)
- Multiple languages (1)
Is part of the Bibliography
- no (138) (remove)
Keywords
- Deutsch (52)
- Korpus <Linguistik> (17)
- Rezension (10)
- Interaktion (9)
- Konversationsanalyse (9)
- Linguistik (9)
- Diskursanalyse (8)
- Gesprochene Sprache (8)
- Sprache (8)
- Germanistik (7)
Publicationstate
- Veröffentlichungsversion (58)
- Zweitveröffentlichung (53)
- Postprint (13)
Reviewstate
Publisher
Although the N400 was originally discovered in a paradigm designed to elicit a P300 (Kutas and Hillyard, 1980), its relationship with the P300 and how both overlapping event-related potentials (ERPs) determine behavioral profiles is still elusive. Here we conducted an ERP (N = 20) and a multiple-response speed-accuracy tradeoff (SAT) experiment (N = 16) on distinct participant samples using an antonym paradigm (The opposite of black is white/nice/yellow with acceptability judgment). We hypothesized that SAT profiles incorporate processes of task-related decision-making (P300) and stimulus-related expectation violation (N400). We replicated previous ERP results (Roehm et al., 2007): in the correct condition (white), the expected target elicits a P300, while both expectation violations engender an N400 [reduced for related (yellow) vs. unrelated targets (nice)]. Using multivariate Bayesian mixed-effects models, we modeled the P300 and N400 responses simultaneously and found that correlation between residuals and subject-level random effects of each response window was minimal, suggesting that the components are largely independent. For the SAT data, we found that antonyms and unrelated targets had a similar slope (rate of increase in accuracy over time) and an asymptote at ceiling, while related targets showed both a lower slope and a lower asymptote, reaching only approximately 80% accuracy. Using a GLMM-based approach (Davidson and Martin, 2013), we modeled these dynamics using response time and condition as predictors. Replacing the predictor for condition with the averaged P300 and N400 amplitudes from the ERP experiment, we achieved identical model performance. We then examined the piecewise contribution of the P300 and N400 amplitudes with partial effects (see Hohenstein and Kliegl, 2015). Unsurprisingly, the P300 amplitude was the strongest contributor to the SAT-curve in the antonym condition and the N400 was the strongest contributor in the unrelated condition. In brief, this is the first demonstration of how overlapping ERP responses in one sample of participants predict behavioral SAT profiles of another sample. The P300 and N400 reflect two independent but interacting processes and the competition between these processes is reflected differently in behavioral parameters of speed and accuracy.
Preface
(2019)
Der vorliegende Beitrag beschäftigt sich mit dem Gebrauch von konnektintegrierbaren Konnektoren im gesprochenen Deutsch. Die Analyse wird am Beispiel der Adverbkonnektoren deshalb und deswegen als Korrelate zum Subjunktor weil und ausgehend von theoretischen Prämissen aus der traditionellen Grammatik und aus der Gesprächsforschung durchgeführt. Der Gebrauch der genannten Konnektoren wird innerhalb einer Auswahl von Korpusdaten gesprochener Sprache beobachtet, die mehrere verschiedene Gattungen der alltäglichen bzw. der institutionellen Kommunikation umfasst.
This paper aims at investigating the usage of present subjunctive (Konjunktiv I), which is traditionally labelled as a feature of standard written language and therefore as typically occurring in communication genres based on it such as press texts and reporting, in everyday spoken German. Through an analysis of corpus data performed according to theory and method of Interactional Linguistics and encompassing private, institutional and public interactional domains, the paper will show how this particular verb form expresses different epistemic stances according to its syntactic embedment.
This paper focuses on so called syntactic projection phenomena in the German language. This term from the German Gesprächsforschung is used to define the fact that an utterance or part of it foreshadows another one. This paper aims at pointing out how such projection phenomena are consciously exploited for rhethorical purposes. This will be observed on the basis of excerpts from the Stuttgart 21 mediation talks. The linguistic analysis carried out in this paper will focus on syntactic projection phenomena involving the use of causal adverbial connectives deshalb and deswegen.
Im Streit um Migration soll der Gebrauch von Disclaimern in erster Linie ein positives Bild des Produzenten liefern oder wenigstens Ansprüche auf die Berechtigung seiner kritischen Stellungnahme erheben, ohne dass der Produzent als Rassist abgestempelt wird. Im vorliegenden Beitrag werden die Ergebnisse einer Fallstudie über den Gebrauch eines solchen Disclaimers in Deutschland und in Italien zusammengefasst, nämlich von „Ich bin kein Rassist, aber“ und seiner italienischen Entsprechung „Non sono razzista, ma“. Es wird gezeigt, (i) wie diese Disclaimer zum Ausdruck ausländerkritischer Stellungnahmen verwendet werden und (ii) wie ihre Verwendung in der Öffentlichkeit wahrgenommen wird.
As the Web ought to be considered as a series of sources rather than as a source in itself, a problem facing corpus construction resides in meta-information and categorization. In addition, we need focused data to shed light on particular subfields of the digital public sphere. Blogs are relevant to that end, especially if the resulting web texts can be extracted along with metadata and made available in coherent and clearly describable collections.
Speech planning is a sophisticated process. In dialog, it regularly starts in overlap with an incoming turn by a conversation partner. We show that planning spoken responses in overlap with incoming turns is associated with higher processing load than planning in silence. In a dialogic experiment, participants took turns with a confederate describing lists of objects. The confederate’s utterances (to which participants responded) were pre-recorded and varied in whether they ended in a verb or an object noun and whether this ending was predictable or not. We found that response planning in overlap with sentence-final verbs evokes larger task-evoked pupillary responses, while end predictability had no effect. This finding indicates that planning in overlap leads to higher processing load for next speakers in dialog and that next speakers do not proactively modulate the time course of their response planning based on their predictions of turn endings. The turn-taking system exerts pressure on the language processing system by pushing speakers to plan in overlap despite the ensuing increase in processing load.
Wie werden Wörter im Deutschen und im Englischen geschrieben? Wo sind Gemeinsamkeiten, wo sind Unterschiede? Diese Fragen werden aus morphologisch-graphematischer Perspektive bearbeitet. Es geht hier also nicht um Bezüge zwischen Schrift und Lautform (traditionell oft im Fokus der Graphematik), sondern um Korrespondenzen zwischen Schrift und Morphologie. Das betrifft zum einen den Aufbau von Morphemen. Welche Beschränkungen lassen sich hier für die Abfolge der Buchstaben formulieren? Was sind minimale, was sind prototypische Stämme und Affixe? Zum anderen geht es um Fragen der Einheitlichkeit (Wie uniform wird ein Morphem in der Schrift repräsentiert?) und der Eindeutigkeit (Wie distinkt verweist eine Schreibung auf ein Morphem?). Insgesamt zeigt sich, dass im Englischen eher Affixe verlässlich kodiert werden (oft eindeutig und einheitlich), während im Deutschen häufig Stämme einheitlich kodiert werden. Das sind zwei grundsätzlich unterschiedliche Strategien der Leseerleichterung.
Die aus einer Doktorarbeit hervorgegangene, ausgesprochen reife Monographie von Julia Kaiser ist ein solides Stück linguistischer Arbeit. Die Lektüre spricht an, erweitert den Wissenshorizont und bereichert somit viele Linguisten – von den Epigonen des Strukturalismus über Anhänger der Dependenzoder Konstruktionsgrammatik bis hin zu den Vertretern der modernen Semantik. Im Fokus der Arbeit stehen „infinitivlose“ (= absolut verwendete) Modalverben (MV) im gesprochenen Deutsch. Im Einzelnen wird auf Vollverb-Verwendungen, Ellipsen, Analepsen, MV mit Richtungsbestimmungen und idiomatisierte absolute Verwendungen eingegangen.
This paper investigates two verbal constructions containing the German verb verdienen (‘to earn / deserve’), e.g. er verdient sich sein Brot ‘he earns his living’ (lit. he earns himself his bread) und er verdient gewürdigt zu werden ‘he deserves to be appreciated". It is shown that the notion of analogy allows for motivating some important features of particular constructions with verdienen. Two interpretations of analogy are employed: analogy in the sense of non-hierarchical family resemblance on the one hand, and analogy leading to changes by mapping a structure from one domain to another on the other hand. It is suggested that both verdienen in combination with sich and verdienen in combination with a verbal complement can be accounted for by focusing on their formal and semantic similarities connecting them to other constructions coming from the same construction family. Moreover, it is shown that versprechen and vermögen could be regarded as analogical models for verdienen.
Der Beitrag fokussiert ausgewählte Vorkommen des nicht-phorischen es. Es wird argumentiert, dass das formale Subjekt-es im Vergleich zum formalen Objekt-es insofern eine größere Variabilität zeigt, als Ersteres lexikalische und grammatische Konstruktionen konstituiert, während Letzteres nur in lexikalischen Konstruktionen erscheint. Zur Differenzierung wird der Begriff der Idiomatizität herangezogen, deren Beschaffenheit in sprachvergleichender Perspektive, mit Ungarisch als Kontrastsprache exemplarisch gezeigt wird.
Die Universität als Vorbild/Spiegelbild/Zerrbild für Spracheinstellungen und Sprachgebrauch heute?
(2019)
Der folgende Beitrag beschäftigt sich mit der Frage, wie weit der mündliche Sprachgebrauch an der Universität und die damit verbundenen Spracheinstellungen Vorbild, Spiegelbild oder aber Zerrbild des alltäglichen Sprachgebrauchs und allgemeiner Spracheinstellungen sind. Aus heuristischen Gründen liegt der Fokus dabei auf Sprachformen jenseits des Standards, die üblicherweise nicht mit einem universitären Sprachgebrauch in Verbindung gebracht werden. Die Datenerhebung dokumentiert exemplarisch die Situation an der Universität Salzburg, die Auswertung kombiniert in einem Mixed-Methods-Ansatz quantitative und qualitative Methoden.
Nearly all of the very large corpora of English are “static”, which allows a wide range of one-time, pre-processed data, such as collocates. The challenge comes with large “dynamic” corpora, which are updated regularly, and where preprocessing is much more difficult. This paper provides an overview of the NOW corpus (News on the Web), which is currently 8.2 billion words in size, and which grows by about 170 million words each month. We discuss the architecture of NOW, and provide many examples that show how data from NOW can (uniquely) be extracted to look at a wide range of ongoing changes in English.
We propose a Cross-lingual Encoder-Decoder model that simultaneously translates and generates sentences with Semantic Role Labeling annotations in a resource-poor target language. Unlike annotation projection techniques, our model does not need parallel data during inference time. Our approach can be applied in monolingual, multilingual and cross-lingual settings and is able to produce dependencybased and span-based SRL annotations. We benchmark the labeling performance of our model in different monolingual and multilingual settings using well-known SRL datasets. We then train our model in a cross-lingual setting to generate new SRL labeled data. Finally, we measure the effectiveness of our method by using the generated data to augment the training basis for resource-poor languages and perform manual evaluation to show that it produces high-quality sentences and assigns accurate semantic role annotations. Our proposed architecture offers a flexible method for leveraging SRL data in multiple languages.
Mein Beitrag entstand im Rahmen meiner biografie- und interaktionsanalytischen Studie zu sozialen und sprachlichen Erfahrungen junger „Rückkehrer/innen“, d. h. junger Frauen und Männer türkischer Herkunft, die in Deutschland oder Österreich aufwuchsen, und als Jugendliche bzw. junge Erwachsene in die Türkei migrierten. Furkan, der Informant, den ich hier vorstelle, schildert Ausgrenzungserfahrungen in Deutschland aufgrund seiner ethnischen Herkunft und Anpassungsprobleme in der Türkei aufgrund sprachlicher und sozialer Auffälligkeiten. Ziel meiner Analyse ist es, die verschiedenen Phasen seiner Lebensgeschichte in beiden Lebenswelten zu beschreiben, den Zusammenhang zwischen Ausgrenzungserlebnissen, ihrer Deutung und ihrer narrativen Bewältigung zu rekonstruieren und die Unterschiede zwischen der Schilderung in beiden Lebenswelten herauszuarbeiten. Auf dieser Basis lässt sich die narrative Bewältigung der Erlebnisse in Kindheit und früher Jugend in Deutschland mit Erzählformen für Traumata in Beziehung setzen.
Narrativer Entwurf einer positiven Selbstkategorie in unterschiedlichen Sozial- und Sprachwelten
(2019)
Dieser Beitrag entstand im Rahmen meiner biografie- und interaktionsanalytischen Studie zu sozialen und sprachlichen Erfahrungen junger „RückkehrerInnen“, d.h. junger Frauen und Männer türkischer Herkunft, die in Deutschland oder Österreich aufwuchsen, und als Jugendliche bzw. junge Erwachsene in die Türkei migrierten. Arda, der Informant, den ich im Folgenden vorstellen werde, beschreibt unterschiedliche Sozialwelten in Deutschland und in der Türkei. Dabei räumt er der Beschreibung von zwei grundsätzlich unterschiedlichen Lebenswelten, die seine Kindheit in Deutschland prägen, großen Raum ein: zum einen der Lebenswelt des Türkenviertels in Kreuzberg, wo er geboren ist und bis zur Einschulung lebte, und zum anderen der deutschen Lebenswelt, in die seine Familie später umgezogen ist und in der er die Grundschule besucht und absolviert hat. Nach der Übersiedlung in die Türkei erlebt Arda eine moderne türkische Lebenswelt, an die er sich anpassen muss. In seinem neuen Leben erfährt er den schmerzlichen Verlust der deutschen Alltagssprache. Zur Beschreibung verwendet er komplexe Verfahren ethnischer und sozialer Kategorisierung und negativer bzw. positiver Selbstpositionierungen zu den verschiedenen Welten. Ziel meiner Analysen ist es nach einem Überblick über die soziolinguistische Forschung zu sozialer Kategorisierung, die Kategorisierungsprozesse und deren charakteristische Eigenschaften und Handlungsweisen, die Arda verwendet, zu rekonstruieren und die sprachlichen Mittel und Verfahren zu beschreiben, die zur Positionierung und zur Selbst- und Fremdkategorisierung verwendet werden.
Статтю присвячено дослідженню комунікативних невдач у мовленнєвому жанрі відеоінтерв’ю крізь призму української національної ідентичності. Визначено тематику, типи і жанрово-мовну специфіку українського відеоінтерв’ю як зразка діалогічного мовлення. Встановлено специфіку комунікативних невдач у цьому жанрі (зі спортсменами, політиками і культурними діячами) з огляду на позиції комунікантів, структурні рівні досліджуваного жанру та максими спілкування.
Der Sprachwissenschaft und der Soziologie eröffnen sich angesichts der Digitalisierung vielversprechende Räume zur produktiven Zusammenarbeit. In unserem Beitrag zeigen wir, dass eine sozialstrukturelle Perspektive auf die Online-Kommunikation neue Erkenntnisse uber das Verhältnis von sprachlichem Kapital und sozialer Ungleichheit generieren kann. In Teilen der Sozialtheorie dominiert die Auffassung, dass die sprachliche Praxis ein überwiegend eigendynamisches, von sozialstrukturellen Determinanten weitestgehend unabhängiges System sei. Fur ein umfassendes Verständnis der neuen digitalen Interaktionssphären erscheint jedoch eine systematische Berücksichtigung lagebedingter sprachlicher Fähigkeiten notwendig. Der Beitrag wird dies am Beispiel sozialer Medien veranschaulichen.
Mangelhafter Adressatenzuschnitt in ukrainischen und deutschen politischen Youtube-Interviews
(2019)
The article investigates Ukrainian and German YouTube interviews from the point of view of contrastive linguistics. The purpose of this paper is to separate out the interview as a communicative genre and to determine the main aspects of research on discrepancies in expectations among interview participants, in particular to clarify the role of poor recipient design as the cause of communication failures. Results indicate that poor recipient design is the most common source of communication failures in both languages.
The article deals with communicative failures of journalists in “YouTube” celebrity video interviews in the Ukrainian and German linguacultures from the point of view of social interaction and the theory of speech genres at all structural levels of the communicative genre construction, establishing common and distinctive features in both linguacultures. The analysis made it possible to conclude that behind a language (speech) failure there is a violation caused by a journalist, a respondent, or an external noise.
Gute Argumente. Wo beginnen?
(2019)
Gerade allgemeinere Verben zeigen eine Variationsbreite der Verwendung, die nicht leicht zu einem einheitlichen Bild zu fassen ist. Am Beispiel des Verbs beginnen wird gezeigt, wie hier die Interaktion zwischen der Struktur der Aktanten und den grammatischen Regelmäßigkeiten funktioniert. Dabei wird versucht, in der Kombination von Valenzinformationen, Argumentstrukturpositionierungen und Musterbildungen im Gebrauch ein zusammenhängendes Bild dieses Verbs in seinen verschiedenen Verwendungen zu entwerfen.
Central complements: good arguments are self-explanatory.
Together with its central complements, verbs model basic patterns of interaction. The constellations of these complements in turn correspond to central patterns of the argument structure. Nominative and accusative complements formally occupy the first and second positions (subject and object), but they also have certain semantic preferences. The formal function of the dative is less pronounced, where it occurs (ditransitive verbs) the semantic imprint of the frame („transfer“) is very strong. This corresponds to the meaning of a core group of corresponding verbs. Other verbs that allow this pattern are used more often in other valence structures and the ditransitive use appears as a systematic way of personal extension of object‑related activities. This will be discussed with reference to the verbs zeigen and (in a different way) lehren.
Die Zeitung und die Welt
(2019)
Man muss glaube ich unterscheiden. Poetisch zu sein ist das eine, literarisch das andere. Das lässt sich auch auf die zugehörigen schwierigen Substantive beziehen, die Literarizität und die Poetizität. Und dann kann man auch über die poetische Funktion nachdenken, einem Postulat aus der Ergänzung der Bühler’schen Funktionstrias im Kontext des Prager Funktionalismus, die wir Roman Jakobson verdanken. Dass man unterscheiden muss, gilt vor allem oder auch noch mehr in einer nicht mehr (so) regelgeleiteten Moderne – und für eine sprachwissenschaftlich basierte Antwort.
In diesem Beitrag soll ein Nachschlagewerk zur arealen Variation in der Grammatik des Deutschen kurz vorgestellt werden: die in Form eines Online-Wikis erschienene „Variantengrammatik des Standarddeutschen“. Sie ist das Hauptergebnis einer langjährigen Zusammenarbeit der Projektgruppe „Variantengrammatik“ unter der Leitung der Autorin und der Autoren dieses Beitrags. Für das Projekt wurde ein areal gewichtetes und annotiertes Korpus erstellt, das aus Lokal- und Regionalteilen der Online-Ausgaben von 68 regional verbreiteten Zeitungen besteht. Die ausgewählten Zeitungen sind nach fünfzehn Arealen des zusammenhängenden deutschsprachigen Raums unterteilt. Das tokenisierte, lemmatisierte und nach Wortarten annotierte Gesamtkorpus, auf das sich die Variantengrammatik stützt, umfasst ca. 600 Millionen Wörter.
Lebenslauf bis 2019
(2019)
Ulrich Engel schildert die einzelnen Stationen seines Lebens: als Kind im Vorkriegsdeutschland und als junger Soldat, anschließend seine Lehrertätigkeit und wissenschaftliche Laufbahn, insbesondere seine Funktion als Direktor des Instituts für Deutsche Sprache in Mannheim. Er hebt seine Tätigkeit als Leiter von mehreren Projekten von kontrastiven zweisprachigen Grammatiken sowie Valenzwörterbüchern hervor. Dabei schildert er seinen familiären Hintergrund als Spiegel des gesellschaftlich‑politischen Wandels im Vor‑ und Nachkriegsdeutschland.
We report on a new project building a Natural Language Processing resource for Zulu by making use of resources already available. Combining tagging results with the results of morphological analysis semi-automatically, we expect to reduce the amount of manual work when generating a finely-grained gold standard corpus usable for training a tagger. From the tagged corpus, we plan to extract verb-argument pairs with the aim of compiling a verb valency lexicon for Zulu.
Der vorliegende Beitrag setzt sich mit dem computergestützten Transkriptionsverfahren arabisch-deutscher Gesprächsdaten für interaktionsbezogene Untersuchungen auseinander. Zunächst werden wesentliche methodische Herausforderungen der gesprächsanalytischen Arbeit adressiert: Hinsichtlich der derzeitigen Korpustechnologie ermöglicht die Verwendung von arabischen Schriftzeichen in einem mehrsprachigen, bidirektionalen Transkript keine analysegerechte Rekonstruktion von Reziprozität, Linearität und Simultaneität sprachlichen Handelns. Zudem ist die Verschriftung von arabischen Gesprächsdaten aufgrund der unzureichenden (gesprächsanalytischen) Beschäftigung mit den standardfernen Varietäten und gesprochensprachlichen Phänomenen erschwert. Daher widmet sich der zweite Teil des Beitrags den bisher erarbeiteten und erprobten Lösungsansätzen ̶ einem stringenten, gesprächsanalytisch fundierten Transkriptionssystem für gesprochenes Arabisch.
The paper deals with the process of computer-aided transcription regarding Arabic-German data material for interaction-based studies. First of all, it sheds light upon some major methodological challenges posed by the conversation-analytic approaches: due to current corpus technology, the reciprocity, linearity, and simultaneity of linguistic activities cannot be reconstructed in an analytically proper way when using the Arabic characters in multilingual and bidirectional transcripts. The difficulty of transcribing Arabic encounters is also compounded by the fact that Spoken Arabic as well as its varieties and phenomena have not been standardised enough (for conversation-analytic purposes). Therefore, the second part of this paper is dedicated to preliminary, self-developed solutions, namely a systematic method for transcribing Spoken Arabic.
Die Vermittlung von Fachsprache gewinnt in der heutigen europäischen Gesellschaft, die von 'Bewegungen' unterschiedlicher Art charakterisiert ist, immer mehr an Relevanz, aber die Lernergruppen werden immer differenzierter und die Lehrenden, die meist keine Experten auf dem Fachgebiet sind, haben Schwierigkeiten lernergerechte Kurse zu gestalten, da die Möglichkeiten zur Aus- oder Fortbildung selten sind. Fragen, die offen stehen oder nur teilweise beantwortet wurden, gibt es noch viele und eine einheitliche Antwort ist nicht immer möglich, aber wir möchten trotzdem versuchen, anstatt von Problemfällen auch Experimente und Lösungen vorzustellen. Wir möchten zeigen, wie und mit welchen Mitteln und Werkzeugen Fachsprachen beschrieben werden können und welche Auswirkungen dies im Unterricht haben kann. Nach einem Überblick über die unterschiedlichen Definitionsmöglichkeiten von 'Fachsprache', zeigen wir, welche Auswirkungen die unterschiedlichen Schwerpunkte in der Lehre haben können. Abschließend werden wir ein kleines korpuslinguistisches Experiment vorstellen (Korpus mit den Aufsätzen zum Themenschwerpunkt 'Fachsprache' ZIF 2019-1), um mögliche Anregungen zur Benutzung von Korpora zu geben, da sich Korpora in allen Phasen des Unterrichts (vor, während und danach) sowohl für Lehrende als auch für Lernende positiv auswirken können.
Persuasionsstrategien in deutschen rechtsorientierten Zeitungen. Eine korpuslinguistische Studie
(2019)
Corpus Linguistics has often proved fruitful to examine different types of discourses, also the one of refugees. Aim of the paper is to show how language usage patterns can be focused on with the help of techniques grounded in Corpus Linguistics, giving information about themes and topoi. After showing what type of words (keywords, collocations) and what type of phenomena will be considered (topoi, metaphors and frames) in the article, the focus will shift on the methodology and the adopted criteria. After presenting the primary corpus (articles from right-oriented newspapers) and the comparison corpus (articles from 'Die Zeit') the main results of the analysis are presented and reflected on.
Tourlex: ein deutsch-italienisches Fachwörterbuch zur Tourismussprache für italienische DaF-Lerner
(2019)
Tourlex is a specialized bilingual online dictionary under construction hosted at the University of Mannheim with a particular focus on collocations and multi-word units. The languages included are German and Italian, but because of the need for online dictionaries of tourism language (Flinz 2015: 56) the framework is open to the inclusion of other languages. Tourlex is a corpus-based dictionary, i.e. the primary sources will be corpora, in particular a proper bilingual comparable corpus analysed with the tools Sketch Engine and Lexpan, and the freely accessible corpus DeReKo. The aim of this paper is to give an overview of the main actions (already done but also in planning), according to the phases of the lexicographical process of a dictionary under construction. The description of each phase will be enriched by examples taken from the project, showing also how the decisions taken to satisfy the needs of the user, the Italian learner of German as a foreign language, had influenced the microstructure of the entries. We conclude with a final reflection on the data, facts, and ongoing problems.
Studies on the Linguistic Landscapes (LLs) investigate frequencies, functions, and power relations between languages and their speakers in public space. Research on the LL thereby aims to understand how the production and perception of signs reflect and simultaneously shape realities. In this sense, the LL is one of the most dynamic places where processes of minoritization take place: the (in)visibility of minority languages and the functional and symbolic relationships to majority languages are in direct relationship with negotiations of minorities’ place in society. This chapter looks at minority languages in the LL from two major perspectives. Firstly, it discusses language policies, focussing on which policy categories and which domains of language use are of particular relevance for understanding minority languages in the LL. Then, it turns to issues of conflict, contestation, and exclusion by providing examples from a range of geographically and typologically prototypical case studies, including Israel, Canada, Belgium, the Basque Country, and Friesland.
Text corpora come in many different shapes and sizes and carry heterogeneous annotations, depending on their purpose and design. The true benefit of corpora is rooted in their annotation and the method by which this data is encoded is an important factor in their interoperability. We have accumulated a large collection of multilingual and parallel corpora and encoded it in a unified format which is compatible with a broad range of NLP tools and corpus linguistic applications. In this paper, we present our corpus collection and describe a data model and the extensions to the popular CoNLL-U format that enable us to encode it.
The use of digital resources and tools across humanities disciplines is steadily increasing, giving rise to new research paradigms and associated methods that are commonly subsumed under the term digital humanities. Digital humanities does not constitute a new discipline in itself, but rather a new approach to humanities research that cuts across different existing humanities disciplines. While digital humanities extends well beyond language-based research, textual resources and spoken language materials play a central role in most humanities disciplines.