OPUS 4 | Search

Germany's micro census of 2017: The return of the language question (2018)

Adler, Astrid

Die Frage zur Sprache der Bevölkerung im deutschen Mikrozensus 2017 (2018)

Adler, Astrid

2017 gibt es im deutschen Mikrozensus zum ersten Mal seit etwa achtzig Jahren eine Frage zur Sprache der Bevölkerung in Deutschland. Diese Frage wird dann offenbar im entsprechenden Rhythmus des Mikrozensus jährlich wiederholt werden. Der Mikrozensus ist eine seit 1957 durchgeführte, repräsentative Befragung, bei der ungefähr 830.000 Menschen (das sind ca. 1 % der Bevölkerung) in rund 370.000 Haushalten befragt werden.1 Darin werden etwa Angaben zu den soziodemographischen Daten erfragt, zur familiären Situation, zur Wohnsituation, zur Aus- und Fortbildung und zur Arbeitssituation. Für die befragten Personen besteht Auskunftspflicht. Das Stellen einer Sprachfrage sieht, aus sprachwissenschaftlicher Sicht, zunächst nach einem sinnvollen und wünschenswerten Schritt aus. Nach näherer Betrachtung der gestellten Frage zeigen sich jedoch viele Unzulänglichkeiten und das, obwohl die Antworten und statistischen Auswertungen zu dieser Frage überhaupt noch ausstehen. Die Ergebnisse werden üblicherweise in der zweiten Hälfte des Folgejahres durch das statistische Bundesamt veröffentlicht.

The current status and use of Low German. Initial results of a representative study (2018)

Adler, Astrid ; Ehlers, Christiane ; Goltz, Reinhard ; Kleene, Andrea ; Plewnia, Albrecht

The current status and use of Low German. Initial results of a representative study (2018)

Adler, Astrid ; Ehlers, Christiane ; Goltz, Reinhard ; Kleene, Andrea ; Plewnia, Albrecht

Who understands Low German today and who can speak it? Who makes use of media and cultural events in Low German? What images do people in northern Germany associate with Low German and what is their view of their regional language? These and further questions are answered in this brochure with the help of representative data collected in a telephone survey of a total of 1,632 people from eight federal states (Bremen, Hamburg, Lower Saxony, Mecklenburg-West Pomerania and Schleswig-Holstein as well as Brandenburg, North Rhine-Westphalia and Saxony-Anhalt).

Möglichkeiten und Grenzen der quantitativen Spracheinstellungsforschung (2018)

Adler, Astrid ; Plewnia, Albrecht

Sprecher haben (oft unbewusste) Meinungen und Einstellungen zu Sprachen und Varietäten. Ein Weg, solche Spracheinstellungen zu erfassen, führt über quantitative Verfahren (Fragebogen mit offenen und geschlossenen Fragen), mit denen man Daten großer Gruppen – im Idealfall repräsentativ – erheben kann. Im Beitrag werden solche Erhebungen, die am Institut für Deutsche Sprache durchgeführt wurden, vorgestellt, und es werden zwei Instrumente der Spracheinstellungsforschung, die dabei zum Einsatz kamen, naher erläutert: das Allgemeine Sprachbewertungsinstrument (ASBI) und die Attitudes-Towards-Languages-Skala (AToL). Außerdem wird gezeigt, wie dialektometrische Auswertungs- und Visualisierungsverfahren auf Einstellungsdaten angewendet werden können.

Verschmelzung von Präposition und Artikel. Eine kontrastive Analyse zum Deutschen und Italienischen (2018)

Augustin, Hagen

Präpositionen und Artikelformen gehen in vielen europäischen Sprachen klitische Verbindungen ein, die spezielle Ausdrucksklassen wie die deutschen Verschmelzungsformen (z. B. ans, vom, zur) und italienischen ‚preposizioni articolate‘ (z. B. alla, delle, nel) konstituieren. Dieses Buch widmet sich dem Sprachvergleich dieser Ausdrucksklassen im Deutschen und Italienischen, die ausgehend von ähnlichen Voraussetzungen divergente diachrone Entwicklungen repräsentieren. Gezeigt wird dies anhand intra- und interlingualer Analysen zu Phonologie, Morphologie, Syntax und funktionalen Aspekten im Rede- und Textzusammenhang, die sowohl diachrone als auch synchrone Aspekte berücksichtigen und unmittelbar korpusempirisch abgesichert werden. Zentrale Erkenntnisse liefern außerdem sprachspezifische Fallstudien in großen Korpora, die auf methodisch innovativen, quantitativ und qualitativ ausgerichteten Distributionsanalysen struktureller und orthographischer Varianten von Präposition-Definitartikel-Verbindungen basieren.

Reconstruction of separable particle verbs in a corpus of spoken German (2018)

Batinić, Dolores ; Schmidt, Thomas

We present a method for detecting and reconstructing separated particle verbs in a corpus of spoken German by following an approach suggested for written language. Our study shows that the method can be applied successfully to spoken language, compares different ways of dealing with structures that are specific to spoken language corpora, analyses some remaining problems, and discusses ways of optimising precision or recall for the method. The outlook sketches some possibilities for further work in related areas.

Lightweight grammatical annotation in the TEI: new perspectives (2018)

Bański, Piotr ; Haaf, Susanne ; Mueller, Martin

In mid-2017, as part of our activities within the TEI Special Interest Group for Linguists (LingSIG), we submitted to the TEI Technical Council a proposal for a new attribute class that would gather attributes facilitating simple token-level linguistic annotation. With this proposal, we addressed community feedback complaining about the lack of a specific tagset for lightweight linguistic annotation within the TEI. Apart from @lemma and @lemmaRef, up till now TEI encoders could only resort to using the generic attribute @ana for inline linguistic annotation, or to the quite complex system of feature structures for robust linguistic annotation, the latter requiring relatively complex processing even for the most basic types of linguistic features. As a result, there now exists a small set of basic descriptive devices which have been made available at the cost of only very small changes to the TEI tagset. The merit of a predefined TEI tagset for lightweight linguistic annotation is the homogeneity of tagging and thus better interoperability of simple linguistic resources encoded in the TEI. The present paper introduces the new attributes, makes a case for one more addition, and presents the advantages of the new system over the legacy TEI solutions.

Forschungsdatenmanagement in den Geisteswissenschaften an der Universität zu Köln (2018)

Blumtritt, Jonathan ; Helling, Patrick ; Mathiak, Brigitte ; Rau, Felix ; Witt, Andreas

Die Bedeutung von Forschungsdatenmanagement im wissenschaftspolitischen Diskurs und im wissenschaftlichen Arbeitsalltag nimmt stetig zu. Nationale und internationale Forschungsinfrastrukturen, Verbünde, disziplinäre Datenzentren und institutionelle Kompetenzzentren nähern sich den Herausforderungen aus unterschiedlichen Perspektiven. Dieser Beitrag stellt das Data Center for the Humanities an der Universität zu Köln als Beispiel für ein universitäres Datenzentrum mit fachlicher Spezialisierung auf die Geisteswissenschaften vor.

Vorwort (2018)

Boonen, Ute K. ; Fisseni, Bernhard ; Wesche, Jörg

<was weiß ich>. Form-Funktionskopplung bei einem variablen Vagheitsmarker? (2018)

Brackhane, Fabian ; Zeschel, Arne ; Knöbl, Ralf

Am Beispiel der polyfunktionalen Mehrworteinheit <was weiß ich> wird das Zusammenspiel von pragmatischer und phonetischer Ausdifferenzierung in Pragmatikalisierungsprozessen untersucht. Hierzu werden spontan-sprachliche Belege aus dem Korpus „Deutsch heute“ analysiert. Die beobachtete phonetische Variationsbreite deutet auf eine komplexe Beziehung zu den jeweiligen pragmatischen Funktionen hin.

Präpositionalphrasen (2018)

Breindl, Eva ; Donalies, Elke

Projektvorstellung – Redewiedergabe. Eine literatur- und sprachwissenschaftliche Korpusanalyse (2018)

Brunner, Annelen ; Engelberg, Stefan ; Jannidis, Fotis ; Tu, Ngoc Duyen Tanja ; Weimer, Lukas

Das laufende DFG-Projekt „Redewiedergabe“ stellt einen Anwendungsfall quantitativer Sprach-und Literaturwissenschaft dar und beschäftigt sich mit dem Phänomen „Redewiedergabe“ auf der Grundlage großer Datenmengen. Zu diesem Zweck wird zum einen ein Korpus manuell mit Redewiedergabeformen annotiert, zum anderen werden Verfahren zur automatischen Erkennung des Phänomens entwickelt. Ziel ist es, Forschungsfragen nach der Entwicklung von Redewiedergabe vor allem im 19. Jahrhundert zu beantworten.

Einleitung (2018)

Bubenhofer, Noah ; Kupietz, Marc

Gesucht: sinnvolle Lösungen für Kommunikationsprobleme. Geflüchtete in Qualifizierungsmaßnahmen (2018)

Cindark, Ibrahim

Die auf nationaler Ebene formulierte „Willkommenskultur“ muss sich derzeit auf lokaler Ebene in zahlreichen Maßnahmen zur beruflichen Eingliederung bewähren. Die hohe Anzahl neuer Geflüchteter, aber auch Berufsfelder mit Nachwuchsproblemen machen das Gelingen dieser Maßnahmen zu einer umso dringlicheren Aufgabe. Dabei sind einige Hürden zu überwinden, doch es gibt auch hoffnungsvolle Ansätze.

Flüchtlinge in beruflichen Qualifizierungsmaßnahmen. Kommunikative Probleme und Lösungen bei der Verständigung (2018)

Cindark, Ibrahim

Deutschland sieht sich in den nächsten Jahren vor enorme Herausforderungen gestellt. Mit der Fluchtmigration von knapp 1,5 Mio. Menschen allein zwischen den Jahren 2014 und 2017 stehen nahezu in jedem gesellschaftlichen Bereich und hier insbesondere in den Sektoren Bildung und Arbeit große Integrationsaufgaben an. Steven Vertovec, der Leiter des Max-Planck-Instituts zur Erforschung multireligiöser und multiethnischer Gesellschaften, bezeichnet die Fluchtmigration von 2015 auch deshalb als die „zweite Wende“ (Vertovec 2015) für Deutschland, die das Land nachhaltig verändern wird. Nach seiner Einschätzung sind die erwartbaren gesellschaftlichen Transformationen von so einer Größenordnung, dass die Formulierung „seit der Flüchtlingskrise“ eine ebenso geläufige Redewendung werden wird wie die Formulierung „seit der Wende“. Um diese gegenwärtigen Migrations- und Integrationsprozesse von Anfang an dokumentieren und analysieren zu können, wurde am Institut für Deutsche Sprache (IDS) zu Beginn des Jahres 2016 das Projekt „Deutsch im Beruf: Die sprachlich-kommunikative Integration von Flüchtlingen“ gestartet, dessen erste Ergebnisse hier zusammenfassend präsentiert werden. Eine ausführliche Darstellung unserer Ergebnisse findet sich in der Zeitschrift „Deutsche Sprache 3 / 2018“

Von Schienen, Zügen und linguistischen Fragestellungen (2018)

Cosma, Ruxandra ; Kupietz, Marc

Das hier vorgeführte Schienenbild ist das in Anlehnung an Wittenburg (2009) als Erweiterungsinstrument gewählte Mittel in dem Versuch, Computertechnologie, linguistische Forschung und Vernetzung am Institut für Deutsche Sprache in deren rasch wachsenden Vielschichtigkeit zu beschreiben. Hier werden u. a. drei Blickwinkel, der des Technologie entwickelnden Wissenschaftlers, des entwickelnden Nutzers und des Nutzers von Informationstechnologie in der linguistischen Forschung vereint und um eine für den Sprachvergleich neue Dimension, die sprachspezifische Parameter von Analyseinstrumenten miteinander harmonisiert, erweitert.

"amades" - Arbeiten und Materialien zur deutschen Sprache (2018)

Cußler-Volz, Norbert

Die grammatischen Online-Angebote des IDS aus Sicht der Germanistik im Ausland. Gegenwart und Zukunft (2018)

Dalmas, Martine ; Schneider, Roman

Seit Mitte der 1990er Jahre wird am Institut für deutsche Sprache (IDS) in Mannheim erforscht, wie der hochkomplexe Gegenstandsbereich „Grammatik“ unter Ausnutzung digitaler Sprachressourcen und hypertextueller Navigationsstrukturen gleichermaßen wissenschaftlich fundiert und anschaulich vermittelt werden kann. Die grammatischen Online-Informationssysteme des IDS wenden sich nicht allein an Forscher und die interessierte Öffentlichkeit in Deutschland, sondern in gleichem Maße an Germanisten und Deutsch-Lernende in der ganzen Welt. Der vorliegende Beitrag beschreibt die damit verbundenen Hoffnungen und Anspruche. Daran anschließend thematisiert er praktische Einsatzmöglichkeiten und skizziert die funktionale und inhaltliche Weiterentwicklung der digitalen Grammatik-Angebote.

Offen, unabhängig, interaktiv. Das Journal für Medienlinguistik stellt sich vor (2018)

Dang-Anh, Mark ; Marx, Konstanze ; Meiler, Matthias

Am 17. Mai 2018 wurde das Journal für Medienlinguistik (jfml) mit einer zweitägigen Konferenz am Institut für Deutsche Sprache eröffnet und ist seitdem unter <jfml.org> erreichbar. Zuvor gab es trotz reger medienlinguistischer Forschungstätigkeiten kein zusammenführendes, periodisches Publikationsorgan für die Medienlinguistik im deutschsprachigen Raum. Das wollten wir, die Herausgeber_innen des jfml, ändern.

Sprache in der multimodalen Interaktion (2018)

Deppermann, Arnulf

Der Beitrag plädiert für eine Untersuchung der gesprochenen Sprache als integralem Bestandteil multimodaler Interaktionspraktiken. Das leibliche Handeln bildet die Infrastruktur für die Verwendung von Sprache, es schafft Bedingungen, Möglichkeiten und Motivationen für die Verwendung spezifischer sprachlicher Strukturen; umgekehrt wird es seinerseits durch sprachliches Handeln organisiert. Zunächst werden in dem Beitrag grundlegende Eigenschaften multimodaler Interaktion dargestellt: die Vielfalt der leiblichen Handlungsressourcen und ihre Koordination, Sequenzialität und Simultaneität von Aktivitäten, multimodale Beteiligung an der Interaktion, der Stellenwert von Raum, Objekten, Multiaktivität und Bewegung. Ebenso wird kurz auf die methodischen Grundlagen der Untersuchung eingegangen: Videoaufnahme und multimodale Transkription. An drei sprachlichen Phänomenbereichen wird dann exemplarisch gezeigt, wie sprachliche Praktiken durch ihr Zusammenspiel mit anderen leiblichen Ressourcen der Kommunikation geprägt sind. Im Einzelnen geht es um die Disambiguierung sprachlicher Praktiken durch ihre Koordination mit anderen Ressourcen, die Erweiterung sprachlicher Strukturen, die aufgrund von Rezipientenreaktionen simultan zur Turn-Produktion stattfindet, und die Verwendungen minimaler Referenzformen, die sich auf die multimodale Ko-Orientierung der Beteiligten stützt.

Inferential practices in social interaction: a conversation-analytic account (2018)

Deppermann, Arnulf

This paper argues that conversation analysis has largely neglected the fact that meaning in interaction relies on inferences to a high degree. Participants treat each other as cognitive agents, who imply and infer meanings, which are often consequential for interactional progression. Based on the study of audio- and video-recordings from German talk-in-interaction, the paper argues that inferences matter to social interaction in at least three ways. They can be explicitly formulated; they can be (conventionally) indexed, but not formulated; or they may be neither indexed nor formulated yet would be needed for the correct understanding of a turn. The last variety of inferences usually remain tacit, but are needed for smooth interactional progression. Inferences in this case become an observable discursive phenomenon if misunderstandings are treated by the explication of correct (accepted) and wrong (unaccepted) inferences. The understanding of referential terms, analepsis, and ellipsis regularly rely on inferences. Formulations, third-position repairs, and fourth-position explications of erroneous inferences are practices of explicating inferences. There are conventional linguistic means like discourse markers, connectives, and response particles that index specific kinds of inferences. These practices belong to a larger class of inferential practices, which play an important role for indexing and accomplishing intersubjectivity in talk in interaction.

Wissen im Gespräch (2018)

Deppermann, Arnulf

Dieser Artikel gibt einen Überblick darüber, wie grundlegend Wissen als Voraussetzung, Gegenstand und Produkt von Verständigungsprozessen für die Organisation von Gesprächen ist. Zunächst wird ein kognitivistischer Zugang zu Wissen mit einem sozialkonstruktivistischen kontrastiert. Es werden zum einen kommunikative Gattungen, die auf die Kommunikation von Wissen spezialisiert sind, dargestellt; zum anderen wird gezeigt, wie Wissen auch dann die Gestaltung der Interaktion bestimmt, wenn der primäre Gesprächszweck nicht in Wissensvermittlung besteht. Vier Dimensionen werden angesprochen: a) Das mit dem Adressaten geteilte Wissen (common ground) ist Grundlage des Adressatenzuschnitts von Äußerungen (recipient design); b) geteiltes Wissen wird in Verständigungsprozessen konstituiert; c) der relative epistemische Status der Gesprächspartner zueinander wird durch Praktiken des epistemic stance-taking verdeutlicht und bestimmt selbst die Interpretation von Äußerungsformaten; d) epistemischer Status, soziale Identität und Beziehungskonstitution sind eng miteinander durch moralische Anspruchs- und Erwartungsstrukturen verknüpft.

Overtaking as an interactional achievement : video analyses of participants' practices in traffic (2018)

Deppermann, Arnulf ; Laurier, Eric ; Mondada, Lorenza

In this article we pursue a systematic and extensive study of overtaking in traffic as an interactional event. Our focus is on the accountable organisation and accomplishment of overtaking by road users in real-world traffic situations. Data and analysis are drawn from multiple research groups studying driving from an ethnomethodological and conversation analytic perspective. Building on multimodal and sequential analyses of video recordings of overtaking events, the article describes the shared practices which overtakers and overtaken parties use in displaying, recognizing and coordinating their manoeuvres. It examines the three sequential phases of an overtaking event: preparation and projection; the overtaking proper; the re-alignment post-phase including retrospective accounts and assessments. We identify how during each of these phases drivers and passengers organize intra-vehicle and inter-vehicle practices: driving and non-driving related talk between vehicle- occupants, the emerging spatiotemporal ecology of the road, and the driving actions of other road users. The data is derived from a two camera set-up recording the road ahead and car interior. The recordings are from three settings: daily commuting, driving lessons, race-car coaching. The events occur on a variety of road types (motorways, country roads, city streets, a race track, etc.), in six languages (English, Finnish, French, German, Italian, and Swedish) and in seven countries (Australia, Finland, France, Germany, Sweden, Switzerland, and the UK). From an exceptionally diverse collection of video data, the study of which is made possible thanks to the innovative collaboration of multiple researchers, the article exhibits the range of practical challenges and communicative skills involved in overtaking.

Einleitung: Sprache im kommunikativen, interaktiven und kulturellen Kontext (2018)

Deppermann, Arnulf ; Reineke, Silke

He mo чтобы X - nicht dass X. Konvergenz und Divergenz eines produktiven Musters (2018)

Dobrovolʹskij, Dmitrij Olegovič ; Steyer, Kathrin

Cityfant verschlingt Grünofant - was wir alles mit fant machen (2018)

Donalies, Elke

Neulich sah ich am Pfeifferswörth, wo immer die freundlich orangen Wagen der Mannheimer Abfallwirtschaft runterbrettern, einen Cityfanten, auf dem Cityfant stand. Das fällt einer Sprachwissenschaftlerin natürlich auf, die sich aus ihrer Jugend an den Ottifanten erinnert und mal was über einen aus dem Ei gepellten Mammufanten geschrieben hat. Also habe ich nachrecherchiert, ob es nicht noch mehr Bildungen mit fant als zweitem Teil gibt.

Das Joghurt, der Joghurt, die Joghurt? — Variierendes Genus bei Fremdwörtern (aus: Grammatik in Fragen und Antworten) (2018)

Donalies, Elke

Wenn man Nomina aus anderen Sprachen übernimmt, gibt es nicht nur Probleme mit der Pluralbildung, sondern auch mit der Zuweisung des grammatischen Geschlechts, der sogenannten Genuszuweisung. Der Beitrag untersucht, nach welchen Kriterien bei Fremdwörtern ein Genus zugewiesen wird.

Zum 'Limbus'-Begriff als 'Materia prima' im Corpus Paracelsicum (2018)

Dück, Katharina

Das Deutsche – eine europäische Sprache in der Welt (2018)

Eichinger, Ludwig M.

Warum Frühling? Von einer dynamischen Jahreszeit (2018)

Eichinger, Ludwig M.

Wenn die Frage heißt, „Warum Frühling?“, ist „Weil nicht Winter!“ in mancherlei Hinsicht eine plausible Antwort – auch von der sprachlichen Form her. Und sie ist besser als „Weil nicht Sommer!“, obwohl der Satz natürlich genauso wahr wäre. Den Herbst wollen wir aufgrund seiner nicht unmittelbaren Nachbarschaft zunächst einmal beiseitelassen. So sieht das auch die Bedeutungsbeschreibung, die in elexiko für das Stichwort Frühling ‚geliefert‘ wird: (1) Mit Frühling wird eine der vier Jahreszeiten bezeichnet, und zwar die recht milde, die zwischen Winter und Sommer liegt. Der Frühling ist (in den gemäßigten Zonen der Erde) die Jahreszeit, in der die Natur wieder erwacht.<www.owid.de/artikel/9393/Jahreszeit?module=elex_b>

Keine Ahnung: über etcetera-Formeln und Verwandtes (2018)

Eichinger, Ludwig M.

Das deutsche Wort Frühstück (2018)

Eichinger, Ludwig M.

Vorwort (2018)

Eichinger, Ludwig M.

Einleitung (2018)

Engelberg, Stefan ; Kämper, Heidrun ; Storjohann, Petra

Muster, Dynamik, Komplexität – eine Einführung in den Gegenstand des Bandes (2018)

Engelberg, Stefan ; Lobin, Henning ; Steyer, Kathrin ; Wolfer, Sascha

In der Geschichte der Sprachwissenschaft hat das Lexikon in unterschiedlichem Maße Aufmerksamkeit erfahren. In jüngerer Zeit ist es vor allem durch die Verfügbarkeit sprachlicher Massendaten und die Entwicklung von Methoden zu ihrer Analyse wieder stärker ins Zentrum des Interesses gerückt. Dies hat aber nicht nur unseren Blick für lexikalische Phänomene geschärft, sondern hat gegenwärtig auch einen profunden Einfluss auf die Entstehung neuer Sprachtheorien, beginnend bei Fragen nach der Natur lexikalischen Wissens bis hin zur Auflösung der Lexikon-Grammatik-Dichotomie. Das Institut für Deutsche Sprache hat diese Entwicklungen zum Anlass genommen, sein aktuelles Jahrbuch in Anknüpfung an die Jahrestagung 2017 – „Wortschätze: Dynamik, Muster, Komplexität“ – der Theorie des Lexikons und den Methoden seiner Erforschung zu widmen.

Einleitung (2018)

Felder, Ekkehard ; Jacob, Katharina ; Schwinn, Horst ; Busse, Beatrix ; Große, Sybille ; Gvozdanović, Jadranka ; Lobin, Henning ; Radtke, Edgar

Einleitung (2018)

Felder, Ekkehard ; Jacob, Katharina ; Schwinn, Horst ; Busse, Beatrix ; Große, Sybille ; Gvozdanović, Jadranka ; Lobin, Henning ; Radtke, Edgar

Afrikaans und Deutsch: die besseren Freunde? Zur Rolle des Deutschen bei der Entstehung des Afrikaans (2018)

Fisseni, Bernhard ; Boonen, Ute K.

Wortschatz und Kollokationen in „Allgemeine Reisebedingungen“. Eine intralinguale und interlinguale Studie zum fachsprachlich-lexikographischen Projekt „Tourlex“. (2018)

Flinz, Carolina ; Perkuhn, Rainer

Zur Vorbereitung eines zweisprachigen Fachworterbuchs zur Tourismusfachsprache werden korpuslinguistische Verfahren eingesetzt, um Auffalligkeiten in der jeweiligen Fachsprache im Vergleich zum allgemeinsprachlichen Gebrauch aufzuspüren. Neben den hervorstechenden Elementen des Vokabulars, den Schlüsselwortern als potentiellen Stichwortern, geht es vor allem um sprach- und fachsprachspezifische typische Formulierungen und deren Ubersetzungsaquivalente. Fur die gemeinsame, interlinguale Betrachtung des Sprachenpaars Deutsch-Italienisch wurde ein kleines Fachsprachenkorpus aufgebaut und innerhalb der Sketch Engine-Umgebung unter Zuhilfenahme der darin integrierten Referenzkorpora ausgewertet. Fur eine weitere intralinguale Untersuchung der deutschsprachigen Komponente wurde auf das Deutsche Referenzkorpus DeReKo und weitere, intern zu Verfügung stehende Instrumente des Instituts für Deutsche Sprache zuruckgegriffen. Neben üblichen Verfahren der quantitativen Ein- oder Mehrwortbewertung wird ein Ansatz ergänzend getestet, der der dunnen Datengrundlage im fachsprachlichen Bereich Rechnung trägt: Diese ergibt sich nicht nur aus der Korpusgrobe, sondern auch daraus, dass bestimmte feste Floskeln (wie ,eine Reiserücktrittsversicherung abschlieben‘) selten rekurrent, vielmehr eher nur einmal pro Text verwendet werden. Auch wenn dieser Ansatz aufgrund infrastruktureller Artefakte in Einzelfallen an seine Grenzen stößt, die hier selbstkritisch nicht verschwiegen werden sollen, so zeigt sich doch an vielen Stellen auch das grobe Potential. Abschließend wird beispielhaft illustriert, wie Evidenzen dieser und der anderen korpuslinguistischen Auswertungen lexikographisch umgesetzt wurden.

Universals and cultural diversity in the expression of gratitude (2018)

Floyd, Simeon ; Rossi, Giovanni ; Baranova, Julija ; Blythe, Joe ; Dingemanse, Mark ; Kendrick, Kobin H. ; Zinken, Jörg ; Enfield, N. J.

Gratitude is argued to have evolved to motivate and maintain social reciprocity among people, and to be linked to a wide range of positive effects—social, psychological and even physical. But is socially reciprocal behaviour dependent on the expression of gratitude, for example by saying ‘thank you’ as in English? Current research has not included cross-cultural elements, and has tended to conflate gratitude as an emotion with gratitude as a linguistic practice, as might appear to be the case in English. Here, we ask to what extent people express gratitude in different societies by focusing on episodes of everyday life where someone seeks and obtains a good, service or support from another, comparing these episodes across eight languages from five continents. We find that expressions of gratitude in these episodes are remarkably rare, suggesting that social reciprocity in everyday life relies on tacit understandings of rights and duties surrounding mutual assistance and collaboration. At the same time, we also find minor cross-cultural variation, with slightly higher rates in Western European languages English and Italian, showing that universal tendencies of social reciprocity should not be equated with more culturally variable practices of expressing gratitude. Our study complements previous experimental and culture-specific research on gratitude with a systematic comparison of audiovisual corpora of naturally occurring social interaction from different cultures from around the world.

Sprachliche Variation (2018)

Fuß, Eric

Der Beitrag diskutiert anhand von Kongruenzschwankungen im Zusammenhang mit Subjektreihungen verschiedene Aspekte sprachlicher Variation. Es wird gezeigt, wie mithilfe einer Korpusstudie grammatische Faktoren ermittelt werden können, die die Verteilung der Varianten steuern. Im Anschluss wird eine Analyse vorgestellt, die Variation darauf zurückführt, dass syntaktische Strukturen, die an der Schnittstelle zur Morphologie/Phonologie nicht vollständig interpretierbar sind, auf verschiedene Arten repariert werden können.

Grammar and Corpora – past, present, and future (2018)

Fuß, Eric ; Konopka, Marek ; Trawiński, Beata ; Waßner, Ulrich Hermann

In recent years, the availability of large annotated and searchable corpora, together with a new interest in the empirical foundation and validation of linguistic theory and description, has sparked a surge of novel and interesting work using corpus-based methods to study the grammar of natural languages. However, a look at relevant current research on the grammar of the Germanic, Romance, and Slavic languages reveals a variety of different theoretical approaches and empirical foci, which can be traced back to different philological and linguistic traditions. Still, this current state of affairs should not be seen as an obstacle but as an ideal basis for a fruitful exchange of ideas between different research paradigms.

GeCoTagger: annotation of German verb complements with conditional random fields (2018)

Fürbacher, Monica ; Schneider, Roman

Complement phrases are essential for constructing well-formed sentences in German. Identifying verb complements and categorizing complement classes is challenging even for linguists who are specialized in the field of verb valency. Against this background, we introduce an ML-based algorithm which is able to identify and classify complement phrases of any German verb in any written sentence context. We use a large training set consisting of example sentences from a valency dictionary, enriched with POS tagging, and the ML-based technique of Conditional Random Fields (CRF) to generate the classification models.

Welche Frage, wann und warum? - Eine qualitativ-linguistische Programmatik zur Erforschung von Frage-Sequenzen als zentrale Veränderungspraktik im Coaching (2018)

Graf, Eva-Maria ; Spranz-Fogasy, Thomas

Der folgende Beitrag fokussiert die kommunikative Praktik „Fragen“ im Beratungsformat Führungskräfte-Coaching. Fragen stellen laut Praxis-Literatur und Ausbildungsmanualen zu Coaching ein, wenn nicht das, zentrale Interventionsinstrumentarium dar. Trotz dieser formulierten Omnipräsenz und Omnirelevanz gibt es bis dato kaum empirische Erkenntnisse über die tatsächliche Verwendung von Fragen im Coaching. Fragen sind weder in der quantitativ operierenden, psychologischen Wirksamkeits- bzw. Outcome-Forschung noch in der qualitativ operierenden, linguistischen Prozessforschung (zentraler) Forschungsgegenstand. Diese Forschungslücke gilt es im Austausch mit der Praxis und unter Einbezug aller relevanten Disziplinen und Methoden zu schließen. In einem ersten vorbereitenden Schritt macht es sich der vorliegende programmatische Beitrag zur Aufgabe, das Phänomen „Fragen im Coaching“ als Forschungsgegenstand der linguistischen Gesprächsanalyse zu etablieren. Fragen im Coaching werden dabei sowohl bezüglich ihrer Form, ihrer Funktion als auch als institutionsspezifische soziale Praktik diskutiert, wobei Erkenntnisse zur Verwendung von Fragen in benachbarten professionellen Gesprächen wie Psychotherapie oder Arzt-Patient-Kommunikation als erste Orientierung herangezogen werden. Im Zentrum der gesprächsanalytischen Diskussion steht der Beitrag, den Frage-Sequenzen zur Veränderung und damit zur lokalen Wirksamkeit von Coaching leisten. Der Artikel endet mit einer kritischen Evaluation der Möglichkeiten einer gesprächsanalytischen Erforschung von Frage-Sequenzen und skizziert den Mehrwert von interprofessioneller und interdisziplinärer, insbesondere linguistischer und psychologischer, Forschung für die Coaching-Praxis.

Dokumentationen zur Korpusgrammatik (2018)

Hansen-Morath, Sandra

Vergleich der Quantität, Qualität und Dynamik in den deutschen <a>-Lauten (2018)

Hansen-Morath, Sandra ; Geumann, Anja ; Raffelsiefen, Renate

In diesem Beitrag werden drei quantitative Studien vorgestellt, mit deren Hilfe untersucht wird, ob neben dem robusten Längenunterschied auch Qualitätsunterschiede für die deutschen <a>-Laute vorhanden sind (z.B. <Saat> versus <satt>). Auf Basis von ausgewählten Korpora und instrumentalphonetischen Messungen kann dieser Zusammenhang bestätigt werden. Zudem zeigen sich signifikante Unterschiede in den dynamischen Verläufen der beiden Vokale.

Entscheidungsbäume zur Wahl der Genitivmarkierung (2018)

Hansen-Morath, Sandra ; Konopka, Marek

Postverbal subjects and agreement: specificational copular clauses in Faroese (2018)

Hartmann, Jutta ; Heycock, Caroline

In this paper we discuss a type of copular clause – specificational copular clauses – in which subject properties may be split between two nominative noun phrases. In particular, while the first noun phrase occupies the canonical preverbal subject position, in some languages the finite verb can agree with the postverbal nominative. Such agreement might be expected, on some theoretical assumptions, to show person restrictions. We discuss this phenomenon in two SVO Germanic languages – Icelandic and Faroese – and present new data from Faroese showing that the person effect here follows from the existence of distinct probes for Number and Person agreement.

Sprachliche Interaktion im Raum (2018)

Hausendorf, Heiko ; Schmitt, Reinhold

In unserem Beitrag skizzieren wir im Rahmen des Verhältnisses von Sprache, Interaktion und Raum die Umrisse eines raumbasierten Konzeptes sozialer Positionierung. Zunächst stellen wir aktuelle Entwicklungen der linguistischen Interaktionsraumforschung vor, wobei wir eine grundlegende Differenzierung hinsichtlich der Relevantsetzung des Raums konstatieren: Raum wird zum einen als im Interaktionsprozess von den Beteiligten aktiv hervorgebrachte Größe konzeptualisiert, zum anderen wird Raum als interaktive Ressource entworfen, auf die in der Interaktion zurückgegriffen werden kann. Mit den Begriffen „Interaktionsarchitektur“, „Sozialtopographie“ und „Interaktionsraum“ skizzieren wir im Anschluss die basale konzeptionelle Trias, die unserem interaktionslinguistischen Verständnis zugrunde liegt. Dabei kommt es uns besonders auf die Verdeutlichung der unterschiedlichen analytischen Implikationen der Konzepte für die Analyse multimodal konstituierter Interaktion an. Im empirischen Teil werden unsere Konzepte an einem kurzen Ausschnitt aus einem Alpha-Gottesdienst verdeutlicht, bei dem vor den Augen der Gemeinde ein Wechsel im Kirchenvorstand vollzogen und inszeniert wird. Diese Analyse erfolgt im Hinblick auf die Entwicklung der Grundzüge eines nichtmetaphorisch, sondern wörtlich, d. h. raumbasiert, verstandenen Konzeptes sozialer Positionierung.

Introducing the CLARIN knowledge centre for linguistic diversity and language documentation (2018)

Hedeland, Hanna ; Lehmberg, Timm ; Rau, Felix ; Salffner, Sophie ; Seyfeddinipur, Mandana ; Witt, Andreas

The European digital research infrastructure CLARIN (Common Language Resources and Technology Infrastructure) is building a Knowledge Sharing Infrastructure (KSI) to ensure that existing knowledge and expertise is easily available both for the CLARIN community and for the humanities research communities for which CLARIN is being developed. Within the Knowledge Sharing Infrastructure, so called Knowledge Centres comprise one or more physical institutions with particular expertise in certain areas and are committed to providing their expertise in the form of reliable knowledge-sharing services. In this paper, we present the ninth K Centre – the CLARIN Knowledge Centre for Linguistic Diversity and Language Documentation (CKLD) – and the expertise and services provided by the member institutions at the Universities of London (ELAR/SWLI), Cologne (DCH/IfDH/IfL) and Hamburg (HZSK/INEL). The centre offers information on current best practices, available resources and tools, and gives advice on technological and methodological matters for researchers working within relevant fields.

Blindheit als Ressource: zur professionellen Kompetenz eines blinden Teammitglieds bei der gemeinsamen Anfertigung einer Audiodeskription (2018)

Hirvonen, Maija ; Schmitt, Reinhold

Der Beitrag beschäftigt sich mit der Interaktion zwischen blinden und sehenden Personen bei der kooperativen Anfertigung einer Audiodeskription. Eine Audio-deskription ist die verbale Beschreibung visueller Inhalte für Sehbeeinträchtigte und stellt eine Sonderform der Translation dar. Auf der Basis von Videodaten wird die Kooperation eines Dreierteams mit den Verfahren der multimodalen Interaktionsanalyse untersucht. Ein Charakteristikum dieser Kooperation besteht darin, dass eines der Teammitglieder blind ist und die beiden anderen sehen können. Das Erkenntnisinteresse richtet sich besonders auf die professionelle Beteiligung des blinden Teammitglieds an der Interaktion. Die Analyse zeigt, wie Blindheit als Ressource für die kooperative Herstellung der Audiodeskription genutzt wird und wie die Beteiligten in einer visuell asymmetrischen Situation interagieren. Der Beitrag ist eine der seltenen Untersuchungen, die sich mit professioneller Interaktion zwischen Blinden und Sehenden beschäftigen. Er diskutiert Aspekte von genereller Relevanz für die weitere Entwicklung der empirischen Interaktionsforschung, vor allem in Bezug auf eine Erweiterung von Beteiligungsperspektiven in Richtung Inklusion.

Wer besucht den Integrationskurs? Soziale und sprachliche Hintergründe von Geflüchteten und anderen Zugewanderten (2018)

Hünlich, David ; Wolfer, Sascha ; Lang, Christian ; Deppermann, Arnulf

Language Resources and Research under the General Data Protection Regulation (2018)

Kamocki, Paweł ; Ketzan, Erik ; Wildgans, Julia

The General Data Protection Regulation (hereinafter: GDPR), EU Regulation 2016/679 of 27 April 2016, will become applicable on 25 May 2018 and repeal the Personal Data Directive of 24 October 1995. Unlike a directive, which requires transposition into national laws (while leaving the choice of “forms and methods” to the Member States), a regulation is binding and directly applicable in all Member States. This means that when the GDPR becomes applicable, all the EU countries will have the same rules regarding the protection of personal data — at least in principle, since some details (including in the area of research — see below) are expressly left to the discretion of the Member States. The GDPR is a particularly ambitious piece of legislation (consisting of 99 articles and 173 recitals) whose intended territorial scope extends beyond the borders of the European Union. Its main concepts and principles are essentially similar to those of the Personal Data Directive, but enriched with interpretation developed through the case law of the CJEU and the opinions of the Article 29 Data Protection Working Party (hereinafter: WP29). This White Paper will discuss the main principles of data protection and their impact on language resources, as well as special rules regarding research under the GDPR and the standardisation mechanisms recognized by the Regulation.

Sprache und Postkolonialismus: Vorwort (2018)

Kellermeier-Rehbein, Birte ; Schulz, Matthias ; Stolberg, Doris

Zur Aussprache nicht haupttoniger Vorsilben mit <e> in Lehnwörtern im deutschen Gebrauchsstandard (2018)

Kleiner, Stefan ; Knöbl, Ralf

Vortoniges <e> in Lehnwörtern in offenen Silben (demonstrieren, Elefant) ist in den traditionellen deutschen Aussprachewörterbüchern durchgängig mit gespanntem/geschlossenem [e] kodifiziert. Die Auswertung von insgesamt 17 entsprechenden Belegwörtern aus dem Korpus „Deutsch heute“ zeigt für den deutschen Gebrauchsstandard jedoch eine ausgeprägte Variation zwischen den Lauttypen [e], [ɛ] und [ə], die je nach Lexem in ganz unterschiedlichen Anteilen vorkommen. Als Erklärungsansätze für das differierende Variationsverhalten lassen sich Faktoren wie Wortakzentmuster, Folgekonsonanz, Formalitätsgrad und semantisch-morphologische Durchsichtigkeit der Wortbildung anführen. Außerdem zeigt die Variation auch eine ausgeprägte diatopische Dimension: Während im Norden Deutschlands, aber auch im mittelbairisch geprägten Sprachraum und in der Ostschweiz die [e]-Aussprache dominiert, überwiegen in der südlichen Mitte und im Südwesten Deutschlands, im südbairisch geprägten Sprachraum und vor allem in der Westschweiz Belege mit [ɛ]-Aussprache. Die Ergebnisse von „Deutsch heute“ zeigen sich in ähnlicher Weise auch in zusätzlich ausgewerteten Sprachdaten (Nachrichtensendungen, FOLK-Korpus).

New German words: detection and description (2018)

Klosa, Annette ; Lüngen, Harald

In this paper, we discuss an efficient method of (semi-automatic) neologism detection for German and its application for the production of a dictionary of neologisms, focusing on the lexicographic process. By monitoring the language via editorial (print and online) media evaluation and interpreting the findings on the basis of lexicographic competence, many, but not all neologisms can be identified which qualify for inclusion in the Neologismenworterbuch (2006-today) at the Institute for the German Language in Mannheim (IDS). In addition, an automated corpus linguistic method offers neologism candidates based on a systematic analysis of large amounts of text to lexicographers. We explain the principles of the corpus linguistic compilation of a list of candidates and show how lexicographers work with the results, combining them with their own findings in order to continuously enlarge this specialized online dictionary of new words in German.

Verbalkomplex (2018)

Konopka, Marek

Korpuslinguistik, Grammatiktheorie, Grammatikschreibung (2018)

Konopka, Marek

Der Korpuslinguistik begegneten überwiegend introspektiv arbeitende Grammatiktheoretiker lange mit Misstrauen. Dabei kann sie, auch wenn sie selbst kein bestimmtes theoretisches Paradigma vorgibt, in sehr vielfältiger Weise zur Theoriebildung beitragen. Zum einen können mithilfe von Korpora theoretische Aussagen exemplifiziert und validiert werden. Zum anderen liefert die Korpuslinguistik große Mengen differenzierter Sprachdaten sowie Methoden, mit denen sie überschaut und analysiert werden können. Neue Daten müssen theoretisch in neuen Generalisierungen aufgearbeitet werden und auch die Datenvielfalt selbst rückt in den theoretischen Fokus. Die Grammatikforschung erfährt so eine empirische Wende, in der die Variation grammatischer Strukturen zu einem der zentralen Themen wird. Die theoretische Erfassung dieser Variation geht dabei weit über die Grenzen einer klassischen Theorie der Sprachkompetenz hinaus. Immer dringlicher wird damit eine neue wissenschaftliche Grammatik des Deutschen, die diese Entwicklung aufnimmt, sich den neuen Forschungsfragen stellt, sie mit modernen korpuslinguistischen Methoden untersucht und damit die Grundlagen für eine umfassende Theorie schafft, in der Kompetenz und Performanz (wie auch Synchronie und Diachronie) näher aneinanderrücken.

The role of syntax in the productivity of German N+N compounds. A diachronic corpus study (2018)

Kopf, Kristin

This paper studies the morphological productivity of German N+N compounding patterns from a diachronic perspective. It argues that the productivity of compounds increases due to syntactic influence from genitive constructions (“improper compounds”) in Early New High German. Both quantitative and qualitative productivity measures are adapted from derivational morphology and tested on compound data from the Mainz Corpus of (Early) New High German (1500–1710).

Attitudes of Slovenian Language Users Towards General Monolingual Dictionaries: An International Perspective (2018)

Kosem, Iztok ; Wolfer, Sascha ; Lew, Robert ; Müller-Spitzer, Carolin

This paper presents the results of a survey on dictionary use in Europe, the largest survey of dictionary use to date with nearly 10,000 participants in nearly thirty countries. The paper focuses on the comparison of the results of the Slovenian participants with the results of the participants from other European countries. The comparisons are made both with the European averages, and with the results from individual countries, in order to determine in which aspects Slovenian participants share similarities with other dictionary users (and non-users) around Europe, and in which aspects they differ. The findings show that in many ways the Slovenian users are similar to their European counterparts, with some noticeable exceptions, including (much) stronger preference for digital dictionaries over print ones, above-average reliance on other people when dictionary does not contain the relevant information, and the largest difference between the price of a dictionary and the amount willing to spend on it.

Annotation and beyond – Using ATHEN Annotation and Text Highlighting Environment (2018)

Krug, Markus ; Tu, Ngoc Duyen Tanja ; Weimer, Lukas ; Reger, Isabella ; Konle, Leonard ; Fotis, Jannidis ; Puppe, Frank

The workshop presents ATHEN 1 (Annotation and Text Highlighting Environment), an extensible desktop-based annotation environment which supports more than just regular annotation. Besides being a general purpose annotation environment, ATHEN supports indexing and querying support of your data as well as the ability to automatically preprocess your data with Meta information. It is especially suited for those who want to extend existing general purpose annotation tools by implementing their own custom features, which cannot be fulfilled by other available annotation environments. On the according gitlab, we provide online tutorials, which demonstrate the use of specific features of ATHEN

Recent developments in the European Reference Corpus (EuReCo) (2018)

Kupietz, Marc ; Cosma, Ruxandra ; Cristea, Dan ; Diewald, Nils ; Trawinski, Beata ; Tufis, Dan ; Váradi, Tamás ; Wöllstein, Angelika

How to get the computation near the data: improving data accessibility to, and reusability of analysis functions in corpus query platforms (2018)

Kupietz, Marc ; Diewald, Nils ; Fankhauser, Peter

The paper discusses use cases and proposals to increase the flexibility and reusability of components for analysis and further processing of analysis results in corpus query platforms by providing standardized interfaces to access data at multiple levels.

The German reference corpus DeReKo: new developments – new opportunities (2018)

Kupietz, Marc ; Lüngen, Harald ; Kamocki, Paweł ; Witt, Andreas

This paper discusses current trends in DeReKo, the German Reference Corpus, concerning legal issues around the recent German copyright reform with positive implications for corpus building and corpus linguistics in general, recent corpus extensions in the genres of popular magazines, journals, historical texts, and web-based football reports. Besides, DeReKo is finally accessible via the new corpus research platform KorAP, offering registered users several news features in comparison with its predecessor COSMAS II.

Einleitung (2018)

Kupietz, Marc ; Schmidt, Thomas

Extracting specialized terminology from linguistic corpora (2018)

Lang, Christian ; Schneider, Roman ; Suchowolec, Karolina

In this paper, we present our approach to automatically extracting German terminology in the domain of grammar using texts from the online information system grammis as our corpus. We analyze existing repositories of German grammatical terminology and develop Part-of-speech patterns for our extraction thereby showing the importance of unigrams in this domain. We contrast the results of the automatic extraction with a manually extracted standard. By comparing the performance of well-known statistical measures, we show how measures based on corpus comparison outperform alternative methods.

Grammatische Terminologie am IDS – ein terminologisches Online-Wörterbuch als ein vernetztes Begriffssystem (2018)

Lang, Christian ; Schwinn, Horst ; Suchowolec, Karolina

Im Rahmen einer zur Zeit stattfindenden Umgestaltung der Inhalte und der Benutzeroberfläche des Online-Portals grammis hat sich eine Projektgruppe konstituiert, die es sich zur Aufgabe gemacht hat, das am IDS vorhandene Terminologiesystem zur Grammatik des Deutschen zu überarbeiten und zu erweitern: Dies betrifft zum einen die Überarbeitung und Erweiterung des Terminologieinventars, aber auch die zugrundeliegende methodische Grundlage und technische Infrastruktur. Zum Verständnis dieses Vorhabens sollen zunächst die vorhandenen Vorarbeiten und Grundlagen vorgestellt werden.

Einleitung (2018)

Lenz, Alexandra N. ; Plewnia, Albrecht

Organisierte Kooperativität - Forschungsinfrastrukturen für die germanistische Linguistik (2018)

Lobin, Henning ; Schneider, Roman ; Witt, Andreas

Der vorliegende Band befasst sich mit dem Stand und der Entwicklung von Forschungsinfrastrukturen für die germanistische Linguistik und einigen angrenzenden Bereichen. Einen zentralen Aspekt dabei bildet die Notwendigkeit, Kooperativität in der Wissenschaft im institutionellen Sinne, aber auch in Hinsicht auf die wissenschaftliche Praxis zu organisieren. Dies geschieht in Verbunden als Kooperationsstrukturen, wobei Sprachwissenschaft und Sprachtechnologie miteinander verbunden werden. Als zentraler Forschungsressource kommen dabei Korpora und ihrer Erschließung durch spezielle, linguistisch motivierte Informationssysteme besondere Bedeutung zu. Auf der Ebene der Daten werden durch Annotations- und Modellierungsstandards die Voraussetzung für eine nachhaltige Nutzbarkeit derartiger Ressourcen geschaffen.

Reply relations in CMC: types and annotation (2018)

Lüngen, Harald ; Herzberg, Laura

This paper analyses reply relations in computer-mediated communication (CMC), which occur between post units in CMC interactions and which describe references between posts. We take a look at existing practices in the description and annotation of such relations in chat, wiki talk, and blog corpora. We distinguish technical reply structures, indentation structures, and interpretative reply relations, which include reply relations induced by linguistic markers. We sort out the different levels of description and annotation that are involved and propose a solution for their combined representation within the TEI annotation framework.

Reply relations in CMC: types and annotation (2018)

Lüngen, Harald ; Herzberg, Laura

This paper analyses reply relations in computer-mediated communication (CMC), which occur between post units in CMC interactions and which describe references between posts. We take a look at existing practices in the description and annotation of such relations in chat, wiki talk, and blog corpora. We distinguish technical reply structures, indentation structures, and interpretative reply relations, which include reply relations induced by linguistic markers. We sort out the different levels of description and annotation that are involved and propose a solution for their combined representation within the TEI annotation framework.

Cybermobbing aus sprachwissenschaftlicher Perspektive (2018)

Marx, Konstanze

„Bringt morgen jemand ein paar Mistgabeln und Fackeln mit zur Schule???“ Diese Frage werfen Schüler/innen eines Gymnasiums in einem Facebook-Thread auf. Mit Mistgabeln und Fackeln, so malen es sich die Jugendlichen für jede/n mitlesbar aus, müsse man die Person attackieren, die ihren Unmut auf sich gezogen hat. In einem anderen Fall droht ein/e Schreiber/in in einer geschlossenen Hassgruppe, dass ein Mitglied der Trainingsgruppe dessen / deren „füße in der fresse hängen [haben wird]!“, was Beifall in der Gruppe und eine Reihe weiterer diskreditierender Kommentare hervorruft. Diese Schlaglichter aus Online-Interaktionen geben einen ersten Eindruck von Cybermobbing, einer Form von Gewalt, die vornehmlich sprachlich realisiert und in Sozialen Medien verbreitet wird und sozialpsychologischen Studien zufolge heute zum Schulalltag gehört.

Angelika Linke & Juliane Schröter (Hg.). 2017. Sprache und Beziehung (Linguistik – Impulse & Tendenzen). Berlin, Boston: De Gruyter Mouton. vii, 448 S. [Rezension] (2018)

Marx, Konstanze

Das hier zu besprechende Buch, das Ergebnisse einer gleichnamigen Tagung zusammenfasst, die im Juni 2013 in Zürich stattfand, macht eines offenkundig: Wer in jenem Sommer nicht dabei war, hat etwas verpasst. Umso glücklicher darf man sein, dass Angelika Linke und Juliane Schröter die Arbeit, die mit der Herausgabe eines Sammelbandes verbunden ist, auf sich genommen haben. Mehr noch: In einem programmatischen ersten Kapitel geben sie einen systematischen Einblick in das tragfähige Forschungsfeld „Sprachliche Relationalität“ (vgl. S. 1–6), das ganz im Sinne der emotiven Wende in der Sprachwissenschaft konkrete theoretische Anschlussfähigkeit signalisiert, wo bislang eine „fast unübersehbare Menge an Veröffentlichungen“ (Schwarz-Friesel 2013: 16) zwar zeigte, wie attraktiv die Thematik ist, aber auch wie unstrukturiert sich die Zuwendung dazu gestaltet. Dass der Band nun weitere „exemplarische Besetzungen“ (S. 21) des Forschungsfeldes zur Diskussion stellt, wird hier keinesfalls als Nachteil angesehen, sondern als methodisch folgerichtiger empirischer Zugang zur Erschließung eines Forschungsfeldes unter den zielsetzenden Leitfragen „Wie werden im Medium von Sprachgebrauch und Sprache Konzeptualisierungen, Kategorisierungen und Differenzierungen menschlicher Beziehungen ausgebildet, verfestigt und auch wieder verändert?“ und „Welche sprachgeformten Beziehungskonzepte, -kategorien und -unterschiede sind typisch für bestimmte historische Epochen bzw. für bestimmte soziale Gruppierungen?“

"Gefällt mir" - Eine Facebookformel goes kognitiv. Hypothesen zur (Null-)Anaphern-Resolution innerhalb eines multimodalen Kommunikats (2018)

Marx, Konstanze

Einleitung. Kognitive Pragmatik zwischen Grundlagenforschung und empirischem Programm (2018)

Marx, Konstanze ; Meier, Simon

Creating a list of headwords for a lexical resource of spoken German (2018)

Meliss, Meike ; Möhrs, Christine ; Batinić, Dolores ; Perkuhn, Rainer

Except for some recent advances in spoken language lexicography (cf. Verdonik & Sepesy Maučec 2017, Hansen & Hansen 2012, Siepmann 2015), traditional lexicographic work is mainly oriented towards the written language. In this paper, we describe a method we used to identify relevant headword candidates for a lexicographic resource for spoken language that is currently being developed at the Institute for the German Language (IDS, Mannheim). We describe the challenges of the headword selection for a dictionary of spoken language, and having made considerations regarding our headword concept, we present the corpus-based procedures that we used in order to facilitate the headword selection. After presenting the results regarding the selection of one-word lemmas, we discuss the opportunities and limitations of our approach.

Korpusbasierte Diskursrecherche mit Rabbid (2018)

Mell, Ruth M. ; Diewald, Nils

Die Diskurslinguistik hat sich in den letzten Jahren als eine linguistische Teildisziplin etabliert, die in transtextuellen Untersuchungen über sprachliche Muster gesamtgesellschaftlich rele-vante Denk- und Vorstellungswelten rekonstruiert. Die Digitalisierung hat nicht nur unsere Gesellschaft grundlegend verändert und neue Kommunikationsformen und innovative kulturelle Praktiken geprägt, sondern auch das diskurslinguistische Arbeiten maßgeblich beein-flusst. So war die Etablierung der Diskurslinguistik sowie auch der diskursorientierten Lexikographie geprägt durch die Engführung mit computergestützten Methoden (Bubenhofer 2009, Teubert/Čermáková 2007, Halliday et al. 2004), die große Textsammlungen für Diskursanalysen zugänglich machen. Da diskursanalytische Forschung in foucaultscher Tradition nicht am Einzelbeleg interessiert ist, sondern mit kontextuellen Mustern und intertextuellen Verweisstrukturen arbeitet, bietet eine korpusgestützte Analyse eine produktive Ausgangsbasis für Diskursuntersuchungen. Dies gilt insbesondere für die Diskurslexikographie, bei der auf breiter Datenbasis Wörterbücher zu kulturhistorischen Diskursen erstellt werden.

fLexiCoGraph: creating and managing curated graph-based lexicographical data (2018)

Meyer, Peter ; Eppinger, Mirjam

We present the conceptual foundations and basic features of fLexiCoGraph, a generic software package for creating and presenting curated human-oriented lexicographical resources that are roughly modeled according to Měchura’s (2016) idea of graph-augmented trees. The system is currently under development and will be made accessible as open source software. As a sample use case we discuss an existing online database of loanwords borrowed from German into other languages which is based on a growing number of language-specific loanword dictionaries (Lehnwortportal Deutsch). The paper outlines the conceptual foundations of fLexiCoGraph’s hybrid graph/XML data model. To establish a database, XML-based resources may be imported or even input manually. An additional graph database layer is then constructed from these XML source documents in a freely configurable, but automated way; subsequently, the resulting graph can be manipulated and enlarged through a visual user interface in such a way that keeps the relationship to the source document information explicit at all times. We sketch the tooling support for different kinds of graph-level editing processes, including mechanisms for dealing with updated XML source documents and coping with duplicate or inconsistent information, and briefly discuss the browser interface for end users.

Bericht über die Methodenmesse im Rahmen der IDS-Jahrestagung 2017 (2018)

Möhrs, Christine ; Müller-Spitzer, Carolin

Wie nun bereits seit einigen Jahren üblich, wurde die IDS-Jahrestagung auch dieses Jahr wieder von einer Methodenmesse begleitet, auf der sich passend zum Tagungsthema anwendungsorientierte Projekte mit Bezug zur Lexikonforschung präsentierten. Die Bandbreite der dargebotenen Themen war sehr groß: innovative methodische Ansätze im Bereich der Translationswissenschaft, Tools zur Analyse und Beschreibung lexikalischer Muster oder zur Detektion von Neologismen, neue lexikografische Ressourcen bis hin zu Infrastrukturaktivitäten und einem Kooperationsprojekt zwischen Schüler/innen und Wissenschaftler/innen zur Wortschatzanalyse. Im Folgenden sollen die einzelnen Projekte, die sich auf der Messe präsentiert haben, auf der Basis der eingereichten Abstracts der Messeteilnehmer/innen kurz vorgestellt werden.

Investigación sobre el suo de diccionarios en la era digital (2018)

Müller-Spitzer, Carolin

Dictionary usage research is a topic of increasing importance within the field of lexicography. At the beginning of the new millennium, the dictionary user was still relatively unknown. However, in the last ten years, more and more user studies have been published. Consequently, methods, data and the conclusions which can be drawn were successively refined. Also, new possibilities of web-based data collection, e.g., the analysis of log files, enriched this field of research. This contribution aims to describe the state of the art in dictionary usage research in the digital era. I begin by providing a short overview of methodological and terminological basics and then place a special focus on three different methods of collecting empirical data on dictionary use: online questionnaires, eye tracking and the analysis of log-files. All these methods are illustrated on user studies conducted at the Institute for the German Language in Mannheim.

Correct hypotheses and careful reading are essential: results of an observational study on Learners using online language resources (2018)

Müller-Spitzer, Carolin ; Nied Curcio, Martina ; José Domínguez Vázquez, María ; Dias, Idalete Maria Silva ; Wolfer, Sascha

In the past two decades, more and more dictionary usage studies have been published, but most of them deal with questions related to what users appreciate about dictionaries, which dictionaries they use and what type of information they need in specific situations — presupposing that users actually consult lexicographic resources. However, language teachers and lecturers in linguistics often have the impression that students do not use enough high-quality dictionaries in their everyday work. With this in mind, we launched an international cooperation project to collect empirical data to evaluate what it is that students actually do while attempting to solve language problems. To this end, we applied a new methodological setting: screen recording in conjunction with a thinking-aloud task. The collected empirical data offers a broad insight into what users really do while they attempt to solve language-related tasks online.

Eine europaweite Umfrage zu Wörterbuchbenutzung und -kultur. Ergebnisse der deutschen Teilnehmenden (2018)

Müller-Spitzer, Carolin ; Ribeiro Silveira, Maria ; Wolfer, Sascha ; Kosem, Iztok ; Lew, Robert

Gebrauchsgegenstand, Streitschlichter, Spielzeug, Nationalsymbol, Arbeitshilfe oder doch nur etwas, für das sich hauptsächlich Akademikerinnen und Akademiker interessieren? Welche Rolle spielen einsprachige Wörterbücher heute? Um unter anderen diesen Fragen nachzugehen, koordinierten wir gemeinsam mit Iztok Kosem (Universität Ljubljana) und Robert Lew (Adam-Mickiewicz Universität Poznań) die bis dato größte europaweite Umfrage zur Wörterbuchbenutzung und -kultur. Gemeinsam mit 26 ‚lokalen‘ Partnerinnen und Partnern aus ganz Europa führten wir im Rahmen des European Network of e-Lexicography (ENeL) diese Umfrage durch. Die Ergebnisse der Studie versprechen neue Einsichten in den gesellschaftlichen Status von Wörterbüchern in vielen europäischen Ländern. Durch die möglichst parallele Erhebung der Daten in den teilnehmenden Ländern werden außerdem interessante Vergleiche der lokalen ‚Wörterbuchkulturen‘ möglich sein. Im Fokus der Befragung standen allgemeine einsprachige Wörterbücher in der oder den jeweiligen Landessprache(n).

Quantitative Analyse lexikalischer Daten (2018)

Müller-Spitzer, Carolin ; Wolfer, Sascha ; Koplenig, Alexander

Quantitativ ausgerichtete empirische Linguistik hat in der Regel das Ziel, grose Mengen sprachlichen Materials auf einmal in den Blick zu nehmen und durch geeignete Analysemethoden sowohl neue Phanomene zu entdecken als auch bekannte Phanomene systematischer zu erforschen. Das Ziel unseres Beitrags ist es, anhand zweier exemplarischer Forschungsfragen methodisch zu reflektieren, wo der quantitativ-empirische Ansatz fur die Analyse lexikalischer Daten wirklich so funktioniert wie erhofft und wo vielleicht sogar systembedingte Grenzen liegen. Wir greifen zu diesem Zweck zwei sehr unterschiedliche Forschungsfragen heraus: zum einen die zeitnahe Analyse von produktiven Wortschatzwandelprozessen und zum anderen die Ausgleichsbeziehung von Wortstellungsvs. Wortstrukturregularitat in den Sprachen der Welt. Diese beiden Forschungsfragen liegen auf sehr unterschiedlichen Abstraktionsebenen. Wir hoffen aber, dass wir mit ihnen in groser Bandbreite zeigen konnen, auf welchen Ebenen die quantitative Analyse lexikalischer Daten stattfinden kann. Daruber hinaus mochten wir anhand dieser sehr unterschiedlichen Analysen die Moglichkeiten und Grenzen des quantitativen Ansatzes reflektieren und damit die Interpretationskraft der Verfahren verdeutlichen.

Datenbank attributive Adjektive (2018)

Münzberg, Franziska ; Falke, Stefan ; Hansen-Morath, Sandra ; Waßner, Ulrich Hermann

In der Datenbank zum Datensatz attributive_Adjektive_1.csv finden sich 1.598 Belege zu artikellosen Nominalphrasen mit je zwei attributiven Adjektiven im Dativ Singular Maskulinum oder Neutrum. Die Datenbank attributive Adjektive enthält zu jedem Beleg neben dem Satzkontext eine Reihe von Annotationen. Dazu gehören Metadaten wie Register und regionale Zuordnung sowie Annotationen zur Phonologie, Morphosyntax, Semantik und Frequenz. Anhand dieser Annotationen lassen sich Hypothesen zur Adjektivflexion und -reihenfolge überprüfen. Nach einer Auswahl aus diesen Annotationen können Sie hier suchen. Alternativ können Sie unter „Download“ das gesamte Suchergebnis mit allen Annotationen und inklusive aller Belege, die bei der Untersuchung von Adjektivflexion und -reihenfolge als Fehlbelege eingestuft worden sind, herunterladen.

Die Wucht und Strömung war immens – wie stark ist der Ellipseneffekt? (2018)

Münzberg, Franziska ; Hansen-Morath, Sandra

Our corpus study is concerned with subject-verb agreement in contemporary German, more precisely the variation in verb number. We focus on subjects consisting of noun phrases coordinated by the conjunction und (‘and’). In our samples, both nouns are in singular. Number resolution – i.e., plural verb despite of the singular nouns – can be regarded as the default choice in contemporary German. However, our data show that eliding the second determiner in the subject enhances the probability of using the singular verb. This ellipsis effect is highly significant in German and Austrian texts. It seems to be weaker in Swiss texts. Regression analyses reveal that the ellipsis effect is stronger than both the highly significant influence of subject individuation and the significant effect of subject agentivity.

Bericht über die 21. Arbeitstagung zur Gesprächsforschung vom 21. bis 23. März 2018 am Institut für Deutsche Sprache (Mannheim), Rahmenthema: vergleichende Gesprächsforschung (2018)

Neise, Isabell

Die „21. Arbeitstagung zur Gesprächsforschung“ mit dem Rahmenthema „Vergleichende Gesprächsforschung“ fand vom 21.-23. März 2018 am Institut für Deutsche Sprache in Mannheim statt. Das Ziel der Tagung war es, Forscherinnen und Forscher zusammenzubringen, die authentische Interaktionsdaten aus vergleichender Perspektive untersuchen. Das Rahmenthema der Tagung ergab sich aus dem steigenden Interesse an vergleichenden Fragestellungen innerhalb konversations- und gesprächsanalytischer Untersuchungen. Die Tagung nahm gezielt Vorgehensweisen und Methoden bei der Durchführung vergleichender Untersuchungen in den Blick. Die Vorträge1, Projektpräsentationen und Datensitzungen erörterten 1. das Vergleichen als analytische Grundoperation der Konversations- und Gesprächsanalyse, 2. Vergleiche alternativer Ressourcen und Praktiken für spezifische Handlungen und Aktivitäten in der Interaktion sowie 3. methodologische Herausforderungen einer vergleichenden Gesprächsforschung.

Bericht über die 21. Arbeitstagung zur Gesprächsforschung vom 21.-23. März am Institut für Deutsche Sprache (Mannheim). Rahmenthema: vergleichende Gesprächsforschung (2018)

Neise, Isabell

Die „21. Arbeitstagung zur Gesprächsforschung“ mit dem Rahmenthema „Vergleichende Gesprächsforschung“ fand vom 21.-23. März 2018 am Institut für Deutsche Sprache in Mannheim statt. Das Ziel der Tagung war es, Forscherinnen und Forscher zusammenzubringen, die authentische Interaktionsdaten aus vergleichender Perspektive untersuchen. Das Rahmenthema der Tagung ergab sich aus dem steigenden Interesse an vergleichenden Fragestellungen innerhalb konversations- und gesprächsanalytischer Untersuchungen. Die Tagung nahm gezielt Vorgehensweisen und Methoden bei der Durchführung vergleichender Untersuchungen in den Blick. Die Vorträge1, Projektpräsentationen und Datensitzungen erörterten 1. das Vergleichen als analytische Grundoperation der Konversations- und Gesprächsanalyse, 2. Vergleiche alternativer Ressourcen und Praktiken für spezifische Handlungen und Aktivitäten in der Interaktion sowie 3. methodologische Herausforderungen einer vergleichenden Gesprächsforschung.

Neues vom heutigen Deutsch. Empirisch - methodisch - theoretisch. Bericht von der 54. Jahrestagung des Instituts für Deutsche Sprache, Mannheim, 13. - 15. März 2018 (2018)

Overath, Santana

Über 400 Wissenschaftler/-innen aus insgesamt 25 verschiedenen Herkunftsländern kamen dieses Jahr zur 54. Jahrestagung des Instituts für Deutsche Sprache (IDS) nach Mannheim in den Rosengarten. Unter dem Titel „Neues vom heutigen Deutsch. Empirisch – methodisch – theoretisch“ konnten sich die Besucher/-innen hier über drei Tage hinweg insgesamt 14 Fachvorträge zu verschiedensten Gebieten der Sprachwissenschaft anhören.

Kontexte und ihre Verteilung (2018)

Perkuhn, Rainer

Die typischen sprachlichen Kontexte, in denen ein Wort verwendet wird, spannen den Rahmen auf, über den sowohl Sprecher als auch Forscher einer Sprache wesentliche Aspekte der Bedeutung des Wortes erschließen und vermitteln. Über große Korpora und entsprechende korpus-, aber auch computerlinguistische Methoden stehen nunmehr systematische Zugänge zu den typischen Verwendungsweisen zur Verfügung, am Institut für Deutsche Sprache etwa über die Kookkurrenzanalyse seit 1995. Auf den Ergebnissen des letztgenannten Verfahrens operieren weitere Methoden, die Bedeutungsbeziehungen zwischen Wörtern auf Ähnlichkeitsbeziehungen des Kontextverhaltens zurückfuhren. In jüngerer Zeit werden Ansätze vor allem aus der Computerlinguistik und dem information retrieval diskutiert, die mit einem ähnlichen Ziel antreten. Dieser Beitrag soll einen prinzipiellen Überblick bieten, wie die verschiedenen Forschungsstränge den Begriff Kontext interpretieren, wie sie ihn systematisch erfassen und zum Vergleich einsetzen. Neben Bedeutungsnähe wird vor allem Mehrdeutigkeit besondere Beachtung finden.

Visualisierung als aufmerksamkeitsleitendes Element bei der Analyse sehr großer Korpora (2018)

Perkuhn, Rainer ; Kupietz, Marc

Sehr große Korpora – wie das Deutsche Referenzkorpus DeReKo – bieten eine breite Basis für die empirische Forschung. Sie bringen aber auch Herausforderungen mit sich, da sich weder Eigenschaften ihrer Zusammensetzung noch derer von Recherche- und Analyseergebnissen mit einfachen Mitteln erschließen lassen. Dafür bedarf es Verfahren geschickter Sortierung, Gruppierung oder des Clusterings, kurzum: strukturentdeckender Methoden. In Kombination mit Visualisierungstechniken kann so die Wahrnehmung bestimmter Eigenschaften und Zusammenhänge unterstützt und die Aufmerksamkeit auf bestimmte Phänomene, ggf. in Anlehnung an präferenzrelationale Befunde, gelenkt werden. Neben der illustrativen Funktion geht es in diesem Beitrag vor allem um das erkenntnisleitende Potenzial derartiger Verfahren in Kombination. Aus verschiedenen Bereichen werden Beispiele gezeigt, die am IDS oder in Kooperationen zum Einsatz kommen, sowohl zur dokumentarischen und reflexiven Kontrolle von Eigenschaften der Korpuszusammensetzung als auch hinsichtlich korpusanalytischer Methodik, um die qualitative Interpretation von Analysebefunden und die Abduktion von Hypothesen stimulierend zu unterstützen.

Partisipativnaja ritual´nost´: mul´timodal´noe issledovanie religioznoj kommunikacii v prostranstve cerkvi (2018)

Petrova, Anna A. ; Schmitt, Reinhold ; Stulberg, Oleg E.

In this article, the execution of a ritual as a component of religious communication is analysed. The ritual, in which the church community remembers the deceased, is celebrated in the evangelic church of Sarepta (Volgograd) on the last Sunday of the church year, the so-called ‘eternity Sunday’. The study of the ritual is based on two scientific approaches: ethnomethodology and multimodal interaction analysis. These approaches make it possible to analyse the social and cultural practices of church visitors in conjunction with the organisation of church service. Specifically, it becomes possible to: a) develop new scientific paradigms when analysing the actual use of the church interior, b) identify basic religious activities of communication in church, c) introduce new concepts into scientific use, d) present the ritual of remembrance in Sarepta as a complex, multimodally constituted religious event, e) focus the coordination of linguistic, physical and spatial activities of church visitors and clerics at different stages of church service and to understand their respective social content and communicative status. For analysing the video recordings of the church service, the concepts of ‘architecture-for-interaction’ and ‘social topography’ are used, making it possible to discover new aspects of spatial influence on communication. The concept of ‘architecture-for-interaction’ provides the framework for answering the question of how the church interior in Sarepta contributes to the organisation of the ritual. Forms of situational use of space and the cultural knowledge underlying this use are captured with the concept of ‘social topography’. From a structural viewpoint, the analyzed ritual in Sarepta is based on organization and division of responsibilities, consists of phases of structural non-simultaneity, has a three-positional spatial basis, and is structurally open. Because of these characteristics, the execution of the ritual can be described as ‘participatory rituality’. Participatory rituality allows for a religious socialization which lets the community members participate as active and legitimate participants in religious communication and autonomously contribute to the execution of the ritual.

Zum Nutzen der Frame-Semantik für die Analyse der Bedeutungskonstitution in der Interaktion (2018)

Proske, Nadine

Phonologische Abstraktheit und symbolische Repräsentation (2018)

Raffelsiefen, Renate

Symbolische Repräsentation sprachlicher Lautstruktur beinhaltet die Zergliederung kontinuierlicher Rede in diskrete Einheiten, die mit einem finiten Inventar von Zeichen assoziiert werden. Die Grundidee hinter dieser Abstraktion ist, „wiederkehrendes“ Material, das trotz phonetischer Unterschiede als gleich aufgefasst wird, mit jeweils gleichen Zeichen zu assoziieren. Die Entwicklung geeigneter Verfahren zur Ermittlung einheitlicher und empirisch adäquater Abstraktionsgrade wurde in strukturalistischen Arbeiten vehement diskutiert, scheint aber allgemein seltsam vernachlässigt. In vorliegendem Beitrag wird ein solches im Rahmen der Optimalitätstheorie entwickeltes Verfahren anhand der sogenannten Vokalopposition im Deutschen vorgestellt. Verschiedene Typen konvergierender empirischer Evidenz untermauern die Annahme einer einzigen phonologisch relevanten Abstraktionsebene mit fünfzehn qualitativ unterschiedlichen Vollvokalen.

Phonological analysis at the word level: the role of corpora (2018)

Raffelsiefen, Renate ; Geumann, Anja

Notions such as “corpus-driven” versus “theory-driven” bring into focus the specific role of corpora in linguistic research. As for phonology with its intrinsic focus on abstract categorical representation, there is a question of how a strictly corpus-driven approach can yield insight into relevant structures. Here we argue for a more theory-driven approach to phonology based on the concept of a phonological grammar in terms of interacting constraints. Empirical validation of such grammars comes from the potential convergence of the evidence from various sources including typological data, neutralization patterns, and in particular patterns observed in the creative use of language such as acronym formation, loanword adaptation, poetry, and speech errors. Further empirical validation concerns specific predictions regarding phonetic differences among opposition members, paradigm uniformity effects, and phonetic implementation in given segmental and prosodic contexts. Corpora in the narrowest sense (i.e. “raw” data consisting of spontaneous speech produced in natural settings) are useful for testing these predictions, but even here, special purpose-built corpora are often necessary.

Diphthongs versus monophthongs in English (2018)

Raffelsiefen, Renate ; Geumann, Anja

We present evidence for the analysis of the vowels in English <say> and <so> as biphonemic diphthongs /ɛi/ and /əu/, based on neutralization patterns, regular alternations, and foot structure. /ɛi/ and /əu/ are hence structurally on a par with the so called “true diphthongs” /ɑi/, /ɐu/, /ɔi/, but also share prosodic organization with the monophthongs /i/ and /u/. The phonological evidence is supported by dynamic measurements based on the American English TIMIT database. Calculations of F2-slopes proved to be especially suited to distinguish the relevant groups in accordance with their phonologically motivated prosodic organizations.

Sprucing up the trees – error detection in treebanks (2018)

Rehbein, Ines ; Ruppenhofer, Josef

We present a method for detecting annotation errors in manually and automatically annotated dependency parse trees, based on ensemble parsing in combination with Bayesian inference, guided by active learning. We evaluate our method in different scenarios: (i) for error detection in dependency treebanks and (ii) for improving parsing accuracy on in- and out-of-domain data.

A harmonised testsuite for POS tagging of German social media data (2018)

Rehbein, Ines ; Ruppenhofer, Josef ; Zimmermann, Victor

We present a testsuite for POS tagging German web data. Our testsuite provides the original raw text as well as the gold tokenisations and is annotated for parts-of-speech. The testsuite includes a new dataset for German tweets, with a current size of 3,940 tokens. To increase the size of the data, we harmonised the annotations in already existing web corpora, based on the Stuttgart-Tübingen Tag Set. The current version of the corpus has an overall size of 48,344 tokens of web data, around half of it from Twitter. We also present experiments, showing how different experimental setups (training set size, additional out-of-domain training data, self-training) influence the accuracy of the taggers. All resources and models will be made publicly available to the research community.

Interaktionale Analysen kognitiver Phänomene. Wissenszuschreibungen mit der Modalpartikel ja (2018)

Reineke, Silke

Analyzing user behavior with Matomo in the online information system Grammis (2018)

Ripp, Saskia ; Falke, Stefan

The grammatical information system grammis combines descriptive texts on German grammar with dictionaries of specific word classes and grammatical terminology. In this paper, we describe the first attempts at analyzing user behavior for an online grammar of the German language and the implementation of an analysis and data extraction tool based on Matomo, a web analytics tool. We focus on the analysis of the keywords the users search for, either within grammis or via an external search platform like Google, and the analysis of the interaction between the text components within grammis and the integrated dictionaries. The overall results show that about 50% of the searches are for grammatical terms, and that the users shift from texts to dictionaries, mainly by using the integrated links to the dictionary of terminology within the texts. Based on these findings, we aim to improve grammis by extending its integrated dictionaries.

Open Access

Refine

Author

Year of publication

Document Type

Language

Has Fulltext

Is part of the Bibliography

Keywords

Publicationstate

Reviewstate

Publisher

151 search hits