Refine
Year of publication
- 2018 (311) (remove)
Document Type
- Part of a Book (167)
- Article (70)
- Book (39)
- Conference Proceeding (13)
- Other (10)
- Working Paper (6)
- Part of Periodical (3)
- Review (3)
Language
Is part of the Bibliography
- yes (311) (remove)
Keywords
- Deutsch (95)
- Korpus <Linguistik> (54)
- Gesprochene Sprache (21)
- Linguistik (17)
- Interaktionsanalyse (15)
- Konversationsanalyse (15)
- Sprache (14)
- Interaktion (13)
- Grammatik (12)
- Multimodalität (12)
Publicationstate
- Veröffentlichungsversion (151)
- Zweitveröffentlichung (85)
- Postprint (26)
Reviewstate
Publisher
- de Gruyter (76)
- Institut für Deutsche Sprache (24)
- Heidelberg University Publishing (14)
- European language resources association (ELRA) (13)
- Narr Francke Attempto (11)
- Erich Schmidt (10)
- De Gruyter (9)
- Benjamins (7)
- Znanstvena založba Filozofske fakultete Univerze v Ljubljani / Ljubljana University Press, Faculty of Arts (7)
- Hempen (6)
Multiethnolektale Sprechweisen von Jugendlichen sind in mittel- und nordeuropäischen Ländern nicht nur ein Thema soziolinguistischer Forschung, sie werden auch in der Öffentlichkeit viel diskutiert. Trotz der großen Aufmerksamkeit, die das Thema auf sich zieht, gibt es für das Deutsche nur wenige Untersuchungen, die die linguistischen Phänomene auf ausreichender empirischer Basis beschreiben und auswerten. In der vorliegenden Korpusstudie wird die Sprache von Jugendlichen aus Stuttgart analysiert. Im Zentrum der Untersuchung stehen multiethnolektale Syntagmen, bei denen Artikel, Präpositionen und Pronomen nicht verwendet werden. Die Forschungsergebnisse basieren auf über 6.000 Einzelbelegen aus Audiodaten, die im Rahmen von informellen Interviews in den Stadtteilen Stuttgart-Nord, Bad Cannstatt und Hallschlag entstanden sind.
Die Funktion und der Gebrauch von Artikeln, Präpositionen und Pronomen im autochthonen Deutschen werden detailliert beschrieben, bevor anhand von umfangreichen syntaktischen und semantischen Analysen die sprachlichen Bedingungen herausausgearbeitet werden, unter denen die Jugendlichen die multiethnolektalen Strukturen verwenden. Gestützt werden diese Auswertungen durch Aussagen über die Häufigkeit der grammatischen Varianten in den verschiedenen syntaktisch-semantischen Kontexten. Eine multivariate Analyse bindet zudem außersprachliche Faktoren, beispielsweise den Einfluss der verschiedenen Familiensprachen, mit ein und zeigt, welche Variablen die Verwendung der multiethnolektalen Syntagmen steuern. Darüber hinaus liefern Auswertungen und Beobachtungen zum situativen Gebrauch wichtige Forschungsergebnisse zur multiethnolektalen Sprachvariation.
The workshop presents ATHEN 1 (Annotation and Text Highlighting Environment), an extensible desktop-based annotation environment which supports more than just regular annotation. Besides being a general purpose annotation environment, ATHEN supports indexing and querying support of your data as well as the ability to automatically preprocess your data with Meta information. It is especially suited for those who want to extend existing general purpose annotation tools by implementing their own custom features, which cannot be fulfilled by other available annotation environments. On the according gitlab, we provide online tutorials, which demonstrate the use of specific features of ATHEN
Projektvorstellung – Redewiedergabe. Eine literatur- und sprachwissenschaftliche Korpusanalyse
(2018)
Das laufende DFG-Projekt „Redewiedergabe“ stellt einen Anwendungsfall quantitativer Sprach-und Literaturwissenschaft dar und beschäftigt sich mit dem Phänomen „Redewiedergabe“ auf der Grundlage großer Datenmengen. Zu diesem Zweck wird zum einen ein Korpus manuell mit Redewiedergabeformen annotiert, zum anderen werden Verfahren zur automatischen Erkennung des Phänomens entwickelt. Ziel ist es, Forschungsfragen nach der Entwicklung von Redewiedergabe vor allem im 19. Jahrhundert zu beantworten.
Diskursmarker
(2018)
deiktischer Ausdruck
(2018)
Codeswitching
(2018)
Bedeutungszusammenhang
(2018)
Äußerung
(2018)
Funktion
(2018)
Frame
(2018)
figurative Bedeutung
(2018)
Einwortäußerung
(2018)
mentales Lexikon
(2018)
lexikalische Variation
(2018)
lexical frame
(2018)
lexical configuration
(2018)
konzeptuelle Basisebene
(2018)
Konzeptualisierung
(2018)
kognitive Lexikologie
(2018)
Heckenausdruck
(2018)
Null subjects (NSs) have been a central research topic in generative syntax ever since the 1980s. This chapter considers the situation of German NSs both from a dialectological and from a diachronic perspective and attempts to reconstruct a direct line concerning the licensing conditions of pro-drop from Old High German (OHG) through Middle High German (MHG) and Early New High German (ENHG) to current dialects of New High German (NHG). Particularly, we will argue that German changed from a consistent, yet asymmetric pro-drop language to a partial, but symmetric one. In order to demonstrate that this development took place and the steps involved, we survey the existing empirical evidence and introduce new data.
Im Kontext des Essens und seiner Zubereitung, der Speisen und ihres Verzehrs, akzentuiert das Wort Gericht, dass es sich bei der gesellschaftlich üblichen Form von Nahrungsaufnahme um eine spezifisch ausgeformte soziale Praxis handelt. In diesem Handlungs- und Interpretationskontext wird mit dem Wort Gericht hervorgehoben, dass eine auf bestimmte Weise zubereitete („zugerichtete“) Speise als relevanter Teil einer Mahlzeit zu gelten hat. Wie bei solchen Alltagspraktiken nicht unüblich, ist die Verwendung dieses Worts nicht scharf von anderen Benennungen in diesem Kontext zu trennen, von denen die Praktiken des Essens nicht so sehr über die „Zurichtung“, sondern z.B. über die Abfolge (z.B. Hauptspeise, Gang usw.) geleistet werden. Allerdings ist mit dem Angerichtetsein, das im Wort Gericht steckt, doch auch immer seine Angemessenheit angedeutet, etwas, was es mit dem gleichlautenden juristischen Wort verbindet – und zu mancherlei textueller Verbindung führt.
Präpositionalphrasen
(2018)
In Studien zu pädiatrischer Interaktion wird immer wieder die niedrige Redebeteiligung der jungen Patient/innen, deren Leiden in den ärztlichen Gesprächen verhandelt werden, herausgestellt. In einigen triadisch-pädiatrischen Erstkonsultationen, die sich in mehreren Punkten signifikant von dyadischen Erstgesprächen unterscheiden, ist allerdings die Beteiligung der Patient/innen deutlich höher. Eine Kombination aus quantitativer und konversationsanalytischer Untersuchung von Erstkonsultationen in der pädiatrischen Praxis zeigt, dass der Aufforderung zur Beschwerdenschilderung dabei eine entscheidende Bedeutung zukommt, weswegen der Formulierung besondere Aufmerksamkeit geschenkt werden sollte. Doch die herausfordernde Situation birgt nicht nur Stolpersteine, sondern kann auch von allen Interaktionspartner/innen als strategisches Mittel eingesetzt werden. Eine interaktive Relevanz haben überdies elterliche Initiativen. An mehreren Beispielen wird gezeigt, welche erheblichen Konsequenzen eine Nicht-Bearbeitung oder eine nicht ausreichende Bearbeitung für die jeweilige Interaktion hat.
Verbalkomplex
(2018)
Lexical explorer
(2018)
Das Tool Lexical Explorer ermöglicht, die Korpus-Frequenzangaben vom FOLK (Forschung und Lehrkorpus Gesprochenes Deutsch; Schmidt 2014) und GeWiss (Gesprochene Wissenschaftssprache; Fandrych, Meißner & Wallner 2017) zu durchsuchen und abzufragen. Das Tool besteht aus Tabellen, die für die Zwecke des Projekts LeGeDe entwickelt wurden (Möhrs et al. 2017). Die Zahlen beruhen auf dem DGD-Release 2.10 (23.05.2018). Für den Vergleich zwischen Korpora der gesprochenen Sprache und DeReKo wird die DeReKo Version 2016-II (30.09.2016) ohne Subkorpora Wikipedia-Daten (Artikel, Diskussionen) und ohne Sprachliche Umbrüche (45/68) verwendet (vgl. Kupietz & Keibel 2009). Die Tabellen werden mit Hilfe von DataTables (plug-in for jQuery) präsentiert, wobei die Ajax Protokolle benutzt werden, um die Tabellen asynchron aus der Datenbank zu ziehen. Die Benutzung des Tools setzt die Vertrautheit mit der Annotation der Korpora in der DGD voraus.
The General Data Protection Regulation (hereinafter: GDPR), EU Regulation 2016/679 of 27 April 2016, will become applicable on 25 May 2018 and repeal the Personal Data Directive of 24 October 1995.
Unlike a directive, which requires transposition into national laws (while leaving the choice of “forms and methods” to the Member States), a regulation is binding and directly applicable in all Member States. This means that when the GDPR becomes applicable, all the EU countries will have the same rules regarding the protection of personal data — at least in principle, since some details (including in the area of research — see below) are expressly left to the discretion of the Member States.
The GDPR is a particularly ambitious piece of legislation (consisting of 99 articles and 173 recitals) whose intended territorial scope extends beyond the borders of the European Union. Its main concepts and principles are essentially similar to those of the Personal Data Directive, but enriched with interpretation developed through the case law of the CJEU and the opinions of the Article 29 Data Protection Working Party (hereinafter: WP29).
This White Paper will discuss the main principles of data protection and their impact on language resources, as well as special rules regarding research under the GDPR and the standardisation mechanisms recognized by the Regulation.
Baiern im Raum
(2018)
Who understands Low German today and who can speak it? Who makes use of media and cultural events in Low German? What images do people in northern Germany associate with Low German and what is their view of their regional language?
These and further questions are answered in this brochure with the help of representative data collected in a telephone survey of a total of 1,632 people from eight federal states (Bremen, Hamburg, Lower Saxony, Mecklenburg-West Pomerania and Schleswig-Holstein as well as Brandenburg, North Rhine-Westphalia and Saxony-Anhalt).
In this paper we discuss a type of copular clause – specificational copular clauses – in which subject properties may be split between two nominative noun phrases. In particular, while the first noun phrase occupies the canonical preverbal subject position, in some languages the finite verb can agree with the postverbal nominative. Such agreement might be expected, on some theoretical assumptions, to show person restrictions. We discuss this phenomenon in two SVO Germanic languages – Icelandic and Faroese – and present new data from Faroese showing that the person effect here follows from the existence of distinct probes for Number and Person agreement.
Aus der etwas apophtegmatischen Formulierung des Titels lässt sich die Behauptung ableiten, eine Grammatik der politischen Sprache gebe es nicht. Das kann nun dreierlei heißen: Zum ersten könnte gemeint sein, es gebe keine politische Sprache - womit sich die Frage nach ihrer Grammatik a fortiori erübrigt. Weniger voraussetzungsreich und daher unmittelbar plausibler erscheint ein Verständnis, nach der es zwar eine politische Sprache gebe, diese aber keine eigene Grammatik habe. Vielleicht ist auch die dritte Lesart nur eine spezifischere Interpretation dieser zweiten Lesart: Es sei gar nicht so wichtig, was der Terminus „politische Sprache“ genau bedeute und was ihm in einer wahrscheinlichen Wirklichkeit entspreche. Auf jeden Fall sei sprachliches Interagieren im politischen Raum ein Spezialfall öffentlichen Agierens (unter spezifischen gesellschaftlichen/politischen Konstellationen) insgesamt und zeige daher entsprechende grammatische Präferenzen. Wir wollen in diesem Beitrag Argumente für diese letzte Position versammeln.
„[…] die Partei soll weg. Aber sonst soll sich nicht viel am Regierungssystem ändern. Man hat an sich nichts gegen das Hakenkreuz und auch nichts gegen Hitler, wiewohl die Kritik jetzt Hitler keineswegs noch immer ausnimmt. Oft heißt es: ,Er hats a net zusammenbracht.‘" (Deutschlandberichte II, 896)
Dieser Bericht vom August 1935 gibt die Haltung der Bevölkerung zum NS-Regime mit in diesem Fall dialektal gefärbter Alltagssprache wieder. Unter anderem Texte wie dieser sind Grundlage eines Projekts, dessen Konzeption im Folgenden vorgestellt wird. Der Projektplan sieht eine kulturlinguistische Verortung des Gegenstands ‚Sprachliche Sozialgeschichte 1933 bis 1945‘ vor. Die Umsetzung des kulturlinguistischen Zugangs richtet sich auf zwei Kernideen, die eine Idee ist die der Perspektivendifferenz - wir werden unsere Analysen nach Akteuren unterschieden anlegen. Die zweite Kernidee orientiert die Analysen an dem anthropologischen Leitkonzept des Authentischen. Dieses Forschungskonzept werde ich im Folgenden erläutern.
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), zugänglich über die Datenbank für Gesprochenes Deutsch (DGD), strebt den Status eines Referenzkorpus für den aktuellen mündlichen Sprachgebrauch im deutschen Sprachraum an. Es enthält einen wachsenden Bestand von Audio- und Videoaufnahmen authentischer Gespräche aus verschiedenen Bereichen des gesellschaftlichen Lebens. Die Dokumentation und Repräsentation von Interaktions- und Sprecherinformationen sind bereits seit den Anfängen des Korpusaufbaus integrale Bestandteile von FOLK. Allerdings lag bislang kein ausgearbeitetes, empirisch erprobtes und vollständig in die Korpusinfrastruktur integrierbares Stratifikationskonzept vor. Mit dem vorliegenden Artikel wird ein solches Konzept vorgeschlagen. Es knüpft an frühere Konzeptionen an und wurde anhand der vorhandenen Daten überprüft, korrigiert und erweitert. Dieser Prozess verlief parallel zur Überarbeitung des XML-Schemas zur Metadatendokumentation, um die konkrete Implementierung vorzubereiten. Im Anschluss an eine Skizzierung genereller Aspekte des Korpusdesigns werden die stratifikationsleitenden und ergänzenden Parameter vorgestellt und erläutert. Abschließend werden Ansätze und Strategien zum Korpusausbau diskutiert.
Einleitung
(2018)
Der Sprachgebrauch in der Zeit 1933 bis 1945 ist vielfältig auf unterschiedlichen Sprachebenen untersucht und dargestellt worden. Dass die dem Nationalsozialismus zugehörigen Sprecher aber nicht die alleinige Diskurs- und Sprachgemeinschaft bildeten, wurde bisher in der empirischen Forschung selten als Gegenstand etabliert, während das Phänomen seit langem theoretisch erkannt und beschrieben ist. Durch eine Konzentration auf öffentlich-propagandistische Kommunikationsformen sind etwa Studien zu Formen institutionellen Kommunizierens, zur gruppenspezifischen oder privaten Schriftlichkeit und insbesondere zum sprachlichen Agieren im Widerstand selten. Der vorliegende Band besteht aus Beiträgen, die hierfür Beispiele vorlegen. Sie basieren auf Vorträgen, die auf der von den Herausgeberinnen veranstalteten Tagung »Sprachliche Sozialgeschichte des Nationalsozialismus« im April 2017 am Institut für Deutsche Sprache gehalten wurden. Die Beiträge erschließen in methodischer Hinsicht, bzgl. der Fragestellung oder in Bezug auf die Quellen mit zum Teil noch nicht oder kaum untersuchtem sprachwissenschaftlichem Material aus der Zeit des Nationalsozialismus neue Perspektiven.
This paper discusses a specific subclass of English it-clefts posited in the theoretical literature, so-called predicational clefts. The main point of the paper is to show that there is no need to postulate such a separate class. Predicational clefts look special because of the narrow focus on the adjective within an indefinite pivot, but their special properties can all be derived from this narrow focus in a focus analysis in which it-clefts express contrasting focus. Contrasting focus means that besides the assertion of the proposition expressed in the cleft, there is one contrasting proposition which is excluded. The focus on the adjective in apparent predicational clefts gives rise to a narrow set of relevant alternatives, all of which differ only in the adjectival property within the pivot. The analysis developed here can account for many of the observations for apparent predicational clefts. Other properties are shown to be not conclusive. Thus, predicational clefts need not be considered a special subclass beyond their special focus characteristics.
Wir diskutieren in diesem Beitrag Implikationen, mit denen man zu tun bekommt, wenn man kleinste Formen situativer Vergesellschaftung – wir sprechen von kommunikativen Minimalformen – untersucht. Kommunikative Minimalformen sind kurzzeitige, nur wenige Sekunden dauernde, gemeinsam konstituierte Interaktionsereignisse. Ungeachtet ihrer Kürze weisen sie zum einen eine komplexe Interaktionsstruktur auf. Zum anderen besitzen sie auch eine klare soziale Implikation und eigene Wertigkeit. In dem hier untersuchten Fall, bei dem Passanten durch ein offenes Fenster in einen Privatraum blicken und dabei ertappt werden, zeigt sich diese soziale Implikativität als moralische Kommunikation im Sinne der interaktiven Bearbeitung eigenen Fehlverhaltens.
We study German affixoids, a type of morpheme in between affixes and free stems. Several properties have been associated with them – increased productivity; a bleached semantics, which is often evaluative and/or intensifying and thus of relevance to sentiment analysis; and the existence of a free morpheme counterpart – but not been validated empirically. In experiments on a new data set that we make available, we put these key assumptions from the morphological literature to the test and show that despite the fact that affixoids generate many low-frequency formations, we can classify these as affixoid or non-affixoid instances with a best F1-score of 74%.
In this paper we use methods for creating a large lexicon of verbal polarity shifters and apply them to German. Polarity shifters are content words that can move the polarity of a phrase towards its opposite, such as the verb “abandon” in “abandon all hope”. This is similar to how negation words like “not” can influence polarity. Both shifters and negation are required for high precision sentiment analysis. Lists of negation words are available for many languages, but the only language for which a sizable lexicon of verbal polarity shifters exists is English. This lexicon was created by bootstrapping a sample of annotated verbs with a supervised classifier that uses a set of data- and resource-driven features. We reproduce and adapt this approach to create a German lexicon of verbal polarity shifters. Thereby, we confirm that the approach works for multiple languages. We further improve classification by leveraging cross-lingual information from the English shifter lexicon. Using this improved approach, we bootstrap a large number of German verbal polarity shifters, reducing the annotation effort drastically. The resulting German lexicon of verbal polarity shifters is made publicly available.
Both for psychology and linguistics, emotion concepts are a continuing challenge for analysis in several respects. In this contribution, we take up the language of emotion as an object of study from several angles. First, we consider how frame semantic analyses of this domain by the FrameNet project have been developing over time, due to theory-internal as well as application-oriented goals, towards ever more fine-grained distinctions and greater within-frame consistency. Second, we compare how FrameNet’s linguistically oriented analysis of lexical items in the emotion domain compares to the analysis by domain experts of the experiences that give rise (directly or indirectly) to the lexical items. And finally, we consider to what extent frame semantic analysis can capture phenomena such as connotation and inference about attitudes, which are important in the field of sentiment analysis and opinion mining, even if they do not involve the direct evocation of emotion.
We present the pilot edition of the GermEval Shared Task on the Identification of Offensive Language. This shared task deals with the classification of German tweets from Twitter. It comprises two tasks, a coarse-grained binary classification task and a fine-grained multi-class classification task. The shared task had 20 participants submitting 51 runs for the coarse-grained task and 25 runs for the fine-grained task. Since this is a pilot task, we describe the process of extracting the raw-data for the data collection and the annotation schema. We evaluate the results of the systems submitted to the shared task. The shared task homepage can be found at https://projects.cai. fbi.h-da.de/iggsa/
Offensive language in social media is a problem currently widely discussed. Researchers in language technology have started to work on solutions to support the classification of offensive posts. We present the pilot edition of the GermEval Shared Task on the Identification of Offensive Language. This shared task deals with the classification of German tweets from Twitter. GermEval 2018 is the fourth workshop in a series of shared tasks on German processing.
Der Beitrag beschäftigt sich mit der Interaktion zwischen blinden und sehenden Personen bei der kooperativen Anfertigung einer Audiodeskription. Eine Audio-deskription ist die verbale Beschreibung visueller Inhalte für Sehbeeinträchtigte und stellt eine Sonderform der Translation dar. Auf der Basis von Videodaten wird die Kooperation eines Dreierteams mit den Verfahren der multimodalen Interaktionsanalyse untersucht. Ein Charakteristikum dieser Kooperation besteht darin, dass eines der Teammitglieder blind ist und die beiden anderen sehen können. Das Erkenntnisinteresse richtet sich besonders auf die professionelle Beteiligung des blinden Teammitglieds an der Interaktion. Die Analyse zeigt, wie Blindheit als Ressource für die kooperative Herstellung der Audiodeskription genutzt wird und wie die Beteiligten in einer visuell asymmetrischen Situation interagieren. Der Beitrag ist eine der seltenen Untersuchungen, die sich mit professioneller Interaktion zwischen Blinden und Sehenden beschäftigen. Er diskutiert Aspekte von genereller Relevanz für die weitere Entwicklung der empirischen Interaktionsforschung, vor allem in Bezug auf eine Erweiterung von Beteiligungsperspektiven in Richtung Inklusion.
We address the detection of abusive words. The task is to identify such words among a set of negative polar expressions. We propose novel features employing information from both corpora and lexical resources. These features are calibrated on a small manually annotated base lexicon which we use to produce a large lexicon. We show that the word-level information we learn cannot be equally derived from a large dataset of annotated microposts. We demonstrate the effectiveness of our (domain-independent) lexicon in the crossdomain detection of abusive microposts.
Based on the empirical data of 97 fourth-graders from three districts of Braunschweig in Germany, this paper investigates the possibility of changing semantic frames in multilingual communities. The focus of study is the verb field of self-motion. In a free-sorting task involving 52 verbs, Turkish-speaking students, in particular, placed the verbs schleichen (‘to sneak’) and kommen (‘to come’) in the same group. When explaining the perceived similarity they also used the word schleichen (‘to sneak’), in a specific grammatical construction that is not found in Standard German. This paper suggests that semantic frames may change along with grammatical constructions when typologically distinct languages come into close contact.
Terminological resources play a central role in the organization and retrieval of scientific texts. Both simple keyword lists and advanced modelings of relationships between terminological concepts can make a most valuable contribution to the analysis, classification, and finding of appropriate digital documents, either on the web or within local repositories. This seems especially true for long-established scientific fields with elusive theoretical and historical branches, where the use of terminology within documents from different origins is often far from being consistent. In this paper, we report on the progress of a linguistically motivated project on the onomasiological re-modeling of the terminological resources for the grammatical information system grammis. We present the design principles and the results of their application. In particular, we focus on new features for the authoring backend and discuss how these innovations help to evaluate existing, loosely structured terminological content, as well as to efficiently deal with automatic term extraction. Furthermore, we introduce a transformation to a future SKOS representation. We conclude with a positioning of our resources with regard to the Knowledge Organization discourse and discuss how a highly complex information environment like grammis benefits from the re-designed terminological KOS.
Mit dem hier besprochenen Band liegt eine Monographie zu Pennsylvania Dutch (Pennsylvania German, Pennsylvania-Deutsch; im Weiteren auch PD) vor, die sowohl die Entstehungsbedingungen und -verläufe und den soziohistorischen, soziopolitischen und religionsbezogenen Kontext seiner Entwicklung als auch seine sprachlichen und literarischen Formen, seine historische und heutige gesellschaftliche Stellung und Verwendung umfassend und gründlich darstellt. Louden wendet sich dabei nicht nur an ein linguistisches Fachpublikum, sondern auch an LeserInnen ohne eine speziell linguistische Vorbildung. Dementsprechend werden für die Darstellung relevante linguistische Konzepte eingeführt und erklärt. Ein umfassendes Stichwortverzeichnis macht die Monographie gut erschließbar, und die umfangreiche Bibliographie ermöglicht es, sich weitergehend zu allen angesprochenen Themen zu informieren. Die Endnoten werden strategisch gut eingesetzt, da sie nicht nur fachwissenschaftliche ‚Unterfütterung‘ bieten, sondern auch dazu genutzt werden, alle zitierten Quellentexte sowohl auf Englisch als auch in der (pennsylvania-)deutschen Originalfassung zur Verfügung zu stellen.
This paper analyses reply relations in computer-mediated communication (CMC), which occur between post units in CMC interactions and which describe references between posts. We take a look at existing practices in the description and annotation of such relations in chat, wiki talk, and blog corpora. We distinguish technical reply structures, indentation structures, and interpretative reply relations, which include reply relations induced by linguistic markers. We sort out the different levels of description and annotation that are involved and propose a solution for their combined representation within the TEI annotation framework.
Der vorliegende Beitrag thematisiert zwei unterschiedliche Forschungsergebnisse aus der Auswertung des Korpus »Deutsch heute«. Im ersten Teil wird in einem lautsystematischen Aufriss die phonetische Variation, wie sie sich in der Vorleseaussprache der österreichischen Schülerinnen in den Korpusdaten manifestiert, dargestellt. Ein zweiter Teil des Beitrags präsentiert metasprachliche Äußerungen aus sprachbiographischen Interviews, die Einblicke in sprachbezogene Kategorien und Konzepte der jungen Österreicherinnen geben und Rückschlüsse auf Spracheinstellungen zulassen. Die Schülerinnen bestätigen nicht nur verschiedene Facetten des für Österreich anzunehmenden diaglossischen Verhältnisses der Varietäten durch ihren Formengebrauch, sondern auch in metasprachlichen Aussagen, die einen hohen Grad der Bewusstheit des eigenen Sprachgebrauchs sowie der formalen wie auch soziosymbolischen Unterschiede der Varietäten erkennen lassen.
Die Normen des »Hochdeutschen« sind entstanden als Festlegungen für eine geschriebene öffentliche Sprachform. In den letzten Jahrzehnten richten sich die Sprecherinnen und Sprecher auch im Mündlichen an dieser Norm aus. Gleichzeitig gibt es dadurch mehr Situationen, in denen standardnahes Sprechen als normal gilt. Damit das angemessen bewältigt werden kann, muss diese Sprachform typische Merkmale des Sprechens aufweisen, Merkmale, die traditionell zum Beispiel eher in regionaler Form vorlagen. Um den beiden Bedingungen - Standardnähe und gesprochene Natürlichkeit - gerecht zu werden, entwickelt sich ein Gebrauchsstandard, der durch eine Bandbreite von (auch regionalen) Optionen gekennzeichnet ist. Um diesen Gebrauchsstandard, seine Randbedingungen, seine Ausgestaltung, aber auch seinen theoretischen Status geht es in dem vorliegenden Beitrag.
Sprachpurismus ist eine Form der Sprachkritik, die sich die 'Reinhaltung‘ der Sprache zum obersten Ziel gesetzt hat. Unter Reinhaltung ist zunächst die Zurückdrängung fremdsprachlicher Einflüsse vor allem im Bereich der Lexik zu verstehen, aber auch Versuche der Herausbildung eines Standards und der Entwicklung einer Hochsprache bzw. Nationalsprache sind Gegenstände des Purismus. Sprachpurismus kann individuell als auch institutionell sein. Die ersten institutionellen Versuche zur Reinhaltung des Deutschen gehen auf die Sprachgesellschaften des 17. Jahrhunderts zurück. Diachron betrachtet hat sich der Fokus des Purismus auf unterschiedliche Aspekte der Sprache und der Sprachverwendung gerichtet; gemeinsam ist allen puristischen Bestrebungen, dass sie in der Regel gesellschaftlich an ein Erstarken des Nationalgefühls gekoppelt sind. Trotz institutioneller Bestrebung und im Gegensatz zu anderen Sprachen ist für das Deutsche der Purismus keine Form der Sprachpolitik, also nicht staatlich gelenkt.
Einleitung
(2018)
Einleitung
(2018)
In dem vorliegenden Handbuchband wird Sprachpurismus als eine Kritik am Sprachgebrauch und als eine Kritik an verschiedenen Strukturen und Elementen einer Sprache verstanden. Es wird sprachvergleichend aufgezeigt, in welchen Sprachkonstellationen Sprachpurismus in der Vergangenheit sowie heute von Bedeutung ist und inwiefern die einzelnen Sprachkulturen von sprachpuristischen Aktionen betroffen waren bzw. sind. Außerdem wird auf wichtige Akteure und auf spezifische diskursive Zusammenhänge der einzelnen Sprachräume eingegangen.
In dem vorliegenden Handbuchband werden aus sprachkritischer Sicht Standardisierungsprozesse im Deutschen, Englischen, Französischen, Italienischen und Kroatischen behandelt sowie Instanzen und Bereiche der Standardisierung verglichen. Hierbei geht es sowohl um Aspekte der Diachronie, welche die Herausbildung von Normen für die geschriebene und gesprochene Sprache betreffen, als auch um synchrone Gesichtspunkte wie aktuelle plurizentrische Normtendenzen, Fragen der Orthographie und der Kodifizierung.
This paper presents the results of a survey on dictionary use in Europe, the largest survey of dictionary use to date with nearly 10,000 participants in nearly thirty countries. The paper focuses on the comparison of the results of the Slovenian participants with the results of the participants from other European countries. The comparisons are made both with the European averages, and with the results from individual countries, in order to determine in which aspects Slovenian participants share similarities with other dictionary users (and non-users) around Europe, and in which aspects they differ. The findings show that in many ways the Slovenian users are similar to their European counterparts, with some noticeable exceptions, including (much) stronger preference for digital dictionaries over print ones, above-average reliance on other people when dictionary does not contain the relevant information, and the largest difference between the price of a dictionary and the amount willing to spend on it.
Psychotherapy talk is characterized by epistemic, emotional and professional asymmetries of knowledge, which are continuously adjusted to by the participants in joint process of negotiation. Adjustment is based on structural features of communication: the fundamental sequentiality of verbal interaction, i.e. interrelated succession of utterances of at least two interlocutors, provides for and guarantees the achievement of intersubjectivity and therapeutic efficiency. Solution-oriented questions as a rhetorical practice serve to produce forward-looking awareness, expansion of knowledge and reorganization of knowledge on the patient’s side as well as an increased ability to act. These processes become apparent not only locally in the immediate context of solution-oriented questions but also globally in the course of the interaction as a whole. The data for this research consists of psychodiagnostic interviews conducted according to the concept and manual of the Operationalized Psychodynamic Diagnostics (OPD Task Force 2009).
The article presents the results of a survey on dictionary use in Europe, focusing on general monolingual dictionaries. The survey is the broadest survey of dictionary use to date, covering close to 10,000 dictionary users (and non-users) in nearly thirty countries. Our survey covers varied user groups, going beyond the students and translators who have tended to dominate such studies thus far. The survey was delivered via an online survey platform, in language versions specific to each target country. It was completed by 9,562 respondents, over 300 respondents per country on average. The survey consisted of the general section, which was translated and presented to all participants, as well as country-specific sections for a subset of 11 countries, which were drafted by collaborators at the national level. The present report covers the general section.
To date, little is known about prosodic accommodation and its conversational functions in instances of overlapping talk in conversation. A major conversational action that happens in overlap is turn competition. It is not known whether participants accommodate prosodic parameters locally in the overlapped turn (initialisation) or access a repertoire of prosodic patterns that refer to general prosodic parameter norms (normalisation) when competing for the turn in overlap. This paper investigates the initialisation and normalisation of fundamental frequency (f0) and assesses its role as a resource for turn competition in overlap. We drew instances of overlapping talk from a corpus of conversational multi-party interactions in British English. We annotated the overlaps on a competitiveness scale and categorised them by overlap onset position and conversational function. We automatically extracted f0 parameters from the speech signal and processed them into f0 accommodation features that represent the normalising or the initialising use of f0. Using decision tree classification we found that f0 accommodation is only relevant as a turn competitive resource in overlaps that start clearly before a speaker transition. In this turn context, we found that normalising and initialising f0 features can both be relevant turn competitive resources. Their deployment depends on the conversational function of overlap.
Die Wortbildungsforschung konzentriert sich auf die Hauptwortarten Substantiv, Adjektiv und Verb; Adverbien vernachlässigt sie. Dieser Beitrag soll eine Lücke schließen. Er beschreibt strukturell, statistisch, sprachgeschichtlich und semantisch 11 zentrale Strukturtypen von Adverbien, nämlich Adverbien, die wir mit Präpositionen des Kernbestands gebildet haben und gelegentlich noch bilden. Und er erklärt, mit welchem Verfahren Adverbien dieser 11 Strukturtypen gebildet werden. Denn wer Wortbildungsprozesse durchschaut, versteht.
Mit politischer, wirtschaftlicher und gesellschaftlicher Öffnung im Rahmen von Globalisierung und Internationalisierung gelangen trotz weitreichender Dominanz von Anglizismen verstärkt auch Neologismen aus anderen Sprach- und Kulturräumen in den deutschen Gegenwartswortschatz. Der Beitrag beschreibt, wie sich diese Neuentlehnungen - Italianismen und neue Fremdwörter aus anderen europäischen und außereuropäischen Sprachen - orthografisch entwickeln und wie sie sich zu den amtlichen Regeln der deutschen Rechtschreibung verhalten. Auf der Grundlage großer digitaler Textkorpora wird der Schreibusus professioneller und informeller Schriftlichkeit analysiert - mit dem Ziel einheitlicher Kodifizierung und Integration in das Regelsystem der deutschen Orthografie.
We present ESDexplorer (https://owid.shinyapps.io/ESDexplorer), a browser application which allows the user to explore the data from a large European survey on dictionary use and culture. We built ESDexplorer with several target groups in mind: our cooperation partners, other researchers, and a more general public interested in the results. Also, we present in detail the architecture and technological realisation of the application and discuss some legal aspects of data protection that motivated some architectural choices.
In the past two decades, more and more dictionary usage studies have been published, but most of them deal with questions related to what users appreciate about dictionaries, which dictionaries they use and what type of information they need in specific situations — presupposing that users actually consult lexicographic resources. However, language teachers and lecturers in linguistics often have the impression that students do not use enough high-quality dictionaries in their everyday work. With this in mind, we launched an international cooperation project to collect empirical data to evaluate what it is that students actually do while attempting to solve language problems. To this end, we applied a new methodological setting: screen recording in conjunction with a thinking-aloud task. The collected empirical data offers a broad insight into what users really do while they attempt to solve language-related tasks online.
Zum Umlaut in der Wortbildung wurde in der Forschungsliteratur bislang nur sporadisch spekuliert. „‚Nuss‘ und ‚nussig‘, aber ‚Fluss‘ und ‚flüssig‘ – Wortbildung und Umlaut“ bietet nun reiches Material und statistisch gestützte Analysen. Sprachlehrer und Sprachforscher finden hier gründliche und konzise Informationen in Überblickstabellen und neuen, opulenten Beispielsammlungen.
Language shift after migration has been reported to occur within three generations. While this pattern holds in many cases there is also some counter evidence. In this paper, family documents from a German immigration community in Canada are investigated to trace individual decisions of language choice that contributed to an extended process of shift taking four generations and more than a century.
Das hier zu besprechende Buch, das Ergebnisse einer gleichnamigen Tagung zusammenfasst, die im Juni 2013 in Zürich stattfand, macht eines offenkundig: Wer in jenem Sommer nicht dabei war, hat etwas verpasst. Umso glücklicher darf man sein, dass Angelika Linke und Juliane Schröter die Arbeit, die mit der Herausgabe eines Sammelbandes verbunden ist, auf sich genommen haben. Mehr noch: In einem programmatischen ersten Kapitel geben sie einen systematischen Einblick in das tragfähige Forschungsfeld „Sprachliche Relationalität“ (vgl. S. 1–6), das ganz im Sinne der emotiven Wende in der Sprachwissenschaft konkrete theoretische Anschlussfähigkeit signalisiert, wo bislang eine „fast unübersehbare Menge an Veröffentlichungen“ (Schwarz-Friesel 2013: 16) zwar zeigte, wie attraktiv die Thematik ist, aber auch wie unstrukturiert sich die Zuwendung dazu gestaltet. Dass der Band nun weitere „exemplarische Besetzungen“ (S. 21) des Forschungsfeldes zur Diskussion stellt, wird hier keinesfalls als Nachteil angesehen, sondern als methodisch folgerichtiger empirischer Zugang zur Erschließung eines Forschungsfeldes unter den zielsetzenden Leitfragen „Wie werden im Medium von Sprachgebrauch und Sprache Konzeptualisierungen, Kategorisierungen und Differenzierungen menschlicher Beziehungen ausgebildet, verfestigt und auch wieder verändert?“ und „Welche sprachgeformten Beziehungskonzepte, -kategorien und -unterschiede sind typisch für bestimmte historische Epochen bzw. für bestimmte soziale Gruppierungen?“
DaF-Lernende sollen – laut z. B. dem „Gemeinsamen europäischen Referenzrahmen für Sprachen“ – auf C1 Niveau über lexikalische Kompetenzen in der Interaktion verfügen und aus einem Repertoire von Diskursmitteln eine geeignete Wendung für konkrete Kommunikationsbedürfnisse auswählen können. Wir betrachten diese Annahme im vorliegenden Beitrag als Ausgangspunkt und stellen darauf aufbauend die Frage, welche Diskursmittel und lexikalischen Einheiten typisch für die mündliche Interaktion sind und daher auch spezifische Beachtung im DaF-/DaZ-Unterricht finden sollten. Zu hinter-fragen ist, wie die Anforderungen an DaF-Lernende zu lexikalischen Besonderheiten im Mündlichen in Richtlinien wie dem GeR oder „Profile Deutsch“ formuliert werden und wie diese Anforderungen in Lehr- und Nachschlagewerken für diese Zielgruppe aufgegriffen werden. Unsere Untersuchungen zeigen, dass die Möglichkeiten noch ausbaufähig sind, was aus unserer Sicht zum Beispiel über eine verstärkte Nutzung der inzwischen vorhandenen Korpora zum gesprochenen Deutsch denkbar sein kann. In diesem Zusammenhang wird auch eine direkte Verbindung zu dem Forschungsprojekt LeGeDe (IDS Mannheim) hergestellt, das u. a. die Konzipierung einer innovativen korpusbasierten Ressource zur Lexik des gesprochenen Deutsch in der Interaktion als Prototyp anvisiert und damit einen Ausschnitt aus einem Repertoire an standardnahen lexikalischen Elementen und Diskursmitteln zusammen mit lexikalisch und interaktions-linguistisch relevanten Informationen in multimedialer Form anbieten möchte. Dieses Vorhaben kommt, laut der Ergebnisse entsprechender Befragungen, u. a. auch den Erwartungen der Probanden aus der Lernerperspektive entgegen und findet daher sowohl für die Forschung als auch für die Lehre entsprechende Anwendungsmöglichkeiten.
Ausgehend von der engelschen Ergänzungstypologie soll in dem Beitrag die Leistung der Expansivergänzung für valenztheoretisch fundierte Verbanalysen in Verbindung mit bestimmten Verbsubklassen genauer untersucht werden. Eine ausführliche Darstellung der Begriffsgeschichte und der Abgrenzungsproblematik zeigt die Notwendigkeit auf, die semantischen, morpho-syntaktischen und funktionalen Kriterien zur Begriffsbestimmung für inter- und intralinguale Studien integrativ zu erfassen.
Ulrich Engel hat mit seinen Publikationen zur deutschen Grammatik, zur Verbvalenz und zur kontrastiven Linguistik große Wirkung auf die internationale germanistische Linguistik ausgeübt. Weniger bekannt ist, dass er mit seinem Werk auch andere linguistische Teildisziplinen beeinflusst hat, die davon bis heute profitieren. Dependenzielle Ansätze spielen bei der maschinellen Syntaxanalyse mittlerweile eine zentrale Rolle, und bei der Entwicklung von Systemen zur maschinellen Übersetzung haben Engels Arbeiten ebenfalls ihre Spur hinterlassen. Der Aufbau von Sprachressourcen in Gestalt von „Baumbanken“ kann auf Engels Grammatikkonzeption zurückgreifen, und auch zur neuerlich florierenden Konstruktionsgrammatik bestehen klare Bezüge. Im Beitrag werden diese weniger bekannten Einwirkungen von Engels Werk in andere Bereiche dargestellt und in ihrer andauernden Aktualität gewürdigt.
Über 400 Wissenschaftler/innen aus insgesamt 25 verschiedenen Herkunftsländern kamen dieses Jahr zur 54. Jahrestagung des Instituts für Deutsche Sprache (IDS). Unter dem Titel „Neues vom heutigen Deutsch. Empirisch – methodisch – theoretisch“ konnten sich die Besucher/innen insgesamt 14 Fachvorträge anhören. In diesem Jahr wurde der Titel weit gefasst, um Themenvielfalt zu ermöglichen. „Neues“ bezeichnet dabei zum einen Neues von der deutschen Sprache, zum anderen aber auch neue Methoden, theoretische Ansätze und empirische Schwierigkeiten.
We present a method for detecting annotation errors in manually and automatically annotated dependency parse trees, based on ensemble parsing in combination with Bayesian inference, guided by active learning. We evaluate our method in different scenarios: (i) for error detection in dependency treebanks and (ii) for improving parsing accuracy on in- and out-of-domain data.
In der Datenbank zum Datensatz attributive_Adjektive_1.csv finden sich 1.598 Belege zu artikellosen Nominalphrasen mit je zwei attributiven Adjektiven im Dativ Singular Maskulinum oder Neutrum.
Die Datenbank attributive Adjektive enthält zu jedem Beleg neben dem Satzkontext eine Reihe von Annotationen. Dazu gehören Metadaten wie Register und regionale Zuordnung sowie Annotationen zur Phonologie, Morphosyntax, Semantik und Frequenz. Anhand dieser Annotationen lassen sich Hypothesen zur Adjektivflexion und -reihenfolge überprüfen. Nach einer Auswahl aus diesen Annotationen können Sie hier suchen. Alternativ können Sie unter „Download“ das gesamte Suchergebnis mit allen Annotationen und inklusive aller Belege, die bei der Untersuchung von Adjektivflexion und -reihenfolge als Fehlbelege eingestuft worden sind, herunterladen.
Die Analyse sprachlicher Massendaten zeigt, wie zentral mehr oder weniger feste Wortverbindungen als Lexikoneinheiten für die Sprachkompetenz sind. Der Beitrag geht zunächst kurz auf aktuelle Entwicklungen in der Phraseologie ein: eine Abkehr von der starken Betonung des Idiosynkratischen einerseits und die Hinwendung zum Vorgeprägten andererseits. Wir führen hierzu den Terminus‚ lexikalisch geprägte Muster‘ (LGM) ein. In einer Detailanalyse beschäftigen wir uns mit satzwertigen Wortverbindungen im Spannungsfeld zwischen ausgeprägter Lexikalisierung, die auf eine gesonderte kognitive Verankerung hindeutet, und der Konstitution abstrakter Spruchmuster als LGM-Subtyp. Im zweiten Teil zeigen wir, wie usuelle Wortverbindungen innerhalb von Phrasenkomposita zur Lexembildung beitragen.
Multimediale Narration im Angesicht des Todes. Zeugnisse terminaler KrebspatientInnen im Internet
(2018)
A general concept of perspective is proposed, using the mathematical notion of vector spaces as metaphor. The concept is applied to different phenomena which use perspective: spatiotemporal perspective, lexical semantics (prototypes and features), perspectivation in syntax and lexical inferences. Criteria for constructing a superordinate perspective for two given perspectives are developed.
Die „21. Arbeitstagung zur Gesprächsforschung“ mit dem Rahmenthema „Vergleichende Gesprächsforschung“ fand vom 21.-23. März 2018 am Institut für Deutsche Sprache in Mannheim statt. Das Ziel der Tagung war es, Forscherinnen und Forscher zusammenzubringen, die authentische Interaktionsdaten aus vergleichender Perspektive untersuchen. Das Rahmenthema der Tagung ergab sich aus dem steigenden Interesse an vergleichenden Fragestellungen innerhalb konversations- und gesprächsanalytischer Untersuchungen. Die Tagung nahm gezielt Vorgehensweisen und Methoden bei der Durchführung vergleichender Untersuchungen in den Blick. Die Vorträge1, Projektpräsentationen und Datensitzungen erörterten 1. das Vergleichen als analytische Grundoperation der Konversations- und Gesprächsanalyse, 2. Vergleiche alternativer Ressourcen und Praktiken für spezifische Handlungen und Aktivitäten in der Interaktion sowie 3. methodologische Herausforderungen einer vergleichenden Gesprächsforschung.
This presentation introduces a new collaborative project: the International Comparable Corpus (ICC) (https://korpus.cz/icc), to be compiled from European national, standard(ised) languages, using the protocols for text categories and their quantities of texts in the International Corpus of English (ICE).
In this article, the execution of a ritual as a component of religious communication is analysed. The ritual, in which the church community remembers the deceased, is celebrated in the evangelic church of Sarepta (Volgograd) on the last Sunday of the church year, the so-called ‘eternity Sunday’. The study of the ritual is based on two scientific approaches: ethnomethodology and multimodal interaction analysis. These approaches make it possible to analyse the social and cultural practices of church visitors in conjunction with the organisation of church service. Specifically, it becomes possible to:
a) develop new scientific paradigms when analysing the actual use of the church interior,
b) identify basic religious activities of communication in church,
c) introduce new concepts into scientific use,
d) present the ritual of remembrance in Sarepta as a complex, multimodally constituted religious event,
e) focus the coordination of linguistic, physical and spatial activities of church visitors and clerics at different stages of church service and to understand their respective social content and communicative status.
For analysing the video recordings of the church service, the concepts of ‘architecture-for-interaction’ and ‘social topography’ are used, making it possible to discover new aspects of spatial influence on communication. The concept of ‘architecture-for-interaction’ provides the framework for answering the question of how the church interior in Sarepta contributes to the organisation of the ritual. Forms of situational use of space and the cultural knowledge underlying this use are captured with the concept of ‘social topography’. From a structural viewpoint, the analyzed ritual in Sarepta is based on organization and division of responsibilities, consists of phases of structural non-simultaneity, has a three-positional spatial basis, and is structurally open. Because of these characteristics, the execution of the ritual can be described as ‘participatory rituality’. Participatory rituality allows for a religious socialization which lets the community members participate as active and legitimate participants in religious communication and autonomously contribute to the execution of the ritual.
This paper discusses the interaction of Freezing with movement and focus on the basis of subextraction from the pivot of it-cleft sentences. It shows that subextraction is in principle possible, and that it is not sensitive to whether the pivot is related to a derived subject or real object. However, if the context induces an additional contrastive focus on the pivot, extraction is less acceptable. It is suggested that the problem is that two different sets of alternatives need to be construed on the basis of one and the same syntactically marked focus phrase, the pivot. Once the two sets of alternatives are syntactically separated, interpretation is less complex and licit.
Quantitativ ausgerichtete empirische Linguistik hat in der Regel das Ziel, grose Mengen sprachlichen Materials auf einmal in den Blick zu nehmen und durch geeignete Analysemethoden sowohl neue Phanomene zu entdecken als auch bekannte Phanomene systematischer zu erforschen. Das Ziel unseres Beitrags ist es, anhand zweier exemplarischer Forschungsfragen methodisch zu reflektieren, wo der quantitativ-empirische Ansatz fur die Analyse lexikalischer Daten wirklich so funktioniert wie erhofft und wo vielleicht sogar systembedingte Grenzen liegen. Wir greifen zu diesem Zweck zwei sehr unterschiedliche Forschungsfragen heraus: zum einen die zeitnahe Analyse von produktiven Wortschatzwandelprozessen und zum anderen die Ausgleichsbeziehung von Wortstellungsvs. Wortstrukturregularitat in den Sprachen der Welt. Diese beiden Forschungsfragen liegen auf sehr unterschiedlichen Abstraktionsebenen. Wir hoffen aber, dass wir mit ihnen in groser Bandbreite zeigen konnen, auf welchen Ebenen die quantitative Analyse lexikalischer Daten stattfinden kann. Daruber hinaus mochten wir anhand dieser sehr unterschiedlichen Analysen die Moglichkeiten und Grenzen des quantitativen Ansatzes reflektieren und damit die Interpretationskraft der Verfahren verdeutlichen.
This abstract discusses the possibility to adopt a CLARIN Data Protection Code of Conduct pursuant art. 40 of the General Data Protection Regulation. Such a code of conduct would have important benefits for the entire language research community. The final section of this abstract proposes a roadmap to the CLARIN Data Protection Code of Conduct, listing various stages of its drafting and approval procedures.
New exceptions for Text and Data Mining and their possible impact on the CLARIN infrastructure
(2018)
The proposed paper discusses new exceptions for Text and Data Mining that have recently been adopted in some EU Member States, and probably will soon be adopted also at the EU level. These exceptions are of great significance for language scientists, as they exempt those who compile corpora from the obligation to obtain authorisation from rightholders. However, corpora compiled on the basis of such exceptions cannot be freely shared, which in a long run may have serious consequences for Open Science and the functioning of research infrastructure such as CLARIN ERIC.