Refine
Year of publication
- 2017 (370) (remove)
Document Type
- Part of a Book (161)
- Article (101)
- Conference Proceeding (43)
- Book (33)
- Part of Periodical (13)
- Other (7)
- Working Paper (6)
- Report (4)
- Doctoral Thesis (2)
Keywords
- Deutsch (154)
- Korpus <Linguistik> (64)
- Gesprochene Sprache (30)
- Grammatik (22)
- Sprachvariante (22)
- Englisch (14)
- Linguistik (14)
- Sprache (14)
- Diskursanalyse (13)
- Interaktion (13)
Publicationstate
- Veröffentlichungsversion (163)
- Zweitveröffentlichung (87)
- Postprint (20)
- Erstveröffentlichung (1)
- Preprint (1)
Reviewstate
- (Verlags)-Lektorat (135)
- Peer-Review (114)
- Peer-review (12)
- (Verlags-)Lektorat (2)
- Peer-Revied (2)
- (Verlags-)lektorat (1)
- Peer Review (1)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (1)
Publisher
- Institut für Deutsche Sprache (56)
- de Gruyter (50)
- Narr Francke Attempto (39)
- Narr (19)
- De Gruyter (17)
- Verlag für Gesprächsforschung (11)
- Stauffenburg (10)
- Hempen (9)
- Springer (6)
- TUDpress (6)
Rückblick 2017
(2017)
The following article gives an overview on common evaluation methods that are used in reviews of bilingual dictionaries published in learned journals. Based on a corpus containing 50 reviews of printed general bilingual dictionaries for textrelated purposes with German, English or French as one of the languages, this case study is aimed at drawing a list of requirements for writing such reviews. A critical analysis of the text corpus shows which features of the reviewed dictionaries are evaluated and in which way this evaluation happens. The resulting list of requirements presents some of the principles for writing reviews of bilingual dictionaries and recommends appropriate evaluation methods for future reviews.
Mit dem Fokus auf Medienpraktiken bündelt dieses Heft aktuelle Positionen zur empirischen Erforschung von Medien. Die Beiträge gehen davon aus, dass Medien erst durch ihren Gebrauch zu Medien werden. Medienpraktiken zu erforschen, bedeutet jedoch nicht nur herauszufinden, was Menschen mit Medien tun, sondern auch was Medien mit Menschen machen. Diese für die Medienpraktikenforschung zentrale Einsicht lösen die interdisziplinären Beiträge des Bandes ein, indem sie aus den jeweiligen Positionen und Konstellationen verdeutlichen, wie Medien und Praktiken sich gegenseitig bedingen. Medienpraktikenforschung erfordert erstens, medienpraktische Phänomene in einem hohen Detailgrad zu fassen, um die Relation der beteiligten menschlichen und medialen Akteure zueinander in situ und in actu nachzuvollziehen. Erst durch die analytische Durchdringung dieser situativen Vollzugsmomente lässt sich zweitens der Status von Medien klären: was durch Praktiken zu einem Medium wird und wie die Praktiken unter Berücksichtigung der an ihnen konstitutiv beteiligten Medien beschaffen sind. Dadurch lassen sich ebenso übersituative Bezüge zur Praxis herstellen, durch die die Praktiken zur situativen Entfaltung kommen. Drittens muss dabei berücksichtigt werden, inwiefern die eigenen Medienpraktiken der Erforschung in ihren jeweiligen situativen Stadien die (Analyse der) Medienpraktik zurichten. Die Beiträge dieses Bandes lösen diese Forderungen in unterschiedlicher Gewichtung ein. Sie befassen sich aus medienethnologischer, kultursoziologischer, literaturwissenschaftlicher, historischer, soziologischer und medienwissenschaftlicher Perspektive damit, was jeweils als situierte Medienpraktik verstanden werden kann. Gemeinsam ist damit allen Beiträgen, dass sie erst aus ihren jeweiligen Untersuchungen und Perspektiven heraus bestimmen, was genau als Medienpraktik und Medien, die in ihnen zum Tragen kommen, gefasst werden kann.
Der vorliegende Artikel untersucht die Frage, wie sich die Angebote im Bereich von Social Media heute darstellen und wie sie sich in den nächsten Jahren voraussichtlich entwickeln werden. Der Fokus liegt dabei auf der Entwicklung der technischen Infrastruktur und deren Einfluss auf die verschiedenen Aspekte wissenschaftlicher Kommunikation. Einen Schwerpunkt bilden dabei einerseits die Auswirkungen der Automatisierung, im Bereich der Wissenschaftskommunikation die Entwicklung von spezifischen Scores und Altmetriken, andererseits die Etablierung neuartiger Vermittlungskanäle für wissenschaftliche Themen.
Sprachwissenschaft geht logozentrisch vor, konzentriert sich also aufs geschriebene und seit einigen Jahrzehnten auch aufs gesprochene Wort. Das ist verständlich und sinnvoll (Schuster, bleib bei deinen Leisten!), setzt sich aber auch Scheuklappen auf und übersieht bedeutsame Erscheinungen am Rande.
Mit diesem Bild beschreibt Hermann Unterstöger in einem „Sprachlabor“- Artikel der Süddeutschen Zeitung vom 23.3.2013 die Erfolgsgeschichte, die das Substantiv (das) Narrativ in den letzten 30 Jahren vorgelegt hat. Während Unterstöger feinsinnig den intertextuellen Bezug zum „Narrenschiff“ des Sebastian Brant oder dem gleichnamigen Roman von Katherine Ann Porter bemüht, wird Matthias Heine, der Autor von „Seit wann hat geil nichts mehr mit Sex zu tun? 100 deutsche Wörter und ihre erstaunlichen Karrieren“ in einem Artikel in der WELT vom 13.11.2016, wie nach diesem Buchtitel zu erwarten, eher grob: Dort heißt es: „Hinz und Kunz schwafeln heutzutage vom ,Narrativ‘“.
Emoticons erfreuen sich auf der ganzen Welt großer Beliebtheit, vor allem in der alltäglichen elektronischen Kommunikation wie E-Mail, SMS, Forumsdiskussionen, Instant Messaging, Facebook oder Twitter. Zum ersten Mal in der Geschichte wurde 2015 von den Sprachbeobachtern der britischen Oxford Dictionaries ein Emoticon zum Wort des Jahres gewählt: das Grinsegesicht, dem die Freudentränen aus den Augen spritzen (vgl.<www.sueddeutsche.de/kultur/britisches-wortdes-jahres-was-haben wir-gelacht-1.2740952>, Stand: 8.11.2017). Die Jury begründete ihre Wahl wie folgt: „[E]moji have come to embody a core aspect of living in a digital world that is visually driven, emotionally expressive, and obsessively immediate.“
Im September 1522 erschien in Wittenberg „Das newe Testament Deutzsch“ mit einer Auflage von über 3.000 Stück und war binnen einer Woche ausverkauft. Martin Luther, der auf dem Titelblatt auf eigenen Wunsch nicht erwähnt wird, hatte die Übersetzung auf der Wartburg in nur elf Wochen angefertigt und wenig später fünf Wochen lang mit seinem Kollegen und Freund, dem Gräzisten Philipp Melanchthon, insbesondere im Hinblick auf die griechische Urfassung bearbeitet. Die Geschichte der Revisionen der Lutherbibel beginnt im gleichen Jahr – schon für den Nachdruck im Dezember hat Luther dieses so genannte „Septemberevangelium“ an vielen Stellen revidiert. In Teilen erschien danach seine Übersetzung des Alten Testaments, 1534 die vollständige Übersetzung der Bibel. Luther korrigierte den Bibeltext unablässig weiter bis zur Ausgabe von 1545, der Lutherbibel „letzter Hand“.
Verstehen und Motivieren: semantische Fluchtpunkte deutscher und italienischer Lexeme mit -log-
(2017)
Unlike traditional text corpora collected from trustworthy sources, the content of web based corpora has to be filtered. This study briefly discusses the impact of web spam on corpus usability and emphasizes the importance of removing computer generated text from web corpora.
The paper also presents a keyword comparison of an unfiltered corpus with the same collection of texts cleaned by a supervised classifier trained using FastText. The classifier was able to recognize 71% of web spam documents similar to the training set but lacked both precision and recall when applied to short texts from another data set.
Am Anfang ist das Wort
(2017)
Die Migration in die Türkei stellt für viele junge Menschen einen Wendepunkt in ihrem Leben dar. Sie kann verschiedene Gründe haben.
In der biografie- und interaktionsanalystischen Pilotstudie wird die Darstellung der narrativen Identitätsentwürfe von drei deutsch-türkischen Germanistikstudentinnen in Instanbul untersucht. Sie zeigt, wie die Informantinnen aus der Retrospektive ihre sprachlichen und sozialen Erfahrungen in Deutschland und nach der Migration in die Türkei konstituieren und welche Rolle ihre sprachlichen Ressourcen beim Ausdruck von sozialer Zugehörigkeit spielen.
This study investigates the interrelations between bilingual development (German/Russian), immigration and integration in the host society. Participants are Russian-Germans, that is, ethnic Germans who have repatriated to Germany from the former Soviet Union. They were part of a longitudinal study dedicated to the integration of multi-generation Russian-German families in Germany. The paper focuses on eight Russian-Germans who moved to Germany between the ages of five and eight and are now young adults. The analysis is based on interviews conducted in the twentieth year of their life in Germany in German and Russian, A semi-structured questionnaire was used to elicit information on the main stages of integration, the use of the languages, the attitudes towards German and Russian, and an assessment of the current situation. The obtained data were used to make an initial assessment of the oral language competencies of the participants and as sources of information about the objective facts and subjective attitudes that determined linguistic and social integration.
Seit 2015 ist die Zahl der Migranten, die aus Bürgerkriegsländern des Nahen und Mittleren Ostens sowie aus Afrika nach Deutschland kommen, bis in die ersten Monate 2016 rasant gestiegen – auf knapp 1 Million in einem Jahr, zeitweise ohne Grenzkontrolle und Registrierung. Nach der auch von den Oppositionsparteien im Bundestag weitgehend unterstützten Positionierung der Bundeskanzlerin Merkel, Deutschland für die überwiegend als „Flüchtlinge“ bezeichneten Migranten politisch, rechtlich und gesellschaftlich zu öffnen, entwickelt sich bald ein Gegendiskurs, der nicht von den Oppositionsparteien im Deutschen Bundestag, sondern vor allem von der Führung der – an der Bundesregierung beteiligten – CSU getragen wurde, unterstützt von einigen Verfassungsrechtlern. Begriffe wie „Willkommenskultur“, „Obergrenze“, „humanitäre Katastrophe“, „Grundrecht auf Asyl“, „kulturelle Identität“, „Herrschaft des Unrechts“ etc. beginnen die öffentliche und private Kommunikation über Politik zu beherrschen.
Die Diskurslinguistik als relativ neue Teildisziplin der germanistischen Linguistik beschäftigt sich mit der Frage, wie soziale Wirklichkeiten in transtextuell organisierten Einheiten konstruiert werden. Bisher finden dabei noch kaum Texte aus digitalen Medien (z. B. aus Facebook, Twitter oder Wikipedia) Berücksichtigung. Das Netzwerk vereint die unten genannten WissenschaftlerInnen, die in ihren Projekten an der Analyse digitaler Diskurse arbeiten und dabei digitale Methoden der Korpuslinguistik bzw. Digital Methods nutzen.
Ein Teildiskurs der Digital Humanities dreht sich um die Frage, wie tradierte Wissensressourcen der Geisteswissenschaften sinnvoll mit digitalen Technologien und Tools verbunden werden können. Auch bei der Neubearbeitung des Deutschen Wörterbuchs von Jacob Grimm und Wilhelm Grimm (DWB) ist dieser Diskurs spürbar, denn mit der Ende 2016 abgeschlossenen Arbeit des traditionsreichen Unternehmens liegt ein konzeptuell einzigartiges Referenzwerk der historischen Lexikografie des Deutschen vor, das in ‘traditioneller’ Printform entstanden, dessen Umsetzung in ein digitales Format jedoch bereits beschlossen ist. Im Laufe der Arbeit am DWB sind überdies zwei Datensammlungen entstanden, die mittlerweile digitalisiert wurden und öffentlich zugänglich sind: das (digitale) Quellenverzeichnis und die Kartei Literatur zur Wortforschung (LW-Kartei). Ihre Einbindung in die Wörterbucharbeit und -benutzung trägt auf unterschiedliche Weise zum Verständnis des DWB bei; weiterhin verweisen sie als digitale Werkzeuge auf grundlegende Möglichkeiten zur Aufbereitung von lexikografischen Daten. Im Folgenden werden beide Projekte, die sich ursprünglich als innerbetriebliche lexikografische Werkzeuge aus der Wörterbuchpraxis ergaben, vorgestellt. Anschließend wird anhand mehrerer ausgewählter Beispielwörter demonstriert, inwiefern sich die LW-Kartei und das Quellenverzeichnis für ein breites Spektrum von Forschungsfragen nutzen lassen. Am Ende werden Überlegungen zur Erweiterung der Datenbanken, d. h. der jeweiligen Systeme zur elektronischen Datenverwaltung, und ihrer Vernetzung mit den jeweiligen DWB-Artikeln diskutiert – Themen, denen u. a. bei der anstehenden Retrodigitalisierung des DWB besondere Beachtung zukommen sollte.
Seit Jahrhunderten gab es und gibt es im russländischen Reich, in der Sowjetunion und im postsowjetischen Raum Menschen, deren Leben dadurch charakterisiert ist, dass in ihm die deutsche und die russische Sprache und die damit verbundenen Traditionen eng verflochten sind (vgl. Stricker (Hg.) 1997). Mit der Bezeichnung ,Russlanddeutsche‘ beziehen wir uns in diesem Beitrag nur auf diejenigen unter ihnen, deren Vorfahren auf Einladung russischer Zaren aus deutschsprachigen Regionen nach Russland übersiedelten, um dort dünn besiedelte Landstriche zu erschließen und zu kultivieren - deutsch-sprachige Menschen in der Kolonisten-Tradition (vgl. Ditc 1997).
Corpus researchers, along with many other disciplines in science are being put under continual pressure to show accountability and reproducibility in their work. This is unsurprisingly difficult when the researcher is faced with a wide array of methods and tools through which to do their work; simply tracking the operations done can be problematic, especially when toolchains are often configured by the developers, but left largely as a black box to the user. Here we present a scheme for encoding this ‘meta data’ inside the corpus files themselves in a structured data format, along with a proof-of-concept tool to record the operations performed on a file.
This article describes a series of ongoing efforts at the Stanford Literary Lab to manage a large collection of literary corpora (~40 billion words). This work is marked by a tension between two competing requirements – the corpora need to be merged together into higher-order collections that can be analyzed as units; but, at the same time, it’s also necessary to preserve granular access to the original metadata and relational organization of each individual corpus. We describe a set of data management practices that try to accommodate both of these requirements – Apache Spark is used to index data as Parquet tables on an HPC cluster at Stanford. Crucially, the approach distinguishes between what we call “canonical” and “combined” corpora, a variation on the well-established notion of a “virtual corpus” (Kupietz et al., 2014; Jakubíek et al., 2014; van Uytvanck, 2010).
Our paper describes an experiment aimed to assessment of lexical coverage in web corpora in comparison with the traditional ones for two closely related Slavic languages from the lexicographers’ perspective. The preliminary results show that web corpora should not be considered ― inferior, but rather ― different.
The Manatee corpus management system on which the Sketch Engine is built is efficient, but unable to harness the power of today’s multiprocessor machines. We describe a new, compatible implementation of Manatee which we develop in the Go language and report on the performance gains that we obtained.
Creating CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes - The National Corpus of Contemporary Welsh)
(2017)
CorCenCC is an interdisciplinary and multiinstitutional project that is creating a large-scale, open-source corpus of contemporary Welsh. CorCenCC will be the first ever large-scale corpus to represent spoken, written and electronicallymediated Welsh (compiling an initial data set of 10 million Welsh words), with a functional design informed, from the outset, by representatives of all anticipated academic and community user groups.
Many (modernist) works of literature can be understood by their associativeness, be it constructed or “free”. This network-like character of (modernist) literature has often been addressed by terms like “free association”, connotation”, “context” or “intertext”. This paper proposes an experimental and exemplary approach to intraconnect a literary corpus of the Austrian writer Ilse Aichinger with semantic web-technologies to enable interactive explorations of word-associations.
This paper outlines the broad research context and rationale for a new international comparable corpus (ICC). The ICC is to be largely modelled on the text categories and their quantities the International Corpus of English with only a few changes. The corpus will initially begin with nine European languages but others may join in due course. The paper reports on those and other agreements made at the inaugural planning meeting in Prague on 22-23 June 2017. It also sets out the project’s goals for its first two years.
Complex linguistic phenomena, such as Clitic Climbing in Bosnian, Croatian and Serbian, are often described intuitively, only from the perspective of the main tendency. In this paper, we argue that web corpora currently offer the best source of empirical material for studying Clitic Climbing in BCS. They thus allow the most accurate description of this phenomenon, as less frequent constructions can be tracked only in big, well-annotated data sources. We compare the properties of web corpora for BCS with traditional sources and give examples of studies on CC based on web corpora. Furthermore, we discuss problems related to web corpora and suggest some improvements for the future.
In German there are about twenty-five elements (like gemäß, nahe, voll) that seem to be used as a preposition along with their use as an adjective. In former approaches the preposition is interpreted as the product of grammaticalizing (and/or reanalyzing) the adjective. It is argued that the two criteria these approaches rely on, namely change of linear position and change of case government, are insufficient. In this paper, seven criteria for distinguishing adjectives form prepositions in German are put forward. What is most important is that these criteria have to be evaluated on the token level as well as on the level of type and word class/syntactic category. It can be shown that the individual ‘adjective-prepositions' as types possess a specific mixture of adjective-like and preposition-like features. On the token level, occurring as part of a postnominal restrictive attribute is indicative for preposition-like status in German. The comparison of German with English and Italian adjective-prepositions (like near, far, due and vicino, lontano) reveals a lot of differences, which counts as evidence for the language-specific nature of word classes. Nevertheless, Lehmanns functional-typological approach uncovers a fundamental functional similarity between complement governing adjectives and prepositions: the primary function of the phrases, i.e., adjective/preposition + complement, is to modify a nominal or a verbal concept, respectively. This insight explains why adjective-prepositions can be found cross-linguistically. The question whether we should propose one type or two types for gemäß and its cognates is of minor importance only.
Abschreckend beim Deutschlernen ist u. a. die Erkenntnis, dass man so viel beachten muss, um eine kleine Wortgruppe mit einem Adjektiv, einem Nomen und gegebenenfalls einem Artikel richtig bilden zu können. Es reicht nämlich nicht, zu wissen, ob das Adjektiv vor einem maskulinen, einem femininen oder einem neutralen Nomen steht. Auch das Wissen, in welchem Kasus dieses Nomen steht, reicht nicht aus, um die richtige Form des Adjektivs auszuwählen, nein, man muss auch noch berücksichtigen, ob ein Artikel vor dem Adjektiv steht und wenn ja, welcher, denn auch das beeinflusst die Form des Adjektivs.
Alles verstehen heißt alles verzeihen ist ein Satz, der im Deutschen den Charakter eines Spruchs, eines geflügelten Wortes angenommen hat, und der wahrscheinlich auf einem Zitat aus „Corinne ou l‘Italie“ von Madame de Staël (1807) (tout) comprendre c‘est (tout) pardonner basiert. Dieser Satz wurde ins Deutsche übersetzt und als Alles verstehen heißt alles verzeihen tradiert. Die Form eines Spruchs, eines geflügelten Wortes ist im Allgemeinen sehr konstant. Die Tendenz zur grammatischen Variation ist auch dann gering, wenn sie nach gängigen grammatischen Regeln möglich wäre.
Welche Sprachen sehen wir auf Schildern, Plakaten, Graffiti in der Öffentlichkeit? Wovon hängt es ab, an welchen Orten und in welchen Funktionen bestimmte sprachliche Varietäten zu finden sind? Wie spiegeln sich Mehrsprachigkeit in der Gesellschaft, Prestige von Sprachen und Machtverhältnisse von Sprechergruppen in den Texten im öffentlichen Raum?
Dieser Band widmet sich derartigen Fragen, die in der Sprachwissenschaft heute unter dem Schlagwort der Linguistic Landscapes untersucht werden, aus einer Perspektive der deutschen Sprache außerhalb des deutschsprachigen Kerngebietes. Welches – z. T. unerwartete – Auftreten des Deutschen lässt sich in Ländern wie Malta, Estland, Dänemark oder Tschechien beobachten? Was für Geschichten stehen dahinter und wie spiegeln sich in deutschen Texten und Symbolen historische Ereignisse und heutige Verbindungen zu den deutschsprachigen Ländern?
Gleichzeitig berichten die Beiträge des Bandes über Erfahrungen, die Präsenz der deutschen Sprache in der Öffentlichkeit zu Unterrichtszwecken und zum Sprachmarketing einzusetzen. Ob in Schule, Universität oder in der Werbung für Deutsch in der allgemeinen Öffentlichkeit – dieser in Anlehnung an ein Projekt auf Malta Spot German genannte Ansatz veranschaulicht nicht nur die Vielfalt der Rollen des Deutschen, er zeigt vor allem, dass Projekte zur deutschen Sprache Spaß machen und auf einfache Weise zur Nachahmung einladen können.
The present paper explores the change in distribution and potential function as well as the interplay of two phenomena that occur at the internal boundaries of nominal compounds, namely linking elements and hyphenation. About 40% of present-day German compounds contain a linking element, most prominently -s- (e.g. Geburt-s-ort ‘birth place’). Numerous theories have been brought forward to explain its function, two of which are examined here: It will be shown that the linking-s tends to mark morphologically complex constituents while the assumption that it prefers marked phonological words cannot be corroborated.
Linked compounds in present-day German use hyphenation, a strategy that is mostly employed with graphematically or phonologically marked constituents, at a much smaller rate than unlinked compounds. In Early New High German (ENHG, 1350-1650), when the linked type arose by reanalyzing prenominal genitive attributes as first constituents of compounds, the reverse held true: Linked compounds underwent a gradual graphematic integration from separate writing into directly connected words which was partly reversed by a century of hyphenation (1650-1750). While hyphenation also occurred with unlinked compounds, the linked compounds show a striking preference with hyphenation rates reaching a peak at around 90%. It will be argued that ENHG hyphenation had the same function it has today, namely structuring constituents that are perceived as marked: The change in spelling between ENHG and today reflects the integration of a formerly syntactic and thereby marked pattern into word-formation.
Tempuswahn
(2017)
Dass es im Deutschen ein am Verb hängendes "Tempussystem" gäbe und dass dieses Zeitinformationen in die Äußerungen einbringe, gehört zum Grammatikkanon unserer Schulen und auch vieler Lehrerbildungsanstalten und Universitäten, im Ausland, soweit es um Deutsch als Fremdsprache geht, verständlicherweise noch konsequenter als im Inland. Wir brauchen Tempus, um die Sachverhalte, über die wir reden, zeitlich festzumachen – dies kann weithin als opinio communis gelten.
Gezweifelt wurde selten. Harald Weinrich hat immerhin 1964 mit seinem Buch "Tempus. Besprochene und erzählte Welt" das ganze vorgebliche Gemeinwissen in Frage gestellt und damit viel Widerspruch, aber auch positive Reaktionen hervorgerufen. Man muss Weinrich nicht in allen Punkten zustimmen (und ich tue es auch nicht), um doch an der alten Tempustradition irrewerden zu können und nach neuen Tempuskonzeptionen zu suchen.
Im Folgenden wird die Frage behandelt, ob die deutschen Tempora primär mit Zeit zu tun haben und ob es überhaupt sinnvoll ist, für das Deutsche ein Tempussystem anzusetzen.
Grammatik und Variation im Spannungsfeld von Sprachwissenschaft und öffentlicher Sprachreflexion
(2017)
Der Beitrag bezieht systematische und funktionale Faktoren zur Erklärung grammatischer Variation aufeinander, indem er ausgehend von der Annahme eines rekursiven Systems mit konfligierenden Teilsystemen ‚System‘ als Möglichkeitsraum für (funktional ausdifferenzierte) Variation versteht. Inwiefern die vom System bereitgestellten Möglichkeiten grammatischer Variation im Sprachgebrauch genutzt werden, diskutiert der Beitrag anhand der lexikographischen Praxis der Erfassung von grammatischer Variation im Dudenband 9 „Richtiges und gutes Deutsch“. Mit diesem Material werden nicht nur zentrale Bereiche grammatischer Variation rekonstruiert, sondern auch Zentralbereiche grammatischer Variation mit diasystematischen Variationsdimensionen korreliert.
Der Band umfasst grundlegende Arbeiten, die methodologisch und im Sinne des Theorieaufbaus besonders aussagekräftig und allgemein anwendbar sind, sowie Werke, die den Fokus auf deutschsprachige Länder und/oder Deutsch als Einzelsprache legen. In der Einleitung des Bandes werden – zum ersten Mal im deutschsprachigen Kontext – Sprachplanung/Sprach(en)politik und Sprachmanagementtheorie in Beziehung gesetzt. Exkursorisch werden außerdem Sprachenrecht, europäische Sprachenpolitik und Deutsch im Licht von Sprachplanung/Sprach(en)politik und Sprachmanagement thematisiert.
Traditionell wird das Genus der Nomina im Lexikon verortet. Die beiden anderen Erscheinungen des Genus, nämlich syntaktische Integration bei der Kongruenz sowie pragmatische Identifikation von Partizipanten im Diskurs, werden als Folgeerscheinungen der lexikalischen Verankerung des Genus betrachtet.
Wir wollen der lexikalistischen Theorie eine Alternative gegenüberstellen, bei der das Genus in der Syntax und Pragmatik verwurzelt ist. Erst in der Produktion einer Nominalphrase greift der Sprecher auf das Genusmerkmal (GM) für die morphologische Gestaltung der Phrase zurück. Dabei ist die Genuskodierung von Einzellexemen im Lexikon nur eine von vielen Quellen für die Gewinnung der Merkmale.
Vorgestellt werden unterschiedliche Auslösertypen für das Genus. Unter anderem werden Merkmale diskutiert, die durch den Referenten, durch morphologische und syntaktische Prozesse oder auch durch ein Begriffsfeld im Lexikon bedingt sind. Genusvariation ergibt sich demnach aus der Konkurrenz zwischen verschiedenen Auslösertypen, die auf die gleiche NP (und deren nominalen Kopf) zielen.
Die historische Variation als eine der zentralen Variationsdimensionen der Sprache ist gekennzeichnet durch große Variantenvielzahl, Fluktuation der Häufigkeit und zeitliche Überlagerung unterschiedlich alter Muster, aber auch durch Distributionsverschiebungen von Varianten. Sie weist enge Bezüge zur synchronen Mikro- und Makrovariation auf. Die Muster historischer Variation stellen zudem wichtige Argumente für die grammatiktheoretische Analyse dar. Die Spezifik und Dynamik historischer Variation wird exemplarisch anhand der Entwicklung der Vergleichskonstruktionen in der Geschichte des Deutschen veranschaulicht, die durch den Komparativzyklus, d.h. wiederholte Distributionsverschiebungen der Vergleichspartikeln von Äquativ- zu Komparativvergleichen gekennzeichnet ist.
Ausgangspunkt der Überlegungen ist die Beobachtung, dass bestimmte Verwendungsweisen der deutschen Sprache zwar grammatisch und lexikalisch richtig sind, aber dennoch in einem bestimmten Kontext für einen Muttersprachler merkwürdig klingen und gewöhnlich nicht gebraucht werden. Man findet diese Formen der Variation zum Beispiel bei sehr fortgeschrittenen Lernern des Deutschen und auch in Übersetzungen, die sich der Originaltreue verpflichtet sehen. In dem Beitrag soll gezeigt werden, dass Abweichungen dieser Art auf eine Komponente unseres sprachlichen Wissens verweisen, die man als Prinzipien der Informationsorganisation bezeichnen kann. Es wird argumentiert, dass solche sprachspezifischen Prinzipien, die sich u.a. auf Informationswahl, Perspektivensetzung und Kohärenzmuster beziehen, aus Eigenschaften der einzelsprachlichen Grammatik abzuleiten sind. Gezeigt werden soll dies am Beispiel von empirischen Daten zum Ausdruck von Bewegungsereignissen und zum Textaufbau in unterschiedlichen Sprachen und in Lernersprachen.
Mögliche Erklärungshorizonte für grammatische Variation in Übersetzungen können durch kontrastive Unterschiede sowie Textsortenkonventionen für die involvierten Sprachen hergeleitet werden. Weiterhin ausschlaggebend sind die vom Übersetzer verwendeten Übersetzungsstrategien, wie Simplifizierung und Explizierung, die mit Methoden der Korpuslinguistik und der Translationsprozessforschung untersucht werden können. Letztere betreffend liefert das Eyetracking Hinweise auf Problemstellen im Ausgangstext; das Keylogging lässt Rückschlüsse auf die Problemlösestrategien im Zieltext zu. Durch die Triangulation der gewonnenen Produkt- und Prozessdaten kann einerseits der ganzheitliche Übersetzungsprozess und andererseits die Produktion der grammatischen Variation empirisch aufgearbeitet werden.
In diesem Beitrag argumentiere ich, dass das grammatische Regelwerk „Lücken“ hat und dass „realistische“ Grammatikschreibung das in Theorie und Praxis berücksichtigen muss; insbesondere sind eventuelle Äußerungen in Lückensituationen außergrammatisch zu modellieren. Diese Konzeption wird anhand morphologischer und syntaktischer so genannter Zweifelsfälle intuitiv plausibilisiert und ihr Nutzen für die Grammatikschreibung in vergleichender Auseinandersetzung mit prominenten „lücken-losen“ Analysen von zwei Beispielen - ‚Right Node Raising‘- und gewissen Ersatzinfinitiv-Strukturen - nachgewiesen.
Harold Garfinkel, Begründer der Ethnomethodologie, wäre dieses Jahr 100 Jahre alt geworden, seine Studies in Ethnomethodology werden 50 Jahre. Grund genug diesen doppelten Geburtstag mit einer Tagung zur "deutschsprachigen Vorge-schichte, Wirkung und Rezeption des Werkes und der Person zu würdigen" (so der Ankündigungstext zur Tagung), die nicht ganz zufällig in Konstanz stattfand, lange Zeit und nach wie vor eine Hochburg rekonstruktiver Sozialforschung (auch) ethnomethodologischer Prägung. Die Tagung Harold Garfinkel's 'Studies in Ethnomethodolgy' – Fifty Years After vom 26.-28.10.2017 an der Universität Konstanz, ausgerichtet vom Lehrstuhl für Allgemeine Soziologie und Kultursoziologie und organisiert von Jörg Bergmann, Christian Meyer und Erhard Schüttpelz, tat dies in einer gebührlichen und beson-deren Weise: Die acht Kapitel der Studies in Ethnomethodology (im Folgenden kurz Studies), ein Konvolut aus Essays und Artikeln, die 1967 erschienen sind, dienten als Grundlage zur Strukturierung der Tagung und als Ausgangspunkt der einzelnen Vorträge.
Die folgenden Ausführungen zur Maskierung basieren auf den Erfahrungen bei der Aufbereitung der Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für die Veröffentlichung in der Datenbank für Gesprochenes Deutsch (DGD). Sie sollen anderen Forschern und Forschungsprojekten als praktische Hilfestellung für die Maskierung von Aufnahmen dienen, können aber selbstverständlich nicht die gesamte Bandbreite von Einzelfallentscheidungen und Pflichten der Forschenden abdecken.
Es werden sowohl allgemeine Hinweise zur Maskierung von Audio- und Videoaufnahmen gegeben als auch praktische Tipps zur Umsetzung der Maskierung mit dem Transkriptionseditor FOLKER.
Die in den Ausführungen geschilderten arbeitsteiligen Prozesse in größeren Projekten können in kleineren Projekten einzelner Forscher selbstverständlich auch von einer einzelnen Person ausgeführt werden.
This paper presents a short insight into a new project at the "Institute for the German Language” (IDS) (Mannheim). It gives an insight into some basic ideas for a corpus-based dictionary of spoken German, which will be developed and compiled by the new project "The Lexicon of spoken German” (Lexik des gesprochenen Deutsch, LeGeDe). The work is based on the "Research and Teaching Corpus of Spoken German” (Forschungs- und Lehrkorpus Gesprochenes Deutsch, FOLK), which is implemented in the "Database for Spoken German” (Datenbank für Gesprochenes Deutsch, DGD). Both resources, the database and the corpus, have been developed at the IDS.
This article explores how close one can come to a cultural-scientific perspective on the basis of a constitution-analytical methodology. We do this on the basis of a comparison of the celebration of Totensonntag in Zotzenbach (Southern Hesse) and Sarepta (Wolgograd). In both places, there are protestant churches that perform this ritual to commemorate the dead on this “Sunday of the Dead” as a part of their church service. Our scientific interest lies in the reconstruction of the rituality produced during the in situ execution. In both services, the names of the deceased are read out and a candle is lit for each deceased person. In Zotzenbach the priest reads out the names and an assistant ignites the candles for the deceased, whereas in Sarepta the bereaved are responsible for this. Since the ritual is organised in very different ways in terms of architecture-for-interaction (statically in Zotzenbach, spatially dynamic in Sarepta), we can reconstruct two completely different models of rituality: a demonstrative one (Zotzenbach) and a participative one (Sarepta). The demonstrative model works on the basis of a finely tuned coordination between the two church representatives and is aimed at a dignified execution. The model in Sarepta is not suitable for the production of formality due to its participatory structure. Here, however, the focus is also on the aspect of socialization, which goes beyond the church service and offers the Russian-German worshipers the opportunity to situationally constitute as a culturally homogeneous group.
Der vorliegende Beitrag beschreibt auf der Basis authentischer Alltagsinteraktionen das Formen- und Funktionsspektrum der äußerungsmodalisierenden Kommen-tarphrase ohne Scheiß im gesprochenen Deutsch. Die Konstruktion wird von Inter-agierenden insbesondere als Ressource zur Steigerung des Geltungsanspruchs einer Bezugsäußerung genutzt, wodurch diese als wahr und/oder ernstgemeint modali-siert wird. Damit leistet ohne Scheiß einen wichtigen Beitrag zur Bearbeitung des Erwartungsmanagements durch den/die SprecherIn sowie zur Herstellung von In-tersubjektivität. Die Konstruktion ist syntaktisch variabel und kann somit Äußerun-gen sowohl prospektiv als auch retraktiv modalisieren. Zudem wird mit der Wahl des Lexem Scheiß ein nähesprachliches Register aktiviert, was in Verbindung mit weiteren (prosodischen und/oder lexikalischen) Elementen zu affektiver Aufladung führen kann. Eine abschließende Darstellung häufiger lexikalischer Kookkurrenz-partner und deren funktionaler Bedeutung sowie ein Abgleich zu intrakonstruktio-nalen Varianten wie ohne Witz/ohne Spaß zeigt die Produktivität der Konstruktion im alltäglichen Sprachgebrauch auf.
We present a major step towards the creation of the first high-coverage lexicon of polarity shifters. In this work, we bootstrap a lexicon of verbs by exploiting various linguistic features. Polarity shifters, such as ‘abandon’, are similar to negations (e.g. ‘not’) in that they move the polarity of a phrase towards its inverse, as in ‘abandon all hope’. While there exist lists of negation words, creating comprehensive lists of polarity shifters is far more challenging due to their sheer number. On a sample of manually annotated verbs we examine a variety of linguistic features for this task. Then we build a supervised classifier to increase coverage. We show that this approach drastically reduces the annotation effort while ensuring a high-precision lexicon. We also show that our acquired knowledge of verbal polarity shifters improves phrase-level sentiment analysis.
In the NLP literature, adapting a parser to new text with properties different from the training data is commonly referred to as domain adaptation. In practice, however, the differences between texts from different sources often reflect a mixture of domain and genre properties, and it is by no means clear what impact each of those has on statistical parsing. In this paper, we investigate how differences between articles in a newspaper corpus relate to the concepts of genre and domain and how they influence parsing performance of a transition-based dependency parser. We do this by applying various similarity measures for data point selection and testing their adequacy for creating genre-aware parsing models.
The possibilities of re-use and archiving of spoken and written corpora are affected by personality rights (depending on legal tradition also called: the right of publicity), copyright law and data protection / privacy laws. These recommendations include information about legal aspects which should be considered while creating corpora to ensure the greatest archivability and re-usability possible in compliance with current laws.
The information compiled here shall serve researchers who plan to create corpora or who are involved in evaluation of such measures as a guideline. This information is not exhaustive or to be considered as legal advice. Researchers should consult institutional legal departments and management before making legally relevant decisions. That said, further legal expertise should be sought if possible as early as project planning phases.
Gesprochene Alltagssprache
(2017)
This paper deals with the creation of the first morphological treebank for German by merging two pre-existing linguistic databases. The first of these is the linguistic database CELEX which is a standard resource for German morphology. We build on its refurbished and modernized version. The second resource is GermaNet, a lexical-semantic network which also provides partial markup for compounds. We describe the state of the art and the essential characteristics of both databases and our latest revisions. As the merging involves two data sources with distinct annotation schemes, the derivation of the morphological trees for the unified resource is not trivial. We discuss how we overcome problems with the data and format, in particular how we deal with overlaps and complementary scopes. The resulting database comprises about 100,000 trees whose format can be chosen according to the requirements of the application at hand. In our discussion, we show some future directions for morphological treebanks. The Perl script for the generation of the data from the sources will be made publicly available on our website.
This paper discusses how cognitive aspects can be incorporated into lexicographic meaning descriptions based on corpus-driven analysis. The new German Online dictionary “Paronyme − Dynamisch im Kontrast” is concerned with easily confused words such as effektiv/effizient, sensibel/sensitiv. It is currently in the process of being developed and it aims at adopting a more conceptual and encyclopedic approach to meaning. Contrastive entries emphasize usage, comparing conceptual categories and indicating the mapping of knowledge. Adaptable access to lexicographic details offers different perspectives on information, and authentic examples reflect prototypical structures.
Some of the cognitive features are demonstrated with the help of examples. Firstly, I will outline how patterns of usage imply conceptual categories as central ideas instead of sufficiently logical criteria of semantic distinction. In this way, linguistic findings correlate better with how users conceptualize language. Secondly, it is pointed out how collocates are family members and fillers in contexts. Thirdly, I will demonstrate how contextual structure and function are included by summarizing referential information. Details are drawn from corpus data; they are usage-based patterns illustrating conversational interaction and semantic negotiation in contemporary public discourse. Finally, I will show flexible consultation routines where the focus on structural knowledge changes.
This paper gives an insight into the basic concepts for a corpus-based lexical resource of spoken German, which is being developed by the project "The Lexicon of Spoken German"(Lexik des gesprochenen Deutsch, LeGeDe) at the "Institute for the German Language" (Institut für Deutsche Sprache, IDS) in Mannheim. The focus of the paper is on initial ideas of semi-automatic and automatic resources that assist the quantitative analysis of the corpus data for the creation of dictionary content. The work is based on the "Research and Teaching Corpus of Spoken German" (Forschungs- und Lehrkorpus Gesprochenes Deutsch, FOLK).
This paper discusses changes of lexicographic traditions with respect to approaches to meaning descriptions towards more cognitive perspectives. I will uncover how cognitive aspects can be incorporated into meaning descriptions based on corpus-driven analysis. The new German Online dictionary “Paronyme − Dynamisch im Kontrast” (Storjohann 2014; 2016) is concerned with easily confused words such as effektiv/effizient, sensibel/sensitiv. It is currently in the process of being developed and it aims at adopting a more conceptual and encyclopaedic approach to meaning by incorporating cognitive features. As a corpus-guided reference work it strives to adequately reflect ideas such as conceptual structure, categorisation and knowledge. Contrastive entries emphasise aspects of usage, comparing conceptual categories and indicate the (metonymic) mapping of knowledge. Adaptable access to lexicographic details and variable search options offer different foci and perspectives on linguistic information, and authentic examples reflect prototypical structures. Some of the cognitive features are demonstrated with the help of examples. Firstly, I will outline how patterns of usage imply conceptual categories as central ideas instead of sufficiently logical criteria of semantic distinction. In this way, linguistic findings correlate better with how users conceptualise language. Secondly, it is pointed out how collocates are treated as family members and fillers in contexts. Thirdly, I will demonstrate how contextual structure and functions are included summarising referential information. Details are drawn from corpus data, they are usage-based linguistic patterns illustrating conversational interaction and semantic negotiations in contemporary public discourse. Finally, I will outline consultation routines which activate different facets of structural knowledge, e.g. through changes of the ordering of information or through the visualisation of semantic networks.
Das Verb machen im gesprochenen Deutsch. Bedeutungskonstitution und interaktionale Funktionen
(2017)
Die Arbeit untersucht unter anderem sowohl die semantischen Interpretationen von machen als auch seine pragmatischen Funktionen in der Interaktion, diskutiert die Behandlung von machen in der Lexikographie und liefert dazu einen Vergleich mit der Bedeutung und Funktion des Verbs tun in der gesprochenen Sprache. Außerdem wird die Konstitution von Bedeutung am Beispiel von machen anhand eines eigens entwickelten Ebenenmodells dargestellt, durch welches sich die einzelnen (außer-)sprachlichen Ebenen jeweils abgrenzen und einzeln beschreiben lassen. Die Analysen basieren dabei auf der Grundlage aktueller und spontansprachlicher Interaktionen unterschiedlicher Gesprächstypen.
Languages employ different strategies to transmit structural and grammatical information. While, for example, grammatical dependency relationships in sentences are mainly conveyed by the ordering of the words for languages like Mandarin Chinese, or Vietnamese, the word ordering is much less restricted for languages such as Inupiatun or Quechua, as these languages (also) use the internal structure of words (e.g. inflectional morphology) to mark grammatical relationships in a sentence. Based on a quantitative analysis of more than 1,500 unique translations of different books of the Bible in almost 1,200 different languages that are spoken as a native language by approximately 6 billion people (more than 80% of the world population), we present large-scale evidence for a statistical trade-off between the amount of information conveyed by the ordering of words and the amount of information conveyed by internal word structure: languages that rely more strongly on word order information tend to rely less on word structure information and vice versa. Or put differently, if less information is carried within the word, more information has to be spread among words in order to communicate successfully. In addition, we find that–despite differences in the way information is expressed–there is also evidence for a trade-off between different books of the biblical canon that recurs with little variation across languages: the more informative the word order of the book, the less informative its word structure and vice versa. We argue that this might suggest that, on the one hand, languages encode information in very different (but efficient) ways. On the other hand, content-related and stylistic features are statistically encoded in very similar ways.
The Google Ngram Corpora seem to offer a unique opportunity to study linguistic and cultural change in quantitative terms. To avoid breaking any copyright laws, the data sets are not accompanied by any metadata regarding the texts the corpora consist of. Some of the consequences of this strategy are analyzed in this article. I chose the example of measuring censorship in Nazi Germany, which received widespread attention and was published in a paper that accompanied the release of the Google Ngram data (Michel et al. (2010): Quantitative analysis of culture using millions of digitized books. Science, 331(6014): 176–82). I show that without proper metadata, it is unclear whether the results actually reflect any kind of censorship at all. Collectively, the findings imply that observed changes in this period of time can only be linked directly to World War II to a certain extent. Therefore, instead of speaking about general linguistic or cultural change, it seems to be preferable to explicitly restrict the results to linguistic or cultural change ‘as it is represented in the Google Ngram data’. On a more general level, the analysis demonstrates the importance of metadata, the availability of which is not just a nice add-on, but a powerful source of information for the digital humanities.
In this paper, we will present a first attempt to classify commonly confused words in German by consulting their communicative functions in corpora. Although the use of so-called paronyms causes frequent uncertainties due to similarities in spelling, sound and semantics, up until now the phenomenon has attracted little attention either from the perspective of corpus linguistics or from cognitive linguistics. Existing investigations rely on structuralist models, which do not account for empirical evidence. Still, they have developed an elaborate model based on formal criteria, primarily on word formation (cf. Lăzărescu 1999). Looking from a corpus perspective, such classifications are incompatible with language in use and cognitive elements of misuse.
This article sketches first lexicological insights into a classification model as derived from semantic analyses of written communication. Firstly, a brief description of the project will be provided. Secondly, corpus-assisted paronym detection will be focused. Thirdly, in the main section the paper concerns the description of the datasets for paronym classification and the classification procedures. As a work in progress, new insights will continually be extended once spoken and CMC data are added to the investigations.
Unknown words are a challenge for any NLP task, including sentiment analysis. Here, we evaluate the extent to which sentiment polarity of complex words can be predicted based on their morphological make-up. We do this on German as it has very productive processes of derivation and compounding and many German hapax words, which are likely to bear sentiment, are morphologically complex. We present results of supervised classification experiments on new datasets with morphological parses and polarity annotations.
Ziel einer größer angelegten Studie – die Grundlage dieses Beitrags ist – war es, anhand der „Gassigespräche“ auf gattungsspezifische Ordnungsprinzipien und Familienähnlichkeiten miteinander verwandter Alltagsgattungen einzugehen, die vor allem in westlichen Kulturen etabliert zu sein scheinen. Die ihnen zugrundeliegenden kommunikativen Muster beschreiben wir als mehr oder weniger stark verfestigte Elemente. Mit diesem Beitrag wollen wir einen Einblick in die gattungsanalytische Betrachtung von Alltagskommunikation am Beispiel der Gassigespräche bieten.
Die ältesten schriftlichen Rezepte in deutscher Sprache sind uns im Buoch von guoter Spise aus der Zeit um 1350 überliefert (<http://digital.slub-dresden.de/werkansicht/dlf/2518/1/>, 10.7.2017). Schon damals hatten Rezepte wie heute außer der Kochanleitung einen Namen. Denn um über etwas reden zu können, geben wir allem einen Namen. Im Buoch von guoter Spise heißen die Gerichte Ain mandel suppen oder Ein gebraten gefültes ferhelin.
Cybermobbing ist ein spezifischer Typ digitaler Gewalt, der vor allem unter Kindern und Jugendlichen vorkommt und in den Fokus der breiten Öffentlichkeit geraten ist. Die Cybermobbing-Forschung ist geprägt von zahlreichen sozialpsychologischen und medienwissenschaftlichen Studien. Eine linguistische Beschäftigung mit konkretem Sprachmaterial stand jedoch bis heute aus. Im vorliegenden Buch wird anhand vieler authentischer Beispiele erörtert, wie sich Cybermobbing im Netz zeigt, in welchen Formvarianten es als kommunikatives Phänomen in Erscheinung tritt und wie die Spezifik der Online-Kommunikation in der virtuellen Welt Einfluss auf die spezifischen Prozesse dieser verbalen Gewalt nimmt. Umfangreiche Detailanalysen helfen, die Spezifik des Emotionspotenzials dieser Texte besser zu verstehen. Das Buch ist einerseits für die spezifische Medialität digitaler Kommunikation und somit die Medienlinguistik allgemein äußerst relevant, andererseits bildet es einen wichtigen Referenzpunkt für künftige Untersuchungen anderer Formen verbaler Gewalt in der digitalen Kommunikation wie auch in anderen Kommunikationsformen.
Une e-Université est une université qui utilise les nouvelles technologies de l'information et de la communication (NTIC) pour remplir ses missions traditionnelles : la production, la préservation et la transmission du savoir. Ses activités consistent donc à collecter et analyser les données de recherche, à diffuser les écrits scientifiques et à fournir des ressources pédagogiques numériques. Or ces biens immatériels font souvent l'objet de droits de propriété littéraire et artistique, notamment le droit d'auteur et le droit sui generis des producteurs de bases de données. Ceci oblige les e-Universités soit à obtenir des autorisations nécessaires des titulaires des monopoles, soit à avoir recours aux exceptions légales. La recherche et l'enseignement font l'objet d'exceptions légales (cf. art. L. 122-5, 3°, e) du Code de la propriété intellectuelle (CPI) et dans les art. 52a et 53 de la Urheberrechtsgesetz (UrhG)). Toutefois, celles-ci s'avèrent manifestement insuffisantes pour accommoder les activités des e-Universités. Ainsi, les législateurs nationaux ont très récemment introduit de nouvelles exceptions visant plus spécifiquement l'utilisation des NTIC dans la recherche et l'enseignement (art. L. 122-5, 10° et art. L. 342-3, 5° du CPI et les futurs art. 60a-60h de la UrhG). Une réforme en ce sens a également été proposée par la Commission Européenne (art. 3 et 4 de la proposition de la Directive sur le droit d'auteur dans le marche unique numérique). Dans ce contexte, il est souhaitable de mener le débat sur l'introduction d'une norme ouverte (de type fair use) en droit européen. Malgré cette incertitude juridique qui entoure la matière, les e-Universités n'ont pas cessé de remplir leurs missions. En effet, la communauté académique a depuis un certain temps entrepris des efforts d'autorégulation (private ordering). Le concept d'Open Science, inspiré des valeurs traditionnelles de l'éthique scientifique, a donc émergé pour promouvoir le libre partage des données de recherche (Open Research Data), des écrits scientifiques (Open Access) et des ressources pédagogiques (Open Educational Resources). Le savoir est donc perçu comme un commun (commons), dont la préservation et le développement durable sont garantis par des standards acceptés par la communauté académique. Ces standards se traduisent en langage juridique grâce aux licences publiques, telles que les Creative Commons. Ces dernières années les universités, mais aussi les organismes finançant la recherche et même les législateurs nationaux se sont activement engagés dans la promotion des communs du savoir. Ceci s'exprime à travers des "mandats" Open Access et l'instauration d'un nouveau droit de publication secondaire, d'abord en droit allemand (art. 38(4) de la UrhG) et récemment aussi en droit français (art. L. 533-4, I du Code de la recherche).
Der Themenkreis dieses Bandes umfasst Fragen der system- und normbezogenen Deskription des Gegenwartsdeutschen unter Berücksichtigung seiner Variierung und Dynamik, darunter insbesondere in den Bereichen des Wortschatzes, der Grammatik, der Textlinguistik und der kontrastiven Sprachforschung, der Sprachpolitik, der Sprachkultur sowie der Sprachdidaktik und des Faches “;Deutsch als Fremdsprache”. Die einzelnen Beiträge können vier zentralen und miteinander verschränkten Arbeitsfeldern zugeordnet werden: “Das Deutsche in der Welt”, “Der Wortschatz in Bewegung”, “In den Tiefen der Grammatik” und “Blicke auf den Sprachgebrauch”.
Der vorliegende Beitrag beschäftigt sich mit Imperativen, die nicht oder nicht nur für Handlungsaufforderungen, sondern auch für gesprächsorganisatorische Zwecke eingesetzt werden. Einschlägige Vertreter wie guck mal, hör mal, komm oder geh wurden in der Literatur meist als Interjektionen, aber auch als Diskursmarker klassifiziert. Anhand einer explorativen Korpusrecherche wird zunächst ein Überblick über die Häufigkeit und einige distributionelle Eigenschaften gesprächsorganisatorischer Imperative im gesprochenen Deutsch gegeben. Anschließend wird ein bisher nicht empirisch untersuchter Vertreter, warte (mal), anhand einer Kollektion von 190 Belegen im Hinblick auf seine Semantik und Funktion untersucht. In turninitialer und syntaktisch vorangestellter Position wird warte (mal) zur Markierung von Unterbrechungen der Progressivität und von Aktivitätswechseln verwendet, z.B. um Verstehensprobleme zu klären oder Argumente in eine Diskussion einzubringen. Tritt es satzmedial auf, markiert es Selbstreparaturen und Häsi-tationen. Es wird argumentiert, dass die Distribution und Funktionen es nicht rechtfertigen, warte (mal) als Diskursmarker zu bezeichnen.
In diesem Aufsatz wird einzelfallanalytisch der Frage nachgegangen, wie die Struktur einer Kirchenbesichtigung aussieht. Im theoretischen Rahmen, der die Kirchenbesichtigung als kulturelle Praktik konzeptualisiert, wird „Objektkonstitution“ als eine aktive Leistung des Kirchenbesichtigers in den Blick genommen. Bei den Aufnahmen zum Kirchenbesichtigungskorpus wurden die Besichtiger nicht nur bei ihrem Gang durch den Kirchenraum und der visuellen Wahrnehmung bestimmter Raumaspekte gefilmt. Sie wurden vielmehr darum gebeten, ihre visuelle Wahrnehmung durch begleitendes Sprechen auch zu kommentieren. Aufgezeichnet wurde das Besichtigungskorpus mit zwei Kameras: einer Actionkamera, die den Wahrnehmungsraum der Besichtiger dokumentiert, und einer Kontextkamera, die ihnen bei ihrem Weg durch den Raum folgt.
Dieses experimentelle Erhebungsdesign, bei dem exothetisches Sprechen bewusst als wissenschaftliche Erhebungsmethode eingesetzt wird, macht es möglich, das Besichtigungskonzept der Personen als dynamisches Zusammenspiel ihrer visuellen Wahrnehmung des Kirchenraums und ihrer wahrnehmungsbegleitenden Exothese zu rekonstruieren. Dass Objektkonstitution eine aktive Herstellung ist, durch die der Kirchenraum in den Relevanzen seines Betrachters teilweise neu entsteht, zeigt die Fallanalyse in exemplarischer Klarheit: Anton, der analysierte Besichtiger, der sich ausführlich mit zwei großen Gemälden beschäftigt, konstituiert diese de facto als „Bilderrahmen“, ohne überhaupt auf die dargestellten Szenen einzugehen.
Der vorliegende Beitrag beschäftigt sich mit ICH WEIß NICHT und der Frage danach, ob einige der Verwendungen als Diskursmarker bezeichnet werden können oder nicht. Es wird zunächst ein Überblick über die Kriterien gegeben, die in der interaktionalen Linguistik für die Diskursmarkerdefinition diskutiert wurden. Dabei wird versucht, definitorische Kriterien von empirischen Befunden abzugrenzen. Es folgt eine Analyse verschiedener Verwendungen von ICH WEIß NICHT. Ein Schwerpunkt liegt dabei auf Verwendungen als epistemischer und pragmatischer Marker, die sowohl mit prospektiver Orientierung als auch mit retrospektiver Orientierung vorkommen. Abschließend wird der Unterschied zwischen definitorischen und empirischen Kriterien für die Diskursmarkerdefinition systematisiert. Auf dieser Basis argumentieren wir dafür, dass alle Verwendungen von ICH WEIß NICHT, die diskursfunktionale Eigenschaften haben und syntaktisch desintegriert sind, Diskursmarkerverwendungen sind. Einige davon sind prototypischer, während andere Fälle eher marginal sind, da sie einige Merkmale, die die meisten Diskursmarker kennzeichnen, nicht aufweisen.
Wie können Diskursmarker in einem Korpus gesprochener Sprache auffindbar gemacht werden? Was ist Part-of-Speech-Tagging und wie funktioniert es? In diesem Artikel soll anhand der POS-Kategorie Diskursmarker dargestellt werden, wie für das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) ein Part-of-Speech-Tagging entwickelt wurde, das auf die Annotation typisch gesprochen-sprachlicher Phänomene ausgerichtet ist. Diskursmarker sollen dafür aus der Sicht maschineller Sprachverarbeitung dargestellt werden, d. h. wie eine POS-Kategorie Diskursmarker so definiert werden kann, dass sie automatisch annotiert werden kann. Schließlich soll gezeigt werden, wie man auch weitere Diskursmarker in der Datenbank auffinden kann
Intention des Kooperationsprojektes „Grammatische Kenntnisse in der Sekundarstufe II“ (GramKid-SII) des Instituts für Deutsche Sprache (IDS) und der Ruhr-Universität Bochum ist, die deutschdidaktische Behauptung, Grammatikunterricht bis in die Sekundarstufe II führe zu besseren expliziten und nachhaltigen Grammatikkenntnissen des Deutschen, empirisch in Form einer longitudinalen Interventionsstudie mit Kontrollgruppendesign zu untersuchen.
Qualifizierungsmaßnahmen wie „Perspektive für Flüchtlinge Plus“ (PerFPlus) können als wichtige Bestandteile der neuen Willkommenskultur in Deutschland betrachtet werden. Deutschland als Einwanderungsland kann mit Hilfe solcher Initiativen gezielt für Arbeitsbereiche und Berufsgruppen werben, in denen es an Nachwuchs mangelt. Den Neuzugewanderten bieten sie die eine Chance sich in der hiesigen Arbeitswelt zu orientieren und Berufsfelder zu erkunden, die ihnen bislang noch nicht oder nur in anderer Form bekannt waren. Auf der anderen Seite bergen solche Maßnahmen aber auch ihr Risiko: Wenn sie ihr Ziel verfehlen und Frustrationen auf beiden Seiten erzeugen, sind lange Warteschleifen, Arbeitslosigkeit und möglicherweise politische Polarisierung und Radikalisierung die Folge. Insofern ist eine schnelle Intervention hinsichtlich der Verbesserung solcher Maßnahmen essentiell. Der vorliegende Bericht soll die konzeptionell-arbeitenden Teams bei der Bundesagentur für Arbeit (BA) sowie bei Bildungsanbietern die mit der BA kooperieren bei ihren wichtigen Aufgaben unterstützen. Alle Partner bleiben im Bericht anonym.