Refine
Year of publication
- 2017 (370) (remove)
Document Type
- Part of a Book (161)
- Article (101)
- Conference Proceeding (43)
- Book (33)
- Part of Periodical (13)
- Other (7)
- Working Paper (6)
- Report (4)
- Doctoral Thesis (2)
Keywords
- Deutsch (154)
- Korpus <Linguistik> (64)
- Gesprochene Sprache (30)
- Grammatik (22)
- Sprachvariante (22)
- Englisch (14)
- Linguistik (14)
- Sprache (14)
- Diskursanalyse (13)
- Interaktion (13)
Publicationstate
- Veröffentlichungsversion (163)
- Zweitveröffentlichung (87)
- Postprint (20)
- Erstveröffentlichung (1)
- Preprint (1)
Reviewstate
- (Verlags)-Lektorat (135)
- Peer-Review (114)
- Peer-review (12)
- (Verlags-)Lektorat (2)
- Peer-Revied (2)
- (Verlags-)lektorat (1)
- Peer Review (1)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (1)
Publisher
- Institut für Deutsche Sprache (56)
- de Gruyter (50)
- Narr Francke Attempto (39)
- Narr (19)
- De Gruyter (17)
- Verlag für Gesprächsforschung (11)
- Stauffenburg (10)
- Hempen (9)
- Springer (6)
- TUDpress (6)
Rückblick 2017
(2017)
The following article gives an overview on common evaluation methods that are used in reviews of bilingual dictionaries published in learned journals. Based on a corpus containing 50 reviews of printed general bilingual dictionaries for textrelated purposes with German, English or French as one of the languages, this case study is aimed at drawing a list of requirements for writing such reviews. A critical analysis of the text corpus shows which features of the reviewed dictionaries are evaluated and in which way this evaluation happens. The resulting list of requirements presents some of the principles for writing reviews of bilingual dictionaries and recommends appropriate evaluation methods for future reviews.
Mit dem Fokus auf Medienpraktiken bündelt dieses Heft aktuelle Positionen zur empirischen Erforschung von Medien. Die Beiträge gehen davon aus, dass Medien erst durch ihren Gebrauch zu Medien werden. Medienpraktiken zu erforschen, bedeutet jedoch nicht nur herauszufinden, was Menschen mit Medien tun, sondern auch was Medien mit Menschen machen. Diese für die Medienpraktikenforschung zentrale Einsicht lösen die interdisziplinären Beiträge des Bandes ein, indem sie aus den jeweiligen Positionen und Konstellationen verdeutlichen, wie Medien und Praktiken sich gegenseitig bedingen. Medienpraktikenforschung erfordert erstens, medienpraktische Phänomene in einem hohen Detailgrad zu fassen, um die Relation der beteiligten menschlichen und medialen Akteure zueinander in situ und in actu nachzuvollziehen. Erst durch die analytische Durchdringung dieser situativen Vollzugsmomente lässt sich zweitens der Status von Medien klären: was durch Praktiken zu einem Medium wird und wie die Praktiken unter Berücksichtigung der an ihnen konstitutiv beteiligten Medien beschaffen sind. Dadurch lassen sich ebenso übersituative Bezüge zur Praxis herstellen, durch die die Praktiken zur situativen Entfaltung kommen. Drittens muss dabei berücksichtigt werden, inwiefern die eigenen Medienpraktiken der Erforschung in ihren jeweiligen situativen Stadien die (Analyse der) Medienpraktik zurichten. Die Beiträge dieses Bandes lösen diese Forderungen in unterschiedlicher Gewichtung ein. Sie befassen sich aus medienethnologischer, kultursoziologischer, literaturwissenschaftlicher, historischer, soziologischer und medienwissenschaftlicher Perspektive damit, was jeweils als situierte Medienpraktik verstanden werden kann. Gemeinsam ist damit allen Beiträgen, dass sie erst aus ihren jeweiligen Untersuchungen und Perspektiven heraus bestimmen, was genau als Medienpraktik und Medien, die in ihnen zum Tragen kommen, gefasst werden kann.
Der vorliegende Artikel untersucht die Frage, wie sich die Angebote im Bereich von Social Media heute darstellen und wie sie sich in den nächsten Jahren voraussichtlich entwickeln werden. Der Fokus liegt dabei auf der Entwicklung der technischen Infrastruktur und deren Einfluss auf die verschiedenen Aspekte wissenschaftlicher Kommunikation. Einen Schwerpunkt bilden dabei einerseits die Auswirkungen der Automatisierung, im Bereich der Wissenschaftskommunikation die Entwicklung von spezifischen Scores und Altmetriken, andererseits die Etablierung neuartiger Vermittlungskanäle für wissenschaftliche Themen.
Sprachwissenschaft geht logozentrisch vor, konzentriert sich also aufs geschriebene und seit einigen Jahrzehnten auch aufs gesprochene Wort. Das ist verständlich und sinnvoll (Schuster, bleib bei deinen Leisten!), setzt sich aber auch Scheuklappen auf und übersieht bedeutsame Erscheinungen am Rande.
Mit diesem Bild beschreibt Hermann Unterstöger in einem „Sprachlabor“- Artikel der Süddeutschen Zeitung vom 23.3.2013 die Erfolgsgeschichte, die das Substantiv (das) Narrativ in den letzten 30 Jahren vorgelegt hat. Während Unterstöger feinsinnig den intertextuellen Bezug zum „Narrenschiff“ des Sebastian Brant oder dem gleichnamigen Roman von Katherine Ann Porter bemüht, wird Matthias Heine, der Autor von „Seit wann hat geil nichts mehr mit Sex zu tun? 100 deutsche Wörter und ihre erstaunlichen Karrieren“ in einem Artikel in der WELT vom 13.11.2016, wie nach diesem Buchtitel zu erwarten, eher grob: Dort heißt es: „Hinz und Kunz schwafeln heutzutage vom ,Narrativ‘“.
Emoticons erfreuen sich auf der ganzen Welt großer Beliebtheit, vor allem in der alltäglichen elektronischen Kommunikation wie E-Mail, SMS, Forumsdiskussionen, Instant Messaging, Facebook oder Twitter. Zum ersten Mal in der Geschichte wurde 2015 von den Sprachbeobachtern der britischen Oxford Dictionaries ein Emoticon zum Wort des Jahres gewählt: das Grinsegesicht, dem die Freudentränen aus den Augen spritzen (vgl.<www.sueddeutsche.de/kultur/britisches-wortdes-jahres-was-haben wir-gelacht-1.2740952>, Stand: 8.11.2017). Die Jury begründete ihre Wahl wie folgt: „[E]moji have come to embody a core aspect of living in a digital world that is visually driven, emotionally expressive, and obsessively immediate.“
Im September 1522 erschien in Wittenberg „Das newe Testament Deutzsch“ mit einer Auflage von über 3.000 Stück und war binnen einer Woche ausverkauft. Martin Luther, der auf dem Titelblatt auf eigenen Wunsch nicht erwähnt wird, hatte die Übersetzung auf der Wartburg in nur elf Wochen angefertigt und wenig später fünf Wochen lang mit seinem Kollegen und Freund, dem Gräzisten Philipp Melanchthon, insbesondere im Hinblick auf die griechische Urfassung bearbeitet. Die Geschichte der Revisionen der Lutherbibel beginnt im gleichen Jahr – schon für den Nachdruck im Dezember hat Luther dieses so genannte „Septemberevangelium“ an vielen Stellen revidiert. In Teilen erschien danach seine Übersetzung des Alten Testaments, 1534 die vollständige Übersetzung der Bibel. Luther korrigierte den Bibeltext unablässig weiter bis zur Ausgabe von 1545, der Lutherbibel „letzter Hand“.
Verstehen und Motivieren: semantische Fluchtpunkte deutscher und italienischer Lexeme mit -log-
(2017)
Unlike traditional text corpora collected from trustworthy sources, the content of web based corpora has to be filtered. This study briefly discusses the impact of web spam on corpus usability and emphasizes the importance of removing computer generated text from web corpora.
The paper also presents a keyword comparison of an unfiltered corpus with the same collection of texts cleaned by a supervised classifier trained using FastText. The classifier was able to recognize 71% of web spam documents similar to the training set but lacked both precision and recall when applied to short texts from another data set.
Am Anfang ist das Wort
(2017)
Die Migration in die Türkei stellt für viele junge Menschen einen Wendepunkt in ihrem Leben dar. Sie kann verschiedene Gründe haben.
In der biografie- und interaktionsanalystischen Pilotstudie wird die Darstellung der narrativen Identitätsentwürfe von drei deutsch-türkischen Germanistikstudentinnen in Instanbul untersucht. Sie zeigt, wie die Informantinnen aus der Retrospektive ihre sprachlichen und sozialen Erfahrungen in Deutschland und nach der Migration in die Türkei konstituieren und welche Rolle ihre sprachlichen Ressourcen beim Ausdruck von sozialer Zugehörigkeit spielen.
This study investigates the interrelations between bilingual development (German/Russian), immigration and integration in the host society. Participants are Russian-Germans, that is, ethnic Germans who have repatriated to Germany from the former Soviet Union. They were part of a longitudinal study dedicated to the integration of multi-generation Russian-German families in Germany. The paper focuses on eight Russian-Germans who moved to Germany between the ages of five and eight and are now young adults. The analysis is based on interviews conducted in the twentieth year of their life in Germany in German and Russian, A semi-structured questionnaire was used to elicit information on the main stages of integration, the use of the languages, the attitudes towards German and Russian, and an assessment of the current situation. The obtained data were used to make an initial assessment of the oral language competencies of the participants and as sources of information about the objective facts and subjective attitudes that determined linguistic and social integration.
Seit 2015 ist die Zahl der Migranten, die aus Bürgerkriegsländern des Nahen und Mittleren Ostens sowie aus Afrika nach Deutschland kommen, bis in die ersten Monate 2016 rasant gestiegen – auf knapp 1 Million in einem Jahr, zeitweise ohne Grenzkontrolle und Registrierung. Nach der auch von den Oppositionsparteien im Bundestag weitgehend unterstützten Positionierung der Bundeskanzlerin Merkel, Deutschland für die überwiegend als „Flüchtlinge“ bezeichneten Migranten politisch, rechtlich und gesellschaftlich zu öffnen, entwickelt sich bald ein Gegendiskurs, der nicht von den Oppositionsparteien im Deutschen Bundestag, sondern vor allem von der Führung der – an der Bundesregierung beteiligten – CSU getragen wurde, unterstützt von einigen Verfassungsrechtlern. Begriffe wie „Willkommenskultur“, „Obergrenze“, „humanitäre Katastrophe“, „Grundrecht auf Asyl“, „kulturelle Identität“, „Herrschaft des Unrechts“ etc. beginnen die öffentliche und private Kommunikation über Politik zu beherrschen.
Die Diskurslinguistik als relativ neue Teildisziplin der germanistischen Linguistik beschäftigt sich mit der Frage, wie soziale Wirklichkeiten in transtextuell organisierten Einheiten konstruiert werden. Bisher finden dabei noch kaum Texte aus digitalen Medien (z. B. aus Facebook, Twitter oder Wikipedia) Berücksichtigung. Das Netzwerk vereint die unten genannten WissenschaftlerInnen, die in ihren Projekten an der Analyse digitaler Diskurse arbeiten und dabei digitale Methoden der Korpuslinguistik bzw. Digital Methods nutzen.
Ein Teildiskurs der Digital Humanities dreht sich um die Frage, wie tradierte Wissensressourcen der Geisteswissenschaften sinnvoll mit digitalen Technologien und Tools verbunden werden können. Auch bei der Neubearbeitung des Deutschen Wörterbuchs von Jacob Grimm und Wilhelm Grimm (DWB) ist dieser Diskurs spürbar, denn mit der Ende 2016 abgeschlossenen Arbeit des traditionsreichen Unternehmens liegt ein konzeptuell einzigartiges Referenzwerk der historischen Lexikografie des Deutschen vor, das in ‘traditioneller’ Printform entstanden, dessen Umsetzung in ein digitales Format jedoch bereits beschlossen ist. Im Laufe der Arbeit am DWB sind überdies zwei Datensammlungen entstanden, die mittlerweile digitalisiert wurden und öffentlich zugänglich sind: das (digitale) Quellenverzeichnis und die Kartei Literatur zur Wortforschung (LW-Kartei). Ihre Einbindung in die Wörterbucharbeit und -benutzung trägt auf unterschiedliche Weise zum Verständnis des DWB bei; weiterhin verweisen sie als digitale Werkzeuge auf grundlegende Möglichkeiten zur Aufbereitung von lexikografischen Daten. Im Folgenden werden beide Projekte, die sich ursprünglich als innerbetriebliche lexikografische Werkzeuge aus der Wörterbuchpraxis ergaben, vorgestellt. Anschließend wird anhand mehrerer ausgewählter Beispielwörter demonstriert, inwiefern sich die LW-Kartei und das Quellenverzeichnis für ein breites Spektrum von Forschungsfragen nutzen lassen. Am Ende werden Überlegungen zur Erweiterung der Datenbanken, d. h. der jeweiligen Systeme zur elektronischen Datenverwaltung, und ihrer Vernetzung mit den jeweiligen DWB-Artikeln diskutiert – Themen, denen u. a. bei der anstehenden Retrodigitalisierung des DWB besondere Beachtung zukommen sollte.
Seit Jahrhunderten gab es und gibt es im russländischen Reich, in der Sowjetunion und im postsowjetischen Raum Menschen, deren Leben dadurch charakterisiert ist, dass in ihm die deutsche und die russische Sprache und die damit verbundenen Traditionen eng verflochten sind (vgl. Stricker (Hg.) 1997). Mit der Bezeichnung ,Russlanddeutsche‘ beziehen wir uns in diesem Beitrag nur auf diejenigen unter ihnen, deren Vorfahren auf Einladung russischer Zaren aus deutschsprachigen Regionen nach Russland übersiedelten, um dort dünn besiedelte Landstriche zu erschließen und zu kultivieren - deutsch-sprachige Menschen in der Kolonisten-Tradition (vgl. Ditc 1997).
Corpus researchers, along with many other disciplines in science are being put under continual pressure to show accountability and reproducibility in their work. This is unsurprisingly difficult when the researcher is faced with a wide array of methods and tools through which to do their work; simply tracking the operations done can be problematic, especially when toolchains are often configured by the developers, but left largely as a black box to the user. Here we present a scheme for encoding this ‘meta data’ inside the corpus files themselves in a structured data format, along with a proof-of-concept tool to record the operations performed on a file.
This article describes a series of ongoing efforts at the Stanford Literary Lab to manage a large collection of literary corpora (~40 billion words). This work is marked by a tension between two competing requirements – the corpora need to be merged together into higher-order collections that can be analyzed as units; but, at the same time, it’s also necessary to preserve granular access to the original metadata and relational organization of each individual corpus. We describe a set of data management practices that try to accommodate both of these requirements – Apache Spark is used to index data as Parquet tables on an HPC cluster at Stanford. Crucially, the approach distinguishes between what we call “canonical” and “combined” corpora, a variation on the well-established notion of a “virtual corpus” (Kupietz et al., 2014; Jakubíek et al., 2014; van Uytvanck, 2010).
Our paper describes an experiment aimed to assessment of lexical coverage in web corpora in comparison with the traditional ones for two closely related Slavic languages from the lexicographers’ perspective. The preliminary results show that web corpora should not be considered ― inferior, but rather ― different.
The Manatee corpus management system on which the Sketch Engine is built is efficient, but unable to harness the power of today’s multiprocessor machines. We describe a new, compatible implementation of Manatee which we develop in the Go language and report on the performance gains that we obtained.
Creating CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes - The National Corpus of Contemporary Welsh)
(2017)
CorCenCC is an interdisciplinary and multiinstitutional project that is creating a large-scale, open-source corpus of contemporary Welsh. CorCenCC will be the first ever large-scale corpus to represent spoken, written and electronicallymediated Welsh (compiling an initial data set of 10 million Welsh words), with a functional design informed, from the outset, by representatives of all anticipated academic and community user groups.
Many (modernist) works of literature can be understood by their associativeness, be it constructed or “free”. This network-like character of (modernist) literature has often been addressed by terms like “free association”, connotation”, “context” or “intertext”. This paper proposes an experimental and exemplary approach to intraconnect a literary corpus of the Austrian writer Ilse Aichinger with semantic web-technologies to enable interactive explorations of word-associations.
This paper outlines the broad research context and rationale for a new international comparable corpus (ICC). The ICC is to be largely modelled on the text categories and their quantities the International Corpus of English with only a few changes. The corpus will initially begin with nine European languages but others may join in due course. The paper reports on those and other agreements made at the inaugural planning meeting in Prague on 22-23 June 2017. It also sets out the project’s goals for its first two years.
Complex linguistic phenomena, such as Clitic Climbing in Bosnian, Croatian and Serbian, are often described intuitively, only from the perspective of the main tendency. In this paper, we argue that web corpora currently offer the best source of empirical material for studying Clitic Climbing in BCS. They thus allow the most accurate description of this phenomenon, as less frequent constructions can be tracked only in big, well-annotated data sources. We compare the properties of web corpora for BCS with traditional sources and give examples of studies on CC based on web corpora. Furthermore, we discuss problems related to web corpora and suggest some improvements for the future.
In German there are about twenty-five elements (like gemäß, nahe, voll) that seem to be used as a preposition along with their use as an adjective. In former approaches the preposition is interpreted as the product of grammaticalizing (and/or reanalyzing) the adjective. It is argued that the two criteria these approaches rely on, namely change of linear position and change of case government, are insufficient. In this paper, seven criteria for distinguishing adjectives form prepositions in German are put forward. What is most important is that these criteria have to be evaluated on the token level as well as on the level of type and word class/syntactic category. It can be shown that the individual ‘adjective-prepositions' as types possess a specific mixture of adjective-like and preposition-like features. On the token level, occurring as part of a postnominal restrictive attribute is indicative for preposition-like status in German. The comparison of German with English and Italian adjective-prepositions (like near, far, due and vicino, lontano) reveals a lot of differences, which counts as evidence for the language-specific nature of word classes. Nevertheless, Lehmanns functional-typological approach uncovers a fundamental functional similarity between complement governing adjectives and prepositions: the primary function of the phrases, i.e., adjective/preposition + complement, is to modify a nominal or a verbal concept, respectively. This insight explains why adjective-prepositions can be found cross-linguistically. The question whether we should propose one type or two types for gemäß and its cognates is of minor importance only.
Abschreckend beim Deutschlernen ist u. a. die Erkenntnis, dass man so viel beachten muss, um eine kleine Wortgruppe mit einem Adjektiv, einem Nomen und gegebenenfalls einem Artikel richtig bilden zu können. Es reicht nämlich nicht, zu wissen, ob das Adjektiv vor einem maskulinen, einem femininen oder einem neutralen Nomen steht. Auch das Wissen, in welchem Kasus dieses Nomen steht, reicht nicht aus, um die richtige Form des Adjektivs auszuwählen, nein, man muss auch noch berücksichtigen, ob ein Artikel vor dem Adjektiv steht und wenn ja, welcher, denn auch das beeinflusst die Form des Adjektivs.
Alles verstehen heißt alles verzeihen ist ein Satz, der im Deutschen den Charakter eines Spruchs, eines geflügelten Wortes angenommen hat, und der wahrscheinlich auf einem Zitat aus „Corinne ou l‘Italie“ von Madame de Staël (1807) (tout) comprendre c‘est (tout) pardonner basiert. Dieser Satz wurde ins Deutsche übersetzt und als Alles verstehen heißt alles verzeihen tradiert. Die Form eines Spruchs, eines geflügelten Wortes ist im Allgemeinen sehr konstant. Die Tendenz zur grammatischen Variation ist auch dann gering, wenn sie nach gängigen grammatischen Regeln möglich wäre.