Refine
Year of publication
Document Type
- Part of a Book (4500)
- Article (2965)
- Book (996)
- Conference Proceeding (688)
- Part of Periodical (308)
- Review (257)
- Other (151)
- Working Paper (83)
- Doctoral Thesis (68)
- Report (35)
Language
- German (8077)
- English (1765)
- Russian (145)
- French (38)
- Multiple languages (22)
- Spanish (16)
- Portuguese (14)
- Italian (9)
- Polish (7)
- Ukrainian (5)
Keywords
- Deutsch (5140)
- Korpus <Linguistik> (940)
- Wörterbuch (605)
- Konversationsanalyse (451)
- Rezension (423)
- Grammatik (405)
- Rechtschreibung (374)
- Gesprochene Sprache (361)
- Sprachgebrauch (356)
- Interaktion (338)
Publicationstate
- Veröffentlichungsversion (3889)
- Zweitveröffentlichung (1641)
- Postprint (395)
- Preprint (10)
- Erstveröffentlichung (8)
- Ahead of Print (7)
- (Verlags)-Lektorat (4)
- Hybrides Open Access (2)
- Verlags-Lektorat (1)
- Verlagsveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (3835)
- Peer-Review (1595)
- Verlags-Lektorat (94)
- Peer-review (56)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (44)
- Review-Status-unbekannt (14)
- Peer-Revied (12)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (10)
- (Verlags-)Lektorat (9)
- (Verlags-)lektorat (5)
Publisher
- de Gruyter (1334)
- Institut für Deutsche Sprache (1091)
- Schwann (638)
- Narr (484)
- Leibniz-Institut für Deutsche Sprache (IDS) (263)
- De Gruyter (244)
- Niemeyer (200)
- Lang (184)
- Narr Francke Attempto (170)
- IDS-Verlag (144)
The internationally renowned conference of the European Association for Lexicography (EURALEX) has taken place every two years for the past 39 years. Last year’s conference, held July 12th–16th, 2022, marked EURALEX’s 20th edition, and more than 200 international participants gathered at Mannheim Palace to discuss current developments, learn about new projects, and present their own work — either in lexicography or in one of the many applied or neighboring disciplines such as corpus and computational linguistics.
Der vorliegende, in das Themenheft einführende Text will einen Überblick über die Ursprünge, die wesentlichen Entwicklungen und die Perspektiven dieses jungen Forschungsgebietes geben. Er ist zunächst wissenschaftshistorisch angelegt, wird also zu Beginn auf einige Vorläuferstudien verweisen und dann versuchen, die Entwicklung der Auseinandersetzung mit den LL in ihren Grundlinien darzustellen und zentrale Themen und Anwendungsfelder, Methoden sowie Begriffe und Termini vorstellen. Im letzten Teil wird auf Forschungsdesiderate bzw. -perspektiven verwiesen. Dabei wird auch immer wieder die Relevanz dieses Ansatzes für den Deutschunterricht und andere Lehrsituationen angesprochen.
„Unserdeutsch“ – das Kreoldeutsch aus den ehemaligen Südseekolonien und dem heutigen Papua-Neuguinea wird erstmals sprachwissenschaftlich dokumentiert und erforscht. Die Zeit drängt, denn die weltweit einzige und lange nicht beachtete deutschbasierte Kreolsprache steht nach einer wechselvollen Geschichte vor dem Aussterben.
Unserdeutsch (Rabaul Creole German) ist nach heutigem Kenntnisstand die einzige deutschbasierte Kreolsprache der Welt. Sie entstand zu Beginn des 20. Jahrhunderts an einer katholischen Missionsstation in der damaligen Kolonie Deutsch-Neuguinea im melanesischen Pazifik. Die Sprache selbst und ihre Entstehungsumstände sind in mehrfacher Hinsicht bemerkenswert. Trotzdem wäre die Chance zur Dokumentation und Erforschung von Unserdeutsch beinahe verpasst worden: Nur noch rund 100 Sprecher, alle in fortgeschrittenem Alter, leben heute verstreut in Ostaustralien und Papua-Neuguinea.
Der hier vorliegende Blickpunkt informiert über die Entstehung, Bedeutung, Forschung und Aktualität der Sprache „Unserdeutsch“ im Pazifik.
Speech islands are historically and developmentally unique and will inevitably disappear within the next decades. We urgently need to preserve their remains and exploit what is left in order to make research on language-in-contact and historical as well as current comparative language research possible.
The Archive for Spoken German (AGD) at the Institute for German Language collects, fosters and archives data from completed research projects and makes them available to the wider research community.
Besides large variation corpora and corpora of conversational speech, the archive already contains a range of collections of data on German speech minorities. The latter will be outlined in this chapter. Some speech island data is already made available through the personal service of the AGD, or the database of spoken German (DGD), e.g. data on Australian German, Unserdeutsch, or German in North America. Some corpora are still being prepared for publication, but still important to document for potentially interested research projects. We therefore also explain the current problems and efforts related to the curation of speech island data, from the digitization of recordings and the collection of metadata, to the integration of transcriptions, annotations and other ways of accessing and sharing data.
Die Entstehung und Geschichte der einzigen deutschlexifizierten Kreolsprache Unserdeutsch (Rabaul Creole German) war bis heute weitgehend unbeschrieben, obwohl die Zeit drängt: Die koloniale High-contact-Varietät, entstanden zu Beginn des 20. Jahrhunderts an einer katholischen Missionsstation im damaligen Schutzgebiet Deutsch-Neuguinea im melanesischen Pazifik, ist inzwischen kritisch gefährdet mit weniger als 100 noch lebenden SprecherInnen fortgeschrittenen Alters. Mit dieser Arbeit wird nun eine detaillierte Rekonstruktion zu den Anfängen und der weiteren Entwicklung von Unserdeutsch bis in die Gegenwart vorgelegt, basierend auf Archivdaten, Interviews und Strukturanalysen. Dabei wird unter anderem die Rolle von im Sprachsystem nachweisbarem Transfer aus den zentralen Kontaktsprachen von Unserdeutsch sowie von L2-Effekten und autochthonen Innovationen untersucht, außerdem die deutsche Superstratvarietät von Unserdeutsch genau bestimmt und der Spracherwerb der ersten Sprechergeneration nachgezeichnet. Die Arbeit verortet die aus kreolistischer Perspektive in mehrfacher Hinsicht besonderen Entstehungsumstände von Unserdeutsch – darunter etwa ihre Genese unter Kindern – in einschlägigen Fachdiskursen.
Wenn wir unseren persönlichen Kanon, die Bücher, die für uns wichtig sind oder gewesen sind, durchgehen, kommt sicher ein schönes, gattungsreiches, multikulturelles, individuelles Sammelsurium zusammen. Wenn man sich vor die Aufgabe gestellt sieht, Goethe zu kommentieren und zu übersetzen, sollte man sich auf folgende Überlegungen einlassen: Wie steht es heute um bestimmte Figuren aus dem tradierten Kanon? Wie steht es zum Beispiel um Goethe? Auf ihn möchte ich mich jetzt sozusagen exemplarisch beschränken. Welche Position hat Goethe in Spanien? Gehört er zum eigenen, persönlichen Kanon eines (nicht einmal) wichtigen Teils der Leser? Kann er das überhaupt? Wer liest noch Die Leiden des jungen Werther, zum Beispiel, wenn es nicht gerade Pflicht in der Schule oder im Germanistikstudium ist? Oder gar Wilhelm Meisters Wanderjahre, die nirgendwo Pflichtlektüre sind? Baut heute noch jemand Goethes Werke in seine Identitätskonstruktion ein?
An der Börse sind zwei und zwei nie vier, sondern fünf ‒ minus eins. Es kommt schließlich zur Vier, aber nie direkt.1 Das geflügelte Wort André Kostolanys unterliegt einer narrativen Schemabildung: Kontinuität wird nicht nach dem Muster der aufsteigenden Zahlenreihe hergestellt, sondern gleichsam epizyklisch, also auf Umwegen. Wie seine berühmtere Metapher vom Spaziergänger (Wirtschaft) mit Hund (Börse), so beschreibt auch die Zahlenversion derselben die Vorstellung einer letztlich doch linearen Aufwärtsbewegung, in der der Mensch Herr und behaust bleiben kann. Das neue Jahrtausend stellt diese Beherrschbarkeitsnarratio offenbar in Frage. Der Beitrag untersucht drei narrative Modelle im Bereich der Wirtschaftskommunikation: das lineare Modell des „homo oeconomicus“, das nichtlineare Modell des „Schwarzen Schwans“ und den synthetischen Versuch der „Antifragilität“ nach Nassim Taleb.
Argumentation nicht erwünscht – Einstellungen zum Argumentativen im Japanischen und Deutschen
(2017)
Dieser Beitrag behandelt Erscheinungsweisen des Argumentativen im Japanischen und Deutschen. Diesbezügliche Unterschiede und ihre Hintergründe werden je nach alltäglichen und institutionalisierten Situationen dargestellt. Im ersten teil werden Relationen von schwer bemerkbaren Normalitäten verbaler Interaktion und Kooperationsstilen dargestellt. Unterschiedliche Orientierung an Gleichheit bzw. Andersartigkeit entspricht jeweils positiver oder negativer Einstellung zur Argumentation. Die Grundzüge argumentativer Handlungen im Japanischen und Deutschen, die sich vorwiegend in Alltagsinteraktionen manifestieren, werden skizziert. Anhand deutschsprachiger Beispiele wird gezeigt, wie in (halb-)öffentlichen Diskursen eine positive Einstellung zur Argumentation reflexiv ausgedrückt wird. Krasse Differenzen zum Japanischen sind zu erwarten. Im zweiten Teil werden zuerst Hinweise auf historische Prozesse der Modernisierung Japans als Hintergrund der negativen Einstellung zur Argumentation gegeben. Anschließend werden in Anlehnung an kritische Untersuchungen öffentlicher Diskurse Beobachtungen über die gegenwärtige Situation vorgestellt. Der dritte Teil behandelt zur Erörterung der oben erwähnten Umstände sprachlich- interaktionale Eigenschaften des stigmatisierenden Worts hühyö ('Gerücht'). Dabei geht es um eine Herausarbeitung von Strategien zum Vorbeugen und Außerkraftsetzen der prototypischen Form der Argumentation. Zum Schluss wird nach der Zusammenfassung der Ausführungen auf den Sinn der Argumentation als allgemeines Werkzeug der Konfliktbewältigung hingewiesen.
Was in Märkten sich künftig ereignen wird, kann man nicht wissen, nur erwarten. Was man erwartet, wird in der Ökonomik probabilistisch eingearbeitet: als Risikoentscheidungen. Elena Esposito zufolge besteht unter Ökonomen aber ein fundamentales Missverständnis bezüglich der Prognosefähigkeit der Wahrscheinlichkeitstheorie. Die Wahrscheinlichkeitstheorie werde statt zur Berechnung von Unsicherheit zur Erzeugung von Sicherheit verwendet und so in ihren Grundzügen missverstanden (Esposito 2007, 2010, 2014; ähnlich Morgan 2012). Indem man eine (subjektive) Wahrscheinlichkeit von 80% des Ereigniseintrittes schätzt, wird sie epistemisch verbucht als ‘fast sicher’ / ‘so gut wie sicher’. Dabei ist nur – subjektiv – das Risiko genauer spezifiziert, aber es wird geglaubt, man wisse, was kommt. Das riskante, nur wahrscheinliche Ereignis als irgendwie durch diesen Prozess bemessen angeben zu können, ist eine operative Fiktion. Man lasse sich nicht verführen durch den mathematischen Modus der Modellaussagen: es sind fingierte, d.h. fiktionale Aussagen (sie entstammen z.B. keiner häufigkeits- bzw. frequenzstatistischen Ausmessung).
Fast 20 Jahre sind vergangen, seit ich für meine Dissertation Untersuchungen über Ein- und Verkaufsgespräche von Deutschen und Japanern in Deutschland und Japan durchführte. Dort wurden konkrete verbale und nonverbale Handlungen zwischen deutschen bzw. japanischen Verkäufern und deutschen bzw. japanischen Kunden beim Ein- und Verkaufen untersucht. Untersuchungsorte waren dabei Düsseldorf, wo die meisten Japaner in Deutschland ansässig sind, Tokio, wo die meisten Deutschen in Japan ansässig sind, Heidelberg, das von vielen japanischen Touristen besucht wird, und Nagano, wo deutsche Touristen damals bei der Olympiade waren. Anlässlich dieser Festschrift für meinen Doktorvater Prof. Dr. Gerhard Stickel versuchte ich, eine kleine Untersuchung durchzuführen, um sprachliche Veränderungen im Verlauf der Zeit und der sozialen Veränderung zu beobachten. In dieser Abhandlung werden die Veränderung der Gesellschaft und ihr Einfluss auf die Sprache behandelt. Im folgenden zweiten Abschnitt werden soziale Veränderungen in Düsseldorf thematisiert, im dritten Abschnitt werden die Ergebnisse der zwei Befragungen analysiert und zum Schluss wird eine Möglichkeit der Sprachverbreitung im Zusammenhang mit der heutigen Gesellschaft dargestellt.
In den letzten Jahren ist der konzessive Konnektor verstärkt in den Fokus der Gesprochene-Sprache-Forschung (GSF) geraten. Diese hat an authentischen Hörbeispielen eine Grammatikalisierungstendenz von dessen konzessiver, einräumender Bedeutung zur korrektiven Diskursmarkierung nachgewiesen. Im Anschluss insbesondere an die Forschungsergebnisse von Günthner (1999, 2000a, 2002, 2005, 2008) hat dann Moraldo (2012a, 2012b) zum einen versucht nachzuweisen, dass auch in schriftbasierten neumedialen Kommunikationsplattformen (z.B. Twitter) diese Hauptsatzwortstellung nach obwohl mittlerweile vorkommt. Zum anderen, dass Korrektivsätze vereinzelt auch in standardschriftsprachlichen Texten auftreten. (vgl. Moraldo 2012c). Der folgende Beitrag will nun die Entwicklung der Subjunktion obwohl zum Diskursmarker nachvollziehen. Ausgehend von seiner konzessiven Bedeutung (Kap. 2) soll korrektives obwohl zuerst anhand gesprochensprachlicher Beispiele illustriert, dann in konzeptionell mündlichen aber medial schriftlichen Kontexten analysiert und schließlich in standardschriftsprachlichen Texten nachgewiesen werden (Kap. 3), bevor abschließend seine Mutation von subordinierendem Konnektor zum Diskursmarker (Kap. 4) diskutiert wird.
Die untrennbaren Präfixe be-, ent-, er- und ver- gehören zu den wichtigsten verbalen Wortbildungselementen im heutigen Deutsch. Im Laufe der Zeit haben sie Derivate nach verschiedenen Wortbildungsmustern hervorgebracht, aber von diesen sind heute nicht wenige unproduktiv geworden. Viele heute noch gebräuchliche Verben mit diesen Präfixen wurden früher nach Derivationsprozessen gebildet, die nicht mehr zur Bildung neuer lexikalischer Einheiten fähig sind, und einige von diesen, wie etwa entsprechen, sind vollkommen idiomatisiert. Andere Wortbildungsmuster mit den untrennbaren Präfixen sind jedoch im heutigen Deutsch durchaus noch produktiv, und in diesem Beitrag sollen diese anhand einer angemessenen Materialbasis festgestellt und eingehend untersucht werden.
The present paper examines the rise and fall of Modern High German loanwords in English from 1600 until 2000, principally making use of the record of borrowing documented by the Oxford English Dictionary (OED) in its Third Edition (online version, in revision 2000-). Groups of loanwords are analysed by century, with reference to the changing social and cultural landscape characterising relationships between the relevant nations over this period. This is not a simple picture: each language grows over the period in different ways, and the speakers of English look to German at different times for different types of borrowing, as the political and intellectual balance alters.
Gerd Hentschel gehört zu den Pionieren der heutigen Computerlexikografie und der IT-gestützten Korpuserschließung. Eine seiner ersten Zeitschriftenpublikationen, mit dem Titel Einsatz von EDV und Mikrocomputer in einem lexikographischen Forschungsprojekt zum deutschen Lehnwort im Polnischen (Hentschel 1983), befasst sich mit der Frage, wie - unter den damaligen technischen Vorzeichen - Forschungs- und Dokumentationsarbeiten zu polnischen Germanismen sinnvoll durch die Verwendung von Computern unterstützt werden können. Die besagten Arbeiten mündeten später in die Online-Publikation des Wörterbuchs der deutschen Lehnwörter in der polnischen Schrift- und Standardsprache (WDLP). Es ist aus heutiger Sicht bemerkenswert, mit welchen Beschränkungen die Arbeit mit dem Computer noch vor 40 Jahren zu kämpfen hatte. Aus gegebenem Anlass sei es gestattet, diesen Punkt etwas ausführlicher zu illustrieren.
У статті представлено розвиток девіатологічних ідей в Україні. Встановлено міждисциплінарний і спеціалізований підходи, запропоновано перспективи розвитку девіатологічних досліджень. Міждисциплінарний підхід знайшов відображення девіатологічних студій у філософії, психології, педагогіці, міжкультурній комунікації та журналістиці, а спеціалізований – у системно-теоретичному, когнітивному, дискурсно-текстовому, комунікативному, дидактичному і контрастивному напрямах досліджень. Така тенденція становить спробу комплексного комунікативнофункціонального підходу до явища девіацій.
Morphophonological asymmetries in affixation concern systematic correlations between morphological properties of affixes (e.g. combination with bound versus free stems, position relative to stem (suffixes versus prefixes)) and their phonological properties (e.g. stress behaviour). The arguably most insightful approach to capturing relevant asymmetries invokes a notion of affix coherence, first introduced by Dixon in connection with his work on Yidiɲ, a nearly extinct language spoken in Northern Australia. This notion is based on a categorical division of affixes into ones that integrate into the phonological word of the stem and ones that do not. The integration of affixes is envisioned as being fully determined by phonological and morphological structure in a given language and verifiable by diagnostics relevant to phonological word domains (primarily the syllable and the foot structure). The assumption of two types of prosodic domains characterized by integrated versus non-integrated affixes is manifest in consistent asymmetries that pertain to morphophonological, phonological, and phonetic rules. This consistency constitutes compelling evidence for the structure-based analysis of the impact of various affixes on derived words, as opposed to alternative approaches to capturing these effects by associating affixes with diacritics (morpheme versus word boundary, class 1 versus class 2, stratum 1 versus stratum 2). The present entry aims to demonstrate, mostly on the basis of data from Germanic languages, the breadth of the empirical evidence in support of a fundamental role of affix coherence. Moreover, it aims to draw attention to the various implications of affix coherence for modeling relevant generalizations, in particular the necessary reference to a level of phonological representation characterized by a specific degree of abstractness (‘phonemic’).
Dieser Beitrag stellt den Aufbau eines multimodalen Korpus zur Erforschung des Deutschen als Minderheitssprache in Argentinien vor (DiA). In dem sich im Aufbau befindlichen DiA-Korpus werden die heutige wie auch die historische Situation mit multimodalen (mündlichen, schriftlichen und visuellen) Datensätzen repräsentiert, die mit entsprechenden methodischen Zugängen erfasst wurden und werden. Dazu gehören fragebogengeleitete Interviews (mündliches Medium), Briefe und elizitierte Schriftzeugnisse (geschriebenes Medium) sowie Linguistic-Landscape-Bilddaten (visuelles Medium). In diesem Beitrag wird zunächst ein Überblick über die Forschungssituation zum Deutschen als Minderheitensprache in Argentinien gegeben. Kern des Beitrags ist dann die Vorstellung der Korpusstruktur und des Vorgehens beim Korpusaufbau sowie die Darstellung von Auswertungspotentialen des Datenfundus auf systemischer, soziolinguistischer, sprachideologischer und kontaktlinguistischer Ebene. Eine Methodenreflexion rundet den Beitrag ab.
Der Beitrag widmet sich dem Thema der kommunikativen Deviationen in Interviews im Ukrainischen und Deutschen. Dabei werden die Deviationen sowohl in den Presseinterviews als auch in den populärsten Videointerviews auf YouTube untersucht. Die Deviationen werden in die von der Position des Adressanten, des Adressaten sowie des Zuschauers aufgeteilt. Die Aufmerksamkeit wird der Sprach- und der kommunikativen Kompetenz der Kommunikanten als der Hauptursache der Deviationen in den Interviews gelenkt. Die Deviationen werden als eine der Voraussetzungen der erfolgreichen Kommunikation bestimmt.
Статтю присвячено комунікативним девіаціям (невдачам) на матеріалі українських і німецьких телеінтерв’ю з П. Порошенком та А. Меркель. Встановлено, що спілкування осіб з різними комунікативними цілями і стратегіями – головні причини девіацій. Проаналізовано комунікативні невдачі, враховуючи позиції адресанта й адресата, а також глядача даних інтерв’ю, визначено спільні та відмінні стратегії у випадку комунікативних девіацій в українській і німецькій лінгвокультурах.
Статтю присвячено дослідженню комунікативних невдач у мовленнєвому жанрі відеоінтерв’ю крізь призму української національної ідентичності. Визначено тематику, типи і жанрово-мовну специфіку українського відеоінтерв’ю як зразка діалогічного мовлення. Встановлено специфіку комунікативних невдач у цьому жанрі (зі спортсменами, політиками і культурними діячами) з огляду на позиції комунікантів, структурні рівні досліджуваного жанру та максими спілкування.
Im Zentrum der Betrachtungen stehen Sprachkontaktsituationen sowie Sprachkontaktphänomene der Kaukasiendeutschen. Sie sind Nachfahren deutschstämmiger Einwohner des Russischen Reichs und der Sowjetunion, die ab Ende des 18. Jahrhunderts in mehreren Phasen in Gebiete Transkaukasiens ausgewandert sind. Bei der untersuchten Gruppe handelt es sich um diejenigen, die aufgrund von interethnischen Ehen von den Deportationen 1941 aus den deutschen Siedlungsgebieten ausgenommen waren und bis heute im Südkaukasus leben. Mithilfe soziolinguistischer Methoden wurden von der Autorin erstmalig 2017 formelle, leitfadengestützte Interviews im Südkaukasus mit der noch lebenden Erlebnisgeneration sowie einer Nachkommengeneration aufgenommen, transkribiert und ausgewertet. Im Beitrag werden Sprachkontaktkonstellationen deutscher Varietäten (Schwäbisch sowie standardnahes Deutsch) mit dem Russischen (und Georgischen) sowie Sprachkontaktphänomene vorgestellt.
This paper discusses contemporary societal roles of German in the Baltic states (Latvia, Estonia, Lithuania). Speaker and learner statistics and a summary of sociolinguistic research (Linguistic Landscapes, language learning motivation, language policies, international roles of languages) suggest that German has by far fewer speakers and functions than the national languages, English, and Russian, and it is not a dominant language in the contemporary Baltics anymore. However, German is ahead of ‘any other language’ in terms of users and societal roles as a frequent language in education, of economic relations, as a historical lingua franca, and a language of traditional and new minorities. Highly diverse groups of users and language policy actors form a ‘coalition of interested parties’ which creates niches which guarantee German a frequent use. In the light of the abundance of its functions, the paper suggests the concept ‘additional language of society’ for a variety such as German in the Baltics – since there seems to be no adequate alternative labelling which would do justice to all societal roles. The paper argues that this concept may also be used for languages in similar societal situations and, not least, be useful in language marketing and the promotion of multilingualism.
Im Beitrag werden die Methodologie und die Ziele eines Projekts vorgestellt, das anstrebt, auf der Grundlage eines breiten Korpus von Texten aus allen Ländern und Regionen des zusammenhängenden deutschen Sprachgebiets die Variation in der Grammatik der geschriebenen deutschen Standardsprache zu erfassen, in einem Handbuch zu dokumentieren und damit eine Basis sowohl für Grammatiken als auch für weitergehende grammatische Untersuchungen zu schaffen. Nach einleitenden Bemerkungen zum Projekt und zu der Frage, in welcher Relation die geplante „Variantengrammatik des Standarddeutschen“ zum bereits erhältlichen „Variantenwörterbuch des Deutschen“ von Ammon et al. (2004) steht, folgt ein Forschungsüberblick zur grammatischen Variation in der Standardsprache. Dann werden Beispiele für grammatische Variabilität in verschiedenen Phänomenbereichen gegeben, und es wird anhand von zwei Fallbeispielen gezeigt, wie eine grammatische Beschreibung dieser Phänomene aussehen kann. Um Angaben zur arealen Distribution grammatischer Varianten machen zu können, wird den Analysen ein Korpus zugrunde gelegt, das sich auf den geschriebenen Standard beschränkt und darunter den Sprachgebrauch in der Presse fasst. Das Korpus, das als Basis für die Erstellung der geplanten Variantengrammatik dient, wird im Beitrag kurz vorgestellt, außerdem wird erläutert, welche Zielsetzungen mit einer solchen Grammatik verbunden sind.
This study explores the interdependence of qualitative and quantitative analysis in articulating empirically plausible and theoretically coherent generalizations about grammatical structure. I will show that the use of large electronic corpora is indispensable to the grammarian's work, serving as a rich source of semantic and contextual information, which turns out to be crucial in categorizing and explaining grammatical forms. These general concerns are illustrated by the patterns of use of Czech relative clauses (RC) with the non-declinable relativizer co, by taking a set of existing claims about these RCs and testing their accuracy on corpus material. The relevant analytic categories revolve around the referential type of the relativized noun, the interaction between relativization and deixis, and the semantic relationship between the relativized noun and the proposition expressed by the RC. The analysis demonstrates that some of the existing claims are fully invalid in the face of regularly attested semantic distinctions, while others are more or less on the right track but often not comprehensive or precise enough to capture the full richness of the facts. 1
Conversation is usually considered to be grammatically simple, while academic writing is often claimed to be structurally complex, associated primarily with a greater use of dependent clauses. Our goal in the present paper is to challenge these stereotypes, based on the results of large-scale corpus investigations. We argue that both conversation and professional academic writing are grammatically complex but that their complexities are dramatically different. Surprisingly, the traditional view that complexity is realized through extensive clausal embedding leads to the conclusion that conversation is more complex than academic writing. In contrast, written academic discourse is actually much more ‘compressed’ than elaborated, and the complexities of academic writing are realized mostly as phrasal embedding rather than embedded clauses.
Das Wort als das wichtigste und ureigenste Element des Sprachsystems wird in der modernen Linguistik als linguistische Einheit unter phonetisch/phonologischem, orthographischem, morphologischem, syntaktischem und semantischem Kriterium untersucht und beschrieben. Wenn man jedoch der Frage nachgeht, wie ein Wort rein physikalisch entsteht und besteht, wird man feststellen, dass alles auf die Energie zurückgeht. Unter diesen Gesichtspunkten wäre es daher angebracht, unseren linguistischen Blickwinkel zu ändern und das Wort nicht nur als linguistische Einheit sondern auch als Energieträger aufzufassen und die energietragende Funktion des Wortes bzw. der Sprache im Zusammenhang mit der heutigen Wissenschaft und den religiösen und mystischen Betrachtungen zu untersuchen.
Entlehnungen aus dem Englischen sind weder erst ein Phänomen der Nachkriegsjahre noch die Folge der Globalisierung, in der das Englische als die neue lingua franca nur eines der Ergebnisse dieses Prozesses, zugleich aber sein Vehikel darstellt. In den Ergebnissen der Zeitungs- und Repräsentativerhebungen zu Einstellungen der Deutschen zu ihrer Sprache spiegelt sich der in der Tat seit über 60 Jahren fortschreitende deutsch-englische Sprachkontakt, den die deutsche Sprachgemeinschaft erfährt. Kommunikation zwischen Trägern verschiedener Sprachen begünstigt Übernahmen aus nicht nur genetisch verwandten Sprachen. So finden sich unter dem entlehnten Sprachgut auch Formen, die in der Geber- und Nehmersprache auf eine gemeinsame Wurzel zurück gehen. In dieser Arbeit werden Überlegungen zu fair und fegen in ihrem historische, genetischen und morphologischen Kontext gemacht und auf die Begriffe des Lehnworts und Erbes hin untersucht.
Deutsch in Finnland
(2017)
In meinem Artikel behandele ich den Umfang des Deutschunterrichtes an Schulen und Universitäten sowie die Verwendung des Deutschen in Wissenschaft und Wirtschaft in Finnland, vor allem im 20. und 21. Jahrhundert. Zunächst aber will ich die Geschichte der deutschen Kontakte und die Rolle der deutschen Sprache in bestimmten finnischen Städten sowie den Anteil Deutschsprachiger in der modernen finnischen Gesellschaft beleuchten. Nicht behandelt werden kann in diesem Zusammenhang die Lektüre und Übersetzung deutscher Belletristik, obwohl beide bedeutenden Einfluss auf die finnische Gedankenwelt und die literarische Bildung gehabt haben.
In der vorliegenden Studie wird der Versuch unternommen, diese Kriterienkomplexität auf das Problem der Stellung der deutschen Sprache unter anderen Sprachen zu applizieren. Dieses Ziel ist mit der Würdigung des Beitrags des Geehrten zur Popularisierung der deutschen Sprache und Bewusstmachung ihrer Weltgeltung im internationalen Ausmaß durchaus affin. Dabei werden sprachinterne („organologische") und sprachexterne (soziokulturelle) Faktoren nach Möglichkeit in ihrer Wechselbeziehung bzw. Wechselwirkung dargestellt. Das Hauptziel dieser Darstellung besteht in einer Modellierung von linguistisch relevanten Parametern, die eine wissenschaftlich angemessene Basis für die adäquate Zuordnung der deutschen Sprache unter definitivem Ausschluss vor- bzw. pseudowissenschaftlicher Kriterien wie die subjektiven, wissenschaftsfernen Axiologien und Präferenzen schaffen können.
Ungefähr 5,8 Mio. Menschen in der Welt sprechen heute die dänische Sprache - die meisten davon in Dänemark. Dänisch hat seine Wurzeln im Germanischen und begann sich zwischen den Jahren 800 und 1000 aus dem Urnordischen als selbständige Sprache zu entwickeln. Noch heute weist Dänisch viele gemeinsame Züge mit dem Norwegischen und Schwedischen auf. Besonders für Deutsche sollte die dänische Schriftsprache eigentlich leicht verständlich sein. Durch die vielen politischen, wirtschaftlichen und kulturellen Kontakte zwischen den beiden Nachbarländern, vermittelt z.B. durch die Hanse im Ostseeraum, haben sich viele deutsche, insbesondere niederdeutsche Wörter und Redewendungen in der dänischen Sprache eingebürgert, und man kann noch heute dänische Sätze bilden, in denen alle inhaltstragende Wörter aus dem Deutschen entliehen sind. Im Folgenden wird eine Untersuchung des aktuellen Wortschatzes anhand eines dänischen Wörterbuchs aufgezeigt. Anschließend wird ein Blick auf das offizielle nationale dänische Sprachinstitut geworfen und deren empirische Grundlagen der offiziellen Rechtschreibung genauer geschildert.
Ausgehend von einer alten These des Essayisten und Literaturhistorikers Giulio Natali (1917), die eine grundsätzliche „antideutsche Haltung" der Italiener postulierte, wird in diesem Beitrag zuerst der Frage nachgegangen, ob es in Italien historisch begründete, herkömmliche Stereotype gibt, die das heutige Deutschlandbild zu beeinflussen vermögen (Kap. 1). Den Hauptteil dieser Arbeit bildet ein Exkurs über historisch belegte Meinungen der Italiener im Laufe der Geschichte der deutsch-italienischen Beziehungen (Kap. 2). Der Exkurs zielt darauf, ein besseres Verständnis für die heutige Situation zu gewinnen. Diese wird schließlich an den Ergebnissen einer kleinen Umfrage dargestellt, die zeigt, wie die jüngere „Erasmus"-Generation von heute, die sich in Italien für ein Deutschstudium entschieden hat, über die deutsche Sprache denkt (Kap. 3). Die Untersuchung ist u.a. durch die Vorstellung motiviert, dass Einstellungen über die deutsche Sprache Einfluss darauf haben, ob etwa ein Germanistik- oder DaF-Studium aufgenommen wird. Demgemäß könnte man sich die Frage stellen, woher bei jungen Italiener/inne/n der Bedarf entstehen soll, eine - wie Boccaccio sagte - „abscheuliche Sprache" zu lernen, welche vielleicht für Tiere und Teufel besser geeignet ist als für Menschen.
Im folgenden Beitrag, der im Bereich der Politolinguistik und der Diskursanalyse angesiedelt ist, wird auf der Grundlage der deutschen Berichterstattung des Sommers 2015 die brisante Problematik der griechischen Euro-Währungskrise, die das ganze Europa wochenlang in Atem hält, unter die Lupe genommen. Die Debatte über die bis dahin „schwerste Krise der europäischen Integration" verläuft als äußerst emotional geführter gesamteuropäischer Meinungsaustausch. Obwohl man annehmen könnte, dass die nervenaufreibenden Auseinandersetzungen über die Euro-Währungskrise eigentlich nur auf Staaten der Euro-Zone begrenzt sein sollten, beweist die europäische Berichterstattung, dass man in der heutigen EU nicht mehr aus der Beobachter-, sondern eigentlich aus der Teilnehmerperspektive berichtet, weil die Probleme eines Landes genauso Schwierigkeiten für andere, die sogar selbst nicht unbedingt in der Euro-Zone sein müssen, bedeuten können. Im Jahr 2015 wird die griechische Euro-Krise zum Auslöser für Fragen nach der Zukunft Europas. Sie betreffen in erster Linie die Problematik der weiteren Integration und der europäischen Identität.
This paper examines multi-unit turns that allow speakers to retrospectively close the prior sequence while prospectively launching a new sequence, which Schegloff (1986) referred to as interlocking organization. Using English telephone conversations as data, we focus on how multi-unit turns are used for topic shifts, and show that interlocking organization operates in conjunction with other phonetic and lexical features, such as increased pitch and overt markers of disjunction (e.g., “listen”). In addition, speakers utilize an audible inbreath that is placed between the first and the second units as a central interactional resource to project further talk, thereby suppressing speaker transition and possibly highlighting the action delivered in the second unit as being distinctly new. We propose that interlocking multi-unit turns, when used to make topically disjunctive moves, promote progressivity by avoiding a possible lapse in turn transition
Ziel des vorliegenden Aufsatzes ist die Betrachtung der lexikalischen Begegnung des Rumänischen und des Deutschen vor dem Hintergrund des Bildes des deutschen Siedlers im rumänischen Paradigma. Ausgangspunkt der Überlegungen sind zum einen den Allgemeinplatz bildende Fragen zu Sprechern, Kontakt-Konstellationen, zu Auswirkungen ihres Sprach- und Kulturkontaktes, denn Wörter werden erstmal von einzelnen Sprechern übernommen, nicht von der Sprache selbst.
This contribution summarizes the lessons learned from the organization of a joint conference on text analytics research by the Business, Economic, and Related Data (BERD@NFDI) and Text+ consortia within the National Research Data Infrastructure (NFDI) in Germany. The collaboration aimed to identify common ground and foster interdisciplinary dialogue between scholars in the humanities and in the business domain. The lessons learned include the importance of presenting research questions using textual data to establish common ground, similarities in methodology for processing textual data between the consortia, similarities in research data management, and the need for regular interconsortial discussions on textual analysis methods and data. The collaboration proved valuable for interdisciplinary dialogue within the NFDI, and further collaboration between the consortia is planned.
"Reproducibility crisis" and "empirical turn" are only two keywords when it comes to providing reasons for research data management. Research data is omnipresent and with the more and more automatic data processing procedures, they become even more important. However, just because new methods require data and produce data, this does not mean that data are easily accessible, reusable or even make a difference in the CV of a researcher, even if a large portion of research goes into data creation, acquisition, preparation, and analysis. In this talk I will present where we find data in the research process, where we may find appropriate support for data management and advocate for a procedure for including it in research publications and resumes.
This presentation relies on work within the BMBF-funded project CLARIN-D. It also builds on work within the German National Research Data Infrastructure (NFDI) consortium Text+, DFG project number 460033370.
In this chapter, we will investigate smartphone-based showing sequences in everyday social encounters, that is, moments in which a personal mobile device is used for presenting (audio-)visual content to co-present participants. Despite a growing interest in object-centred sequences and mundane technology use, detailed accounts of the sequential, multimodal, and material dimensions of showing sequences are lacking. Based on video data of social interactions in different languages and on the framework of multimodal interaction analysis, this chapter will explore the link between mobile device use and social practices. We will analyse how smartphone showers and their recipients coordinate the manipulation of a technological object with multiple courses of action, and reflect upon the fundamental complexity of this by-now routine joint activity.
Prediction is a central mechanism in the human language processing architecture. The psycholinguistic and neurolinguistic literature has seen a lively debate about what form prediction may take and what status it has for language processing in the human mind and brain. While predictions are a ubiquitous finding, the implications of these results for models of language processing differ. For instance, eyetracking data suggest that predictions may rely on sublexical orthographic information in natural reading, while electrophysiological data provide mixed evidence for form-based predictions during reading. Other research has revealed that humans rapidly adapt to text specifics and that their predictive capacity varies, broadly speaking, in accordance with inter- and intra-individual language proficiency, which cuts across the speaker groups (e.g. L1 vs. L2 speakers, skilled vs. untrained readers) traditionally used for experimental contrasts. There is therefore evidence that the kind and strength of linguistic predictions depend on (at least) three sources of variability in language processing: speaker, text genre and experimental method.
The aim of this Research Topic is to develop a better understanding of prediction in light of the three sources of variability in language processing, by providing an overview of state-of-the art research on predictive language processing and by bringing together research from various disciplines.
First, intra-and inter-individual differences and their influence on predictive processes remain underrepresented in experimental research on predictive processing. How do language users differ in their predictive abilities and strategies, and how are these differences shaped by e.g. biological, social and cultural factors?
Second, while language users experience great stylistic diversity in their daily language exposure and use, the majority of language processing research still focuses on a very constrained register of well-controlled sentences composed in the standard language. How are predictions shaped by extra- and meta-linguistic context, such as register/genre or accent/speaker identity, and how may this influence the processing of experimental items in another language or text variety?
Third, the Research Topic invites contributions that make use of a multi-method approach, such as combined behavioral and electrophysiological measures or experimental methods combined with measures extracted from corpus data. What opportunities and challenges do we face when integrating multiple approaches to examine linguistic, experimental and individual differences in human predictive capacity?
We welcome contributions from all areas of empirical psycho- and neurolinguistics, but contributions must explicitly address variability and variation in language and language processing. Relevant topics include individual differences and the impact of genre, modality, register and language variety. Contributions that go beyond single word and single sentence paradigms are especially desirable. Experimental, corpus-based, meta-analytic and review papers, as well as theoretical/opinion pieces are welcome; however, papers of the latter type should support their arguments with substantial empirical evidence from the literature. Particularly desirable are contributions which combine topics and/or methods, such as the impact of an individual's native dialect on processing of constructions that show variability in the standard language (e.g. choice of auxiliary, agreement of mass nouns, etc.) or experimental methods combined with measures extracted from corpus data such as information-theoretic surprisal.
Vor 30 Jahren gab es in Westdeutschland nur ganz wenige Lexikologen und Lexikografen, die sich mit Neologismen befassten. Infolgedessen hatte man damals kein richtiges Neologismenwörterbuch: Heute sieht es ganz anders aus. Allein am Institut für Deutsche Sprache sind zwei Neologismenwörterbücher in Printausgabe entstanden, nämlich „Neuer Wortschatz. Neologismen der 90er Jahre im Deutschen" und „Neuer Wortschatz. Neologismen im Deutschen 2001-2010". Hinzu kommt OWID, auf dem ihre Online-Version und jüngste Neologismen den Benutzern zur Verfügung stehen. Parallel dazu gibt es zahlreiche Aufsätze bzw. Beiträge über Neologie (Neologismenlexikologie) und Neographie (Neologismenlexikographie). In dieser Arbeit werden die Termine des Wortschatz- und Sprachwandels, hinsichtlich der Neologismen und Archaismen in der deutschen Sprache näher untersucht. Dabei erfolgt zu den letzteren beiden Phänomenen eine genauere Betrachtung.
Nachdem die Erforschung der Wortbildungsregularitäten des Deutschen in den zentralen Bereichen zu erheblichen Fortschritten und weithin konsensfähigen Ergebnissen geführt hat, wendet sich die Forschung in den letzten Jahren verstärkt neuen Aspekten zu, wobei textlinguistische und in verschiedener Weise anwendungsorientierte Fragen eine erhebliche Rolle spielen, daneben aber auch andere, häufig theoriespezifischere Herangehensweisen gewählt werden. Wie viele andere Bereiche der Sprachwissenschaft hat sich auch die Wortbildungsforschung mit der neuen Möglichkeit auseinanderzusetzen, elektronische Korpora als empirische Basis zu nutzen.
Der Band dokumentiert die Ergebnisse der Tagung zur Wortbildung an der Universität Santiago de Compostela im Sommer 2006, und gerade bei einer transnationalen - und im Gefolge auch germanistisch-hispanistisch transdisziplinären - Tagung liegt es nahe, die typologisch vergleichenden Aspekte zu betonen, die ebenfalls in letzter Zeit erheblich an Bedeutung gewonnen haben. Mit der Schwerpunktsetzung auf den (deutsch-spanischen) Vergleich, auf textuelle und auf am Bereich DaF anwendungsorientierte Fragestellungen ergänzen die im vorliegenden Band dokumentierten Ergebnisse dieser Tagung die derzeit wieder recht lebhafte Diskussion um Fragen der Wortbildung.
Basierend auf Gesprächsaufnahmen, Beobachtungsprotokollen und Interviews untersucht die Studie, was die Identitätsarbeit von Aussiedlern in der Kommunikation mit Hiesigen erschwert bzw. unterstützt, wie sich die Betroffenen auf die Lebenswirklichkeit in Deutschland einstellen, welche Rolle institutionelle Eingliederungsmaßnahmen spielen und welche Probleme dabei der Identitätsentwurf "als Deutsche(r) unter Deutschen leben" bereitet.
Simultandolmetschen ist eine komplexe und kognitive Aktivität, bei der verschiedene Prozesse gleichzeitig ablaufen. Neben monolingualer Textverarbeitung braucht man auch dolmetschspezifische Strategien, die erworben werden müssen. Die Notstrategien werden erst dann angewendet, wenn die Kapazitätsgrenze des Dolmetschers erreicht ist.
Die grammatische Kategorie eingebetteter Sätze zählt seit über 50 Jahren zu den zentralen Themen der theoretischen Syntax. Dabei dreht sich die Diskussion speziell um die Frage, ob manche oder vielleicht alle eingebetteten Sätze als Nominalphrasen zu behandeln sind, sei es, weil sie einen (stummen) nominalen Kopf haben (D oder N), oder sei es, weil der Satzeinleiter selbst als nominal zu betrachten ist. Die Beiträge des Sonderhefts nehmen diese Fragestellung erneut auf und explorieren sie unter verschiedenen, syntaktischen wie semantischen Aspekten im Lichte neuerer theoretischer Ansätze. Das Spektrum an Sprachen, die genauer untersucht oder argumentativ für die Zwecke der Analyse herangezogen werden, umfasst neben Deutsch – einschließlich dialektaler Varietäten wie Bairisch und Alemannisch – Englisch, Niederländisch (einschließlich der Brabanter Varietät), Alt- und Neugriechisch, Jula (Niger-Kongo), Schwedisch, Baskisch sowie eine Reihe anderer genetisch und typologisch unterschiedlicher Sprachen.
We introduce DeReKoGram, a novel frequency dataset containing lemma and part-of-speech (POS) information for 1-, 2-, and 3-grams from the German Reference Corpus. The dataset contains information based on a corpus of 43.2 billion tokens and is divided into 16 parts based on 16 corpus folds. We describe how the dataset was created and structured. By evaluating the distribution over the 16 folds, we show that it is possible to work with a subset of the folds in many use cases (e.g., to save computational resources). In a case study, we investigate the growth of vocabulary (as well as the number of hapax legomena) as an increasing number of folds are included in the analysis. We cross-combine this with the various cleaning stages of the dataset. We also give some guidance in the form of Python, R, and Stata markdown scripts on how to work with the resource.
Computational language models (LMs), most notably exemplified by the widespread success of OpenAI's ChatGPT chatbot, show impressive performance on a wide range of linguistic tasks, thus providing cognitive science and linguistics with a computational working model to empirically study different aspects of human language. Here, we use LMs to test the hypothesis that languages with more speakers tend to be easier to learn. In two experiments, we train several LMs—ranging from very simple n-gram models to state-of-the-art deep neural networks—on written cross-linguistic corpus data covering 1293 different languages and statistically estimate learning difficulty. Using a variety of quantitative methods and machine learning techniques to account for phylogenetic relatedness and geographical proximity of languages, we show that there is robust evidence for a relationship between learning difficulty and speaker population size. However, contrary to expectations derived from previous research, our results suggest that languages with more speakers tend to be harder to learn.
Recent years have seen a growing interest in grammatical variation, a core explanandum of grammatical theory. The present volume explores questions that are fundamental to this line of research: First, the question of whether variation can always and completely be explained by intra- or extra-linguistic predictors, or whether there is a certain amount of unpredictable – or ‘free’ – grammatical variation. Second, the question of what implications the (in-)existence of free variation would hold for our theoretical models and the empirical study of grammar. The volume provides the first dedicated book-length treatment of this long-standing topic. Following an introductory chapter by the editors, it contains ten case studies on potentially free variation in morphology and syntax drawn from Germanic, Romance, Uralic and Mayan.
Allusion
(2023)
Assessment
(2023)
Most broadly, an assessment is a type of social action by which an interactant expresses an evaluative stance towards someone or something (e.g., an object, an event, an action, an experience, a state of affairs, a place, a circumstance, etc.). The target of an assessment is typically called the ‘assessable’.
Collaborative work in NFDI
(2023)
The non-profit association National Research Data Infrastructure (NFDI) promotes science and research through a National Research Data Infrastructure. Its aim is to develop and establish an overarching research data management (RDM) for Germany and to increase the efficiency of the entire German science system. After a two-and-a-half year build up phase, the process of adding new consortia, each representing a different data domain, has ended in March 2023. NFDI now has 26 disciplinary consortia (and one additional basic service collaboration). Now the full extent of cross-consortial interaction is beginning to show.
KoMuX, der Kompositamuster-Explorer, (www.owid.de/plus/komux) ist eine Webanwendung, die es ermöglicht, mehr als 50.000 nominale Komposita des Deutschen gezielt nach abstrakten oder lexikalisch-teilspezifizierten Mustern zu durchsuchen. Unterschiedliche Visualisierungen helfen dabei, Strukturen und Zusammenhänge innerhalb der Ergebnismenge zu erfassen.
Retro-sequence
(2023)
The Data Governance Act was proposed in late 2020 as part of the European Strategy for Data, and adopted on 30 May 2022 (as Regulation 2022/868). It will enter into application on 24 September 2023. The Data governance Act is a major development in the legal framework affecting CLARIN and the whole language community. With its new rules on the re-use of data held by the public sector bodies and on the provision of data sharing services, and especially its encouragement of data altruism, the Data Governance Act creates new opportunities and new challenges for CLARIN ERIC. This paper analyses the provisions of the Data Governance Act, and aims at initiating the debate on how they will impact CLARIN and the whole language community.
For many reasons, Mennonite Low German is a language whose documentation and investigation is of great importance for linguistics. To date, most research projects that deal with this language and/ or its speakers have had a relatively narrow focus, with many of the data cited being of limited relevance beyond the projects for which they were collected. In order to create a resource for a broad range of researchers, especially those working on Mennonite Low German, the dataset presented here has been transformed into a structured and searchable corpus that is accessible online. The translations of 46 English, Spanish, or Portuguese stimulus sentences into Mennonite Low German by 321 consultants form the core of the MEND-corpus (Mennonite Low German in North and South America) in the Archive for Spoken German. In addition to describing the origin of this corpus and discussing possibilities and limitations for further research, we discuss the technical structure and search possibilities of the Database for Spoken German. Among other things, this database allows for a structured search of metadata, a context-sensitive token search, and the generation of virtual corpora that can be shared with others. Moreover, thanks to its text-sound alignment, one can easily switch from a particular text section of the corpus to the corresponding audio section. Aside from the desire to equip the reader with the technical knowledge necessary to use this corpus, a further goal of this paper is to demonstrate that the corpus still offers many possibilities for future research.
Conventional terminology resources reach their limits when it comes to automatic content classification of texts in the domain of expertlayperson communication. This can be attributed to the fact that (non-normalized) language usage does not necessarily reflect the terminological elements stored in such resources. We present several strategies to extend a terminological resource with term-related elements in order to optimize automatic content classification of expert-layperson texts.
We present a collection of (currently) about 5.500 commands directed to voice-controlled virtual assistants (VAs) by sixteen initial users of a VA system in their homes. The collection comprises recordings captured by the VA itself and with a conditional voice recorder (CVR) selectively capturing recordings including the VA-directed commands plus some surrounding context. Next to a description of the collection, we present initial findings on the patterns of use of the VA systems during the first weeks after installation, including usage timing, the development of usage frequency, distributions of sentence structures across commands, and (the development of) command success rates. We discuss the advantages and disadvantages of the applied collection-specific recording approach and describe potential research questions that can be investigated in the future, based on the collection, as well as the merit of combining quantitative corpus linguistic approaches with qualitative in-depth analyses of single cases.
Linguistische Studien arbeiten häufig mit einer Differenzierung zwischen gesprochener und geschriebener Sprache bzw. zwischen Kommunikation der Nähe und Distanz. Die Annahme eines Kontinuums zwischen diesen Polen bietet sich für eine Verortung unterschiedlichster Äußerungsformen an, inklusive unkonventioneller Textsorten wie etwa Popsongs. Wir konzipieren, implementieren und evaluieren ein automatisiertes Verfahren, das mithilfe unkorrelierter Entscheidungsbäume entsprechende Vorhersagen auf Textebene durchführt. Für die Identifizierung der Pole definieren wir einen Merkmalskatalog aus Sprachphänomenen, die als Markierer für Nähe/Mündlichkeit bzw. Distanz/Schriftlichkeit diskutiert werden, und wenden diesen auf prototypische Nähe-/Mündlichkeitstexte sowie prototypische Distanz-/Schrifttexte an. Basierend auf der sehr guten Klassifikationsgüte verorten wir anschließend eine Reihe weiterer Textsorten mithilfe der trainierten Klassifikatoren. Dabei erscheinen Popsongs als „mittige Textsorte“, die linguistisch motivierte Merkmale unterschiedlicher Kontinuumsstufen vereint. Weiterhin weisen wir nach, dass unsere Modelle mündlich kommunizierte, aber vorab oder nachträglich verschriftlichte Äußerungen wie Reden oder Interviews vollkommen anders verorten als prototypische Gesprächsdaten und decken Klassifikationsunterschiede für Social-Media-Varianten auf. Ziel ist dabei nicht eine systematisch-verbindliche Einordung im Kontinuum, sondern eine empirische Annäherung an die Frage, welche maschinell vergleichsweise einfach bestimmbaren Merkmale („shallow features“) nachweisbar Einfluss auf die Verortung haben.
"Das im Januar 2022 gestartete Projekt "Sprachanfragen" (https://www.ids-mannheim.de/gra/projekte2/sprachanfragen/) verfolgt erstmalig das Ziel, Sprachanfragedaten zu erfassen, aufzubereiten und ein wissenschaftsöffentliches Monitorkorpus aus ihnen zu erstellen. Dazukommend wird eine Rechercheschnittstelle entwickelt, mit der die Sprachanfragen systematisch wissenschaftlich analysierbar gemacht werden. Das Poster gibt einen Überblick über das Projekt, zeigt erste Ergebnisse und bietet einen Ausblick auf Überlegungen zur Konzeption eines Chatbots zur automatisierten Beantwortung von Sprachanfragen." Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.
This article investigates mundane photo taking practices with personal mobile devices in the co-presence of others, as well as “divergent” self-initiated smartphone use, thereby exploring the impact of everyday technologies on social interaction. Utilizing multimodal conversation analysis, we examined sequences in which young adults take pictures of food and drinks in restaurants and cafés. Although everyday interactions are abundant in opportunities for accomplishing food photography as a side activity, our data show that taking pictures is also often prioritized over other activities. Through a detailed sequential analysis of video recordings and dynamic screen captures of mobile devices, we illustrate how photographers orient to the momentary opportunities for and relevance of photo taking, that is, how they systematically organize their photographing with respect to the ongoing social encounter and the (projected) changes in the material environment. We investigate how the participants multimodally negotiate the “mainness” and “sideness” (Mondada, 2014) of situated food photography and describe some particular features of participants’ conduct in moments of mundane multiactivity.
Seit Mitte der 1990er Jahre wird am Institut für deutsche Sprache (IDS) in Mannheim erforscht, wie der hochkomplexe Gegenstandsbereich „Grammatik“ unter Ausnutzung hypertextueller Navigationsstrukturen wissenschaftlich fundiert und anschaulich vermittelt werden kann. Eine zentrale Bedeutung kommt folglich einer konsistenten, theorieübergreifenden Vernetzung sämtlicher Textinhalte zu. Um eine automatisierbare Bezugnahme zwischen mit unterschiedlichem terminologischem Vokabular formulierten, aber das gleiche sprachliche Phänomen beschreibenden Inhalten zu befördern, bildet eine onomasiologisch konzipierte Terminologiedatenbank das Rückgrat des Online-Systems. Der Beitrag beschreibt Konzeption und Aufbau der skizzierten linguistischen Fachterminologie.
Das Ziel des Beitrages ist es, das Schweigen und seine sprachliche Gestaltung in Bezug auf die Makro- und Mikrostruktur des literarischen Textes zu erforschen. Den theoretischen Hintergrund bilden linguistische und literaturwissenschaftliche Arbeiten, die kommunikative, pragmatische, semantische, kulturelle sowie literaturhistorische Aspekte des Schweigens behandeln und seine Abgrenzung von der Stille hervorheben, die als Naturphänomen zu verstehen ist. Hingewiesen wird ausgehend vom Modell der literarischen Kommunikation auf die Rolle des Schweigens in der Triade Autor-Text-Leser sowie auf seine Realisierungsmöglichkeiten in der Struktur und Sprache des Erzähltextes. Dabei richtet sich die Aufmerksamkeit nicht nur auf das Schweigen als Nicht-Sprechen, sondern auch auf die nichtssagende Rede, die im Rahmen der Kommunikationssituation die Semantik des Schweigens aktualisiert. Die zwei gegensätzlichen Schweigeformen kommen in den Berliner Romanen von Robert Walser (1878-1956) zum Vorschein und unterliegen der genauen Analyse aus der Perspektive der Makro- und Mikrostilistik. Untersucht werden das Erzählprinzip der Geschwätzigkeit in Geschwister Tanner (1907), die Ironie in Der Gehülfe (1908) und die fragmentarische Erzählweise in Jakob von Gunten (1909), durch die das Schweigen sowohl auf der thematischen Ebene als auch in der Struktur und Sprache des Textes realisiert wird. Als narrative Strategie beeinflusst Schweigen die Form und den Inhalt Walsers Berliner Romane und erzielt somit die vom Autor gewünschte Wirkung auf den Leser.
Developments within the field of Second Language Acquisition (SLA) have meant that scholars are increasingly engaging with corpora and corpus-based resources, providing a source of “‘authentic’ language” to learners and educators (Mitchell 2020: 254), and contributing to “state-of-the-art research methodologies” (Deshors and Gries 2023: 164). However, there are areas in which progress can still be made, particularly in the area of metadata, such as information about the speaker and contexts of the language use, as well as increased variety in the text types and genres of corpora used to develop SLA materials (Paquot 2022: 36). This post discusses one such possibility for increasing the variety of text types and providing a rich source of authentic language that can be used to create engaging SLA materials, particularly for young people learning German, namely the use of the NottDeuYTSch corpus (to download the corpus in a variety of formats, see Cotgrove 2018).
Meine folgenden Überlegungen gehen weit über rein „linguistische Theorien und Methoden" hinaus. Sie beziehen sich auch weniger als seine auf innersprachliche Fragen und mehr auf sprachensoziologische und -politische. Allerdings entziehen sie sich auch damit nicht Poppers pauschalem Urteil, die mit „human society and human history" befassten Wissenschaften seien generell unfähig zu Prognosen - im Gegensatz zu manchen (wenn auch nicht allen) Naturwissenschaften. Abgesehen davon räume ich für das Folgende jedoch gerne Abstriche ein vom Grad der von Popper für Prognosen offenbar vorausgesetzten Zuverlässigkeit und Exaktheit. Sie entsprechen auch verbreiteten Auffassungen, dass sich die Weiterentwicklung der Technik zuverlässiger Voraussagen lässt als die der menschlichen Sozialbeziehungen, angesichts unkalkulierbarer „Anarchie und Ignoranz, die das Gefüge unserer Gesellschaft zerstören könnten" (Kaku 2016, S. 33). Bei einer solchen Abschwächung der Ansprüche im Sinne derartiger Vorbehalte erscheint es mir aber dennoch treffender, die folgenden Überlegungen, soweit sie zukunftsgerichtet sind, eher den Prognosen zuzuordnen als den bloßen Prophezeiungen, denen man ja dann - bei ihrer typischen Stütze durch „göttliche Offenbarung" - jegliche theoretische oder faktische, also wissenschaftliche Grundlage absprechen darf. Freilich verliert mit der genannten Abschwächung die Opposition zwischen den Begriffen 'Prognose' und 'Prophezeiung' ihre strenge Disjunktheit und wird in Richtung eines abgestuften oder kontinuierlichen Übergangs aufgelockert. Jedoch widerspricht dies keineswegs gängigem wissenschaftlichen Procedere. Damit nun aber genug an allgemeinen methodischen Vorüberlegungen! Im Übrigen geht es mir im Folgenden weniger um die Auseinandersetzung mit bisherigen Publikationen zum Thema, auch nicht denen des mit diesem Band Geehrten, die - bei einem nicht zu engen Verständnis - in großer Zahl vorliegen, als um die Skizzierung meiner eigenen Einschätzungen.
Wie die Eule erkunden große & kleine Sprach-Checker ihre Neckarstadt-West. Kommt mit auf Entdeckungsreise!
Das Buch „Der Wörter-Sammel-Koffer“ ist ein Werk der Sprach-Checker. Es entstand im Rahmen des Projekts „Die Sprach-Checker - So sprechen wir in der Neckarstadt“ (Leitung: Dr. Christine Möhrs & Elena Schoppa-Briele) des Leibniz-Instituts für Deutsche Sprache (IDS), Mannheim, in Zusammenarbeit mit der Kinderbuchautorin und Illustratorin Anke Faust, dem Campus Neckarstadt-West, den Neckarstadt-Kids sowie der Alten Feuerwache Mannheim.
Aus den vielen witzigen Ideen der Kinder entwickelte sich die Geschichte um die Eule, die anschließend mit Wasserfarben, Farbstiften und viel Phantasie von den Sprach-Checkern illustriert wurde.
OWID und OWIDplus – lexikographisch-lexikologische Online-Informationssysteme des IDS Mannheim
(2023)
Lexikographische und lexikalische Ressourcen zum Deutschen werden an vielen unterschiedlichen Institutionen erarbeitet, z. B. an Akademien der Wissenschaften oder in privatwirtschaftlichen Verlagen. Auch am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim werden solche Materialien erstellt und der (Fach-)Öffentlichkeit unter dem Dach von OWID, dem „Online-Wortschatz-Informationssystem Deutsch“ (owid.de), präsentiert.
Modular pivot
(2023)
A modular pivot is a type of turn-constructional pivot. It is built from syntactically entirely optional items (i.e. linguistic adjuncts) that can occur in both turn-initial and turn-final position and can therefore be used to patch a wide range of otherwise discrete turn-constructional units (TCUs) together (Clayman & Raymond 2015). A prime example of an item that lends itself to be deployed as a modular pivot are address terms (Clayman 2012).
Pivot
(2023)
The term pivot denotes an element of talk that can be understood to belong to two larger units of talk simultaneously, thereby joining them together and acting as a transitional link between them (Schegloff 1979: 275-276). Most commonly, the term is used to refer to lexico-syntactic elements that can be interpreted as ending one turn-constructional unit (TCU) while at the same time launching a next.
Mit dem cGAT-Handbuch stellt das FOLK-Projekt eine Richtlinie für das computergestützte Transkribieren nach GAT 2 zur Verfügung. Das Handbuch wurde anhand der Transkriptionspraxis in FOLK entwickelt und enthält eine Vielzahl von authentischen Beispielen, die mit dem zugehörigen Audio auch über die Datenbank für Gesprochenes Deutsch (DGD) abgerufen werden können.
Der Beitrag gliedert sich in drei Teile. In Abschnitt 2 führe ich zunächst den Begriff der Phraseoschablone ein und erläutere, inwiefern diese Untergruppe der Phraseologismen Eigenschaften von grammatischen Konstruktionen aufweist, deren konzise Erfassung eine notwendige Voraussetzung dafür ist, Beschränkungen bei der Produktivität und der semantischen Variabilität der Phraseologismen zu erklären. Daran anschließend werden in Abschnitt 3 Ergebnisse einer korpuslinguistischen Fallstudie nominaler Reduplikationen mit den Präpositionen an, in und über dargelegt und erörtert. Abschnitt 4 fasst schließlich die erzielten Ergebnisse im übergeordneten Zusammenhang zusammen und gibt einen Ausblick auf weitere Forschungsfragen.
The special issue opens up a construction-grammatical perspective on (German) word formation phenomena and goes back to a DFG-funded conference of the same name, which we held at the University of Düsseldorf in December 2020. The aim is to bundle up for the first time research from the field of German linguistics that is oriented towards construction grammar, and thus to lay the foundation for a 'Construction Word Formation' (cf. Booij 2010) also in the German-speaking world. Furthermore, ‘Construction Word Formation’ as a discipline shall hereby be sharpened. In this context, construction grammar should not be seen as a radical alternative to traditional word formation approaches that completely reinvents the wheel, but rather as a further development that builds on traditional concepts such as the pattern term with prominent consideration of usage-based aspects.
The Encyclopedia of Terminology for Conversation Analysis and Interactional Linguistics is an online resource for students and scholars of CA/IL, publicly available on the EMCA Wiki page. Encyclopedias and glossaries are widespread across various fields and methods, and serve as immensely valuable resources. Given the extent to which the EMCA/IL community has expanded over the years—both terminologically as well as geographically—we hope that this encyclopedia of terminology will be well received by students and practitioners of CA and IL across the globe.
Im Folgenden werden wir uns überwiegend mit der syntaktischen Realisierung der Intensivierung auseinandersetzen, wobei die morphologische anhand des Phänomens der Komposition nicht unkommentiert bleiben wird. Im Vordergrund unserer Analyse stehen überwiegend Fälle lexikalischer und se-mantischer bzw. funktionaler Divergenz zwischen dem Deutschen und dem Italienischen. Die von uns analysierten komparativen Phraseologismen wurden anhand einer Suche in ein- und zweisprachigen Wörterbüchern des Deutschen und des Italienischen ausgewählt. Unser Beitrag ist wie folgt strukturiert: Kapitel 2 gibt einen Überblick über die komparative Phrasem-Konstruktion aus kontrastiver Sicht: Es werden ihre strukturellen (morphosyntaktischen), semantischen und pragmatischen Hauptmerkmale beschrieben. Aufgrund ihrer Frequenz wird überwiegend auf die Subtypen mit einem Verb (Kap. 2.1.) und einem prädikativen Adjektiv (2.2.) als tertium comparations eingegangen. Da die Beziehung zwischen Metapher und Vergleich sehr eng ist, werden in Kapitel 3 die Analogien und Unterschiede zwischen diesen rhetorischen Figuren kurz skizziert. Kapitel 4 ist der interlingualen Analyse der phraseologischen Einheiten gewidmet, bei denen dasselbe Konzept im Deutschen und im Italienischen entweder durch einen (lexikalisierten) Vergleich oder durch eine (lexikalisierte) Metapher realisiert wird. Wie zu sehen sein wird, kann man außerdem intralingual manchmal auch die Kookkurrenz beider sprachlichen Formen feststellen. In Kapitel 5 wird der Objektbereich der komparativen Phrasem-Konstruktionen aus konstruktionsgrammatischer Sicht vertieft, wobei vor allem auf Hierarchisierungen von Konstruktionen, Vererbungsrelationen, Produktivität, kognitive Verfestigung (entrenchment) und Emergenzphänomene eingegangen wird.
Muttersprachler verfügen über eine sprachliche Kompetenz, die sie prinzipiell befähigt, Sprache, d.h. sprachliche Strukturen bzw. Konstruktionen, kommunikativ angemessen - im Normalfall sogar unbewusst - zu rezipieren und zu produzieren. In einer Fremdsprache hingegen ist die Ausgangssituation eine ganz andere: auch wenn von einer sprachlichen Kompetenz in der Muttersprache (und in vorher erworbenen und/oder erlernten Zweit- oder Fremdsprachen) ausgegangen werden kann, muss die sprachliche Kompetenz in der Fremdsprache erst Phase für Phase aufgebaut werden - was in der Fremdsprachendidaktik als Lernersprache bezeichnet wird. Die phraseologische Kompetenz ist ein Bestandteil der muttersprachlichen Sprachkompetenz, durch die Sprecher in der Lage sind, phraseologische Einheiten zu erkennen, zu verstehen und kommunikativ angemessen zu verwenden. Um einen unauffälligen, natürlichen, muttersprachenähnlichen phraseologischen Sprachgebrach in der Fremdsprache gewährleisten zu können, muss erstens erörtert werden, welche Phraseologismen überhaupt zum gegenwärtigen Sprachgebrauch gehören, und zweitens, wie diese Phraseologismen prototypisch von Muttersprachlern (rezeptiv und produktiv) verwendet werden. Für eine angemessene Erfassung und Beschreibung des Gebrauchs solcher Phraseologismen zu entsprechen, richtet sich in der vorliegenden Arbeit das Hauptaugenmerk exemplarisch auf eine der in dieser Liste aufgeführten idiomatischen Redewendungen, nämlich sich ins Zeug legen.
This paper presents an extended annotation and analysis of interpretative reply relations focusing on a comparison of reply relation types and targets between conflictual pages and neutral pages of German Wikipedia (WP) talk pages. We briefly present the different categories identified for interpretative reply relations to analyze the relationship between WP postings as well as linguistic cues for each category. We investigate referencing strategies of WP authors in discussion page postings, illustrated by means of reply relation types and targets taking into account the degree of disagreement displayed on a WP talk page. We provide richly annotated data that can be used for further analyses such as the identification of interactional relations on higher levels, or for training tasks in machine learning algorithms.
Telephone-based remote interpreting has come into widespread use in multilingual encounters, all the more so in times of refugee crises and the large influx of asylum-seekers into Europe. Nevertheless, the linguistic practices in this mode of communication have not yet been examined comprehensively. This article therefore investigates selected aspects of turn-taking and clarification sequences during semi-authentic telephone-interpreted counselling sessions for refugees (Arabic–German). A quantitative analysis reveals that limited audibility makes it more difficult for interpreters to claim their turn successfully; in most cases, however, turn-taking occurs smoothly. The trouble sources that trigger queries are mainly content-related and interpreters vary greatly in the ways they deal with such difficulties. Contrary to what one might expect, the study shows that coordination fails only rarely during telephone-based remote interpreting.
Anders als bei Sonntagspredigten haben die katholischen und evangelischen AutorInnen von Kirche in 1live nur 90 Sekunden zur Verfügung, um ihre christliche Botschaft zu vermitteln. Vorliegender Beitrag untersucht, wie die katholischen und evangelischen AutorInnen dies tun. Welche Inhalte erachten sie für relevant? Welche sprachliche Gestaltung wählen sie? Greifen katholische und evangelische AutorInnen zu den gleichen Inhalten und sprachlichen Mitteln oder zeigen sich konfessionelle Präferenzen und Differenzen? Diesen Fragen soll an einem Korpus aus Kirche in 1live-Radiopredigten aus den Jahren 2012 bis 2021 (= 2.755 Texte mit insgesamt 726.570 Token) mit einem quantitativen und qualitativen Methoden-Mix nachgegangen werden. Die Studie wird im Rahmen des DFG-Projekts „Sprache und Konfession 500 Jahre nach der Reformation“ am Germanistischen Institut der Westfälischen Wilhelms-Universität Münster durchgeführt.
The landscape of digital lexical resources is often characterized by dedicated local portals and proprietary interfaces as primary access points for scholars and the interested public. In addition, legal and technical restrictions are potential issues that can make it difficult to efficiently query and use these valuable resources. As part of the research data consortium Text+, solutions for the storage and provision of digital language resources are being developed and provided in the context of the unified cross-domain German research data infrastructure NFDI. The specific topic of accessing lexical resources in a diverse and heterogenous landscape with a variety of participating institutions and established technical solutions is met with the development of the federated search and query framework LexFCS. The LexFCS extends the established CLARIN Federated Content Search that already allows accessing spatially distributed text corpora using a common specification of technical interfaces, data formats, and query languages. This paper describes the current state of development of the LexFCS, gives an insight into its technical details, and provides an outlook on its future development.
Die Studie untersucht die Formen, Funktionalität und Relevanz von binnensprachlichen Variationsphänomenen im schwäbischen Dialektraum anhand der Sprachgebrauchspraktiken in einer neunten Klasse eines Gymnasiums in Ulm. Im Mittelpunkt stehen der Gebrauch koexistenter sprachlicher Formen mit unterschiedlicher Nähe oder Distanz zu den Polen Standard und Dialekt des sprachlichen Kontinuums und daraus ableitbare Hinweise auf die Varietätentektonik im untersuchten Sprachraum. Durch die Kombination von quantitativ und qualitativ orientierten Analyseverfahren werden die Zusammenhänge von formalen Mustern und funktionalen Möglichkeiten von Sprachvariation greifbar gemacht. Dabei wird deutlich, dass der variative Gebrauch der sprachlichen Formen bei den untersuchten Sprechern strukturiert ist und als interaktionskonstitutive linguistische Ressource in Bezug zu unterschiedlichen situativen Kommunikationsanforderungen an die Lehrer und Schüler steht.
The proposed contribution will shed light on current and future challenges on legal and ethical questions in research data infrastructures. The authors of the proposal will present the work of NFDI’s section on Ethical, Legal and Social Aspects (hereinafter: ELSA), whose aim is to facilitate cross-disciplinary cooperation between the NFDI consortia in the relevant areas of management and re-use of research data.
Reduzierte Parenthesen stehen in einer zweifachen Beziehung zur einschließenden Trägerstruktur. Die Trägerstruktur liefert den propositionalen Gehalt eines internen Arguments, das durch das Prädikat der Parenthese selegiert wird, während die Parenthese wie ein Modifikator in Bezug auf die Trägerstruktur fungiert. Die erstere Relation ist anaphorischer Natur, was durch ein pronominales Leerelement im parenthetischen Satz angemessen modelliert wird. Die letztere Relation lässt sich am besten durch die Sättigung eines externen (referenziellen) Arguments des parenthetischen Satzes durch die Trägerstruktur modellieren – analog zu gewöhnlichen Adverbialsätzen. Die strukturelle Bedingung dieser Relation resümiert dann darin, dass die Parenthese in die terminale Zeichenkette der Trägerstruktur eingeschlossen ist. Die Funktion der Parenthese als Modifikator wiederum ist eine Bedingung für die Lizenzierung des Leerelements innerhalb dieser Parenthese. Diese Erklärung wird durch Parallelen zu Phänomenen in Relativ- und in Vergleichsätzen untermauert.
This paper first argues that the distinction between Propositions and States-of-Affairs is significant for understanding a number of linguistic contrasts, including contrasts between nominalizations, complement clauses, readings of modal infinitives, raising constructions, illocutions and moods, relative clauses, and nouns. Subsequently, the paper outlines a cognitive linguistic model of the distinction, according to which Propositions and States-of-Affairs differ in terms of construal. Both prompt Langackerian “processes”, but only Propositions prompt a construal of these processes as referential. The paper argues that this model has a number of advantages over a traditional, denotational understanding of the distinction.
The present article proposes a syntactic and semantic analysis of assertive clauses that comprises their truth-conditional aspects and their speech act potential in communication. What is commonly called “illocutionary force” is differentiated into three structurally and functionally distinct layers: a judgement phrase, representing subjective epistemic and evidential attitudes; a commitment phrase, representing the social commitment related to assertions; and an act phrase, representing the relation to the common ground of the conversation. The article provides several pieces of evidence for this structure: from the interpretation and syntactic position of various classes of epistemic, evidential, affirmative and speech act-related operators, from clausal complements embedded by different types of predicates, from embedded root clauses, and from anaphora referring to different clausal projections. The syntactic assumptions are phrased within X-bar theory, and the semantic interpretation makes use of dynamic update of common ground, differentiating between informative and performative updates. The object language is German, with particular reference to verb final and verb second structure.
This article describes an English Zulu learners’ dictionary that is part of a larger set of information tools, namely an online Zulu course, an e-dictionary of possessives (which was implemented earlier) accompanied by training software offering translation tasks on several levels, and an ontology of morphemic items categorizing and describing all parts of speech of Zulu. The underlying lexicographic database contains the usual type of lexicographic data, such as translation equivalents and their respective morphosyntactic data, but its entries have been extended with data related to the lessons of the online course in order to enable the learner to link both tools autonomously. The ‘outer matter’ is integrated into the website in the form of several texts on additional web pages (how-to-use, typical outputs, grammar tables, information on morphosyntactic rules, etc.). The dictionary comprises a modular system, where each module fulfils one of the necessary functions.
This paper describes general requirements for evaluating and documenting NLP tools with a focus on morphological analysers and the design of a Gold Standard. It is argued that any evaluation must be measurable and documentation thereof must be made accessible for any user of the tool. The documentation must be of a kind that it enables the user to compare different tools offering the same service, hence the descriptions must contain measurable values. A Gold Standard presents a vital part of any measurable evaluation process, therefore, the corpus-based design of a Gold Standard, its creation and problems that occur are reported upon here. Our project concentrates on SMOR, a morphological analyser for German that is to be offered as a web-service. We not only utilize this analyser for designing the Gold Standard, but also evaluate the tool itself at the same time. Note that the project is ongoing, therefore, we cannot present final results.