400 Sprache
Refine
Year of publication
Document Type
- Part of a Book (43)
- Article (33)
- Book (18)
- Conference Proceeding (18)
- Part of Periodical (12)
- Working Paper (5)
- Contribution to a Periodical (2)
- Review (2)
- Doctoral Thesis (1)
- Other (1)
Keywords
- Deutsch (36)
- Korpus <Linguistik> (28)
- Linguistik (13)
- Germanistik (12)
- Corpus linguistics (11)
- Gesprochene Sprache (9)
- Englisch (7)
- Corpus technology (6)
- Deutschland (6)
- Europa (6)
Publicationstate
- Veröffentlichungsversion (63)
- Zweitveröffentlichung (12)
- Postprint (4)
Reviewstate
- Peer-Review (42)
- (Verlags)-Lektorat (33)
- (Verlags-)Lektorat (1)
- Peer Review (1)
- Peer-Revied (1)
- Peer-review (1)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (1)
Publisher
- Institut für Deutsche Sprache (25)
- de Gruyter (8)
- Heidelberg University Publishing (6)
- De Gruyter (4)
- Peter Lang (4)
- Leibniz-Institut für Deutsche Sprache (IDS) (3)
- Narr (3)
- Narr Francke Attempto (3)
- Retorika (3)
- Stauffenburg (3)
In recent years, formal semantic research on the meaning of tense and aspect has benefited from a number of studies investigating languages with graded tense systems. This paper contributes a first sketch of the temporal marking system of Awing (Grassfields Bantu), focusing on two varieties of remote past and remote future. We argue that the data support a "symmetric" analysis of past and future tense in Awing. In our specific proposal, Awing temporal remoteness markers are uniformly analyzed as quantificational tense operators, and both the past and the future paradigm include a form that prevents contextual restriction of this temporal quantifier.
Linguistic query systems are special purpose IR applications. We present a novel state-of-the-art approach for the efficient exploitation of very large linguistic corpora, combining the advantages of relational database management systems (RDBMS) with the functional MapReduce programming model. Our implementation uses the German DEREKO reference corpus with multi-layer linguistic annotations and several types of text-specific metadata, but the proposed strategy is language-independent and adaptable to large-scale multilingual corpora.
The Manatee corpus management system on which the Sketch Engine is built is efficient, but unable to harness the power of today’s multiprocessor machines. We describe a new, compatible implementation of Manatee which we develop in the Go language and report on the performance gains that we obtained.
In the first volume of Corpus Linguistics and Linguistic Theory, Gries (2005. Null-hypothesis significance testing of word frequencies: A follow-up on Kilgarriff. Corpus Linguistics and Linguistic Theory 1(2). doi:10.1515/ cllt.2005.1.2.277. http://www.degruyter.com/view/j/cllt.2005.1.issue-2/cllt.2005. 1.2.277/cllt.2005.1.2.277.xml: 285) asked whether corpus linguists should abandon null-hypothesis significance testing. In this paper, I want to revive this discussion by defending the argument that the assumptions that allow inferences about a given population – in this case about the studied languages – based on results observed in a sample – in this case a collection of naturally occurring language data – are not fulfilled. As a consequence, corpus linguists should indeed abandon null-hypothesis significance testing.
American English and German AI, AU observed in cognates such as Wein, wine, Haus, house are usually treated on a par, represented with the same initial vowel (cf. [ai], [au] for Am. Engl, and German [1]). Yet, acoustic measurements indicate differences as the relevant trajectories characteristically cross in Am. Engl, but not in German. These data may indicate consistency with the same initial target for these diphthongs in German, supporting the choice of the same Symbol /a/ in phonemic representation, as opposed to distinct targets (and distinct initial phonemes) in American English.
The English language has taken advantage of the Digital Revolution to establish itself as the global language; however, only 28.6 %of Internet users speak English as their native language. Machine Trans-lation (MT) is a powerful technology that can bridge this gap. In devel-opment since the mid-20th century, MT has become available to every Internet user in the last decade, due to free online MT services. This paper aims to discuss the implications that these tools may have for the privacy of their users and how they are addressed by EU data protec-tion law. It examines the data-flows in respect of the initial processing (both from the perspective of the user and the MT service provider) and potential further processing that may be undertaken by the MT service provider.
Our paper describes an experiment aimed to assessment of lexical coverage in web corpora in comparison with the traditional ones for two closely related Slavic languages from the lexicographers’ perspective. The preliminary results show that web corpora should not be considered ― inferior, but rather ― different.
Language attitudes may be differentiated into attitudes towards speakers and attitudes towards languages. However, to date, no systematic and differentiated instrument exists that measures attitudes towards language. Accordingly, we developed, validated, and applied the Attitudes Towards Languages (AToL) scale in four studies. In Study 1, we selected 15 items for the AToL scale, which represented the three dimensions of value, sound, and structure. The following studies replicated and validated the three-factor structure and differential mean profiles along the three dimensions for different languages (a) in a more diverse German sample (Study 2), (b) in different countries (Study 3), and (c) when participants based their evaluations on speech samples (Study 4). Moreover, we investigated the relation between the AToL dimensions and stereotypic speaker evaluations. Results confirm the reliability, validity, and generalizability of the AToL scale and its incremental value to mere speaker evaluations.
This chapter focuses on the formation of adverbs from a corpuslinguistic perspective, providing an overview of adverb formation patterns in German that includes frequencies and hints to productivity as well as combining quantitative methods and theoretically founded hypotheses to address questions that concern possible grammaticalization paths in domains that are formally marked by prepositional elements or inflectional morphology (in particular, superlative or superlative-derived forms). Within our collection of adverb types from the project corpus, special attention is paid to adverbs built from primary prepositions. The data suggest that generally, such adverb formation involves the saturation of the internal argument slot of the relation-denoting preposition. In morphologically regular formations with the preposition in final position, pronominal forms like da ‘there’, hier ‘here’, wo ‘where’ as well as hin ‘hither’ and her ‘thither’ serve to derive adverbs. On the other hand, morphologically irregular formations with the preposition – in particular: zu ‘to’ or vor ‘before, in front of’ – in initial posi-tion show traits of syntactic origin such as (remnants of) inflectional morphology. The pertaining adverb type dominantly saturates the internal argument slot by means of universal quantification that is part and parcel as well of the derivation of superlatives and demonstrably fuels the productivity of the pertaining formation pattern.
„Bausteine einer Korpusgrammatik des Deutschen“ ist eine neue Schriftenreihe, die am Leibniz-Institut für Deutsche Sprache in Mannheim (IDS) entsteht. Sie setzt sich zum Ziel, mit korpuslinguistischen Methoden die Vielfalt und Variabilität der deutschen Grammatik in großer Detailschärfe zu erfassen und gleichzeitig für die Validierbarkeit der Ergebnisse zu sorgen. Die erste Ausgabe enthält eine Einführung in die Reihe sowie vier als Kapitel einer neuen Grammatik gestaltete Texte: 1. Grundlegende Aspekte der Wortbildung, 2. Bau von und Umbau zu Adverbien, 3. Starke vs. schwache Flexion aufeinanderfolgender attributiver Adjektive und 4. Reihenfolge attributiver Adjektive. Die Ausgabe ist mit einer interaktiven Datenbank zu attributiven Adjektiven verknüpft.
Brief
(2022)
Der folgende Beitrag untersucht Briefe aus der Zeitspanne des Nationalsozialismus, die von unterschiedlichen Akteur*innen in unterschiedlichen Beteiligungsrollen verfasst worden sind. Es handelt sich um von Soldaten und ihren Angehörigen verfasste Feldpost-, um von Gegner*innen des Nationalsozialismus geschriebene Haftbriefe sowie um Eingaben an Staats- und Parteiinstanzen, die Teil des institutionellen Briefverkehrs sind. Alle diese Formen des Briefschreibens besitzen eine längere Tradition. Ihre Nutzung während der NS-Zeit ist jedoch durch spezifische Ausprägungen gekennzeichnet, die in den jeweiligen Abschnitten beleuchtet werden.
CMC Corpora in DeReKo
(2017)
We introduce three types of corpora of computer-mediated communication that have recently been compiled at the Institute for the German Language or curated from an external project and included in DeReKo, the German Reference Corpus, namely Wikipedia (discussion) corpora, the Usenet news corpus, and the Dortmund Chat Corpus. The data and corpora have been converted to I5, the TEI customization to represent texts in DeReKo, and are researchable via the web-based IDS corpus research interfaces and in the case of Wikipedia and chat also downloadable from the IDS repository and download server, respectively.
Creating CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes - The National Corpus of Contemporary Welsh)
(2017)
CorCenCC is an interdisciplinary and multiinstitutional project that is creating a large-scale, open-source corpus of contemporary Welsh. CorCenCC will be the first ever large-scale corpus to represent spoken, written and electronicallymediated Welsh (compiling an initial data set of 10 million Welsh words), with a functional design informed, from the outset, by representatives of all anticipated academic and community user groups.
In Deutschland gibt es Anzeichen für ein zunehmendes Interesse an der eigenen Sprache. Dennoch ergeben sich hier wie in anderen europäischen Ländern mit der kommunikativen Internationalisierung Probleme für die weitere Entwicklung der Hochsprachen, die für die kulturelle Vielfalt des Kontinents konstitutiv sind. Die steigende Tendenz, Englisch als einzige internationale Verkehrssprache und auch national als Fachsprache in mehreren Domänen zu verwenden, wird verstärkt durch einen Fremdsprachenunterricht, der in Deutschland wie in anderen Ländern Englisch zu Lasten anderer Sprachen bevorzugt. Dieser Entwicklung sucht die Europäische Union zu begegnen, indem sie das Ziel M + 2 Sprachen (Muttersprache plus zwei andere Sprachen) für alle Europäer propagiert. Dieses Programm wird auch von der Europäischen Föderation nationaler Sprachinstitutionen (EFNIL) unterstützt, das Netzwerke der zentralen Spracheinrichtungen der EU- Staaten, das sich für die Erhaltung und Weiterentwicklung der europäischen Sprachenvielfalt und die Mehrsprachigkeit der Europäer einsetzt. Für dieses Ziel sind aber Einsicht und Interesse bei vielen Deutschen noch zu wecken oder zu verstärken.
Die Gründerjahre des IDS
(2007)
Dieses Büchlein ist die zweite Auflage meiner 1959/60 geschriebenen und 1961 erschienenen Schrift „Sprachliche Bildung in der höheren Schule“. Der damalige Titel war gewählt worden im Blick auf eine geplante Schriftenreihe zum Gymnasialunterricht, die auch meine Arbeit einbeziehen sollte. Da die Schriftenreihe dann nicht zustande kam, scheint es mir richtig, jetzt wieder auf den ursprünglichen, einfacheren Titel zurückzugreifen.
Der Text konnte im wesentlichen beibehalten werden, nur einige Einzelheiten habe ich auf Grund der seitherigen Erfahrungen geändert. Die summarischen Literaturangaben, die im Vorwort gegeben waren, habe ich nun an den Schluß gestellt (S. 120-121); doch erstreben diese Hinweise, dem praktischen Zweck des Büchleins entsprechend, keinerlei Vollständigkeit, sondern wollen nur einige Möglichkeiten zur Vertiefung und zur kritischen Überprüfung des hier Gegebenen nennen. Als Anhang sind die „Hamburger Empfehlungen zur Sprachlehre in der Volksschule“ abgedruckt, die 1961-1963 erarbeitet wurden; sie mögen zeigen, wie das in diesem Büchlein für die Grundschule Skizzierte von einem breiteren Kreis von Fachleuten aufgenommen wurde.
Ich danke allen Freunden und Fachgenossen, die mir bei der Ausarbeitung der ersten Auflage geholfen haben, vor allem durch freundliche Überprüfung der lateinischen, französischen und englischen Beispiele. Ebenso danke ich allen kritischen Lesern, insbesondere denen, die die gezeigten Möglichkeiten ausprobiert und darüber berichtet haben. Das Ganze ist ja keine ausgeführte Methodik, sondern nur eine Skizze, die dem Lehrer helfen soll, sich der heute gegebenen sprachwissenschaftlichen Möglichkeiten bei seiner täglichen Arbeit mit möglichst viel Erfolg zu bedienen.
Effiziertes Objekt
(2020)
Diese Handreichung stellt die Datenbank für Gesprochenes Deutsch (DGD) und speziell das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) als Instrumente gesprächsanalytischer Arbeit vor. Nach einem kurzen einführenden Überblick werden anhand des Beispiels "sprich" als Diskursmarker bzw. Reformulierungsindikator Schritt für Schritt die Ressourcen und Tools für systematische korpus- und datenbankgesteuerte Recherchen und Analysen vorgestellt und illustriert.
Diese Handreichung stellt die Datenbank für Gesprochenes Deutsch (DGD) und speziell das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) als Instrumente gesprächsanalytischer Arbeit vor. Nach einem kurzen einführenden Überblick werden anhand vier verschiedener Beispiele Schritt für Schritt die Ressourcen und Tools für systematische korpus- und datenbankgesteuerte Recherchen und Analysen vorgestellt und illustriert.
Diese Handreichung stellt die Datenbank für Gesprochenes Deutsch (DGD) und speziell das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) als Instrumente gesprächsanalytischer Arbeit vor. Nach einem kurzen einführenden Überblick werden anhand des Beispiels metapragmatischer Modalisierungen mit den Adverbien "sozusagen" und "gewissermaßen" und mit der Formel "in Anführungszeichen/-strichen" Schritt für Schritt die Ressourcen und Tools für systematische korpus- und datenbankgesteuerte Recherchen und Analysen vorgestellt und illustriert.
Einleitung
(2014)
Einleitung
(2020)
A corpus-based academic grammar of German is an enormous undertaking, especially if it aims at using state-of-the-art methodology while ensuring that its study results are verifiable. The Bausteine-series, which is being developed at the Leibniz Institute for the German Language (IDS), presents individual “building blocks” for such a grammar. In addition to the peer-reviewed texts, the series publishes the results of statistical analyses and, for selected topics, the underlying data sets.
The present article shows an experimental subject investigation on elements of video telephony in relation to experiencing and feeling connectedness and intimacy within private interpersonal communication. Particular interests are questions about possible relationships between image detail, angle of view or perspective as well as image format or the foreign and personal perception of the communicators. Central to this is the question of whether the practices and interactions of users in dealing with communication technology can be used to derive possible conclusions on negotiation measures or even adaptation services. The obtained results are presented on the basis of an introductory theoretical discussion. It is followed by a summary and analysis as well as an outlook on the further use and significance of the results.
Current theories of the syntax-semantics interface associate aspects of meaning that cannot be traced to visible structure with empty projecting heads or constructions as wholes. We present an alternative compositional analysis of the hidden aspectual-temporal, modal or comparative meaning of inchoative, middle, excessive and directional complement constructions. Accord-ingly, the hidden meaning results from a repair mechanism that passes on a locally problematic meaning component to the next higher derivational cycle. The meaning component in question is one half of the logical form of Difference as contributed by certain functional elements or by syntactically transitive (nominative-accusative) configurations.
This paper outlines the broad research context and rationale for a new international comparable corpus (ICC). The ICC is to be largely modelled on the text categories and their quantities the International Corpus of English with only a few changes. The corpus will initially begin with nine European languages but others may join in due course. The paper reports on those and other agreements made at the inaugural planning meeting in Prague on 22-23 June 2017. It also sets out the project’s goals for its first two years.
The German Historical Institute Washington (GHI) is in the development phase of German History Digital (GH-D), a transatlantic digital initiative to meet the scholarly needs of historians and their students facing new historiographical and technological challenges. In the proposed paper we will discuss the research goals, methodology, prototyping, and development strategy of GH-D as infrastructure to facilitate transnational historical knowledge co-creation for the large community of researchers and students already relying on digital resources of the GHI and for the growing constituency of citizen scholars.
This chapter begins with a sketch of the specifics of our approach, an overview of the contents of the chapters on word formation and some methodological notes. It then discusses the general characteristics of word formations and of their overall inventory, comparing word formations to primary words. Furthermore, the chapter explores the relative frequencies of word formations in different vocabulary areas and traces the word formation profiles of individual parts of speech. Finally, it compiles the characteristic word formation rules for different parts of speech.
Mit dem "Handbuch der deutschen Sprachminderheiten in Übersee" liegt nun ein komplementärer Band zum "Handbuch der deutschen Sprachminderheiten in Mittel- und Osteuropa" vor. Es bietet einen konzentrierten Überblick über die Situation der deutschsprachigen Minderheiten außerhalb Europas. Acht Länderartikel (USA, Texas, Südamerika, die Mennoniten, Namibia, Südafrika, Australien, ehemalige Kolonialgebiete in der Südsee) liefern ausführliche Informationen über die historischen Entwicklungen der jeweiligen Sprachinseln, über die politische und rechtliche Lage der Minderheiten und ihre demographische Situation. Dabei wird für jedes Land eine Dokumentation der Kompetenz- und Sprachgebrauchssituation, eine Beschreibung und Analyse der soziolinguistischen Situation mit ihren je spezifischen Standard-Substandard-Verteilungen und eine Untersuchung der Spracheinstellungen der Sprecher geboten.
Das Handbuch Europäische Sprachkritik Online liefert eine vergleichende Perspektive auf Sprachkritik in europäischen Sprachkulturen (im Speziellen auf die Sprachkritik im Deutschen, Englischen, Französischen, Italienischen und Kroatischen). In dem Handbuch werden zentrale Konzepte der Sprachkritik deskriptiv behandelt. Das Ziel ist demnach, eine Konzeptgeschichte der europäischen Sprachkritik zu präsentieren. Zum einen liefert das Handbuch einen spezifischen Blick auf die jeweiligen Sprachkulturen. Zum anderen werden diese vergleichend in den Blick genommen. Das multilinguale Handbuch erscheint periodisch in Bänden. Das Handbuch umfasst einzelsprachliche Artikel und sprachübergreifende Vergleichsartikel. Alle Artikel sind in deutscher Sprache zu lesen. Die einzelsprachlichen Artikel, die die Sprachkritik im Englischen, Französischen, Italienischen und Kroatischen beleuchten, sind in der deutschen Sprache und in der Sprache, auf die sich der Artikel bezieht, zu lesen (also in deutscher/englischer, deutscher/französischer, deutscher/italienischer oder deutscher/kroatischer Sprache).
Der folgende Beitrag bietet einen typologischen Überblick über helfende Berufe bzw. helfende Interaktionen. Die helfenden Elemente dieser professionellen Interaktionen - die diskursive Konstitution und Vermittlung von Wissen sowie die emotionale (Unter-)Stützung - realisieren sich in und durch das spezifische Gespräch zwischen der Hilfe suchenden und der Hilfe gebenden Person und werden gleichzeitig durch die besondere Beziehung zwischen den Beteiligten ermöglicht und getragen. Während Beziehungsgestaltung und Generierung sowie Vermittlung von Wissen zur Lösung des Anliegens bzw. des Problems des/der Hilfesuchenden dialogische Kernaufgaben helfender Interaktion sui generis darstellen, können einzelne Typen helfender Interaktion entlang der Beziehungsdimension (mehr oder weniger patienten- bzw. klientenzentriert bzw. mehr oder weniger expertenzentriert) und der Wissensdimension (faktisches Erkenntniswissen vs. subjektives Erfahrungswissen) und der daraus resultierenden Handlungsstrukturen differenziert werden. Im Fokus des Beitrags steht dabei ein generisch-gegenstandsbezogener Überblick bezogen auf die Handlungstypik und die Wissensbezüge relevanter professionell-helfender Interaktionstypen (Beratung, Arzt-Patient-Gespräch, Psychotherapie, Supervision und Coaching), nicht aber ein Überblick über diskursanalytische Forschung zu den verschiedenen Beratungsformaten.
Wiktionary is increasingly gaining influence in a wide variety of linguistic fields such as NLP and lexicography, and has great potential to become a serious competitor for publisher-based and academic dictionaries. However, little is known about the "crowd" that is responsible for the content of Wiktionary. In this article, we want to shed some light on selected questions concerning large-scale cooperative work in online dictionaries. To this end, we use quantitative analyses of the complete edit history files of the English and German Wiktionary language editions. Concerning the distribution of revisions over users, we show that — compared to the overall user base — only very few authors are responsible for the vast majority of revisions in the two Wiktionary editions. In the next step, we compare this distribution to the distribution of revisions over all the articles. The articles are subsequently analysed in terms of rigour and diversity, typical revision patterns through time, and novelty (the time since the last revision). We close with an examination of the relationship between corpus frequencies of headwords in articles, the number of article visits, and the number of revisions made to articles.