Refine
Year of publication
Document Type
- Part of a Book (4496)
- Article (2962)
- Book (995)
- Conference Proceeding (688)
- Part of Periodical (308)
- Review (256)
- Other (151)
- Working Paper (82)
- Doctoral Thesis (68)
- Report (35)
Language
- German (8069)
- English (1764)
- Russian (145)
- French (38)
- Multiple languages (22)
- Spanish (16)
- Portuguese (14)
- Italian (9)
- Polish (7)
- Ukrainian (4)
Keywords
- Deutsch (5135)
- Korpus <Linguistik> (938)
- Wörterbuch (605)
- Konversationsanalyse (450)
- Rezension (422)
- Grammatik (405)
- Rechtschreibung (374)
- Gesprochene Sprache (361)
- Sprachgebrauch (355)
- Interaktion (337)
Publicationstate
- Veröffentlichungsversion (3883)
- Zweitveröffentlichung (1638)
- Postprint (392)
- Preprint (10)
- Erstveröffentlichung (8)
- Ahead of Print (7)
- (Verlags)-Lektorat (4)
- Hybrides Open Access (2)
- Verlags-Lektorat (1)
- Verlagsveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (3829)
- Peer-Review (1592)
- Verlags-Lektorat (94)
- Peer-review (56)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (44)
- Review-Status-unbekannt (14)
- Peer-Revied (12)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (10)
- (Verlags-)Lektorat (9)
- (Verlags-)lektorat (5)
Publisher
- de Gruyter (1332)
- Institut für Deutsche Sprache (1091)
- Schwann (638)
- Narr (484)
- Leibniz-Institut für Deutsche Sprache (IDS) (263)
- De Gruyter (244)
- Niemeyer (200)
- Lang (184)
- Narr Francke Attempto (170)
- IDS-Verlag (144)
ln einer korpuspragmatischen Sicht auf Sprachgebrauch werden sogenannte Sprachgebrauchsmuster, die typisch für bestimmte Sprachausschnitte sind, datengeleitet berechnet. Solche Sprachgebrauchsmuster können z.B. diskursanalytisch gedeutet werden; noch relativ unerforscht ist aber ein konstruktionsgrammatischer Blick auf solche Muster. An zwei Beispielen wird gezeigt, wie mit der Berechnung von typischen n-Grammen (auf der Basis von Wortformen, sowie komplexer auf der Basis von Wortformen und Wortartkategorien) Sprachgebrauchsmuster berechnet werden können: Beim ersten Beispiel werden typische Formulierungsmuster in Leserbriefen, beim zweiten Beispiel aus einem politischen Diskurs (Wulff-Affäre), untersucht. Der Beitrag zielt in der Folge darauf ab, diese Muster dem usage-based-approach der KxG folgend als Konstruktionen zu deuten, die soziopragmatischen Verwendungsbedingungen gehorchen.
KoralQuery 0.3
(2015)
KoralQuery is a general corpus query protocol (i.e. independent of research tasks and corpus formats), serialized in JSON-LD [1]. KoralQuery focuses on simplicity of implementation rather than human readibility and writability. Support for a growing number of query languages is granted by the Koral serialization processor.
In Deutschland leben 7,5 Millionen erwachsene Analphabeten. Daher ist der Bedarf an Materialien zum Erlernen der Schrift gestiegen. Der vorliegende Band ist begleitend für den Rechtschreibunterricht von (vor allem) Erwachsenen gedacht, die Deutsch auf einem (nahezu) muttersprachlichen Niveau beherrschen. Die systemische Beschreibung des Rechtschreibwortschatzes, insbesondere durch seine orthographische Annotation und die Kennzeichnung von Lernstellen, stützt sich größten teils auf die Darstellung der deutschen Orthographie im Rahmencurriculum Schreiben (kurz RCS) des Deutschen Volkshochschulverbandes. Außerdem lehnt sich der vorliegende Wortschatz an Themen an, die sich aus dem alltäglichen Leben ableiten. Lehrende finden in diesem Band gezielt reichlich Material zum Üben im Unterrichtskontext und können bei Bedarf auch neues Übungsmaterial erstellen; sie sollen aber auch zusätzlich vermitteln, dass sie selbst als Experten von Fall zu Fall in Wörterlisten nachschlagen müssen. Für den Lerner soll der Rechtschreibwortschatz dazu beitragen, die Eigeninitiative zu fördern und zu selbständigem praktischen Üben ermutigen.
Das Buch untersucht usuelle Wortverbindungen als kommunikative Einheiten und Muster. Es zeigt, wie ihre pragma-semantischen Restriktionen auf verschiedenen Schematisierungsstufen in sehr großen Korpora zu beschreiben sind. Hierzu werden Korpusmethoden für die Erfassung syntagmatischer Strukturen linguistisch reflektiert und als integratives Analysemodell angewendet. Die Ergebnisse liefern sowohl einen Beitrag zu einer musterbasierten Phrasemtheorie und Phraseografie als auch zu einer qualitativen Korpuslinguistik auf der Basis quantitativer Verfahren. Neue Einsichten erbringt die Abhandlung darüber hinaus zu Festigkeit und Varianz von Chunks und Konstruktionen der geschriebenen Sprache.
Dieser Beitrag thematisiert Besonderheiten der sprachlichen Kommunikation im Alter. Zunächst werden allgemeine Charakteristika der Altersidentität skizziert, in der Komponenten wie Sozialität und Partner- bzw. Personenorientierung eine besondere Rolle spielen. Anschließend werden Merkmale des Diskurses erörtert, in dem Altersidentität ausgebildet und fortentwickelt wird Vor allem die Ambivalenz zwischen dem Festhalten an der Erwachsenenidentität und dem Akzeptieren von Abweichungen davon ist für diesen Diskurs konstitutiv. Anhand exemplarischer Gesprächsausschnitte wird sodann aufgezeigt, in welcher Weise sich die für das Alter typischen Identitätskomponenten sowie die Orientierung an den Normalitätsstandards der mittleren Generation im kommunikativen Geschehen manifestieren.
Operator-Skopus-Strukturen
(1999)
Duden - Das Aussprachewörterbuch: [Aussprache und Betonung von über 132 000 Wörtern und Namen]
(2015)
Speakers’ linguistic experience is for the most part experience with language as used in conversational interaction. Though highly relevant for usage-based linguistics, the study of such data is as yet often left to other frameworks such as conversation analysis and interactional linguistics (Couper-Kuhlen and Selting 2001). On the basis of a case study of salient usage patterns of the two German motion verbs kommen and gehen in spontaneous conversation, the present paper argues for a methodological integration of quantitative corpus-linguistic methods with qualitative conversation analytic approaches to further the usage-based study of conversational interaction.
This article reports about the on-going work on a new version of the metadata framework Component Metadata Infrastructure (CMDI), central to the CLARIN infrastructure. Version 1.2 introduces a number of important changes based on the experience gathered in the last five years of intensive use of CMDI by the digital humanities community, addressing problems encountered, but also introducing new functionality. Next to the consolidation of the structure of the model and schema sanity, new means for lifecycle management have been introduced aimed at combatting the observed proliferation of components, new mechanism for use of external vocabularies will contribute to more consistent use of controlled values and cues for tools will allow improved presentation of the metadata records to the human users. The feature set has been frozen and approved, and the infrastructure is now entering a transition phase, in which all the tools and data need to be migrated to the new version.
Bilingual Kindergarten programmes. The interaction of language management and language attitudes
(2015)
We analyze the linguistic evolution of selected scientific disciplines over a 30-year time span (1970s to 2000s). Our focus is on four highly specialized disciplines at the boundaries of computer science that emerged during that time: computational linguistics, bioinformatics, digital construction, and microelectronics. Our analysis is driven by the question whether these disciplines develop a distinctive language use—both individually and collectively—over the given time period. The data set is the English Scientific Text Corpus (scitex), which includes texts from the 1970s/1980s and early 2000s. Our theoretical basis is register theory. In terms of methods, we combine corpus-based methods of feature extraction (various aggregated features [part-of-speech based], n-grams, lexico-grammatical patterns) and automatic text classification. The results of our research are directly relevant to the study of linguistic variation and languages for specific purposes (LSP) and have implications for various natural language processing (NLP) tasks, for example, authorship attribution, text mining, or training NLP tools.
Recently, a claim was made, on the basis of the German Google Books 1-gram corpus (Michel et al., Quantitative Analysis of Culture Using Millions of Digitized Books. Science 2010; 331: 176–82), that there was a linear relationship between six non-technical non-Nazi words and three ‘explicitly Nazi words’ in times of World War II (Caruana-Galizia. 2015. Politics and the German language: Testing Orwell’s hypothesis using the Google N-Gram corpus. Digital Scholarship in the Humanities [Online]. http://dsh.oxfordjournals.org/cgi/doi/10.1093/llc/fqv011 (accessed 15 April 2015)). Here, I try to show that apparent relationships like this are the result of misspecified models that do not take into account the temporal aspect of time-series data. The main point of this article is to demonstrate why such analyses run the risk of incorrect statistical inference, where potential effects are both meaningless and can potentially lead to wrong conclusions.
Using the Google Ngram Corpora for six different languages (including two varieties of English), a large-scale time series analysis is conducted. It is demonstrated that diachronic changes of the parameters of the Zipf–Mandelbrot law (and the parameter of the Zipf law, all estimated by maximum likelihood) can be used to quantify and visualize important aspects of linguistic change (as represented in the Google Ngram Corpora). The analysis also reveals that there are important cross-linguistic differences. It is argued that the Zipf–Mandelbrot parameters can be used as a first indicator of diachronic linguistic change, but more thorough analyses should make use of the full spectrum of different lexical, syntactical and stylometric measures to fully understand the factors that actually drive those changes.
In dem Beitrag wird der Frage nachgegangen, inwiefern die Frequenz eines Wortes mit seiner orthographischen Richtigschreibung zusammenhangt. Werden häufige Wörter öfter und früher richtig geschrieben? Und welche Rolle spielt dabei die orthographische Regelhaftigkeit der Wortstrukturen? Unter Zuhilfenahme maschineller Analyseverfahren aus der Großstudie "Automatisierte Rechtschreibdiagnostik" (Fay/Berkling/Stüker 2012) werden diesbezuglich über 1000 Schülertexte von Klasse 2 bis 8 untersucht. Im Ergebnis werden zum einen einige Annahmen, die bislang vor allem auf Erfahrungswerten aus der sprachdidaktischen Arbeit fußten, empirisch bestätigt, zum anderen werden sie hinsichtlich spezifischer Rechtschreibphänomene differenziert und erweitert.
Some structures in printed dictionaries also occur in online dictionaries, some do not occur, some need to be adapted whereas new structures may be introduced in online dictionaries. This paper looks at one type of structure, known in printed dictionaries as outer texts. It is argued that the notions of a frame structure and front and back matter texts do not apply to online dictionaries. The data distribution in online dictionaries does not only target the dictionary articles. There are components outside the word list section of the dictionary. These components are not always texts. They could e.g. also be video clips. Consequently the notion of outer texts in printed dictionaries is substituted by the notion of outer features in online dictionaries. This paper shows how outer features help to constitute a feature compound. The outer features in eight online dictionaries are discussed. Where the users guidelines text is a compulsory outer text in printed dictionaries it seems that an equivalent feature is often eschewed in online dictionaries. A distinction is made between dictionary-internal and dictionary-external outer features, illustrating that outer features can be situated in other sources than the specific dictionary. More research is needed to formulate models for online features that can play a comprehensive role in online dictionaries.
In this contribution, we present a novel approach for the analysis of cross-reference structures in digital dictionaries on the basis of the complete dictionary database. Using paradigmatic items in the German Wiktionary as an example, we show how analyses based on graph theory can be fruitfully applied in this context, e. g. to gain an overview of paradigmatic references as a whole or to detect closely connected groups of headwords. Furthermore, we connect information about cross-reference structures with corpus frequencies and log file statistics. In this way, we can answer questions such as the following ones: Are frequent words paradigmatically linked more closely than others? Are closely linked headwords or headwords that stand more solitary in the dictionary visited significantly more often?
Satzpräposition
(2014)
Erweiterungsnomen
(2013)
Bezugsnomen
(2014)
Adnominal
(2013)
Self-Regulated Learning (SRL) is a term that can be used to describe an individual’s ability to develop a skill set allowing him or her to learn in a number of different ways. SRL can also relate to new pedagogical theories that encourage teachers in formal education to motivate and support their students into achieving a high level of self-regulation. This paper reports on the findings of a number of surveys conducted with a wide variety of teachers in different countries, regarding their perceptions of SRL. The results and analysis of these surveys help inform not only the perceptions of SRL amongst teachers but also examine the challenges and opportunities that arise from taking this approach.
Das Wörterbuch "Neuer Wortschatz" präsentiert den deutschen Wortschatz, der zwischen 2001 und 2010 aufgekommen und in die Allgemeinsprache eingegangen ist. Lexikografisch umfassend beschrieben sind mehr als 570 neue Wörter (z.B. Umweltzone, twittern), neue feste Wortverbindungen (z.B. grünes Rezept, etwas ist kein Ponyhof) und neue Bedeutungen etablierter Wörter (z.B. Heuschrecke 'Finanzinvestor', Stolperstein 'Gedenkstein'). Zu den aus herkömmlichen Wörterbüchern bekannten Angaben z.B. zur Aussprache, Grammatik, Bedeutung treten neue, z.B. zur Wortbildung, zu Enzyklopädischem, die den erhöhten Informationsbedarf in Bezug auf neuen Wortschatz befriedigen helfen. Zusätzlich finden sich neologismusspezifische Angaben zu Aufkommen und Ausbreitung im Erfassungszeitraum - unter Einbeziehung von Zeitverlaufsgrafiken - sowie zur Erstbuchung in einschlägigen Wörterbüchern.
Das Wörterbuch "Neuer Wortschatz" präsentiert den deutschen Wortschatz, der zwischen 2001 und 2010 aufgekommen und in die Allgemeinsprache eingegangen ist. Lexikografisch umfassend beschrieben sind mehr als 570 neue Wörter (z.B. Umweltzone, twittern), neue feste Wortverbindungen (z.B. grünes Rezept, etwas ist kein Ponyhof) und neue Bedeutungen etablierter Wörter (z.B. Heuschrecke 'Finanzinvestor', Stolperstein 'Gedenkstein'). Zu den aus herkömmlichen Wörterbüchern bekannten Angaben z.B. zur Aussprache, Grammatik, Bedeutung treten neue, z.B. zur Wortbildung, zu Enzyklopädischem, die den erhöhten Informationsbedarf in Bezug auf neuen Wortschatz befriedigen helfen. Zusätzlich finden sich neologismusspezifische Angaben zu Aufkommen und Ausbreitung im Erfassungszeitraum - unter Einbeziehung von Zeitverlaufsgrafiken - sowie zur Erstbuchung in einschlägigen Wörterbüchern.
Rassmatrivajutsja novye frazeologizmy nemeckogo jazyka i aspekty ich leksikografičeskogo opisanija v „Nemecko-russkom slovare neologizmov“. Obščaja dolja novych frazeologizmov ot obščego količestva neologizmov nemeckogo jazyka v period s 1991 po 2012 gody sostavljaet okolo šesti procentov. K kategorii frazeologizmov v slovare otnosjatsja ustojčivye sočetanija slov raznoj struktury i stepeni idiomatičnosti. Naibolee mnogočislenny frazeologizmy – imennye gruppy, za nimi sledujut glagol’nye gruppy i frazeologizmy-predloženija. Vyjavljajutsja i opisyvajutsja strukturnye i semantičeskie osobennosti frazeologizmov raznych frazovych kategorij. Osveščajutsja osobennosti podači frazeologizmov v slovnike i tipy leksikografičeskoj informacii v strukture slovarnoj stat’i, učityvajuščie specifiku frazeologičeskich neologizmov kak edinic leksikografičeskogo opisanija.
Abtönung
(2015)
Abstufung
(2015)
Wir können auch Hochdeutsch – Das Institut für Deutsche Sprache in Mannheim – ein Ort der Ideen
(2015)
Der vorliegende Beitrag erkundet den Zusammenhang zwischen der Komplexität politischer Argumentationsprozesse und der Diversifikation der Semantik von Schlüsselwörtern, deren Bedeutung im Argumentationsprozess umkämpft und in zahlreichen Facetten entfaltet widAdegenstand der Untersuchung ist die Verwendung von „Ökologie" in den Schlichtungsgesprächen zum Bahnprojekt Stuttgart 21. Im Unterscheid zu bisher vorliegenden Analysen zu semantischen Kämpfen geht es weniger darum, wie ein Ausdruck von einer Partei im Gegensatz zu anderen semantisiert wird. Es wird vielmehr gezeigt, wie semantische Diversifizierung und Ambiguität von „Ökologie" im expertischen Argumentationsprozess entstehen und welche kommunikativen Effekte dies für die Möglichkeit der Bürgerbeteiligung mit sich bringt. Es werden drei Praktiken identifiziert, mit denen die Interaktionsteilnehmer selbst auf semantische Diversifizierung und Ambiguität reagieren und versuchen, den Ausdruck eindeutig interpretierbar und die Quaestio entscheidbar zu machen: Strategieunterstellungen, Popularisierungen und Populismus. Die Interaktionsanalysen zeigen dabei, dass diese Praktiken selbst die Problematik, die sie lösen sollen, reproduzieren.
Wo ein Wille ist, ist auch ein Weg - das erste größere Neologismenwörterbuch für das Deutsche
(2011)
Genitivobjekt
(2014)
Usenet is a large online resource containing user-generated messages (news articles) organised in discussion groups (newsgroups) which deal with a wide variety of different topics. We describe the download, conversion, and annotation of a comprehensive German news corpus for integration in DeReKo, the German Reference Corpus hosted at the Institut für Deutsche Sprache in Mannheim.
This paper discusses computational linguistic methods for the semi-automatic analysis of modality interdependencies (the combination of complex resources such as speaking, writing, and visualizing; MID) in professional crosssituational interaction settings. The overall purpose of the approach is to develop models, methods, and a framework for the description and analysis of MID forms and functions. The paper describes work in progress—the development of an annotation framework that allows annotating different data and file formats at various levels, to relate annotation levels and entries independently of the given file format, and to visualize patterns.
Natural language Processing tools are mostly developed for and optimized on newspaper texts, and often Show a substantial performance drop when applied to other types of texts such as Twitter feeds, Chat data or Internet forum posts. We explore a range of easy-to-implement methods of adapting existing part-of-speech taggers to improve their performance on Internet texts. Our results show that these methods can improve tagger performance substantially.
Durch linguistische Textvergleiche soll vorrangig die Frage beantwortet werden, ob zwei oder mehrere Texte den gleichen Autor und/oder Schreiber haben. Dabei suggeriert der in diesem Zusammenhang auch verwendete Titel „linguistischer Fingerab-druck“, daß dabei ein den naturwissenschaftlichen Verfahren vergleichbarer Sicherheitsgrad erreicht werden könnte. Die Autorin, wissenschaftliche Mitarbeiterin in der Abteilung „Historische Lexikologie und Lexikographie“ am Institut für deutsche Sprache in Mannheim, erläutert, was von sprachlichen Textvergleichen kriminalistisch/forensisch tatsächlich erwartet werden darf.
Gesprochene Sprache
(2005)
Das vorliegende Handbuch vermittelt einige ausgewählte Untersuchungsperspektiven auf die Phänomene Wort und Wortschatz. Die einzelnen Beiträge ordnen die Gegenstände in einen jeweils spezifischen Zusammenhang ein und fokussieren dabei auf sprachliche Kontexte, interdisziplinäre Zusammenhänge, methodische Herangehensweisen unter dem Blickwinkel der linguistischen Theorie oder der angewandten Linguistik. Das Konzept des Wortes und des Wortschatzes erhält daher in jedem Beitrag eine eigene Bedeutung und Funktion. In Summe kommt dadurch ein komplexes Verständnis von Wort und Wortschatz zum Ausdruck, das Vielfalt und Interdisziplinarität statt Einschränkung und singuläre Ausrichtung zulässt.
Learning from Errors. Systematic Analysis of Complex Writing Errors for Improving Writing Technology
(2015)
In this paper, we describe ongoing research on writing errors with the ultimate goal to develop error-preventing editing functions in word-processors. Drawing from the state-of-the-art research in errors carried out in various fields, we propose the application of a general concept for action-slips as introduced by Norman. We demonstrate the feasibility of this approach by using a large corpus of writing errors in published texts. The concept of slips considers both the process and the product: some failure in a procedure results in an error in the product, i.e., is visible in the written text. In order to develop preventing functions, we need to determine causes of such visible errors.
h ach KOMM; hör AUF mit dem klEInkram. Die Partikel komm zwischen Interjektion und Diskursmarker
(2014)
Der vorliegende Beitrag beschreibt das Formen-, Funktions- und Bedeutungsspek-trum der Partikel komm im gesprochenen Deutsch. Die Untersuchung zeigt, dass sich alle Verwendungen auf eine gemeinsame Grundfunktion zurückführen lassen, die als 'Aufforderung zum Aktivitätswechsel mit Appell an den common ground' bezeichnet wird. Es wird gezeigt, dass sich weitere, in der Literatur häufig der Partikel selbst zugeschriebene Bedeutungsbestandteile aus dem syntaktischen und sequenziellen Kontext ergeben. Verschiedene Kontexte lassen verschiedene Aspekte des Aktivitätswechsels salient erscheinen, so dass die Aufforderung ent-weder den Beginn einer neuen Handlung oder das Beenden einer vorausgehenden Aktivität fokussiert. Außerdem wird diskutiert, welcher Subklasse der Diskurspartikeln sich komm zuordnen lässt. Es zeigt sich, dass sowohl Merkmale von Dis-kursmarkern als auch von Interjektionen vorliegen, dass die Partikel aber auch von den prototypischen Vertretern beider Kategorien abweichende Merkmale zeigt, so dass vorgeschlagen wird, auf eine Klassifikation unterhalb der Ebene der Diskurspartikel zu verzichten, solange nicht weitere von Imperativen abgeleitete Partikeln (z.B. warte, sag mal) empirisch untersucht sind, mit denen komm möglicherweise eine eigene Subklasse bildet.
The present paper provides a new approach to the form-function relation in Latin declension. First, inflections are discussed from a functional point of view with special consideration to questions of syncretism. A case hierarchy is justified for Latin that conforms to general observations on case systems. The analysis leads to a markedness scale that provides a ranking of case-number-combinations from unmarked to most marked. Systematic syncretism always applies to contiguous sections of the case-number-scale (‘syncretism fields’). Second, inflections are analysed from a formal point of view taking into account partial identities and differences among noun endings. Theme vowels being factored out, endings are classified on the basis of their make-up, e.g., as sigmatic endings; as containing desinential (non-thematic) vowels; as containing long vowels; and so on. The analysis leads to a view of endings as involving more basic elements or ‘markers’. Endings of the various declensions instantiate a small number of types, and these can be put into a ranked order (a formal scale) that applies transparadigmatically. Third, the relationship between the independently substantiated functional and formal hierarchies is examined. In any declension, the form-function-relationship is established by aligning the relevant formal and functional scales (or ‘sequences’). Some types of endings are in one-to-one correspondence with bundles of morphosyntactic properties as they should be according to a classical morphemic approach, but others are not. Nevertheless, endings can be assigned a uniform role if the form-function-relationship is understood to be based on an alignment of formal and functional sequences. A diagrammatical form-function relationship is revealed that could not be captured in classical or refined morphemic approaches.
Vorwort / Preface
(2011)
Deklinationsklassen bilden einen Grundpfeiler des traditionellen Paradigmenmodells, das nach dem Vorbild der Grammatiken der klassischen Sprachen auch für die Beschreibung der deutschen Substantivflexion Verwendung gefunden hat. Im vorliegenden Beitrag soll die Rolle, die Deklinationsklassen in der deutschen Substantivdeklination spielen, überprüft werden. Beobachtungen zur Substantivflexion in verschiedenen europäischen Sprachen, darunter das Ungarische, das Polnische und das Italienische, die unterschiedliche Positionen innerhalb eines Spektrums besetzen, das vom hochflexivischen Lateinischen bis zu Sprachen ohne Deklinationsklassen (wie dem Englischen oder dem Türkischen) reicht, liefern Bausteine für eine Neuanalyse der deutschen Substantivflexion. Sichtbar wird, dass die deutsche Substantivflexion, bildlich gesprochen, auf dem Weg vom „Typus Latein“ zum „Typus Englisch“ schon sehr viel weiter fortgeschritten ist, als dies traditionelle Darstellungen nahe legen. An die Stelle der für kanonische Deklinationsklassen charakteristischen Sätze von klassentypischen Flexiven ist eine kleine Menge von Mustern der Stammformenbildung getreten.
The multiple gradations of German strong verbs are but manifestations of a rather uncomplicated system. There is a small number of ways to make up ablaut forms; these types of formation are identifiable in formal terms and, what is more, they have definite functions as morphological markers. Using classifications of stem forms according to quality, complexity and quantity of vowels, three types of operations involved in ablaut formation are identified. Ablaut always includes a change of quality type or a change of complexity type, and in addition it may include a change of quantity type. Ablaut forms are clearly distinguished as against bases (and against each other): their vocalism meets a defined standard of dissimilarity. On this basis, gradations are collected into inflectional classes that are defined in strictly synchronic terms. These classes continue the historical seven classes known from reference grammars. For the majority of strong verbs, membership in these classes (and thus ablaut) is predictable.
Lexical chaining has become an important part of many NLP tasks. However, the goodness of a chaining process and hence its annotation output depends on the quality of the chaining resource. Therefore, a framework for chaining is needed which integrates divergent resources in order to balance their deficits and to compare their strengths and weaknesses. In this paper we present an application that incorporates the framework of a meta model of lexical chaining exemplified on three resources and its generalized exchange format.
Der Beitrag befaßt sich mit inszenierten Gesprächen im Fernsehen und fragt, wie der Bezug zwischen Sendungskonzepten und Realisierungsformen dieser Gespräche zu beschreiben ist. Ihre „Inszenierung” schafft einen Rahmen zur Kontextualisierung von Kommunikationsereignissen und Interpretationen. Für Streitgespräche zur medialen Präsentation von Konfliktpositionen gilt das Ideal der „Streitkultur”: Sie sollen reale gesellschaftliche Konflikte in geregelter Form kommunikativ abbilden, Möglichkeiten der Problemlösung aufzeigen und Mittel zur Konfliktreduzierung bereitstellen. „Boulevardisierung” findet dabei statt durch Personalisierung von Konflikten, Präsentation von Sensationen, Beschränkung auf Kleinformate und Sachverhaltsdarstellung, Appelle an stereotype Bewertungsmuster und kalkulierte Verstöße gegen Normalformen von Alltagsgesprächen.
Relationale Adjektive, also Adjektive, die aus Substantiven abgeleitet werden und die in attributiver Konstruktion mit einem Kopfsubstantiv eine unspezifische Relation zwischen dem Begriff des Kopfs und dem Begriff der Basis ausdrücken, spielen in den klassischen Sprachen eine bedeutende Rolle. Ausgehend von der silvestris musa, der Waldmuse des Vergil, wird in dem vorliegenden Beitrag den Nachwirkungen dieses Musters in europäischen Sprachen, dem Französischen, Englischen, vor allem aber im Deutschen nachgegangen. Die semantische Funktion solcher Adjektive wird der funktionalen Domäne ‚klassifikatorische Modifikation‘ zugeordnet. Sprachübergreifende Gemeinsamkeiten und Unterschiede werden herausgearbeitet. In knapper Form werden auch relationale Adjektive im Polnischen und Ungarischen, den weiteren Vergleichssprachen des Projekts „Grammatik des Deutschen im europäischen Vergleich“, einbezogen. Die Frage nach dem Verhältnis von universalen, sprachfamiliären, arealen und sprachspezifischen Eigenschaften des Konstruktionsmusters sowie nach dem Grad des lateinischen Einflusses wird auf diesem Hintergrund präziser formulierbar.
Der Umgang mit Gesprächskorpora am IDS Mannheim: Die Recherche in der COSMAS-II-Gesprächsdatenbank
(2005)
Anakoluthe dependenziell
(2008)
Das einfache, E-Mail-basierte Format der Mailingliste hat sich für professionelle Internet-Kommunikation in einem mittlerweile vielfältigen Web-Angebot aus mehreren Gründen bewährt: gezielte Versorgung mit fachspezifischen Informationen, Kompensation von Orientierungsproblemen für Neulinge, Distribution von vorläufigem, noch nicht abgesichertem Wissen, Selbstverständnis als Selbsthilfegruppe oder kritische Gegenöffentlichkeit für randständige Themen und Positionen. In Mailinglisten finden sich drei Diskursformate: monologisch, einfach dialogisch und „dicht" dialogisch bzw. interaktiv. Dialogizität und Interaktion werden in der Listenkommunikation nicht nur durch die Bildung von „Threads" konstituiert, sondern auch in der lokalen Formulierungsarbeit, etwa durch adressatengerechte Ansprache, Thematisierung der Rezeptionsbedingungen, Selbst- und Fremdkategorisierung, Reformulierungen und andere Kohärenzverfahren.
Einleitung
(2002)
The task-oriented and format-driven development of corpus query systems has led to the creation of numerous corpus query languages (QLs) that vary strongly in expressiveness and syntax. This is a severe impediment for the interoperability of corpus analysis systems, which lack a common protocol. In this paper, we present KoralQuery, a JSON-LD based general corpus query protocol, aiming to be independent of particular QLs, tasks and corpus formats. In addition to describing the system of types and operations that Koral- Query is built on, we exemplify the representation of corpus queries in the serialized format and illustrate use cases in the KorAP project.
The development of tools for computer-assisted transcription and analysis of extensive speech corpora is one main issue at the Institute of German Language (IDS) and the Institute of Natural Language Processing (IMS). Corpora of natural spoken dialogue have been transcribed, and the analogue recordings of these discourses are digitized. An automatic segmentation system is employed which is based on Hidden Markov Models. The orthographic representation of the speech signal is transformed into a phonetic representation, the phonetic transcription is transformed into a system-internal representation, and the time alignment between text and speech signal follows. In this article, we also describe the retrieval software Cosmas II and its special features for searching discourse transcripts and playing time aligned passages.
GAIS – GesprächsAnalytisches InformationsSystem. Ein hypermediales Lernsystem zur Gesprächsforschung
(2002)
Der vorliegende Beitrag stellt das vom BMBF geförderte Projekt GAIS (GesprächsAnalytisches InformationsSystem) vor, welches am Institut für Deutsche Sprache (IDS) entwickelt wird. GAIS ist ein hypermediales und didaktisch aufbereitetes Lernsystem zur Gesprächsanalyse für Einsteiger und Experten. Durch die unterschiedlichen Schwierigkeitsgrade ist es sowohl für Lehrende als auch für Lernende konzipiert. GAIS bietet eine Plattform, die Theorie, Praxis, Beispiele, Links, Anwendungen und Literatur zur Gesprächsforschung bündelt. Nutzer können diese Informationen rezipieren, ihre Kenntnisse überprüfen und mit technischen Werkzeugen eigene Analysen erstellen.
Wie kann man über Gefühle sprechen? Sprachliche Mittel zur Thematisierung von Erleben und Emotionen
(2011)
In literate societies linguistic competence includes speaking as well as writing. Talking and writing are rather different activities, therefore one should expect that in foreign language teaching (and especially in german-as-foreign-language teaching) both parts are included in equal proportions. However, the practise of teaching shows that written language is dominant and spoken language lives a shadow existence (section 1). In the following I will give five reasons as to why spoken language stands in the background and why it is such a bulky and clumsy subject (section 2). After which I will characterise two points of view one can take in regards to the magnitude of the differences between spoken and written language (section 3) and I will describe some of the central differences (section 4). Finally, 1 will formulate some consequences of this study for foreign language teaching, and I will argue that the difficulties connected with spoken language should be confronted, as in my opinion spoken language is an indispensable part of foreign language teaching (section 5).
In meinem Beitrag benenne ich fünf Gründe, warum die gesprochene Sprache im DaF-Unterricht, aber auch generell in der Sprachwissenschaft im Hintergrund steht und ein sperriger, schwer zu handhabender Gegenstand ist (Abschnitt 2). Sodann charakterisiere ich zwei unterschiedliche Positionen zum Ausmaß der Unterschiede zwischen gesprochener und geschriebener Sprache und beschreibe einige zentrale Unterschiede (Abschnitt 3). Abschließend formuliere ich einige Konsequenzen, die sich hieraus für den Fremdsprachen- und DaF-Unterricht ergeben, und plädiere dafür, sich die Schwierigkeiten, die mit einer Berücksichtigung der gesprochenen Sprache verbunden sind, bewusst zu machen und sich ihnen zu stellen, denn gesprochene Sprache ist meines Erachtens ein unverzichtbarer Bestandteil des fremdsprachlichen Unterrichts (Abschnitt 4).
Vorwort
(2015)
Electronic corpora play an ever growing role in lexicography. On the one hand, new access to linguistic usage is made possible through the use of text corpora and intelligent corpus-based query tools; however, the final results are still interpreted and described by lexicographers. In this case corpora are used for data acquisition. On the other hand, there are also projects that provide purely automatically acquired data in the form of "dictionaries". Lexicographers play only a minor role here. This latter type of corpus use creates a completely new kind of electronic dictionary. This article addresses the questions as to what extent these dictionaries differ from lexicographic tradition and whether they must be considered in metalexicography. Starting from previously compiled electronic dictionary typologies, we try to supplement the formulation of lexicographic data as a distinguishing feature. Finally, based on the findings of the project elexiko (Institute for the German Language - IDS), we demonstrate that the distinction between electronic versus man-made lexicographic data is also relevant to lexicographical practice.
CONTRIBUTIONS TO THE STUDY OF GERMAN USAGE A CORPUS-BASED APPROACH
This paper outlines some basic assumptions and principles underlying the corpus linguistics research and some application domains at the Institute for German Language in Mannheim. We briefly address three complementary but closely related tasks: first, the acquisition of very large corpora, second, the research on statistical methods for automatically extracting information about associations between word configurations, and, third, meeting the challenge of understanding the explanatory power of such methods both in theoretical linguistics and in other fields such as second language acquisition or lexicography. We argue that a systematic statistical analysis of huge bodies of text can reveal substantial insights into the language usage und change, far beyond just collocational patterning.
The development of user-adapted views of lexicographic data is frequently in demand by dictionary research on electronic reference works and hypertext information systems. In the printed dictionary it has been indispensable to develop a complete dictionary relative to a user group and using situations. In contrast, for any electronic presentation of lexicographic data there are possibilities to define user-specific views of an initially user-unspecific resource. However, research on the use of dictionaries in general, still has to answer several open questions as far as this subject is concerned. This paper will firstly provide an overview of the present state of research on dictionary use with respect to electronic lexicography. Subsequently, explanations of further prerequisites for a possible user-adapted access to data are followed, as exemplified by OWID, the Online Vocabulary Information System of the Institut für Deutsche Sprache. Finally, it will be outlined what results on the subject have been accomplished so far. Also the prospects of potential user-adapted presentations of lexicographic data will be highlighted.