Refine
Year of publication
- 2015 (318) (remove)
Document Type
- Part of a Book (137)
- Article (77)
- Conference Proceeding (39)
- Book (37)
- Part of Periodical (10)
- Working Paper (8)
- Other (7)
- Master's Thesis (1)
- Preprint (1)
- Review (1)
Keywords
- Deutsch (116)
- Korpus <Linguistik> (52)
- Verb (21)
- Gesprochene Sprache (16)
- Interaktion (14)
- Wörterbuch (14)
- Computerlinguistik (13)
- Computerunterstützte Lexikographie (13)
- Englisch (13)
- Annotation (12)
Publicationstate
- Veröffentlichungsversion (141)
- Zweitveröffentlichung (20)
- Postprint (13)
- Preprint (2)
- Erstveröffentlichung (1)
Reviewstate
Publisher
- Institut für Deutsche Sprache (50)
- De Gruyter (32)
- de Gruyter (25)
- Lang (12)
- Narr Francke Attempto (11)
- Narr (10)
- Springer (7)
- Winter (7)
- Frank & Timme (4)
- IDS (4)
The availability of electronic corpora of historical stages of languages has been wel- comed as possibly attenuating the inherent problem of diachronic linguistics, i.e. that we only have access to what has chanced to come down to us - the problem which was memorably named by Labov (1992) as one of “Bad Data”. However, such corpora can only give us access to an increased amount ot historical material and this can essentially still only be a partial and possibly distorted picture of the actual language at a particular period of history. Corpora can be improved by taking a more representative sample of extant texts if these are available (as they are in significant number for periods after the invention of printing). But, as examples from the recently compiled GerManC corpus of seventeenth and eighteenth century German show, the evidence from such corpora can still fail to yield definitive answers to our questions about earlier stages of a language. The data still require expert interpretation, and it is important to be realistic about what can legitimately be expected from an electronic historical corpus.
Cet article se penche sur un épisode radiophonique durant lequel deux animateurs effectuent un coming out hétérosexuel à l’occasion de la journée internationale du coming out (11 octobre). Dans une perspective issue de l’analyse conversationnelle d’inspiration ethnométhodologique, il étudie une collection d’occurrences de coming out, permettant non seulement d’identifier un format séquentiel récurrent et la manière dont il contribue à l’efficacité de la pratique, mais aussi de réfléchir à la façon dont il peut être utilisé dans différents contextes sociaux, notamment médiatisés et médiatiques. En particulier, l’article montre comment la pratique est au service d’une émission radiophonique sur le coming out et prépare la transition vers le traitement de l’homosexualité à la radio. Grâce à un enregistrement vidéo du travail des animateurs dans le studio de radio, l’article décrit la façon dont le thème de la journée internationale du coming out est fabriqué et orchestré dans les coulisses de la radio et sur les ondes. Ce faisant, il montre la contribution d’une analyse conversationnelle à l’approche du coming out dans les études de genre – où la pratique est largement discutée mais sans être analysée sur la base d’occurrences documentées. L’article revient ainsi sur l’épistémologie du closet chère à Eve Sedgwick, en proposant une anatomie du coming out en contexte médiatisé, qui en éclaire les enjeux non seulement épistémiques mais aussi de normativisation, publicisation et spectacularisation.
Ziel des vorliegenden Beitrags ist es, auszuloten, wie Sprechen und Handeln, das wir aus dem Alltag kennen, einzuschätzen ist, wenn es im Fernsehen und vor allem im so genannten Reality-TV erscheint. Einen guten Einstieg, diese Problemstellung zu illustrieren, bieten Pannen, wie man sie etwa aus Nachrichtensendungen wie der Tagesschau kennt.
In diesem Aufsatz werden Positionierungsverfahren analysiert, welche die Macher einer Talkshow einsetzen, um ihre Gäste den Fernsehzuschauern als relevante Gesprächspartner für das Thema „Steuerhinterziehung durch Prominente” zu präsentieren. Es wird untersucht, wie es den Machern der Talkshow gelingt, die Gäste bereits bei der Erstvorstellung durch das Zusammenspiel einer Stimme aus dem Off und der Kameraführung als „prototypische Vertreter” zu präsentieren und zueinander zu positionieren. Von den insgesamt fünf Teilnehmern der Talkshow werden zwei dieser Erstvorstellungen detailliert analysiert. Es handelt sich um die Präsentation zweier Gäste, die in einer deutlich antagonistischen Beziehung zueinander stehen. Diese Gäste werden unmittelbar hintereinander vorgestellt. Auf der Grundlage aller fünf Gastpräsentationen, die wir detailliert rekonstruiert haben, jedoch aus Platzgründen hier leider nicht ebenfalls präsentieren können, wird ein strukturiertes Positionierungsgeflecht deutlich. Dieses Geflecht weist im Zentrum die von uns rekonstruierte thematische und personelle „Gegnerschaft“ auf. In der Peripherie sind dann insgesamt vier Vertreter relevanter gesellschaftlicher Positionen zum Thema der Talkshow beigeordnet. Dabei handelt es sich um Vertreter der Rechtsprechung, der Politik, der Alltagsmoral und der Psychologie und Theologie. Die Analysen werden in theoretischer Hinsicht auf der Grundlage multimodaler Vorstellungen zur Positionierung und zum Recipient Design durchgeführt. In methodisch-methodologischer Perspektive orientiert sich die Analyse an der multimodalen Interaktionsanalyse.
Zur Ko-Konstruktion einer amüsanten Unterbrechung während einer argumentativen Auseinandersetzung
(2015)
Der Beitrag soll Anregungen geben, wie zwei verschiedene Forschungsstränge zusammengeführt werden könnten, die in der deutschen und französischen germanistischen Linguistik intensiv verfolgt werden. Es handelt sich dabei um die Forschung zu so genannten „Ellipsen“ und die Forschung zur Informations - Struktur bzw. Thema-Rhema-Struktur. Ausgehend von einem Ausschnitt aus einem literarischen Text wird eine kleine Typologie für Sequenzellipsen und ,selbstständige Text-KM‘, wie ich sie im Anschluss an die IDS-Grammatik nennen möchte, vorgestellt. Bei der informationsstrukturellen Analyse wird neben der thematischen Struktur auch der Informationsstatus herangezogen, sodass ein vergleichsweise komplexes Bild der Dynamik im Text nachgezeichnet werden kann. Am Beispiel zweigliedriger .interner Prädikationen wird gezeigt, dass sich hinter der Oberfläche der zwei möglichen Typen der Linearisierung mehrere Strategien der Informationsstrukturierung verbergen. Es bietet sich an, bei deren Beschreibung aus heuristischen Gründen nach dem Modell der Linearstruktur des Verbalsatzes zu verfahren.
Gegenstand des Beitrags sind Phraseologismen, die seit den 1990er-Jahren in den deutschen Wortschatz eingegangen sind und im Neoglogismenwörterbuch (www.owid.de) präsentiert werden. Dargestellt werden u.a. Funktionen von Phraseologismen wie Schließung von Benennungslücken und Ausdrucksverstärkung. Entstehungsprozesse wie Metaphorisierung und elliptische Kürzung, Wortbildungsprozesse auf der Basis von Phraseologismen sowie Einflüsse aus dem Englischen.
Der Beitrag beschäftigt sich mit der lexikografischen Information von fünf DaF-Lernerwörterbüchern und fokussiert in besonderem Maße das verbale Kombinationspotenzial. Die vorgelegte Analyse legt dabei besonderen Wert auf die grammatische Syntagmatik bei Verben, zu deren Beschreibung acht Analyseparameter dienen. Die Resultate werden ausführlich kommentiert und in einer Tabelle schematisch zusammengefasst. Im Ergebnis werden Informationslücken in verschiedenen Bereichen aufgedeckt und daraus neue Herausforderungen für die einsprachige DaF-Lernerlexikografie abgeleitet.
The IMS Open Corpus Workbench (CWB) software currently uses a simple tabular data model with proven limitations. We outline and justify the need for a new data model to underlie the next major version of CWB. This data model, dubbed Ziggurat, defines a series of types of data layer to represent different structures and relations within an annotated corpus; each such layer may contain variables of different types. Ziggurat will allow us to gradually extend and enhance CWB’s existing CQP-syntax for corpus queries, and also make possible more radical departures relative not only to the current version of CWB but also to other contemporary corpus-analysis software.
Wortschatz
(2015)
Die Beschäftigung mit ‚dem Wortschatz‘ ist insofern komplex, als man sich zunächst einer riesigen Menge von Wörtern gegenübersieht. Hilfreich ist es, grundsätzlich zwischen dem Wortschatz einer Sprache und dem Wortschatz einer bestimmten Person(engruppe) zu unterscheiden. Egal, welche Wörtermenge man weiter einkreisen möchte, die Annäherungsschritte sind grundsätzlich die gleichen: sammeln – segmentieren – klassifizieren – interpretieren – ordnen/vernetzen. In dem Beitrag wird für einen dynamischen, prozessualen Wortschatzbegriff plädiert: Die Reflexion über acht Leitfragen soll es Fachleuten wie Laien ermöglichen, das Konzept Wortschatz für ihre Zwecke zu präzisieren: – Wie lässt sich ein Wortschatz ermitteln? – Woraus kann ein Wortschatz bestehen? – Welche Arten von Wortschätzen gibt es? – Auf welcher Textbasis werden Wortschätze erhoben? – Welche Fachdisziplinen widmen sich der Untersuchung von Wortschätzen? – Wie ist ein Wortschatz in sich strukturiert? – Wo (bzw. wie) wird Wortschatz gespeichert? – Wie lassen sich ein Wortschatz und dessen Einheiten adäquat beschreiben?
In dem Beitrag wird der Frage nachgegangen, inwiefern die Frequenz eines Wortes mit seiner orthographischen Richtigschreibung zusammenhangt. Werden häufige Wörter öfter und früher richtig geschrieben? Und welche Rolle spielt dabei die orthographische Regelhaftigkeit der Wortstrukturen? Unter Zuhilfenahme maschineller Analyseverfahren aus der Großstudie "Automatisierte Rechtschreibdiagnostik" (Fay/Berkling/Stüker 2012) werden diesbezuglich über 1000 Schülertexte von Klasse 2 bis 8 untersucht. Im Ergebnis werden zum einen einige Annahmen, die bislang vor allem auf Erfahrungswerten aus der sprachdidaktischen Arbeit fußten, empirisch bestätigt, zum anderen werden sie hinsichtlich spezifischer Rechtschreibphänomene differenziert und erweitert.
Wort und Wortschatz
(2015)
Das Verständnis darüber, was ein Wort ist, zeigt sich je nach linguistischer Teildisziplin, je nach Untersuchungsinstrument und je nach betrachtetem Medium (Schriftlichkeit, Mündlichkeit) als äußerst wandelbar und kontrovers. Zunächst wird eine Übersicht über die wichtigsten Wortbegriffe in Geschichte und Gegenwart gegeben, um zu zeigen, wie sehr sich ein formaler, am Schriftbild orientierter Wortbegriff von semantisch-kognitiven Wortbegriffen unterscheidet. Anschließend wird dargelegt, wie sich welche sprachwissenschaftlichen Methoden auf die Konstituierung des Phänomens "Wort" auswirken und dass die isolierende Sicht auf das Einzelwort durch die Betrachtung von Relationen zwischen Wörtern abgelöst wurde. Dabei kommt den neueren, computerlinguistisch fundierten Verfahren besondere Relevanz zu. Auf dieser Basis wird gezeigt, welche Aspekte und Ebenen der Wortforschung es aktuell gibt; dabei wird der Interaktion von theoretischen wie anwendungsbezogenen Forschungsperspektiven und dem gesellschaftlichen bzw. Laieninteresse an Wörtern besondere Beachtung geschenkt.
Optimality theory (henceforth OT) models natural language competence in terms of interactions of universal constraints, notably markedness and faithfulness constraints. This article illustrates some of the major advances in the understanding of word-formation phenomena originating from this theory, including the prosodic organization of morphologically complex words, neutralization patterns in derivational affixes, allomorphy, and infixation.
Dieser Artikel gibt einen Überblick darüber, wie grundlegend Wissen als Vorausssetzung, Gegenstand und Produkt von Verständigungsprozessen für die Organisation von Gesprächen ist. Zunächst wird ein kognitivistischer Zugang zu Wissen mit einem sozialkonstruktivistischen kontrastiert. Es werden zum einen kommunikative Gattungen, die auf die Kommunikation von Wissen spezialisiert sind, dargestellt; zum anderen wird gezeigt, wie Wissen auch dann die Gestaltung der Interaktion bestimmt, wenn der primäre Gesprächszweck nicht in Wissensvermittlung besteht. Vier Dimensionen werden angesprochen: a) Das mit dem Adressaten geteilte Wissen (common ground) ist Grundlage des Adressatenzuschnitts von Äußerungen (recipient design); b)geteiltes Wissen wird in Verständigungsprozessen konstituiert; c) der relative epistemische Status der Gesprächspartner zueinander wird durch Praktiken des epistemic stance-taking verdeutlicht und bestimmt selbst die Interpretation von Äußerungsformaten; d) epistemischer Status, soziale Identität und Beziehungskonstitution sind durch moralische Anspruchs- und Erwartungsstrukturen eng miteinander verknüpft.
Wir können auch Hochdeutsch – Das Institut für Deutsche Sprache in Mannheim – ein Ort der Ideen
(2015)
Die Stichwortliste bildet eine tragende Säule von gedruckten als auch von Online-Wörterbüchern. Daher ist die Konzeption und Erarbeitung einer Stichwortliste auch eine zentrale Aufgabe in der Anfangsphase des am IDS in Angriff genommenen Paronymwörterbuchs. Welche Überlegungen dabei angestellt, welche Ideen entwickelt und welche Pläne bzw. Entscheidungen schließlich umgesetzt wurden, wird in dem Beitrag aufgezeigt.
Im Fokus dieses Aufsatzes steht die Bereitstellung und Illustration eines Werkzeugs für die Visualisierung bzw. Kontrastierung syntaktischer Strukturen im Lehramtsstudium sowie im (fächerübergreifenden, integrativen) Deutsch- oder Fremdsprachenunterricht höherer Jahrgangsstufen (Sek. II, Ende Sek. I): das „Generalisierte Lineare Satzmodell“ (kurz Gelisa-Modell)1. Das Gelisa-Modell, das auf dem topologischen Satzmodell fußt (vgl. u.a. Reis 1980, Höhle 1986, Pafel 2009, Wöllstein 2010), ermöglicht es, wie bei einem Baukastensystem jegliche Satztypen aus verschiedenen Sprachen (und dann natürlich auch aus einer spezifischen Einzelsprache) in direkter visueller Gegenüberstellung miteinander zu vergleichen. Dabei werden die Sätze und Satztypen distinkter Sprachen unabhängig von der jeweiligen Komplexität auf ein einheitliches Muster bezogen. Die für die grammatische Wohlgeformtheit erforderlichen linearen Strukturzusammenhänge können so auf schematisch anschauliche Weise erfasst und insbesondere zur Basis und zum Ankerpunkt grammatischer Unterrichtsdiskurse und Werkstätten gemacht werden.
Recipient design is a key constituent of intersubjectivity in interaction. Recipient design of turns is informed by prior knowledge about and shared experience with recipients. Designing turns in order to be maximally effective for the particular recipient(s) is crucial for accomplishing intersubjectively coordinated action. This paper reports on a specific pragmatic structure of recipient design, i.e. counter-factual recipient design, and how it impinges on intersubjectivity in interaction. Based on an analysis of video-recordings data from driving school lessons in German, two kinds of counterfactual recipient design of instructors' requests are distinguished: pedagogic and egocentric turn-design. Counterfactual, pedagogic turn-design is used strategically to diagnose student skills and to create opportunities for corrective instructions. Egocentric turn-design rests on private, non-shared knowledge of the instructor. Egocentrically designed turns imply expectations of how to comply with requests which cannot be recovered by the student and which lead to a breakdown of intersubjective cooperation. This paper identifies practices, sources and interactional consequences of these two kinds of counterfactual recipient design. In addition, the study enhances our understanding of recipient design in at least three ways. It shows that recipient design does not only concern referential and descriptive practices, but also the indexing intelligible projections of next actions; it highlights the productive, other-positioning effects of recipient design; it argues that recipient design should be analyzed in terms of temporally extended interactional trajectories, linking turn-constructional practices to interactional histories and consecutive trajectories of joint action.
Zur Gestaltung künftiger Lernerwörterbücher im DaF-Bereich ist es notwendig, die Bedürfnisse und Recherchegewohnheiten der potenziellen Benutzerinnen und Benutzer zu kennen. Seit dem virtuellen Medienwechsel erfährt die Wörterbuchbenutzungsforschung wichtige neue Impulse. Speziell im DaF Bereich liegen aber bis jetzt nur vereinzelt aktuelle empirische Daten über die unterschiedlichen Benutzergewohnheiten der Lernerinnen und Lerner vor, die für zukünftige lexikographische Konsultationssysteme ausgewertet und berücksichtigt werden könnten. Aus diesem Grunde wurde im Rahmen des Forschungsprojekts DICONALE, welches die Erstellung eines konzeptuellonomasiologisch orientierten zweisprachig bilateralen online-Produktionslernerwörterbuches für Verben und deverbale Wortarten des Deutschen und Spanischen anvisiert, eine Umfrage konzipiert, die von Lernenden des Deutschen als Fremdsprache in Spanien, Portugal und Deutschland beantwortet wurde. Im Mittelpunkt dieser Umfrage steht sowohl das Ziel, die Benutzergewohnheiten der DaF-Lernenden unterschiedlicher Sprachstufen im universitären und außeruniversitären Bereich kennenzulernen, als auch die Gründe für mögliche fehlgeschlagene Recherchen zu erforschen und Hinweise auf die Wünsche und Bedürfnisse der Lernenden entsprechend zu interpretieren. Ziel des Beitrages ist es daher, einerseits die wichtigsten Ergebnisse der Umfrage vorzustellen und andererseits sowohl allgemeine Rückschlüsse auf die Konzipierung zukünftiger Lernerwörterbücher für den DaF-Bereich zu ziehen als auch konkrete Anforderungen an DICONALE herauszuarbeiten.
In this paper, general problems with easily confused words among a language community are addressed. Serving as an example, the difficulties of semantic differentiation between the use of German sensibel and sensitiv are discussed. One the one hand, the question is raised as to how a speech community faces challenges of semantic shifts and how monolingual dictionaries document lexical items with similar semantic aspects. On the other hand, I will demonstrate the discrepancies of information on meaning as retrieved and interpreted from large corpus data. It will be shown how the semantics of words change and hence cause confusion among speakers. As a result, empirical evidence opens up several questions concerning the prescriptive vs. descriptive treatment of paronymic items such as sensibel/sensitiv and it demands different approaches to the lexicographic description of such words in future reference works.
Vorwort
(2015)
This paper summarizes essential steps of a workshop-like presentation of lexicographic practice and reflects an application-oriented demonstration. As a point of departure the question is raised of how different linguistic information is extracted from a corpus for the inclusion in a dictionary. The introductory part on lexicographic objectives is followed by insights into methodological aspects (e. g. online dictionary elexiko). A conclusive example is provided to illustrate the procedure.
Voll Energie stecken und voller Geigen hängen - seltsame Phrasentypen und ungewöhnliche Valenzmuster
(2015)
Die öffentliche Akzeptanz und Wirkung natur- und technikwissenschaftlicher Forschung hängt grundlegend davon ab, ob sich die Ziele und Forschungsergebnisse an die Öffentlichkeit vermitteln lassen. Doch die Inhalte aktueller Forschungsvorhaben sind für ein Laienpublikum oft nur schwer zugänglich und verständlich. Vor dem Hintergrund, die gesellschaftliche Diskussion natur- und technikwissenschaftlicher Forschung zu verbessern, untersuchen und bewerten wir im Projekt PopSci – Understanding Science einen wichtigen Sektor des populärwissenschaftlichen Diskurses in Deutschland empirisch. Hierfür identifizieren wir die linguistischen Merkmale deutscher populärwissenschaftlicher Texte durch korpusbasierte Methoden und untersuchen deren Effekt auf die kognitive Verarbeitung der Texte durch Laien. Dazu setzen wir Vor- und Nachwissenstests ein. Außerdem messen wir die Blickbewegungen der Leserinnen und Leser, während sie populärwissenschaftliche Texte lesen. Aus dieser Kombination von unterschiedlichen Methoden versuchen wir, erste Empfehlungen zur Verbesserung des linguistischen Stils und der Wissensrepräsentation populärwissenschaftlicher Texte abzuleiten.
,AUFKLÄRUNG‘ ist ein Schlüsselkonzept im Demokratiediskurs der späten 60er Jahre. Aber ,AUFKLÄRUNG‘ kann vieles bedeuten. Erst mit dem neuartigen Paraphrasenmodell der Diskurslinguistik und mit der Einbeziehung des Begriffs der Intertextualität gelingt es, das Verbindende wie das Besondere jeder einzelnen Diskursäußerung darzulegen. Während für die studentische Linke die Verpflichtung zur Aufklärung bedeutet, die Gesellschaft in ihrer ganzen Breite mit Hilfe politischer Protestaktionen aus ihrer Unmündigkeit zu befreien, sehen linksliberale Intellektuelle im Gebot der Aufklärung eher eine demokratische Erziehungsformel, die den Einzelnen auf eine moralisch begründete Vernunft festlegt, welche jede materiell-physische Gewalt ausschließt. Indem so der Begriff der Aufklärung einerseits zur Rechtfertigung sozialen Umbruchs, andererseits zur Begründung gesellschaftlicher Stabilität instrumentalisiert wird, verliert er seine Wirksamkeit und verschwindet allmählich aus dem Diskurs. Der Diskurs bleibt dabei nie stehen. Bedeutungen wandeln sich fortwährend. Ruth Mell trägt mit diesem Band ganz wesentlich zur Entwicklung einer Methodologie für die Analyse der diachronen Dimension von Diskursen bei.
In this contribution, we present a novel approach for the analysis of cross-reference structures in digital dictionaries on the basis of the complete dictionary database. Using paradigmatic items in the German Wiktionary as an example, we show how analyses based on graph theory can be fruitfully applied in this context, e. g. to gain an overview of paradigmatic references as a whole or to detect closely connected groups of headwords. Furthermore, we connect information about cross-reference structures with corpus frequencies and log file statistics. In this way, we can answer questions such as the following ones: Are frequent words paradigmatically linked more closely than others? Are closely linked headwords or headwords that stand more solitary in the dictionary visited significantly more often?
Valenz und Kookkurrenz
(2015)
Valenz im Fokus: Vorwort
(2015)
Die Festschrift Valenz im Fokus: Grammatische und lexikografische Studien enthält zum einen die Beiträge des internationalen Kolloquiums „Valenz im Fokus“, das am 12. Juli 2013 im Institut für Deutsche Sprache in Mannheim zu Ehren von Jacqueline Kubczak veranstaltet wurde, zum anderen weitere Beiträge von Kollegen aus der ganzen Welt, die zum einen als elektronische Publikation während des Kolloquiums präsentiert wurden, zum anderen speziell für diese Festschrift hinzukamen.
Valenz im Fokus. Grammatische und lexikografische Studien. Festschrift für Jacqueline Kubczak
(2015)
Die Festschrift Valenz im Fokus: Grammatische und lexikografische Studien enthält zum einen die Beiträge des internationalen Kolloquiums „Valenz im Fokus“, das am 12. Juli 2013 im Institut für Deutsche Sprache in Mannheim zu Ehren von Jacqueline Kubczak veranstaltet wurde, zum anderen weitere Beiträge von Kollegen aus der ganzen Welt, die zum einen als elektronische Publikation während des Kolloquiums präsentiert wurden, zum anderen speziell für die Festschrift hinzukamen.
Using the Google Ngram Corpora for six different languages (including two varieties of English), a large-scale time series analysis is conducted. It is demonstrated that diachronic changes of the parameters of the Zipf–Mandelbrot law (and the parameter of the Zipf law, all estimated by maximum likelihood) can be used to quantify and visualize important aspects of linguistic change (as represented in the Google Ngram Corpora). The analysis also reveals that there are important cross-linguistic differences. It is argued that the Zipf–Mandelbrot parameters can be used as a first indicator of diachronic linguistic change, but more thorough analyses should make use of the full spectrum of different lexical, syntactical and stylometric measures to fully understand the factors that actually drive those changes.
Speakers’ linguistic experience is for the most part experience with language as used in conversational interaction. Though highly relevant for usage-based linguistics, the study of such data is as yet often left to other frameworks such as conversation analysis and interactional linguistics (Couper-Kuhlen and Selting 2001). On the basis of a case study of salient usage patterns of the two German motion verbs kommen and gehen in spontaneous conversation, the present paper argues for a methodological integration of quantitative corpus-linguistic methods with qualitative conversation analytic approaches to further the usage-based study of conversational interaction.
Transkriptionsaufwand
(2015)
Während die Erhebung von Gesprächsdaten zwar zeitaufwändig, aber doch noch relativ zügig zu bewältigen ist, handelt es sich bei der Transkription um eine langwierige Aufgabe, die oft unterschätzt wird. Damit Studierende, Promovierende sowie WissenschaftlerInnen, die Exposés, Arbeitspläne usw. aufstellen oder Zuschüsse für Projekte beantragen müssen, zukünftig über fundiertere Werte verfügen und damit realistischere Aussagen über den benötigten Aufwand (zeitliche wie personelle Ressourcen) treffen können, stellt der Beitrag die Ergebnisse einer Erhebung des Transkriptionsaufwandes im FOLK-Projekt vor.
Some 25 years ago, a large-scale repatriation of Russian Germans began. As a result, more than 2,5 million people that grew up in the USSR, Russia, or other post-Soviet states, became German citizens who had native or near-native command of the Russian language. The uncomfortable differences they exhibited in comparison to those who were supposed to accept them as equals, yet failed to do so, compelled them to search for self-designations that would accommodate their new identity and to bond together to form a new minority. The authors examine the attempts of Soviet/Russian Germans to redefine their ethnic identity in terms of not just blood but also language and culture, focusing on two particular cases: the use of the name Rusak in the internet forums of the repatriated immigrants; and the linguistic-cultural practices of the older generation of immigrants.
Der Beitrag stellt die theoretischen und methodologischen Grundlagen des Lernerwörterbuchprojekts DICONALE anhand einiger Analysebeispiele vor. Es handelt sich um ein zweisprachig-bidirektionales, onomasiologisch-konzeptuell ausgerichtetes Verbwörterbuch, das sowohl zur Konsultation für Produktionszwecke ab B2-Niveau im Bereich DaF und ELE als auch für den Übersetzungsprozess in die jeweilige Fremdsprache dienlich sein soll. Es beruht auf häufigkeitsbasierten Daten vergleichbarer elektronisch verfügbarer Korpora beider Sprachen und soll dem Benutzer online zugänglich gemacht werden. Das Wörterbuch gliedert sich in unterschiedliche konzeptuelle (Sub)Felder, denen sich lexikalisch-semantische (Mini)Paradigmen zuordnen lassen. Es basiert auf einem modular-multilateralen lexikologischen Beschreibungsmodell, welches einzelsprachliche und sprachvergleichend relevante korpusbasierte Informationen zu Form, Bedeutung und Verwendung durch die Information von verschiedenen paradigmatischen und syntagmatischen Relationen verbaler und deverbaler Lexeme präsentiert.
We analyze the linguistic evolution of selected scientific disciplines over a 30-year time span (1970s to 2000s). Our focus is on four highly specialized disciplines at the boundaries of computer science that emerged during that time: computational linguistics, bioinformatics, digital construction, and microelectronics. Our analysis is driven by the question whether these disciplines develop a distinctive language use—both individually and collectively—over the given time period. The data set is the English Scientific Text Corpus (scitex), which includes texts from the 1970s/1980s and early 2000s. Our theoretical basis is register theory. In terms of methods, we combine corpus-based methods of feature extraction (various aggregated features [part-of-speech based], n-grams, lexico-grammatical patterns) and automatic text classification. The results of our research are directly relevant to the study of linguistic variation and languages for specific purposes (LSP) and have implications for various natural language processing (NLP) tasks, for example, authorship attribution, text mining, or training NLP tools.
We investigated the effect of high-variability training (HVT) on the production and perception of French bilabial voiced and voiceless stops by German native speakers. Stop consonants in the two languages differ with respect to several articulatory and acoustic features. German learners of French (Experiment Group) trained the perception of word-initial bilabial stops spoken by six French native speakers using identification tests, whereas subjects of a Control Group did not perform a training. Additional perception and production tests of French words including bilabial, alveolar, and velar stops in all word positions were performed to capture the impact of HVT. Subjects were found to be quite good at distinguishing voiced and voiceless stops. However, voiceless stops received lower correctness scores than voiced ones and subjects of the Experiment group were able to further increase their scores after training. Results for production are mirror-inverted showing that subjects of the Experiment Group successfully produced longer negative VOT values but did not show an improvement for voiceless stops.
Temporality in interaction
(2015)
Tagset und Richtlinie für das PoSTagging von Sprachdaten aus Genres internetbasierter Kommunikation
(2015)
Nach einer Definition der Begriffe ‚multimodale Verständigung‘ und ‚gesprochene Sprache‘ werden im vorliegenden Beitrag Prozessualität, Interaktivität und Multimodalität als zentrale Besonderheiten multimodaler Verständigung beschrieben und in ihren möglichen Auswirkungen auf die Syntax gesprochener Sprache charakterisiert. Als aktuelle Konzepte zur syntaktischen Beschreibung gesprochener Sprache stelle ich dann die on line-Syntax, die Konstruktionsgrammatik und die multimodale
Grammatik vor. Als Probleme der syntaktischen Beschreibung gesprochener Sprache diskutiere ich die Beschreibungskategorien sowie die Varianz gesprochener Sprache, die eine eindeutige kategoriale Erfassung erschwert. Als Gegenstand syntaktischer Beschreibung werden die funktionalen Einheiten und der Gesprächsbeitrag eingeführt (Abschnitt 2). Sodann stelle ich Ausschließlichkeit, quantitative Differenz und funktionale Differenz als zu unterscheidende Formen von Besonderheiten vor. Es schließen sich Darstellungen zur Syntax im Formulierungsprozess, zu spezifischen syntaktischen Strukturen und Konstruktionen und zur Syntax ‚elliptischer‘ Gesprächsbeiträge an (Abschnitt 3). Zum Abschluss werden zusammenfassend allgemeine Tendenzen der Syntax gesprochener Sprache benannt (Abschnitt 4).
Mit den Methoden der Interaktionalen Linguistik und der Konversationsanalyse untersucht die vorliegende Arbeit syntaktische Ko-Konstruktionen im gesprochenen Deutsch, wobei der Fokus auf Vervollständigungen eines zweiten Sprechers vor einem möglichen syntaktischen Abschlusspunkt liegt. Auf der Basis von 199 Ko-Konstruktionen aus informellen Interviews und Tischgesprächen leistet die Arbeit eine erste umfassende Analyse der gemeinsamen Konstruktion einer syntaktischen Gestalt durch zwei Sprecher im Deutschen.
Die Struktur der Ko-Konstruktionen wird in einem ersten Schritt über die Basisoperationen der Online-Syntax, Projektion und Retraktion, beschrieben. Im Fokus steht hier die Frage, an welchen Projektionen sich der zweite Sprecher orientiert, wobei sowohl syntaktische und prosodische als auch semanto-pragmatische Aspekte in die Analyse miteinbezogen werden. In einem zweiten Schritt wird die zeitliche und sequenzielle Organisation der Ko-Konstruktionen detailliert herausgearbeitet. Ein Schwerpunkt liegt hier auf einer genauen Darstellung und Analyse der verschiedenen Handlungsoptionen des ersten Sprechers nach der ko-konstruierten Vervollständigung.
In diesem Beitrag werden Teilergebnisse aus einer Untersuchung von zehn einsprachigen deutschen Wörterbüchern (darunter Allgemeine Bedeutungswörterbücher, Lernerwörterbücher und auf Syntagmen fokussierte Spezialwörterbücher) und den darin befindlichen syntagmatischen Verwendungsmustern präsentiert. Zunächst erfolgt eine inhaltliche und terminologische Hinführung. Im Anschluss werden Analyseergebnisse anhand des Beispiellexems Kaffee zusammengefasst dargestellt und diskutiert. Außerdem wird gezeigt, dass Unterschiede in der Auswahl und Aufbereitung der syntagmatischen Verwendungsmuster in Hinblick auf die verschiedenen Wörterbuchtypen bestehen. Ein Einblick in einige zusammenfassende Ergebnisse sowie weitere Forschungsfragen runden den Beitrag ab.
Synonymie und Antonymie
(2015)
Synonymie (zum Beispiel ‚essen‘ und ‚speisen‘) und Antonymie (zum Beispiel ‚heiß‘ und ‚kalt‘), also Ähnlichkeit und Gegensätzlichkeit der Bedeutung, sind Phänomene, die im Zentrum sprachwissenschaftlicher Forschung stehen. Der zweite Band der Reihe ‚Literaturhinweise zur Linguistik‘ bietet eine konzise Einführung in das Thema Synonymie und Antonymie und eine strukturierte Auswahlbibliografie mit aktueller Fachliteratur und bewährten Nachschlagewerken. Er berücksichtigt verschiedene Richtungen der modernen Sprachwissenschaft wie etwa die Kognitionswissenschaft, die Korpus- und Computerlinguistik und Deutsch als Fremdsprache.
Rassmatrivajutsja novye frazeologizmy nemeckogo jazyka i aspekty ich leksikografičeskogo opisanija v „Nemecko-russkom slovare neologizmov“. Obščaja dolja novych frazeologizmov ot obščego količestva neologizmov nemeckogo jazyka v period s 1991 po 2012 gody sostavljaet okolo šesti procentov. K kategorii frazeologizmov v slovare otnosjatsja ustojčivye sočetanija slov raznoj struktury i stepeni idiomatičnosti. Naibolee mnogočislenny frazeologizmy – imennye gruppy, za nimi sledujut glagol’nye gruppy i frazeologizmy-predloženija. Vyjavljajutsja i opisyvajutsja strukturnye i semantičeskie osobennosti frazeologizmov raznych frazovych kategorij. Osveščajutsja osobennosti podači frazeologizmov v slovnike i tipy leksikografičeskoj informacii v strukture slovarnoj stat’i, učityvajuščie specifiku frazeologičeskich neologizmov kak edinic leksikografičeskogo opisanija.
Sprichwörter im Gebrauch
(2015)
Sprachwissenschaft im Fokus
(2015)
Im Jahr 2014 feierte das Institut für Deutsche Sprache (IDS) sein 50-jähriges Bestehen. Dieses Jubiläum nahm das IDS zum Anlass, seine Jahrestagung thematisch etwas breiter anzulegen und diejenigen Themenfelder, die in der sprachwissenschaftlichen Diskussion der letzten fünf Jahrzehnte eine besondere Rolle gespielt haben und zu denen das IDS in besonderer Weise hat beitragen können, einer Revision zu unterziehen. Die Beiträge dieses Bandes bieten daher einerseits eine Zusammenschau der aktuellen Fragen der Grammatikforschung und Grammatikografie, der Lexikologie und Lexikografie, des gesprochenen Sprachgebrauchs sowie der Korpustechnologie und der Computerlinguistik. Andererseits geben sie auch Auskunft darüber, wo die Sprachwissenschaft im Moment steht und wo sich zukünftig vielleicht neue Forschungsräume öffnen.
Zu den Gemeinplätzen wissenschaftlichen wie populären Nachdenkens über den Menschen gehört, dass es die Sprache ist, die ihn gegenüber allen anderen Lebewesen auszeichnet. Die naheliegende Folgerung, dass Sprachwissenschaft deshalb immer auch eine anthropologische Wissenschaft ist, wird dennoch eher selten gezogen. Dies obwohl es praktisch nicht möglich ist, sprachtheoretische Überlegungen zum ‚Wesen‘ der Sprache oder zu zentralen Fragestellungen der Linguistik anzustellen, ohne zumindest implizit auch ein Bild des Menschen selbst zu entwerfen. Der folgende Beitrag geht von Humboldt über Benveniste bis zur neueren conversation analysis denjenigen sprachtheoretischen Traditionslinien nach, welche den sprachlichen Menschen als einen basal auf ein Gegenüber bezogenen Menschen entwerfen – eine Konstellation, die zudem die Figur des ‚Dritten‘ erzeugt – und welche Sprachlichkeit als prägendes Formativ menschlicher Sozialität verstehen. Sprache wird entsprechend nicht nur als Medium referenzieller ‚Aboutness‘, sondern ebenso performativer ‚Withness‘ betrachtet. Im Horizont der Überlegungen steht dann allerdings auch die Frage, in welcher Weise die an gesprochener Sprache ausgerichtete, interaktionsorientierte Neukonturierung der Sprachwissenschaft in der zweiten Hälfte des 20. Jahrhunderts einen neuen Blick auf Schriftsprachlichkeit und ihre Leistungen in der Selbstformierung des Menschen ermöglicht.
In den letzten Jahrzehnten hat sich die Perspektive auf den Gegenstand der Sprachwissenschaft immer wieder verändert, vor allem gegen überkommene Reduktionismen erweitert. Hier soll auf Entwicklungen im Zusammenhang mit der Herausbildung einer „Medienlinguistik“ eingegangen werden, die (allgemeiner) die Medialität von Sprache behandelt, auch im Zusammenspiel mit anderen Zeichenarten, (spezieller) die Rolle von Sprache in (technischen) Medien. Von den sehr zahlreichen Varianten der Kombination von Modalitäten und Kodalitäten sollen hier zwei sehr unterschiedliche Schwerpunkte betrachtet werden: Visualität von Sprache, in und von Texten, und sekundäre Audiovisualität.
Sprache in der Medizin
(2015)
Medizinisches Wissen und Handeln ist ohne Sprache nicht denkbar: weder in der Arzt-Patienten-Kommunikation noch in fachinternen und fachexternen Medizintexten oder in den Medien. Dieser Beitrag liefert einen nähernden Überblick über verschiedene Formen medizinischer Kommunikation. Im Zentrum stehen dabei (1) der Konnex von Sprache und Wissen in der Medizin, (2) Arzt-Patient-Gespräche als Primärkommunikation und (3) der Zusammenhang zwischen Medialisierung und Medikalisierung.
Spiegelpaar im Paarspiegel
(2015)
In the German language, there are two central ways of integrating spatial and temporal information by means of word-formation. Firstly, this type of information is typically located in the verbal phrase of sentences. As a consequence, it plays a major role in the area of word-formation of verbs too. The two major classes of such verbs found in German (“Partikelverben” and “Doppelpartikelverben”) are located in the transition zone between syntax and word-formation. The same adverbial relation is found in one type of nominal compounds (“Rektionskomposita”). On the other hand, space and time are prominent among the relations constituting the patterns of the prototypical type of noun compounds (“N+N-Komposita”). The integration of these relations into compounds involves some kind of functional interpretation.
This article is concerned with the choice of a corpus to be used as the empirical basis of a bilingual, bidirectional and conceptual learner dictionary of German and Spanish. Several standard corpora as well as web corpora for German and Spanish will be compared with respect to their size, the variety of genres they contain, the time span and geographical areas covered and what kind of search facilities they allow (e.g. word queries based on lemmata rather than on word forms). It will be argued that, when standard corpora fail to meet a particular requirement, web data may provide a useful alternative for lexicographical purposes provided they are both linguistically (i.e. morpho-syntactically) and meta-linguistically tagged.
Sinnrelationen wurden lange als stabile Beziehungen zwischen Wörtern betrachtet. Dabei zeigen gebrauchsorientierte Untersuchungen, dass Sinnrelationen dynamische Phänomene sind, die sich kommunikativen Bedürfnissen anpassen. Neuere Studien erforschen die Prozesse, die zur Herstellung von Gegensatz bzw. Ähnlichkeit erforderlich sind. Sie untersuchen variable Strukturen, ihre Funktionen sowie kontextuelle Bedingungen und erklären, warum einige Antonyme bessere Gegensatzpaare bilden als andere. Dieser Beitrag konzentriert sich auf deutsche und englische Synonyme und Antonyme aus korpus- und psycholinguistischer Perspektive. Im Mittelpunkt stehen Beschreibungen kontextbasierter und variabler Strukturen, in denen sinnverwandte Wörter regelhaft vorkommen. Es wird gezeigt, dass diese Strukturen über diverse Funktionen verfügen und dass mithilfe kognitiver Prozesse unterschiedlich stark konventionalisierte Muster entstehen. Traditionelle Klassifikationen und Definitionen werden im Lichte neuer empirischer Studien kritisch hinterfragt. Neuere Theorien, die sich um die Einbettung flexibler Beziehungen bemühen, werden erörtert.
The article analyses data from a corpus of email-correspondence and chat protocols that describe the initial steps of romantic contacts. It shows that different types of silences are used strategically in the process of people getting to know each other. Five silence strategies within conversations are described and their functions are illustrated by typical examples.
Der rechtslinguistische Zugang zu juristischen Texten gibt Aufschluss über Deutungsoptionen umstrittener Fachkonzepte. Dieser text- und diskursorientierte Ansatz ist für die Analyse der Kommunikation zwischen internationalen und nationalen Gerichten besonders erhellend, da hier die sprachliche Konstitution von Faktizität häufig mit gesteigerter Intensität geführt wird. Die Arbeit untersucht die Aushandlungsprozesse um nationalstaatliche Souveränität und Kompetenzverschiebungen anhand einer Sprachhandlungstypologie. Dabei werden sprachlich geronnene Konfliktlinien bei der Harmonisierung von nationalem Recht und Völkerrecht herausgestellt, deren Beschreibung als semantische Kämpfe im Kern der Betrachtung stehen. Als Beispiel dient der Sorgerechtsstreit ‚Görgülü‘. Durch die Untersuchung des Fachdiskurses und seiner Transformation in Medientexte können Vermittlungsprobleme aufgedeckt werden, wodurch ein Beitrag zur Transparenz bei der rechtsstaatlichen Faktizitätsherstellung geleistet wird.
Die Programmbereiche „Korpuslinguistik“ und „Mündliche Korpora“ haben am IDS die Aufgabe, Grundlagen für die empirische Erforschung der deutschen Sprache zu legen. Unter anderem sammeln und erstellen sie schriftliche und mündliche Korpora, bereiten sie für eine wissenschaftliche Nutzung auf und stellen sie über Web-Oberflächen (COSMAS, DGD2 demnächst KorAP) zur Verfügung. Unser Beitrag gibt zunächst einen Überblick über Entstehungsgeschichte und aktuellen Stand dieser Arbeiten. Mit einem Blick in die Zukunft widmen wir uns auch der Frage, ob und in welcher Weise das Schlagwort ,Big Data‘ für diese Arten linguistischer Ressourcen relevant ist. In Bezug auf die schriftlichen Korpora wird dabei insbesondere über die diesjährige DEREKo-Erweiterung um über 17 Milliarden Wörter und die damit verbundenen Arbeiten berichtet. In diesem Zusammenhang werden u.a. DeReKos Design, die zugrundeliegende Akquisitionsstrategie und Überlegungen zu Dispersion und Stratifizierbarkeit diskutiert. Die spezifischen Herausforderungen, die sich beim Aufbau eines großen Gesprächskorpus stellen, werden am Beispiel des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) diskutiert. Dabei steht außer Frage, dass angesichts des Aufwandes, den Feldzugang sowie Erschließung der im Feld gewonnenen Audio- und Videodaten bedeuten, vergleichbare Datenmengen und Wachstumsraten wie bei Textkorpora nicht zu erreichen sind. Für den Aufbau umfangreicher mündlicher Korpora ist daher die Entwicklung eines eigenen Methodeninstrumentariums notwendig.
Diese Arbeit beschreibt und analysiert die soziale und sprachliche Welt von Orchestermusikern. Am Beispiel des „Mikrokosmos“ eines Orchesters untersucht sie das Zusammenspiel von beruflich-strukturellen Bedingungen, kulturell vermittelten Orientierungen und sprachlichen Handlungsmustern. Dabei werden das notwendige Hintergrundwissen über die soziale Kategorien, Leitbilder und Kriterien für Professionalität sowie die Handlungsdispositionen von Orchestermusikern dargestellt. Elemente einer historischen Entwicklung der Institution Orchester werden ebenso wie biografische Erfahrungen der Musiker und Musikerinnen auf ihre Relevanz für die Kommunikation im Orchester hin untersucht.
Scales and Scores. An evaluation of methods to determine the intensity of subjective expressions
(2015)
In this contribution, we present a survey of several methods that have been applied to the ordering of various types of subjective expressions (e.g. good < great), in particular adjectives and adverbs. Some of these methods use linguistic regularities that can be observed in large text corpora while others rely on external grounding in metadata, in particular the star ratings associated with product reviews. We discuss why these methods do not work uniformly across all types of expressions. We also present the first application of some of these methods to the intensity ordering of nouns (e.g. moron < dummy).
Korrekte Verwendung konnektoraler Satzverknüpfungen ist insbesondere in Bezug auf die Textproduktion, aber auch für das Verständnis bzw. die Interpretation von Texten von essenzieller Bedeutung. Wenn nämlich einzelne Propositionen inhaltliche Bausteine von Texten sind, so spielen Satzverknüpfungen eine Rolle als strukturelle Bausteine. Das Anwenden des topologischen Modells im Schulunterricht ist nicht nur ein hilfreiches Mittel zur Veranschaulichung syntaktisch variablen Gebrauchs unterschiedlicher Klassen von Satzverknüpfungsmitteln, sondern auch die Möglichkeit, Schüler auf semantische, pragmatische und mediale Unterschiede bei der Interpretation und Verwendung von Satzverknüpfungen (u.a. auch im gesprochenen Deutsch) aufmerksam zu machen, die sich beispielsweise durch den Positionswechsel ergeben.
Satz - oberflächlich
(2015)
Das hier vorgestellte oberflächennahe Satzkonzept orientiert sich an der Definition der IDS-Grammatik: Sätze sind Konstruktionsformen, die mindestens aus einem finiten Verb und seinen Komplementen bestehen. Das semantische Korrelat des Satzes ist die Proposition, bestehend aus Prädikat und Argumenten. Die Unterscheidung der englischsprachigen Tradition zwischen sentence und clause bzw. die entsprechende Unterscheidung zwischen proposition und phrase im Französischen wird in diesem Ansatz durch die Opposition zwischen ,Vollsatz‘ und ,Teilsatz‘ erfasst. Oberflächenorientierte Satzdefinitionen können, im Gegensatz zu der hier vertretenen intern-syntaktischen Definition, auch – in syntaktischer Hinsicht – auf externen Merkmalen beruhen, nämlich auf orthografisch-prosodischen Merkmalen oder dem Kriterium der syntaktischen Unabhängigkeit gemäß Bloomfields bekannter Satzdefinition. In typologischer Perspektive zeichnen sich Sätze durch einen „satzkonstituierenden Akt“ (Sasse 1991, 77) aus bzw. eine spezifische morphosyntaktische Konstellation, die zum Ausdruck des Sachverhalts hinzukommen muss. Unter pragmatischer Perspektive ist der Satz die prototypische Mitteilungseinheit. Er kann dekontextualisiert werden, während andere Mitteilungsformen nur in ihrem jeweiligen Kontext interpretierbar sind. Ihrem semiotischen Status nach sind Sätze komplexe sprachliche Zeichen. Die ihnen zugrundeliegenden Regeln oder Konstruktionen hingegen haben keinen Zeichencharakter.
Rückblick in Dankbarkeit
(2015)
This paper shows how understanding in interaction is informed by temporality, and in particular, by the workings of retrospection. Understanding is a temporally extended, sequentially organized process. Temporality, namely, the sequential relationship of turn positions, equips participants with default mechanisms to display understandings and to expect such displays. These mechanisms require local management of turn-taking to be in order, i.e., the possibility and the expectation to respond locally and reciprocally to prior turns at talk. Sequential positions of turns in interaction provide an infrastructure for displaying understanding and accomplishing intersubjectivity. Linguistic practices specialized in displaying particular kinds of (not) understanding are adapted to the individual sequential positions with respect to an action-to-be-understood.
This article presents empirical findings about what criteria make for a good online dictionary, using data on expectations and demands collected in an online questionnaire (N~684), complemented by additional results from a second questionnaire (N-390) which looked more closely at whether respondents had differentiated views on individual aspects of the criteria rated in the first study. Our results show that the classical criteria of reference books (such as reliability and clarity) were rated highest by our participants, whereas the unique characteristics of online dictionaries (such as multimedia and adaptability) were rated and ranked as (partly) unimportant. To verify whether or not the poor ratings of these innovative features were a result of the fact that our subjects are unfamiliar with online dictionaries incorporating such features, we incorporated an experiment into the second study. Our results revealed a learning effect: participants in the learning-effect condition, i.e. respondents who were first presented with examples of possible innovative features of online dictionaries, judged adaptability and multimedia to be more useful than participants who were not given that information. Thus, our data point to the conclusion that developing innovative features is worthwhile but that it should be borne in mind that users can only be persuaded of their benefits gradually. In addition, we present data about questions relating to the design of online dictionaries.
In a project called "A Library of a Billion Words" we needed an implementation of the CTS protocol that is capable of handling a text collection containing at least 1 billion words. Because the existing solutions did not work for this scale or were still in development I started an implementation of the CTS protocol using methods that MySQL provides. Last year we published a paper that introduced a prototype with the core functionalities without being compliant with the specifications of CTS (Tiepmar et al., 2013). The purpose of this paper is to describe and evaluate the MySQL based implementation now that it is fulfilling the specifications version 5.0 rc.1 and mark it as finished and ready to use. Further information, online instances of CTS for all described datasets and binaries can be accessed via the projects website.
In Deutschland leben 7,5 Millionen erwachsene Analphabeten. Daher ist der Bedarf an Materialien zum Erlernen der Schrift gestiegen. Der vorliegende Band ist begleitend für den Rechtschreibunterricht von (vor allem) Erwachsenen gedacht, die Deutsch auf einem (nahezu) muttersprachlichen Niveau beherrschen. Die systemische Beschreibung des Rechtschreibwortschatzes, insbesondere durch seine orthographische Annotation und die Kennzeichnung von Lernstellen, stützt sich größten teils auf die Darstellung der deutschen Orthographie im Rahmencurriculum Schreiben (kurz RCS) des Deutschen Volkshochschulverbandes. Außerdem lehnt sich der vorliegende Wortschatz an Themen an, die sich aus dem alltäglichen Leben ableiten. Lehrende finden in diesem Band gezielt reichlich Material zum Üben im Unterrichtskontext und können bei Bedarf auch neues Übungsmaterial erstellen; sie sollen aber auch zusätzlich vermitteln, dass sie selbst als Experten von Fall zu Fall in Wörterlisten nachschlagen müssen. Für den Lerner soll der Rechtschreibwortschatz dazu beitragen, die Eigeninitiative zu fördern und zu selbständigem praktischen Üben ermutigen.
The Czech National Corpus (CNC) is a longterm project striving for extensive and continuous mapping of the Czech language. This effort results mostly in compilation, maintenance and providing free public access to a range of various corpora with the aim to offer a diverse, representative, and high-quality data for empirical research mainly in linguistics. Since 2012, the CNC is officially recognized as a research infrastructure funded by the Czech Ministry of Education, Youth and Sports which has caused a recent shift towards user service-oriented operation of the project. All project-related resources are now integrated into the CNC research portal at http://www.korpus.cz/. Currently, the CNC has an established and growing user community of more than 4,500 active users in the Czech Republic and abroad who put almost 1,900 queries per day using one of the user interfaces. The paper discusses the main CNC objectives for each particular domain, aiming at an overview of the current situation supplemented by an outline of future plans.
Reading corpora are text collections that are enriched with processing data. From a corpus linguist’s perspective, they can be seen as an extension of classical linguistic corpora with human language processing behavior. From a psycholinguist’s perspective, reading corpora allow to test psycholinguistic hypotheses on subsets of language and language processing as it is ‘in the wild’ – in contrast to strictly controlled language material in isolated sentences, as used in most psycholinguistic experiments. In this paper, we will investigate a relevance-based account of language processing which states that linguistic structures, that are embedded deeper syntactically, are read faster because readers allocate less attention to these structures.