Refine
Year of publication
Document Type
- Book (27) (remove)
Language
- English (18)
- German (7)
- Multiple languages (2)
Keywords
- Korpus <Linguistik> (11)
- Deutsch (6)
- Computerlinguistik (5)
- Datenmanagement (5)
- Forschungsdaten (3)
- Soziolinguistik (3)
- Digital Humanities (2)
- EURALEX (20 : 2022 : Mannheim) (2)
- Englisch (2)
- Grammatik (2)
Publicationstate
Reviewstate
- Peer-Review (27) (remove)
Publisher
- De Gruyter (3)
- IDS-Verlag (3)
- European Language Resources Association (ELRA) (2)
- European language resources association (ELRA) (2)
- Leibniz-Institut für Deutsche Sprache (2)
- Universitätsverlag Hildesheim (2)
- Austrian Academy of Sciences (1)
- European Language Resources Association (1)
- Frontiers Media SA (1)
- Gesellschaft für Sprachtechnologie und Computerlinguistik (1)
Variation ist ein wesentliches Merkmal von Sprachen und auf allen Ebenen der linguistischen Beschreibung zu finden. In der Forschungsliteratur wird allgemein angenommen, dass Variation – sofern es nicht zur funktionalen oder semantischen Ausdifferenzierung kommt – langfristig zu Verdrängungsprozessen und damit zu Sprachwandel führt. Als empirische Evidenz wird zumeist die Seltenheit lexikalischer Synonyme genannt. Der vorliegende Band bietet eine kritische Betrachtung dieser Annahme am Beispiel morphologisch-syntaktischer Konkurrenzen im Deutschen und Niederländischen. Konkreter Untersuchungsgegenstand sind Adjektiv-Nomen-Komposita (z.B. Kaltmiete), die gleichermaßen als Benennungen dienenden Phrasen (z.B. kaltes Büfett) sowie die zugrunde liegenden strukturellen Bildungsmuster Komposition und Phrasenbildung. Anhand historischer Fallstudien wird die Entwicklung beider Muster seit 1700 beschrieben und untersucht, ob von einem Verdrängungsprozess ausgegangen werden kann, der zur Unproduktivität eines der beiden Muster führt. Der Sprachvergleich erlaubt dabei die Identifikation einzelsprachlicher Präferenzen sowie verschiedener Faktoren, die zu Divergenz- und Konvergenzprozessen zwischen dem Deutschen und Niederländischen führen.
Die Erforschung von Sprache im öffentlichen Raum (Linguistic Landscapes, LL) hat sich in den vergangen 20 Jahren als Teilgebiet der Soziolinguistik, der Semiotik und anderer Disziplinen fest etabliert. Der vorliegende Band gibt einen Überblick zu zentralen Ansätzen der LL-Forschung mit einem Bezug zur deutschen Sprache. Die Beiträge stellen aktuelle Studien aus dem deutschsprachigen Raum, zu Deutsch als Minderheitensprache sowie aus Ländern mit einer ausgeprägten DaF-Tradition vor. Sie thematisieren sprachstrukturelle und soziolinguistische ebenso wie didaktische, methodische und technologische Aspekte. Damit trägt der Band zu einer Systematisierung der deutschsprachigen LL-Forschung bei, gibt Impulse für internationale Diskussionen und benennt wichtige Desiderata.
In order to satisfy the information needs of a wide range of researchers across a number of disciplines, large textual datasets require careful design, collection, cleaning, encoding, annotation, storage, retrieval, and curation. This daunting set of tasks has coalesced into a number of key themes and questions that are of interest to the contributing research communities: (a) what sampling techniques can we apply? (b) what quality issues should we be aware of? (c) what infrastructures and frameworks are being developed for the efficient storage, annotation, analysis and retrieval of large datasets? (d) what affordances do visualisation techniques offer for the exploratory analysis approaches of corpora? (e) what legal paths can be followed in dealing with IPR and data protection issues governing both the data sources and the query results? (f) how to guarantee that corpus data remain available and usable in a sustainable way?
Contents:
1. Christoph Kuras, Thomas Eckart, Uwe Quasthoff and Dirk Goldhahn: Automation, management and improvement of text corpus production, S. 1
2. Thomas Krause, Ulf Leser, Anke Lüdeling and Stephan Druskat: Designing a re-usable and embeddable corpus search library, S. 6
3. Radoslav Rábara, Pavel Rychlý and Ondřej Herman: Distributed corpus search, S. 10
4. Adrien Barbaresi and Antonio Ruiz Tinoco: Using elasticsearch for linguistic analysis of tweets in time and space, S. 14
5. Marc Kupietz, Nils Diewald and Peter Fankhauser: How to Get the Computation Near the Data: Improving data accessibility to, and reusability of analysis functions in corpus query platforms, S. 20
6. Roman Schneider: Example-based querying for specialist corpora, S. 26
7. Paul Rayson: Increasing interoperability for embedding corpus annotation pipelines in Wmatrix and other corpus retrieval tools, S. 33
Grammar and corpora 2016
(2018)
In recent years, the availability of large annotated and searchable corpora, together with a new interest in the empirical foundation and validation of linguistic theory and description, has sparked a surge of novel and interesting work using corpus-based methods to study the grammar of natural languages. However, a look at relevant current research on the grammar of the Germanic, Romance, and Slavic languages reveals a variety of different theoretical approaches and empirical foci, which can be traced back to different philological and linguistic traditions. Still, this current state of affairs should not be seen as an obstacle but as an ideal basis for a fruitful exchange of ideas between different research paradigms.
How can we measure the impact – such as awareness for economic, ecological, and political matters – of information, such as scientific publications, user-generated content, and reports from the public administration, based on text data? This workshop brings together research from different theoretical paradigms and methodologies for the extraction of impact-relevant indicators from natural language text data and related meta-data. The papers in this workshop represent different types of expertise in different methods for analyzing text data; spanning the whole spectrum of qualitative, quantitative, and mixed methods techniques, as well as domain expertise in the field of impact measurement. The program was built to create an interdisciplinary half-day workshop where we discuss possibilities, limitations, and synergistic effects of different approaches.
The authors are pleased to present to the readers of the Zeitschrift für Sprachwissenschaft a Special Issue in honor of Rosemarie Tracy.
Contents:
0. Frontmatter
1. Petra Schulz, Ira Gawlitzek, Angelika Wöllstein: Introduction, S. 1
2. Natascha Müller: Different sources of delay and acceleration in early child bilingualism, S. 7
3. Hubert Haider, Christina Schörghofer-Essl, Karin Seethaler: Quantifying kids prefer intersecting sets - a pilot study, S. 31
4. Petra Schulz, Rabea Schwarze: How strong is the ban on non-finite verbs in V2? Evidence from early second language learners of German with and without SLI, S. 51
5. Monika Rothweiler, Manuela Schönenberger, Franziska Sterner: Subject-verb agreement in German in bilingual children with and without SLI, S. 79
6. Holger Hopp: The processing of English which-questions in adult L2 learners: Effects of L1 transfer and proficiency, S. 107
7. Oksana Laleko, Maria Polinsky: Silence is difficult: On missing elements in bilingual grammars, S. 135
8. Artemis Alexiadou: Building verbs in language mixing varieties, S. 165
Komplexe Argumentstrukturen. Kontrastive Untersuchungen zum Deutschen, Rumänischen und Englischen
(2014)
Neben dem kanonischen Ausdruck der Argumentstruktur von Verben als Intransitiv- oder Transitivkonstruktion mit Nominal- oder Präpositionalphrasen können Argumente in vielfältiger Weise auch in komplexer, nicht-kanonischer Form realisiert werden. Solche Argumentstrukturen zeigen insbesondere im Sprachvergleich interessante Variationen, wie der vorliegende Band anhand von Studien zum Deutschen, Rumänischen und Englischen zeigt. Er versammelt kontrastive Arbeiten zur Alternation von sententialen und nominalen Subjekten, zu den Typen und Restriktionen von Resultativkonstruktionen, zu den Bedingungen des Auftretens innerer Objekte, zu Eigenschaften infiniter Formen und ihren Verwendungsbeschränkungen als Argumentausdrücke sowie zu den spezifischen Bedingungen der Ditransitiv-Alternation. Die aus verschiedenen theoretischen Perspektiven geschriebenen Arbeiten reflektieren dabei das Spannungsfeld zwischen lexikalischen Forderungen, konstruktionalen Idiosynkrasien und sprachübergreifenden oder sprachspezifischen strukturellen Restriktionen.
Der Sammelband zur typologisch und kontrastiv vergleichenden grammatischen Erforschung und Beschreibung des Satzanfangs des Deutschen und vier seiner Kontrastsprachen ist ein Ergebnis eines Forschungsnetzwerks, bestehend aus dem Institut für Deutsche Sprache (Mannheim) und Forschergruppen verschiedener europäischer Universitäten. Unter Berücksichtigung insbesondere morphosyntaktischer und informationsstruktureller Aspekte werden die satztopologischen Unterschiede der typologisch recht heterogenen Sprachen bzw. Sprachfamilien unter verschiedenen Gesichtspunkten beleuchtet. Die Untersuchungen werden korpusbasiert durchgeführt, wobei sich die Hälfte der Beiträge auf aufbereitete POS-getaggte Wikipedia-Korpora stützt. Die quantitativ ausgerichteten Korpusanalysen ermöglichen einen genauen Einblick in die unterschiedlichen Strukturmerkmale der betreffenden Sprachen sowie in sprachübergreifende Textmerkmale, und die qualitativen Untersuchungen zeigen Ähnlichkeiten und Abweichungen bei bestimmten Verfahren, die sich morphosyntaktisch iederschlagen und besonders am Satzanfang relevant sind. Insgesamt erlauben die Beiträge Hypothesen zu topologisch und informationsstrukturell markierten Satzanfängen und zu Präferenzen in den jeweiligen Sprachen, aber auch zu möglichen Konstanten und Gemeinsamkeiten, was – auf differenziertere Korpora erweitert – für die Bereiche Sprache und Kognition sowie computergestützte Übersetzung ein großer Gewinn sein dürfte.