Refine
Year of publication
- 2018 (15) (remove)
Document Type
- Part of a Book (11)
- Book (4)
Language
- German (6)
- Multiple languages (5)
- English (4)
Has Fulltext
- yes (15)
Keywords
- Korpus <Linguistik> (6)
- Sprachkritik (5)
- Visualisierung (5)
- Deutsch (4)
- Europa (4)
- Grammatik (4)
- Sprachnorm (4)
- Visual Linguistics (4)
- Linguistische Informationswissenschaft (3)
- Sprachdaten (2)
Publicationstate
Reviewstate
- (Verlags)-Lektorat (10)
- Peer-Review (5)
Publisher
- Heidelberg University Publishing (15) (remove)
Visualisierungen spielen in den Wissenschaften eine wichtige Rolle im Forschungsprozess. Sie dienen der Illustration von gewonnener Erkenntnis, aber auch als eigenständiges Mittel der Erkenntnisgewinnung. Auch in der Linguistik sind solche Visualisierungen bedeutend. Beispielsweise in Form von Karten, Baumgraphen und Begriffsnetzen. Bei korpuslinguistischen Methoden sind explorative Visualisierungen oft ein wichtiges Mittel, um die Daten überblickbar und interpretierbar zu machen. Das Buch reflektiert die theoretischen Grundlagen wissenschaftlicher Visualisierungen in der Linguistik, zeigt Praxisbeispiele und stellt auch Visualisierungswerkzeuge vor.
Die ansprechende und geeignete Visualisierung linguistischer Daten gewinnt analog zum steigenden Einfluss quantitativer Methoden in der Linguistik immer mehr an Bedeutung. R ist eine flexible und freie Entwicklungsumgebung zur Umsetzung von statistischen Analysen, die zahlreiche Optionen zur Datenvisualisierung bereithält und sehr gut für große Datensätze geeignet ist. Statistische Analysen und Visualisierungen von Daten werden auf diese Weise in einer Umgebung verzahnt. Durch die zahlreichen Zusatzpakete stehen auch weiterhin zeitgemäße Methoden zur Verfügung, um (linguistische) Daten zu analysieren und darzustellen.
Der Beitrag vermittelt einen stark anwendungsorientierten Einstieg in das Programm und legt mithilfe von vielen praktischen Übungen und Anwendungsbeispielen die Grundlagen für ein eigenständiges Weiterentwickeln der individuellen Fähigkeiten im Umgang mit der Software. Neben einer kurzen, eher theoretisch angelegten Einleitung zu explorativen und explanatorischen Visualisierungsstrategien von Daten werden verschiedene Pakete vorgestellt, die für die Visualisierung in R benutzt werden können.
Sehr große Korpora – wie das Deutsche Referenzkorpus DeReKo – bieten eine breite Basis für die empirische Forschung. Sie bringen aber auch Herausforderungen mit sich, da sich weder Eigenschaften ihrer Zusammensetzung noch derer von Recherche- und Analyseergebnissen mit einfachen Mitteln erschließen lassen. Dafür bedarf es Verfahren geschickter Sortierung, Gruppierung oder des Clusterings, kurzum: strukturentdeckender Methoden. In Kombination mit Visualisierungstechniken kann so die Wahrnehmung bestimmter Eigenschaften und Zusammenhänge unterstützt und die Aufmerksamkeit auf bestimmte Phänomene, ggf. in Anlehnung an präferenzrelationale Befunde, gelenkt werden. Neben der illustrativen Funktion geht es in diesem Beitrag vor allem um das erkenntnisleitende Potenzial derartiger Verfahren in Kombination. Aus verschiedenen Bereichen werden Beispiele gezeigt, die am IDS oder in Kooperationen zum Einsatz kommen, sowohl zur dokumentarischen und reflexiven Kontrolle von Eigenschaften der Korpuszusammensetzung als auch hinsichtlich korpusanalytischer Methodik, um die qualitative Interpretation von Analysebefunden und die Abduktion von Hypothesen stimulierend zu unterstützen.
Sprachpurismus ist eine Form der Sprachkritik, die sich die 'Reinhaltung‘ der Sprache zum obersten Ziel gesetzt hat. Unter Reinhaltung ist zunächst die Zurückdrängung fremdsprachlicher Einflüsse vor allem im Bereich der Lexik zu verstehen, aber auch Versuche der Herausbildung eines Standards und der Entwicklung einer Hochsprache bzw. Nationalsprache sind Gegenstände des Purismus. Sprachpurismus kann individuell als auch institutionell sein. Die ersten institutionellen Versuche zur Reinhaltung des Deutschen gehen auf die Sprachgesellschaften des 17. Jahrhunderts zurück. Diachron betrachtet hat sich der Fokus des Purismus auf unterschiedliche Aspekte der Sprache und der Sprachverwendung gerichtet; gemeinsam ist allen puristischen Bestrebungen, dass sie in der Regel gesellschaftlich an ein Erstarken des Nationalgefühls gekoppelt sind. Trotz institutioneller Bestrebung und im Gegensatz zu anderen Sprachen ist für das Deutsche der Purismus keine Form der Sprachpolitik, also nicht staatlich gelenkt.
Notions such as “corpus-driven” versus “theory-driven” bring into focus the specific role of corpora in linguistic research. As for phonology with its intrinsic focus on abstract categorical representation, there is a question of how a strictly corpus-driven approach can yield insight into relevant structures. Here we argue for a more theory-driven approach to phonology based on the concept of a phonological grammar in terms of interacting constraints. Empirical validation of such grammars comes from the potential convergence of the evidence from various sources including typological data, neutralization patterns, and in particular patterns observed in the creative use of language such as acronym formation, loanword adaptation, poetry, and speech errors. Further empirical validation concerns specific predictions regarding phonetic differences among opposition members, paradigm uniformity effects, and phonetic implementation in given segmental and prosodic contexts. Corpora in the narrowest sense (i.e. “raw” data consisting of spontaneous speech produced in natural settings) are useful for testing these predictions, but even here, special purpose-built corpora are often necessary.
In dem vorliegenden Handbuchband wird Sprachpurismus als eine Kritik am Sprachgebrauch und als eine Kritik an verschiedenen Strukturen und Elementen einer Sprache verstanden. Es wird sprachvergleichend aufgezeigt, in welchen Sprachkonstellationen Sprachpurismus in der Vergangenheit sowie heute von Bedeutung ist und inwiefern die einzelnen Sprachkulturen von sprachpuristischen Aktionen betroffen waren bzw. sind. Außerdem wird auf wichtige Akteure und auf spezifische diskursive Zusammenhänge der einzelnen Sprachräume eingegangen.
In dem vorliegenden Handbuchband werden aus sprachkritischer Sicht Standardisierungsprozesse im Deutschen, Englischen, Französischen, Italienischen und Kroatischen behandelt sowie Instanzen und Bereiche der Standardisierung verglichen. Hierbei geht es sowohl um Aspekte der Diachronie, welche die Herausbildung von Normen für die geschriebene und gesprochene Sprache betreffen, als auch um synchrone Gesichtspunkte wie aktuelle plurizentrische Normtendenzen, Fragen der Orthographie und der Kodifizierung.
In recent years, the availability of large annotated and searchable corpora, together with a new interest in the empirical foundation and validation of linguistic theory and description, has sparked a surge of novel and interesting work using corpus-based methods to study the grammar of natural languages. However, a look at relevant current research on the grammar of the Germanic, Romance, and Slavic languages reveals a variety of different theoretical approaches and empirical foci, which can be traced back to different philological and linguistic traditions. Still, this current state of affairs should not be seen as an obstacle but as an ideal basis for a fruitful exchange of ideas between different research paradigms.
Grammar and corpora 2016
(2018)
In recent years, the availability of large annotated and searchable corpora, together with a new interest in the empirical foundation and validation of linguistic theory and description, has sparked a surge of novel and interesting work using corpus-based methods to study the grammar of natural languages. However, a look at relevant current research on the grammar of the Germanic, Romance, and Slavic languages reveals a variety of different theoretical approaches and empirical foci, which can be traced back to different philological and linguistic traditions. Still, this current state of affairs should not be seen as an obstacle but as an ideal basis for a fruitful exchange of ideas between different research paradigms.
In this paper, we present our approach to automatically extracting German terminology in the domain of grammar using texts from the online information system grammis as our corpus. We analyze existing repositories of German grammatical terminology and develop Part-of-speech patterns for our extraction thereby showing the importance of unigrams in this domain. We contrast the results of the automatic extraction with a manually extracted standard. By comparing the performance of well-known statistical measures, we show how measures based on corpus comparison outperform alternative methods.