Korpuslinguistik
Refine
Year of publication
Document Type
- Part of a Book (200)
- Conference Proceeding (161)
- Article (105)
- Book (34)
- Part of Periodical (10)
- Other (9)
- Working Paper (7)
- Review (4)
- Doctoral Thesis (3)
- Preprint (3)
Language
- German (274)
- English (265)
- Multiple languages (1)
Keywords
- Korpus <Linguistik> (457)
- Deutsch (165)
- Gesprochene Sprache (64)
- Annotation (56)
- Forschungsdaten (36)
- Computerlinguistik (33)
- Korpuslinguistik (28)
- corpus linguistics (27)
- Deutsches Referenzkorpus (DeReKo) (25)
- Grammatik (25)
Publicationstate
- Veröffentlichungsversion (322)
- Zweitveröffentlichung (142)
- Postprint (23)
- Erstveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (237)
- Peer-Review (202)
- Peer-review (5)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (5)
- Zweitveröffentlichung (3)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (2)
- Verlags-Lektorat (2)
- Peer-reviewed (1)
- Review-Status-unbekannt (1)
- Verlagslektorat (1)
Publisher
- de Gruyter (81)
- Institut für Deutsche Sprache (58)
- Narr (33)
- European Language Resources Association (ELRA) (25)
- European Language Resources Association (24)
- Leibniz-Institut für Deutsche Sprache (IDS) (20)
- Narr Francke Attempto (15)
- Leibniz-Institut für Deutsche Sprache (11)
- Linköping University Electronic Press (10)
- CLARIN (8)
- IDS-Verlag (7)
- Universitäts- und Landesbibliothek Darmstadt (7)
- Erich Schmidt (6)
- Heidelberg University Publishing (6)
- Peter Lang (6)
- Association for Computational Linguistics (5)
- Editura Academiei Române (5)
- European language resources association (ELRA) (5)
- Wilhelm Fink (5)
- Gesellschaft für Sprachtechnologie und Computerlinguistik (4)
- Niemeyer (4)
- Nisaba (4)
- University of Birmingham (4)
- De Gruyter (3)
- ELRA (3)
- Extreme Markup Languages Conference (3)
- Lang (3)
- University of Illinois (3)
- University of Liverpool (3)
- Verlag für Gesprächsforschung (3)
- ACM (2)
- Edinburgh University Press (2)
- Eigenverlag ÖGAI (2)
- German Society for Computational Linguistics & Language Technology (GSCL) (2)
- Institut für Kommunikationsforschung und Phonetik (2)
- Institut für deutsche Sprache (2)
- Lexical Computing CZ s.r.o. (2)
- MDPI (2)
- Ruhr-Universität Bochum (2)
- Springer (2)
- Stauffenburg (2)
- Steiner (2)
- The Association for Computational Linguistics (2)
- UCREL (2)
- University of Antwerp (2)
- Universität Hamburg (2)
- Universitätsverlag Rhein-Ruhr (2)
- Universitätsverlag Rhein-Ruhr OHG (2)
- V&R unipress (2)
- Winter (2)
- Zenodo (2)
- Academia (1)
- Academic Publishing Division of the Faculty of Arts of the University of Ljubljana (1)
- Association for Computational Linguistics ( ACL ); Curran Associates, Inc. (1)
- Association for Computational Linguistics and Dublin City University (1)
- Austrian Centre for Digital Humanities, Austrian Academy of Sciences (1)
- Austrian academy of sciences (1)
- Beltz Juventa (1)
- Berlin-Brandenburgische Akademie der Wissenschaften (1)
- Bern Open Publishing (1)
- Bozen University Press (1)
- CECL Papers 1 (1)
- CEUR-WS (1)
- CSLI Publications (1)
- Campus (1)
- Cergy-Pontoise University, France (1)
- Charles University (1)
- Clarin (1)
- Coling 2010 Organizing Committee (1)
- Deutsche Gesellschaft für Sprachwissenschaft (1)
- Digital Curation Centre (1)
- Dublin City University (1)
- Editions Tradulex (1)
- Equinox (1)
- European Network of e-Lexicography (ENeL) (1)
- Europäische Akademie (1)
- Friedrich H. (1)
- GSCL (1)
- Hempen (1)
- IDS-Verlag; Leibniz-Institut für Deutsche Sprache (IDS) (1)
- Ids-Verlag (1)
- Institute for Specialised Communication and Multilingualism (1)
- Institute of the Polish Language (1)
- Ivane Javakhishvili Tbilisi State University (1)
- Izdatel´stvo Sankt-Peterburgskogo gosudarstvennogo universiteta (1)
- Jagiellonian University; Pedagogical University (1)
- John Benjamins Publishing Company (1)
- Johns Hopkins University Pres (1)
- Köllen (1)
- L'Harmattan (1)
- LINDAT/CLARIAH-CZ digital library (1)
- Lancaster University (1)
- LiU Electronic Press (1)
- Linköping University (1)
- Linköping University Electronic Press, Linköpings universitet (1)
- Ljubljana University Press (1)
- Mannheim (1)
- Martin-Luther-Universität Halle-Wittenberg (1)
- Metzler (1)
- Northern European Association for Language Technology (1)
- OSF Preprints, Center for Open Science (1)
- Office for Humanities Communication; Centre for Computing in the Humanities (King’s College London (1)
- Olms (1)
- Oxford University Press (1)
- Polish Information Processing Society (1)
- Presses universitaires de Louvain (1)
- Ruhr-Universität Bochum, Sprachwissenschaftliches Institut (1)
- Schneider Hohengehren (1)
- Scriptor (1)
- Slavistično društvo: Filozofska fakulteta (1)
- Spanish Association for Corpus Linguistics (1)
- Sprachenzentrum der Technischen Universität Darmstadt ; Universitäts- und Landesbibliothek Darmstadt (1)
- Sprachwissenschaftliches Institut, Ruhr-Universität Bochum (1)
- Springer Vieweg (1)
- Springer-Verlag (1)
- Stutz (1)
- Tokyo University of Foreign Studies (1)
- Univ. Karlova, Filozifická Fak. (1)
- University of Brimingham (1)
- University of Maribor (1)
- University of Nottingham (1)
- University of Tartu (1)
- University of Tübingen (1)
- Universität Hildesheim (1)
- Universität Kassel (1)
- Universität Siegen (1)
- Universität Tübingen (1)
- Universität Zürich (1)
- Universitätsverlag C. Winter (1)
- Universitätsverlag Hildesheim (1)
- Université Lumière (1)
- Université catholique de Louvain (1)
- Université de Strasbourg (1)
- Univerzita (1)
- Uniwersytet im. Adama Mickiewicza w Poznaniu (1)
- V&R Unipress (1)
- VS Verlag (1)
- Vandenhoeck & Ruprecht (1)
- Växjö University Press (1)
- Wiley (1)
- Znanstvena založba Filozofske fakultete Univerze v Ljubljani / Ljubljana University Press, Faculty of Arts (1)
- de Gruyter Mouton (1)
- enigma corporation (1)
- nisaba (1)
The availability of electronic corpora of historical stages of languages has been wel- comed as possibly attenuating the inherent problem of diachronic linguistics, i.e. that we only have access to what has chanced to come down to us - the problem which was memorably named by Labov (1992) as one of “Bad Data”. However, such corpora can only give us access to an increased amount ot historical material and this can essentially still only be a partial and possibly distorted picture of the actual language at a particular period of history. Corpora can be improved by taking a more representative sample of extant texts if these are available (as they are in significant number for periods after the invention of printing). But, as examples from the recently compiled GerManC corpus of seventeenth and eighteenth century German show, the evidence from such corpora can still fail to yield definitive answers to our questions about earlier stages of a language. The data still require expert interpretation, and it is important to be realistic about what can legitimately be expected from an electronic historical corpus.
Ein sehr mächtiges Instrument für die Untersuchung von Wörtern und Verwandtschaftsbeziehungen zwischen ihnen ist die Analyse typischer Verwendungskontexte - unabhängig davon, ob die Evidenzen auf Bedeutungskonstitution, ihre Veränderung oder Verwechslung hinweisen, drei Aspekte, die alle bei der Charakterisierung von Paronymie eine Rolle spielen. Auch wenn für die Ermittlung typischer Verwendungsmuster ausgereifte Methoden zur Verfügung stehen, so sollte beim Vergleich der Analysen doch beachtet werden, dass sie diversen Einflussgrößen unterliegen. Neben der Datengrundlage und der Definition und Handhabung des relevanten Kontextes wird im Folgenden besonders darauf eingegangen, welche Rolle verschiedene Teilmengen eines Flexionsparadigmas spielen können, wenn ein Lemma als dessen Gesamtmenge als sprachliche Bezugseinheit einer Untersuchung gewählt wurde. Veranschaulicht wird die Gedankenführung an der beispielhaften Betrachtung von Paronymkandidaten.
Für den öffentlichen Sprachgebrauch im Internet ist Facebook, das mit 15 Jahren zur älteren Generation von Social-Media-Sites zählt, nach wie vor hochrelevant. Im deutschsprachigen Raum ist es die am meisten genutzte Social-Media-Plattform (Newman et al. 2019). Zu den Diensten gehören unter anderem Facebook-Seiten (Pages), die von Unternehmen, Parteien, Medien und anderen Institutionen oder Individuen betrieben werden und als öffentliche Angebote prinzipiell auch von nicht bei Facebook angemeldeten Personen eingesehen werden können. Solche öffentlichen Facebook-Seiten sind als sites of engagement zwischen gesellschaftlichen Institutionen und Individuen reichhaltige Quellen für die linguistische Forschung.
Im Vergleich zu anderen Plattformen bietet Facebook aber nur einen eingeschränkten Zugriff auf diese öffentlichen Sprach- und Interaktionsdaten (Freelon 2018). Während beispielsweise für Twitter viele Tools zur Datensammlung existieren und auch die Plattform selbst eine ausgebaute Suchmaske bietet, erschweren die limitierten Suchmöglichkeiten der Facebook-Plattform und das fehlende Angebot von einfach nutzbarer Software linguistische Projekte in Forschung und Lehre. Gleichzeitig stellen sich neben den praktischen Fragen an vielen Stellen auch forschungsethische Fragen im Umgang mit Onlinedaten.
Der Beitrag beschäftigt sich mit der Frage, wie und inwieweit korpusbasierte Ansätze zur Untersuchung und Bewertung von Sprachwandel beitragen können. Die Bewertung von Sprachwandel erscheint in dieser Hinsicht interessant, da sie erstens von größerem öffentlichen Interesse ist, zweitens nicht zu den Kernthemen der Sprachwissenschaft zählt und drittens sowohl die geisteswissenschaftlichen Aspekte der Sprachwissenschaft berührt als auch die empirischen, die eher für die so genannten harten Wissenschaften typisch sind. Letzteres trifft bei der Frage nach Sprachverfall (gutem vs. schlechtem Deutsch diachron) vermutlich unbestrittener zu als bei der Frage nach richtigem vs. falschem Deutsch, da zu ihrer Beantwortung offensichtlich einerseits empirische, messbare Kriterien herangezogen werden müssen, andererseits aber auch weitere Kriterien notwendig sind und es außerdem einer Entscheidung zur Einordnung und Gewichtung der verschiedenartigen Kriterien sowie einer Begründung dieser Entscheidung bedarf. Zur Annäherung an die Fragestellung werden zunächst gängige, leicht operationalisierbare Hypothesen zu Symptomen eines potenziellen Verfalls des Deutschen auf verschiedenen DeReKo-basierten Korpora überprüft und im Hinblick auf ihre Verallgemeinerbarkeit und Tragweite diskutiert. Im zweiten Teil werden weitere empirische Ansätze zur Untersuchung von Wandel, Variation und Dynamik skizziert, die zur Diskussion spezieller Aspekte von Sprachverfall beitragen könnten. Im Schlussteil werden die vorgestellten Ansätze in den Gesamtkontext einer sprachwissenschaftlichen Untersuchung von Sprachverfall gestellt und vor dem Hintergrund seines gesellschaftlichen Diskurses reflektiert.
Die Darstellung von und Arbeit mit Transkripten spielt in vielen forschungs- und anwendungsbezogenen Arbeiten mit Daten gesprochener Sprache eine wichtige Rolle. Der im ZuMult-Projekt entwickelte Prototyp ZuViel (Zugang zu Visualisierung von Transkripten) knüpft an etablierte Verfahren zur Transkriptdarstellung an und erweitert diese durch neue Möglichkeiten des interaktiven Arbeitens mit Transkripten im digitalen Medium. Der Beitrag führt in diese neuen Möglichkeiten ein und erklärt, wie sie in didaktischen DaF/DaZ-Kontexten aber auch hinsichtlich forschungsbezogener Perspektiven angewendet werden können
ZuRecht steht für Zugang zur Recherche in Transkripten. Es handelt sich um eine prototypische Implementierung einer webbasierten grafischen Benutzeroberfläche, welche Zugriff auf Transkripte gesprochener Sprache aus dem Archiv für Gesprochenes Deutsch (AGD) des Leibniz-Instituts für Deutsche Sprache (IDS) bietet. Der Zugriff erfolgt über die neue, im Projekt „ZuMult“ entwickelte Schnittstelle zur Suche in mündlichen Korpora. ZuRecht dient einerseits der Demonstration der Möglichkeiten der neuen Schnittstelle, indem es komplexe Suchanfragen mit der speziell für die Korpusrecherche entwickelten Anfragesprache CQP auf Transkriptionen gesprochener Sprache erlaubt. Andererseits kommt ZuRecht als Erweiterung der Datenbank für Gesprochenes Deutsch (DGD) zum Einsatz und eröffnet den DGD-Nutzer:innen viele neue Forschungsmöglichkeiten, insbesondere auf den Gebieten der Gesprächsanalyse und der DaF/DaZ-bezogenen Forschung. Im Beitrag werden die Funktionalitäten von ZuRecht ausführlich vorgestellt und ihre Einsatzmöglichkeiten in den genannten Disziplinen exemplarisch vorgeführt.