Korpuslinguistik
Refine
Year of publication
Document Type
- Part of a Book (86)
- Article (29)
- Conference Proceeding (14)
- Book (12)
- Working Paper (1)
Keywords
- Korpus <Linguistik> (125)
- Deutsch (43)
- Gesprochene Sprache (17)
- Annotation (15)
- Forschungsdaten (11)
- Korpuslinguistik (11)
- Sprachgebrauch (11)
- Sprachdaten (9)
- Germanistik (8)
- Datenbank (7)
- Kontrastive Linguistik (7)
- Deutsches Referenzkorpus (DeReKo) (6)
- Digital Humanities (6)
- Lexikografie (6)
- Metadaten (6)
- Schriftsprache (6)
- Sprachvariante (6)
- Computerunterstützte Kommunikation (5)
- Datenanalyse (5)
- Diskursanalyse (5)
- Grammatik (5)
- Historische Sprachwissenschaft (5)
- Leibniz-Institut für Deutsche Sprache. Jahrestagung (58. : 2022 : Online) (5)
- Maschinelles Lernen (5)
- Rumänisch (5)
- Social Media (5)
- Sprachanalyse (5)
- Syntax (5)
- Automatische Spracherkennung (4)
- Datenaufbereitung (4)
- Forschung (4)
- German (4)
- KorAP (4)
- Natürliche Sprache (4)
- Pragmatik (4)
- Visualisierung (4)
- Wortschatz (4)
- Wörterbuch (4)
- corpus linguistics (4)
- Benutzeroberfläche (3)
- COVID-19 (3)
- CoRoLa (3)
- Compterunterstützte Lexikografie (3)
- Computerlinguistik (3)
- Datenerhebung (3)
- Forschungsmethode (3)
- Fremdsprachenlernen (3)
- Interaktion (3)
- Konversationsanalyse (3)
- Korpora (3)
- Lernerkorpora (3)
- Lexik des gesprochen Deutsch (LeGeDe) (3)
- Mündliche Kommunikation (3)
- Neologismus (3)
- Rechtschreibung (3)
- Referenzkorpus (3)
- Semantik (3)
- Standardsprache (3)
- Weblog (3)
- Österreich (3)
- ASR (2)
- Abfragesprache (2)
- Althochdeutsch (2)
- Angewandte Linguistik (2)
- Austrian Media Corpus (2)
- Baumbank (2)
- CLARIN (2)
- CMC (2)
- Computerunterstützte Lexikografie (2)
- DRuKoLA (2)
- Daten (2)
- Datenmanagement (2)
- Datenverarbeitung (2)
- Dativ (2)
- Deutsch in Österreich (2)
- Deutsches Spracharchiv (2)
- Dialektologie (2)
- Diatopische Variation (2)
- Digitales Wörterbuch der deutschen Sprache (DWDS) (2)
- Diskurs (2)
- Distribution <Linguistik> (2)
- Dokumentation (2)
- Englisch (2)
- Europäischer Referenzkorpus (EuReCo) (2)
- Fallstudie (2)
- Flexion (2)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) (2)
- GeWiss-Korpus (2)
- Gegenwartssprache (2)
- Geschlechtergerechte Sprache (2)
- Gesprochenes Deutsch (2)
- Institut für Deutsche Sprache (2)
- Interdisziplinarität (2)
- Internetbasierte Kommunikation (2)
- Interoperabilität (2)
- Kausalität (2)
- Korpusaufbereitung (2)
- Korpusdesign (2)
- Lexikalische Semantik (2)
- Linguistik (2)
- Mehrebenenannotation (2)
- Methode (2)
- Name (2)
- Online-Medien (2)
- Online-Wörterbuch (2)
- Parallelkorpus (2)
- Phonetik (2)
- Plurizentrische Sprache (2)
- Politische Sprache (2)
- Präposition (2)
- Recht (2)
- Referenzkorpora (2)
- Ripuarian (2)
- Software (2)
- Soziolinguistik (2)
- Sprachgeografie (2)
- Sprachhandeln (2)
- Sprachressource (2)
- Sprachstatistik (2)
- Sprachwandel (2)
- Strukturbaum (2)
- Text Encoding Initiative (2)
- Transkription (2)
- Twitter <Softwareplattform> (2)
- Universal Dependencies (2)
- Variationslinguistik (2)
- Wissenschaftliche Kooperation (2)
- Wissenschaftskommunikation (2)
- Worthäufigkeit (2)
- XML (2)
- ZDL-Regionalkorpus (2)
- Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) (2)
- ZuMult (2)
- annotation (2)
- automatic transcription (2)
- corpus (2)
- corpus analysis (2)
- corpus annotation (2)
- corpus curation (2)
- machine learning (2)
- metadata (2)
- oral corpora (2)
- pluricentric (2)
- research infrastructure (2)
- spoken German (2)
- spoken German in interaction (2)
- spoken language (2)
- -gerecht (1)
- /e:/-Diphthongisierung (1)
- Abfrage (1)
- Abfragesystem (1)
- Abweichungstheorie (1)
- Adjektiv (1)
- Adjektive (1)
- Adverb (1)
- Affixoid (1)
- Akademischer Grad (1)
- Akkusativ (1)
- Akustisches Signal (1)
- Angewandte Gesprächsforschung (1)
- Annotation of causal language (1)
- Antwortrelationen (1)
- Antwortstrukturen (1)
- Arbeitsablauf (1)
- Archiv für gesprochenes Deutsch (AGD) (1)
- Argumentstruktur (1)
- Asad, Baššār al (1)
- Audioaufnahmen (1)
- Aufbereitung (1)
- Aufgabendesign (1)
- Ausgewogenheit (1)
- Aussprache (1)
- Automatische Sprachanalyse (1)
- Automatische Sprachverarbeitung (1)
- Automatische Textanalyse (1)
- BeDiaCo (1)
- Benutzerhandbuch (1)
- Berichterstattung (1)
- Bildungsinhalt (1)
- Briefwechsel (1)
- Brüdergemeine (1)
- CLARIN-D (1)
- CLARIN-Infrastruktur (1)
- COVID-19 discourse (1)
- CQLF (1)
- Chinesisches Deutschlerner-Korpus (1)
- Christentum (1)
- Chunk (1)
- CoNNAR (1)
- Collection of Multilingual Parallel Sequences (CoMParS) (1)
- Computerunterstütztes Verfahren (1)
- Corpus Analysis (1)
- Corpus Tools (1)
- DMC (1)
- DSSSL (1)
- DaF (1)
- Darmstädter-Tagblatt-Korpus (1)
- Data Mining (1)
- Data Science (1)
- Data Vizualization (1)
- Datenanreicherung (1)
- Datenbank Gesprochenes Deutsch (DGD) (1)
- Datenerschließung (1)
- Datenerweiterung (1)
- Datengeleitete Forschung (1)
- Datengeleitete Sprachbeschreibung (1)
- Datengeleitete Sprachmodellierung (1)
- Datenkompetenz (1)
- Datenkomposition (1)
- Datenmodell (1)
- Datensammlung (1)
- Datensatz (1)
- Datenschutz-Grundverordnung (1)
- Datenstrukturierung (1)
- Datenvernetzung (1)
- DeReKo (1)
- Deskriptivität (1)
- Deutsch als Fremdsprache (1)
- Deutsch als Fremdsprache (DaF) (1)
- Deutsch als Zweitsprache (1)
- Deutsch in Namibia (DNam) (1)
- Deutsches Referenzkorpus (1)
- Didaktik (1)
- Digital Herrnhut (1)
- Digitale Daten (1)
- Direktionalphrase (1)
- Discourse Lab (1)
- Diskursanalye (1)
- DiÖ-Korpus (1)
- EOSC (1)
- Einfache Sprache (1)
- Einleitung (1)
- Einsprachiges Wörterbuch (1)
- Einsprachigkeit (1)
- Elektronische Publikation (1)
- Elektronisches Wörterbuch (1)
- Empirie (1)
- Empirische Linguistik (1)
- Empirische Sprachdaten (1)
- Ethik (1)
- Europa (1)
- Evangelische Kirche (1)
- Expressionismus (1)
- FOLK (1)
- FOLK-Korpus (1)
- Facebook (1)
- Fachsprache (1)
- Form-Funktion-Kontinuum (1)
- Forschungs- und Lehrkorpus für Gesprochenes Deutsch (FOLK) (1)
- Forschungsdateninfrastruktur (1)
- Forschungsfrage (1)
- Forum für Deutsche Sprache (1)
- Framing-Effekt (1)
- Fremdsprache (1)
- Fremdsprachendidaktik (1)
- Fremdsprachenunterricht (1)
- Frühneuhochdeutsch (1)
- Fugenelement (1)
- Functional Domains (1)
- Fußballsprache (1)
- GDPR (1)
- Gebärdensprache (1)
- Gender (1)
- Gender Bias (1)
- Gendern (1)
- GermaNet (1)
- German as a Foreign Language (1)
- German as a Second Language (1)
- Gesprochene Korpora (1)
- Gesprochenes Deutsch in der Interaktion (1)
- Gesprächs-Metadaten (1)
- Gesprächskorpora (1)
- Globalisierung (1)
- Google Ngram Corpora (1)
- Gospel <Musik> (1)
- Grammatikunterricht (1)
- Grammis (1)
- GraphVar-Korpus (1)
- Graphematische Variation (1)
- Graphemik (1)
- HTML (1)
- Hamburger Zentrum für Sprachkorpora (1)
- Herder-Institut (Leipzig) (1)
- Hermeneutik (1)
- Heuristik (1)
- ISO (1)
- ISO-Norm (1)
- IVK-Ler corpus of German (1)
- Information Retrieval (1)
- Informationsgehalt (1)
- Informationsstruktur (1)
- Informationstheorie (1)
- Infrastruktur (1)
- Inkorporation (1)
- Instant Messaging (1)
- Institut für Deutsche Sprache <Mannheim> (1)
- Instiut für Deutsche Sprache <Mannheim> (1)
- InterCorp (1)
- Interaktionale Linguistik (1)
- Interaktionslinguistik (1)
- Interimsprache (1)
- Internet (1)
- Internetkommunikation (1)
- Jugendlicher (1)
- Jugendsprache (1)
- Kant, Immanuel (1)
- Katholische Kirche (1)
- Kausaler Konnektor (1)
- Kind (1)
- Kirche in 1live (1)
- Klassifikation (1)
- KoGra-R (1)
- Kognition (1)
- Kollokation (1)
- Kommunikation (1)
- Komposition <Wortbildung> (1)
- Kompositum (1)
- Konditionaler Konnektor (1)
- Konditionalität (1)
- Konfession (1)
- Konfessioneller Sprachgebrauch (1)
- Kongress (1)
- Konstruktion (1)
- Konstruktionsgrammatik (1)
- Kontextinformationen (1)
- Kontextualisierung (1)
- Kontrastive Grammatik (1)
- Kontrastive Textlinguistik (1)
- Kookkurrenz (1)
- Korpora Kontoverse Diskurse (1)
- Korpubasierte Methoden (1)
- Korpus <Llinguistik> (1)
- Korpus GiesKaNe (1)
- Korpus-Recherche (1)
- Korpusanalsyse (1)
- Korpusanalyseplattform (KorAP) (1)
- Korpusannotation (1)
- Korpusarchitektur (1)
- Korpusaufbau (1)
- Korpusbeleg (1)
- Korpusexploration (1)
- Korpusrecherchesystem (1)
- Korpusressourcen (1)
- Korpustechnologie (1)
- Korpustools (1)
- Lehrstoff (1)
- LeiKo (1)
- Leibniz-Institut für Deutsche Sprache (IDS) (1)
- Leichte Sprache (1)
- Lemma (1)
- Lemmata (1)
- Lexical Semantics (1)
- Lexicon (1)
- Lexik des gesprochenen Deutsch in der Interaktion (1)
- Lexikalische Ressourcen (1)
- Lexikografische Angabeklassen (1)
- Lexikographie (1)
- Lexikostatistik (1)
- Logische Partikel (1)
- Lyrik (1)
- Mathematische Linguistik (1)
- Mehrsprachigkeit (1)
- Methodenmix (1)
- Methodik (1)
- Methodologie (1)
- Migration (1)
- Mikrostruktur (1)
- Modaladverb (1)
- Moral (1)
- Moralisierung (1)
- Moralität (1)
- Multimodale Korpora (1)
- Multimodalität (1)
- Multirepräsentationale Daten (1)
- Multisituationale Daten (1)
- Mundart (1)
- Muster (1)
- Musterbildung (1)
- Muttersprache (1)
- Mündliche Hochschulkommunikation (1)
- Mündlichkeit (1)
- N-gram modeling (1)
- Named Entity Recognition (1)
- Namibia (1)
- Nationalkorpora (1)
- Natürliches sprachliches Handeln (1)
- Negation (1)
- Negativer Polaritätsausdruck (1)
- NeoRate (1)
- Nex-Gen Agile Reference Corpus (NARC) (1)
- Nominalkompositum (1)
- NottDeuYTSch (1)
- NottDeuYTSch corpus (1)
- Nutzungsrecht (1)
- OAuth (1)
- Online-Dienst (1)
- Onlinelexikografie (1)
- Onlinewörterbuch (1)
- Ontologie <Wissensverarbeitung> (1)
- Open Science (1)
- Oral history (1)
- Orthografisches Kernkorpus (OKK) (1)
- POS-Tagging (1)
- Paradigmenwechsel (1)
- Parallel European Corpus of Informal Interaction (PECII) (1)
- Parallele Korpora (1)
- Paronymie (1)
- Personenbezogene Daten (1)
- Persönlichkeitsrecht (1)
- Phonetische Korpora (1)
- Phraseologie (1)
- Phänomenmodellierung (1)
- Plenarprotokolle des Deutschen Bundestags (1)
- Polarity Shifter (1)
- Polarität (1)
- Poliqarp (1)
- Politik (1)
- Politische Berichterstattung (1)
- Polnisch (1)
- Popmusik (1)
- Pragmem (1)
- Predigt (1)
- Privacy by Design (1)
- Prosodie (1)
- Psycholinguistik (1)
- R <Programm> (1)
- RKorAPClient (1)
- RSS <Informatik> (1)
- Radiopredigt (1)
- Rechtspopulismus (1)
- Rechtsradikalismus (1)
- Rechtssprache (1)
- Redeerwähnung (1)
- Reference Corpora (1)
- Regionalkorpus (1)
- Rektionskompositum (1)
- Religion (1)
- Replikationsstudie (1)
- Repräsentationsformate von Kontexten (1)
- Resultativkonstruktion (1)
- Rezeption (1)
- Romanian corpus (1)
- Rover (1)
- Russlanddeutsch (1)
- Russlanddeutsche Dialektdatenbank (RuDiDat) (1)
- SGML (1)
- Sachtexte (1)
- Satzadverb (1)
- Satzende (1)
- Schallaufzeichnung (1)
- Schema (1)
- Schreibgebrauch (1)
- Schriftliche Reifeprüfung (1)
- Schriftlichkeit (1)
- Schule (1)
- Schüler (1)
- Semantische Relation (1)
- Semantisches Netz (1)
- Sentiment Analysis (1)
- Skalierbarkeit (1)
- Social Bots (1)
- Social Web (1)
- Softwareergonomie (1)
- Softwarewerkzeug (1)
- Songtext <Lyrik> (1)
- Soziale Medien (1)
- Spezialkorpora (1)
- Sprach(an)fragen (1)
- Sprachbeschreibung (1)
- Sprache (1)
- Sprachempirie (1)
- Spracherwerb (1)
- Sprachgebrauchs- und -einstellungsdaten (1)
- Sprachgeographie (1)
- Sprachgeschichte (1)
- Sprachinsel (1)
- Sprachmodellierung (1)
- Sprachnorm (1)
- Sprachpolitik (1)
- Sprachpolitilk (1)
- Sprachressourcen (1)
- Sprachtechnologie (1)
- Sprachtypologie (1)
- Sprachunterricht (1)
- Sprachvariation (1)
- Sprachwissenschaft (1)
- Sprecher-Metadaten (1)
- Standarddeutsch (1)
- Standardisierung (1)
- Statistischer Test (1)
- Stichwortkandidaten (1)
- Suchmaschine (1)
- Suchplattform (1)
- Superlativ (1)
- Supervised Classification (1)
- Swiss-AL (1)
- Syntaktische Annotationen (1)
- Synthese (1)
- Systemlinguistik (1)
- Südtirol (1)
- TEI (1)
- TEI P5 XML (1)
- TIGER (1)
- Technologie (1)
- Terminologie (1)
- Text Encoding Initiative (TEI) (1)
- Textkorpus (1)
- Textlinguistik (1)
- Textsorte (1)
- Textsorten (1)
- Textverstehen (1)
- Thematische Relation (1)
- Topikalisierung (1)
- Transitivität (1)
- Twitter (1)
- TüNDRA (1)
- UGC (1)
- Urheberrecht (1)
- User Generated Content (1)
- Usuelle Wortverbindungen (1)
- Valenz (1)
- Variationskorpora (1)
- Verfügbarkeit (1)
- Vergleichbare Korpora (1)
- Vergleichende Interaktionsforschung (1)
- Vergleichende Sprachwissenschaft (1)
- Vergleichskorpora (1)
- Vernetzung (1)
- Verschmelzung (1)
- Videoaufnahmen (1)
- VinKo (1)
- Visualisierungsplattform (1)
- Vorhersagbarkeit (1)
- Vorwort (1)
- WBÖ-Korpus (1)
- Web (1)
- Web Services (1)
- Webapplikation (1)
- Webmonitor-Korpus (1)
- Whatsapp (1)
- Wiederverwendung (1)
- Wikilog@bw (1)
- Wikipedia (1)
- Wissensbasis (1)
- Wissenschaft (1)
- Wissenschaftsethik (1)
- Wissenschaftssprache (1)
- Wissensrepräsentation (1)
- Word Embeddings (1)
- Wortbildung (1)
- Wortlänge (1)
- Wortschatzwandel (1)
- Wortverbindung (1)
- YouTube (1)
- Zeitung (1)
- Zeitungsartikel (1)
- Zipf–Mandelbrot law (1)
- Zipf’s law (1)
- acquisition (1)
- annotation guidelines (1)
- annotation schema (1)
- anotación de corpus (1)
- blog corpus (1)
- category detection (1)
- causal tagger (1)
- comparable corpora (1)
- compression (1)
- computer-mediated communication (1)
- computer-mediated communication (CMC) (1)
- comunicación mediada por computadora (CMC) (1)
- contraction (1)
- corpus linguistics (1)
- corpus access (1)
- corpus analysis tools (1)
- corpus compilation (1)
- corpus creation (1)
- corpus linguistic methodology (1)
- corpus querying (1)
- corpus search platform (1)
- corpus technology (1)
- corpus-based lexicography (1)
- corpus-based methods (1)
- corpus-lexicographic tool (1)
- definite article (1)
- definiter Artikel (1)
- diachronic corpus linguistics (1)
- digital communication (1)
- discourse dictionary (1)
- expressive Komposita (1)
- framing (1)
- funktionale Pragmatik (1)
- geschriebenes und gesprochenes Deutsch (1)
- gesprochene Sprache (1)
- gesprochensprachliches Korpus (1)
- headword candidates (1)
- impact assessment (1)
- information theory (1)
- internetbasierte Kommunikation (IBK) (1)
- interoperability (1)
- korpusbasierte und korpusgestützte Lexikografie (1)
- language resources (1)
- large-scale corpora (1)
- learner corpus of adolescent (1)
- lexical level (1)
- lexical richness (1)
- lexicographic information classes (1)
- lexis of spoken German (1)
- literarische Texte (1)
- longitudinal study (1)
- metadata analysis (1)
- microstructure (1)
- morphological level (1)
- multidisciplinarity (1)
- naming (1)
- natural language processing (1)
- neologism detection (1)
- noun–pronoun ratio (1)
- null-hypothesis testing (1)
- online dictionary (1)
- online lexicography (1)
- oral history corpora (1)
- personal data (1)
- power law (1)
- preposition (1)
- quantitative approaches (1)
- query (1)
- query languages (1)
- reference corpora (1)
- relaciones de respuesta (1)
- reply relations (1)
- representativeness (1)
- sentence boundary detection (1)
- sentiment (1)
- software (1)
- speech thought writing representation (1)
- spoken language corpora (1)
- spoken language transcripts (1)
- stance (1)
- standardization (1)
- statistical significance (1)
- syntactic competence (1)
- syntactic complexity (1)
- syntactical level (1)
- time series analysis (1)
- treebanks (1)
- type token ratio (1)
- uniform information density (1)
- user interface design (1)
- virtual corpus (1)
- vocabulary size (1)
- youth language (1)
- Öffentlichkeit (1)
- Österreichischer Sprachraum (1)
Publicationstate
- Zweitveröffentlichung (142) (remove)
Reviewstate
- (Verlags)-Lektorat (97)
- Peer-Review (42)
- Peer-reviewed (1)
Publisher
- de Gruyter (49)
- Narr (17)
- European Language Resources Association (14)
- Narr Francke Attempto (13)
- Erich Schmidt (6)
- Editura Academiei Române (5)
- Wilhelm Fink (5)
- Lang (2)
- Steiner (2)
- Universitätsverlag Rhein-Ruhr OHG (2)
We present a new resource for German causal language, with annotations in context for verbs, nouns and adpositions. Our dataset includes 4,390 annotated instances for more than 150 different triggers. The annotation scheme distinguishes three different types of causal events (CONSEQUENCE, MOTIVATION, PURPOSE). We also provide annotations for semantic roles, i.e. of the cause and effect for the causal event as well as the actor and affected party, if present. In the paper, we present inter-annotator agreement scores for our dataset and discuss problems for annotating causal language. Finally, we present experiments where we frame causal annotation as a sequence labelling problem and report baseline results for the prediciton of causal arguments and for predicting different types of causation.
In diesem Kapitel stellen wir zunächst grundlegende Konzepte von Abfragesystemen und Abfragesprachen für die Suche in Korpora vor. Diese Konzepte sollen Ihnen helfen, die einzelnen Abfragesprachen besser zu verstehen und vergleichen zu können. Die gängigen Abfragesprachen unterscheiden sich in vielen Details. Diese Details und die Möglichkeiten und Grenzen der einzelnen Abfragesprachen stellen wir im zweiten Teil mit vielen Beispielaufgaben und dazu passenden Lösungen in jeweils drei Abfragesprachen vor.
In this paper, we present an overview of freely available web applications providing online access to spoken language corpora. We explore and discuss various solutions with which the corpus providers and corpus platform developers address the needs of researchers who are working with spoken language. The paper aims to contribute to the long-overdue exchange and discussion of methods and best practices in the design of online access to spoken language corpora.
Eine korpuslinguistische Untersuchung mit umfassender Analyse der häufiger vorkommenenden Adverbbildungsmuster des Deutschen legt nahe, dass die Sättigung des internen Argumentplatzes eines ursprünglich relationalen Ausdrucks eine wichtige Rolle bei der Adverbproduktion spielt (Brandt 2020). Eine genauere Betrachtung der Unterschiede zwischen -ermaßen- vs. -erweise-Adverbien deutet auf eine grammatische Unterscheidung zwischen Satzadverbien und Adverbien der Art und Weise: Im Fall von -ermaßen erfolgt die Sättigung über Token-Reflexivität, während der interne Slot von -erweise- Bildungen über häufigere und möglicherweise expansive Mechanismen geschlossen wird. Darüber hinaus fördert die pleonastische Qualität von Bildungen auf der Basis gerundivaler Partizipien die Produktivität von -erweise Adverbien.
In the first volume of Corpus Linguistics and Linguistic Theory, Gries (2005. Null-hypothesis significance testing of word frequencies: A follow-up on Kilgarriff. Corpus Linguistics and Linguistic Theory 1(2). doi:10.1515/cllt.2005.1.2.277. http://www.degruyter.com/view//cllt.2005.1.issue-2/cllt.2005.1.2.277/cllt.2005.1.2.277.xml: 285) asked whether corpus linguists should abandon null-hypothesis significance testing. In this paper, I want to revive this discussion by defending the argument that the assumptions that allow inferences about a given population – in this case about the studied languages – based on results observed in a sample – in this case a collection of naturally occurring language data – are not fulfilled. As a consequence, corpus linguists should indeed abandon null-hypothesis significance testing.
Die erfolgreiche Wiederverwendung gesprochener Korpora muss fachspezifischen Evaluationskritierien genügen und erfordert daher eine flexible Korpusarchitektur, die durch multirepräsentationale (Verfügbarkeit eines akustischen Signals und einer Transliteration) und multisituationale Daten (Variabilität von Situationen bzw. Aufgaben) gekennzeichnet ist. Diese Kriterien werden in einer Fallstudie zur /eː/-Diphthongisierung polnischer Deutschlerner/-innen angewendet und diskutiert. Die Fallstudie repliziert die Ergebnisse der /eː/-Diphthongisierung bei Bildbenennungen von Nimz (2016). Vor der Wiederverwendung werden weitere fachspezifische Evaluationskriterien überprüft, wie Multisituationalität, Aufnahmequalitäten, Erweiterbarkeit, vorhandene Metadaten und vorhandene Dokumentation. Nach der Replikationsstudie werden die Herausforderungen für eine Umsetzung der Wiederverwendung bezüglich Datenmanagement, Workflows und Data Literacy in Forschungs- und Lehrkontexten diskutiert.
Korpora sind – als idealerweise digital verfüg- und auswertbare Sammlungen von Texten – eine wertvolle empirische Grundlage linguistischer Studien. Eigene Korpora aufzubauen ist, je nach Sprachausschnitt, mit unterschiedlichen Herausforderungen verbunden. Zu allen Texten sollten Metadaten zu den Textentstehungsbedingungen (Zeit, Quelle usw.) erhoben werden, um diese als Variablen in Auswertungen einbeziehen zu können. Andere Informationen wie etwa die Themenzugehörigkeit (oder Annotationen auch unterhalb der Textebene) sind auch hilfreich, in vielerlei Hinsicht aber schwieriger pauschal taxonomisch vorzugeben, geschweige denn, operationell zu ermitteln. Jenseits der »materiellen« Verfügbarkeit der Texte und der technischen Aufbereitung sind es das Urheberrecht, vor allem Lizenz- bzw. Nutzungsrechte, sowie ethische Verantwortung und Persönlichkeitsrechte, die beachtet werden müssen, auch um zu gewährleisten, dass die Daten für die Reproduktion der Studien Dritten rechtssicher zugänglich gemacht werden dürfen. Bevor für ein Vorhaben ein neues Korpus aufgebaut wird, sollte deshalb am besten geprüft werden, ob nicht ein geeignetes bereits zur Verfügung steht. Wenn ein Korpus aufgebaut wird, sollte für eine nachhaltige Aufbewahrung und Zugänglichmachung gesorgt und die Existenz an geeigneter Stelle dokumentiert werden.
Anhand einer korpusgestützten Untersuchung komplexer Adjektive mit dem Erstelement {gender-} mit DeReKoVecs wird gezeigt, welche Möglichkeiten zur differenzierten sprachlichen Integration von neuen Diskurselementen die Wortbildung des Adjektivs bietet. Gerade die zwischen den klassischen Typen Komposition und Derivation stehenden Techniken bieten hier eine erhebliche Bandbreite an Möglichkeiten.
Die sprachlichen Auffälligkeiten, die in Gedichten zu beobachten sind, haben immer wieder Anlass zu verschiedenen Versionen der Abweichungstheorie gegeben, derzufolge die in Gedichten verwendete Sprache von nicht-lyrischer Sprache abweicht. Expressionistische Lyrik ist insbesondere für ihre argumentstrukturellen Innovationen bekannt. Auf der Basis eines Korpus expressionistischer Gedichte wird eine Übersicht über diese Auffälligkeiten gegeben, die die Grundlage für weitere Studien darstellen soll, in denen zu zeigen sein wird, inwieweit unter bestimmten grammatiktheoretischen Annahmen die Abweichungstheorie zurückgewiesen werden kann.