Korpuslinguistik
Refine
Year of publication
Document Type
- Part of a Book (108)
- Conference Proceeding (67)
- Article (54)
- Book (20)
- Other (5)
- Preprint (3)
- Working Paper (3)
- Report (2)
- Doctoral Thesis (1)
- Master's Thesis (1)
Is part of the Bibliography
- yes (265) (remove)
Keywords
- Korpus <Linguistik> (242)
- Deutsch (80)
- Gesprochene Sprache (41)
- Forschungsdaten (30)
- Annotation (27)
- Computerlinguistik (19)
- Korpuslinguistik (19)
- Datenmanagement (17)
- Deutsches Referenzkorpus (DeReKo) (17)
- Sprachdaten (17)
- corpus linguistics (15)
- Grammatik (13)
- Kontrastive Linguistik (13)
- Computerunterstützte Kommunikation (12)
- Metadaten (12)
- Visualisierung (11)
- Sprachstatistik (10)
- Germanistik (9)
- Sprachgebrauch (9)
- Automatische Sprachanalyse (8)
- Datenbank (8)
- German (8)
- Text Encoding Initiative (8)
- Wortschatz (8)
- corpus (8)
- oral corpora (8)
- CMC (7)
- Digital Humanities (7)
- Fremdsprache (7)
- Fremdsprachenlernen (7)
- Interaktion (7)
- Mündliche Kommunikation (7)
- Rumänisch (7)
- Social Media (7)
- Sprachvariante (7)
- computer-mediated communication (7)
- Datenqualität (6)
- Schriftsprache (6)
- TEI (6)
- Textkorpus (6)
- Urheberrecht (6)
- Worthäufigkeit (6)
- Wörterbuch (6)
- YouTube (6)
- metadata (6)
- spoken language (6)
- Abfragesprache (5)
- Audiovisuelles Material (5)
- Datenanalyse (5)
- Datensatz (5)
- Distribution <Linguistik> (5)
- Englisch (5)
- Fremdsprachenunterricht (5)
- Kommunikation (5)
- Konversationsanalyse (5)
- Leibniz-Institut für Deutsche Sprache. Jahrestagung (58. : 2022 : Online) (5)
- Lexikografie (5)
- Maschinelles Lernen (5)
- Natürliche Sprache (5)
- Sprachwandel (5)
- comparable corpora (5)
- corpora (5)
- Automatische Spracherkennung (4)
- Benutzeroberfläche (4)
- CLARIN (4)
- Corpus linguistics (4)
- Datenaufbereitung (4)
- Diskursanalyse (4)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) (4)
- Forschungsmethode (4)
- Information Retrieval (4)
- Infrastruktur (4)
- Institut für Deutsche Sprache <Mannheim> (4)
- Jugendsprache (4)
- KorAP (4)
- Leibniz-Institut für Deutsche Sprache (IDS) (4)
- Linguistik (4)
- Metadatenmodell (4)
- Phraseologie (4)
- Software (4)
- Sprachanalyse (4)
- Syntax (4)
- annotation (4)
- reply relations (4)
- software (4)
- youth language (4)
- Angewandte Linguistik (3)
- CoRoLa (3)
- Compterunterstützte Lexikografie (3)
- Corpus technology (3)
- Daten (3)
- Datenerhebung (3)
- Datenschutz-Grundverordnung (3)
- Dokumentation (3)
- Fachsprache (3)
- Forschung (3)
- Internet (3)
- Kollokation (3)
- Konstruktionsgrammatik (3)
- Korpora (3)
- Korpora in DaF/DaZ (3)
- Lehrmittel (3)
- Lexik des gesprochen Deutsch (LeGeDe) (3)
- Lyrics <Lyrik> (3)
- Morphologie <Linguistik> (3)
- Mündliche Korpora (3)
- Polnisch (3)
- Präposition (3)
- Recht (3)
- Rechtschreibung (3)
- Redeerwähnung (3)
- Semasiologie (3)
- Technologie (3)
- Textsorte (3)
- Transkription (3)
- Ungarisch (3)
- Universal Dependencies (3)
- Visual Linguistics (3)
- Wortbildung (3)
- Wortverbindung (3)
- copyright (3)
- corpora in GFL/GSL (3)
- corpus analysis (3)
- corpus annotation (3)
- corpus-based lexicography (3)
- impact assessment (3)
- interoperability (3)
- legal issues (3)
- linguistic research software (3)
- research infrastructure (3)
- spoken German (3)
- tokenization (3)
- ASR (2)
- Abfrage (2)
- Anonymisierung (2)
- Archiv für Gesprochenes Deutsch (AGD) (2)
- Argumentstruktur (2)
- CLARIN-D (2)
- COVID-19 (2)
- Computerunterstützte Lexikografie (2)
- Corpus management (2)
- DMC (2)
- DRuKoLA (2)
- Data Mining (2)
- Datenbank für Gesprochenes Deutsch (DGD) (2)
- Datenbanksystem (2)
- Datenformat (2)
- Deutsch als Fremdsprache (2)
- Deutsch als Fremdsprache (DaF) (2)
- Digitale Kommunikation (2)
- Diskurs (2)
- Dortmunder Chat-Korpus (2)
- Empirie (2)
- Europa (2)
- Europäischer Referenzkorpus (EuReCo) (2)
- Evaluation (2)
- FOLK (2)
- Fallstudie (2)
- Funktionsverbgefüge (2)
- GDPR (2)
- Gegenwartssprache (2)
- GermaNet (2)
- Geschlechtergerechte Sprache (2)
- Gesprochenes Deutsch (2)
- Gesprächskorpora (2)
- Google Ngram Corpora (2)
- Historische Sprachwissenschaft (2)
- ISO-Norm (2)
- Indirekte Rede (2)
- Institut für Deutsche Sprache (2)
- Internetbasierte Kommunikation (2)
- Interoperabilität (2)
- Komposition <Wortbildung> (2)
- Kompositum (2)
- Kontrastive Grammatik (2)
- Kookkurrenzanalyse (2)
- KorAP (Korpusanalyseplattform der nächsten Generation) (2)
- Korpusanalyseplattform (KorAP) (2)
- Korpusdesign (2)
- Language Variation (2)
- Langzeitarchivierung (2)
- Lemma (2)
- Lernerkorpora (2)
- Lexikalische Semantik (2)
- Linguistische Informationswissenschaft (2)
- MTAS (2)
- Mehrsprachigkeit (2)
- Methode (2)
- Mundart (2)
- Name (2)
- National corpus (2)
- Negation (2)
- Neologismus (2)
- NottDeuYTSch corpus (2)
- NottDeuYTSch-Korpus (2)
- Nutzungsrecht (2)
- Online-Dienst (2)
- Online-Wörterbuch (2)
- Part-of-Speech-Tagging (2)
- Part-of-Speech-Tagging = POS (2)
- Performanz <Linguistik> (2)
- Personenbezogene Daten (2)
- Plurizentrische Sprache (2)
- Polish (2)
- Popmusik (2)
- Prädikat (2)
- Psycholinguistik (2)
- Rechtsstellung (2)
- Referenzkorpora (2)
- Richtlinie (2)
- Ripuarian (2)
- Semantik (2)
- Softwarewerkzeug (2)
- Soziolinguistik (2)
- Sprachgeografie (2)
- Sprachhandeln (2)
- Sprachkompetenz (2)
- Sprachressource (2)
- Sprachtechnologie (2)
- Sprachwissenschaft (2)
- Sprichwort (2)
- Statistischer Test (2)
- Strukturbaum (2)
- Suchmaschine (2)
- Syntagma (2)
- Textanalyse (2)
- Textlinguistik (2)
- Texttechnologie (2)
- UGC (2)
- Vergleichbare Korpora (2)
- Vernetzung (2)
- Web (2)
- Web Services (2)
- Wiedervereinigung <Deutschland> (2)
- Wikipedia (2)
- Wissenschaftliche Kooperation (2)
- Zipf’s law (2)
- audiovisual data (2)
- automatic transcription (2)
- cmc corpora (2)
- contrastive linguistics (2)
- corpus curation (2)
- corpus linguistic methodology (2)
- corpus management (2)
- corpus processing (2)
- data quality (2)
- diachronic corpus linguistics (2)
- gesprochene Sprache (2)
- infrastructure (2)
- language change (2)
- language resources (2)
- language variation (2)
- large corpora (2)
- lexical richness (2)
- linguistic data (2)
- long-term archival (2)
- machine learning (2)
- n-grams (2)
- noun–pronoun ratio (2)
- null-hypothesis testing (2)
- online language (2)
- personal data (2)
- pluricentric (2)
- power law (2)
- quantitative approaches (2)
- query (2)
- reference corpora (2)
- representativeness (2)
- reusability (2)
- software quality management (2)
- spoken German in interaction (2)
- spoken language corpora (2)
- spoken language data (2)
- syntactic complexity (2)
- time series analysis (2)
- type token ratio (2)
- vocabulary size (2)
- web corpora (2)
- word embeddings (2)
- (un)certainty (1)
- Abfragesystem (1)
- Ableitung <Linguistik> (1)
- Abweichungstheorie (1)
- Access Control (1)
- Adjektive (1)
- Adverb (1)
- Akademischer Grad (1)
- Algorithmus (1)
- Alternation (1)
- Ambiguität (1)
- Amerikanisches Englisch (1)
- Analyse (1)
- Angewandte Gesprächsforschung (1)
- Annotation guidelines (1)
- Annotation of causal language (1)
- Anthropologie (1)
- Anti-Establishment-Texte (1)
- Antonym (1)
- Antwort (1)
- Antwortrelationen (1)
- Antwortstrukturen (1)
- Arbeit mit Transkripten (1)
- Archiv (1)
- Archiv für gesprochenes Deutsch (AGD) (1)
- Archivierung (1)
- Argumentalternationen (1)
- Assoziationsmaß (1)
- Attributives Adjektiv (1)
- Audioaufnahmen (1)
- Aufbereitung (1)
- Augenzeuge (1)
- Ausgewogenheit (1)
- Auslassung (1)
- Austrian Media Corpus (1)
- Authentische Ressourcen (1)
- Automatische Textanalyse (1)
- Baumbank (1)
- BeDiaCo (1)
- Bedeutungsrelation (1)
- Benutzerforschung (1)
- Benutzerfreundlichkeit (1)
- Bildungsinhalt (1)
- Biografisches Interview (1)
- CLARIAH-DE (1)
- CLARIN infrastructure (1)
- CLARIN-Infrastruktur (1)
- CMC (International Conference on Cooperative Multimodal Communication) <2023, Mannheim> (1)
- CMC corpus (1)
- CMDI metadata (1)
- COVID-19 discourse (1)
- CQLF (1)
- Chatten <Kommunikation> (1)
- Chinesisches Deutschlerner-Korpus (1)
- Christentum (1)
- Chunk (1)
- Clarin (1)
- CoMParS (1)
- CoNNAR (1)
- Collection of Multilingual Parallel Sequences (CoMParS) (1)
- Computer-mediated communication (1)
- Computergestützte Lexikographie (1)
- Computerunterstützte Lexikogaphie (1)
- Computerunterstützte Lexikographie (1)
- Computeruntertützte Lexikographie (1)
- Corpora (1)
- Corpus Analysis (1)
- Corpus Comparison (1)
- Corpus Management (1)
- Corpus Tools (1)
- Corpus annotation (1)
- Corpus query platform (1)
- DARIAH-DE (1)
- DaF (1)
- Data Science (1)
- Data Vizualization (1)
- Dateiformat (1)
- Datenkomposition (1)
- Datenmodell (1)
- Datensammlung (1)
- Datenschutz (1)
- Datenstruktur (1)
- Dativ (1)
- DeReKo (1)
- Dependency Parsing (1)
- Deskriptivität (1)
- Deutsch als Muttersprache (1)
- Deutsch als Zweitsprache (1)
- Deutsch als Zweitsprache (DaZ) (1)
- Deutsch in Namibia (DNam) (1)
- Deutsches Referenzkorpus (1)
- Deutschunterricht (1)
- Dialektologie (1)
- Digitale Daten (1)
- Digitaler Sprachassistent (1)
- Digitalisierung (1)
- Direkte Rede (1)
- Direkte Redeeinleiter (1)
- Direktionalphrase (1)
- Diskursive Fähigkeiten (1)
- Diskurslinguistik (1)
- Diskursmarker (1)
- Dispersion (1)
- Drei-Ebenen-Architektur (1)
- Dynamik des Lexikons (1)
- EOSC (1)
- Eigentumsrecht (1)
- Einbettung <Linguistik> (1)
- Einfache Sprache (1)
- Einleitung (1)
- Einwanderer (1)
- Elektronische Publikation (1)
- Elektronisches Forum (1)
- Elektronisches Wörterbuch (1)
- Empirik (1)
- Empirische Linguistik (1)
- Empirische Sprachdaten (1)
- Endlicher Zustandsraum (1)
- English (1)
- Enzyklopädie (1)
- Ergänzung <Linguistik> (1)
- Erzähltechnik (1)
- Ethik (1)
- European Reference Corpus (EuReCo) (1)
- Evangelische Kirche (1)
- Expressionismus (1)
- Externe Ebene (1)
- FAIR (1)
- FAIR data (1)
- FOLK-Korpus (1)
- Fachlexikographie (1)
- Flexion (1)
- Form-Funktion-Kontinuum (1)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) (1)
- Forschungs- und Lehrkorpus für Gesprochenes Deutsch (FOLK) (1)
- Forschungsdateninfrastruktur (1)
- Forschungsfrage (1)
- Forschungsimpact (1)
- Forschungsprojekt (1)
- Forschungsstand (1)
- Forschungsverbund (1)
- Forschungswerkzeuge (1)
- Forum für Deutsche Sprache (1)
- Framing-Effekt (1)
- Französisch (1)
- Fremdsprachendidaktik (1)
- Fremdspracherwerb (1)
- Frequenzverlauf (1)
- Fugenelement (1)
- Functional Domains (1)
- Futur (1)
- GDE-V (1)
- GOLD standard (1)
- GeWiss-Korpus (1)
- Gebärdensprache (1)
- Gender (1)
- Genderlinguistik (1)
- Gendern (1)
- Genus (1)
- German Reference Corpus (DeReKo) (1)
- German as a Foreign Language (1)
- German as a Second Language (1)
- German as foreign language (1)
- German as mother tongue (1)
- German language (1)
- German lessons (1)
- German reference corpus (1)
- German spoken language (1)
- Geschlecht (1)
- Geschlechterstereotyp (1)
- Gesprochene Sprache in Interaktion (1)
- Gesprochenes Deutsch in der Interaktion (1)
- Gespräch (1)
- Gesprächs-Metadaten (1)
- Gesprächsforschung (1)
- Glossar (1)
- Grafen von Platen (1)
- Grammatikografie (1)
- Grammatiktheorie (1)
- Grammatikunterricht (1)
- Grammis (1)
- Graphische Benutzeroberfläche (1)
- Haftung (1)
- Hamburger Zentrum für Sprachkorpora (1)
- Handlungsorientierung im Deutsch als Fremdsprache-Unterricht (1)
- Herder-Institut (Leipzig) (1)
- Heuristik (1)
- Hilfesystem (1)
- Historical Corpora (1)
- Historische Korpora (1)
- Historische Lexikografie (1)
- Hungarian (1)
- Häufigkeitsverteilung (1)
- ICC corpus (1)
- ICE corpus (1)
- IDS (1)
- ISO (1)
- ISO/TEI (1)
- IVK-Ler corpus of German (1)
- Identitätsverwaltung (1)
- Impact-Indikatoren (1)
- Indikativ (1)
- Indirekte Redeeinleiter (1)
- Informationsgehalt (1)
- Informationstheorie (1)
- Interaktionale Linguistik (1)
- Interaktionskorpora (1)
- Interaktionslinguistik (1)
- Interdisziplinarität (1)
- International Conference on Language Resources and Evaluation (12. : 2020 : Marseille) (1)
- Interne Ebene (1)
- Internetkommunikation (1)
- Israel (1)
- Italian (1)
- Italienisch (1)
- Jugend (1)
- Jugendlicher (1)
- Katholische Kirche (1)
- Kausalität (1)
- Kind (1)
- Kirche in 1live (1)
- Klassifikation (1)
- KoGra-R (1)
- Kognition (1)
- Konferenz (1)
- Konfession (1)
- Konfessioneller Sprachgebrauch (1)
- Kongressbericht (1)
- Konjunktiv (1)
- Konstruktion (1)
- Kontextinformationen (1)
- Kontrastive Morphologie (1)
- Kontrastive Syntax (1)
- Kontrastive Textlinguistik (1)
- Konzeptuelle Ebene (1)
- Kookkurrenz (1)
- Kooperation (1)
- Korpubasierte Methoden (1)
- Korpus-Recherche (1)
- Korpusanalsyse (1)
- Korpusanalyse (1)
- Korpusannotation (1)
- Korpusaufbereitung (1)
- Korpusbasierte Gesprächsforschung (1)
- Korpusbeleg (1)
- Korpusexploration (1)
- Korpusmanagement (1)
- Korpusrecherche (1)
- Korpusrecherchesystem (1)
- Korpusressource (1)
- Korpusressourcen (1)
- Korpustechnologie (1)
- Korpusvergleich (1)
- Kulturgeschichte (1)
- L2 Russian (1)
- Large Corpora (1)
- Large corpora (1)
- Lehrstoff (1)
- LeiKo (1)
- Leibniz-Institut für Deutsche Sprache. Jahrestagung (58. : 2022 : Mannheim) (1)
- Leichte Sprache (1)
- Lelxikographie (1)
- Lexical Semantics (1)
- Lexicon (1)
- Lexik des gesprochenen Deutsch in der Interaktion (1)
- Lexikalische Analyse (1)
- Lexikalische Ressourcen (1)
- Lexikografische Angabeklassen (1)
- Lexikographie (1)
- Lexikostatistik (1)
- Literaturwissenschaft (1)
- Logit-Modell (1)
- Lyrik (1)
- Mathematische Linguistik (1)
- Maße lexikalischer Vielfalt (1)
- Mennonite Low German (1)
- Mennonitendeutsch (1)
- Metakommunikation (1)
- Metaphorische Verbinterpretation (1)
- Methodik (1)
- Methodologie (1)
- Mikrostruktur (1)
- Modaladverb (1)
- Modellierung (1)
- Modifikation (1)
- Modifikator (1)
- Modus (1)
- Moral (1)
- Moralisierung (1)
- Morphologie<Linguistik> (1)
- Morphosyntax (1)
- Motion <Linguistik> (1)
- Movierung (1)
- Multilingualismus (1)
- Multimodalität (1)
- Muster (1)
- Musterbildung (1)
- Mündlichkeit (1)
- Mündlichkeitsdidaktik (1)
- N-N compound (1)
- N-gram modeling (1)
- Nachhaltigkeit (1)
- Named Entity Recognition (1)
- Named entity recognition (1)
- Namibia (1)
- Nationalkorpora (1)
- Natürliches sprachliches Handeln (1)
- Negativer Polaritätsausdruck (1)
- NeoRate (1)
- Newspaper (1)
- Niederdeutsch (1)
- Nominalkompositum (1)
- NottDeuYTSch (1)
- NottDeuYTSch Corpus (1)
- Nutzer (1)
- OAuth (1)
- OTRS (1)
- Online-Schnittstelle (1)
- Onlinekommentare (1)
- Onlinelexikografie (1)
- Onlinewörterbuch (1)
- Open Science (1)
- Oral history (1)
- Oraliteralität (1)
- Orthografisches Kernkorpus (OKK) (1)
- Paradigma (1)
- Paradigmenwechsel (1)
- Parallel European Corpus of Informal Interaction (PECII) (1)
- Parallele Korpora (1)
- Parallelkorpus (1)
- Parser (1)
- Personenbezeichnung (1)
- Persönlichkeitsrecht (1)
- Phonetik (1)
- Phonetische Korpora (1)
- Phrase <Syntagma> (1)
- Phraseme (1)
- Phraseologismus (1)
- Polarity Shifter (1)
- Polarität (1)
- Poliqarp (1)
- Polysemie (1)
- Pragmatik (1)
- Pragmem (1)
- Praxisbericht (1)
- Predigt (1)
- Privacy by Design (1)
- Proposition (1)
- Präpositionalphrase (1)
- Präpositionalsemantik (1)
- QUEST (1)
- QUEST project (1)
- Quantitative Analyse (1)
- Quantitative Linguistik (1)
- Quantitative Methoden der Korpuslinguistik (1)
- Query Rewriting (1)
- R <Programm> (1)
- RKorAPClient (1)
- RSS <Informatik> (1)
- Radiopredigt (1)
- Rechtsfrage (1)
- Rechtsschutz (1)
- Rechtssprache (1)
- Rechtsstatus (1)
- Redebeitrag (1)
- Redeeinleiter (1)
- Redewiedergabe (1)
- Redewiedergabe-Korpus (1)
- Reference Corpora (1)
- Referenz (1)
- Referenz <Linguistik> (1)
- Referenzkorpus (1)
- Regressionsanalyse (1)
- Religion (1)
- Repository <Informatik> (1)
- Resultativkonstruktion (1)
- Revolution <1989> (1)
- Rezeption (1)
- Romanian corpus (1)
- Rover (1)
- Russisch (1)
- Russlanddeutsch (1)
- Russlanddeutsche Dialektdatenbank (RuDiDat) (1)
- SQL (1)
- Sachtexte (1)
- Satzadverb (1)
- Satzende (1)
- Schema (1)
- Schlagwort (1)
- Schriftlichkeit (1)
- Schule (1)
- Schwedisch (1)
- Schüler (1)
- Segmentierung (1)
- Semantisches Netz (1)
- Sentiment Analysis (1)
- Service provider (1)
- Skalierbarkeit (1)
- Softwareergonomie (1)
- Somatischer Phraseologismus (1)
- Songkorpus (1)
- Songtext <Lyrik> (1)
- Songtexte (1)
- Soziale Medien (1)
- Soziale Software (1)
- Spezialkorpora (1)
- Sprach(an)fragen (1)
- Sprachakt (1)
- Sprachempirie (1)
- Spracherwerb (1)
- Sprachgebrauchsmuster (1)
- Sprachgeographie (1)
- Sprachgeschichte (1)
- Sprachinsel (1)
- Sprachkontakt (1)
- Sprachliche Minderheit (1)
- Sprachnorm (1)
- Sprachpolitik (1)
- Sprachpolitilk (1)
- Sprachressourcen (1)
- Sprachstil (1)
- Sprachtypologie (1)
- Sprachunterricht (1)
- Sprachverarbeitung (1)
- Sprachverfall (1)
- Sprachübersetzung (1)
- Sprecher-Metadaten (1)
- Sprecherwechsel (1)
- Standardisierung (1)
- Stichwortkandidaten (1)
- Streuung (1)
- Suchanfragesprache (1)
- Suchplattform (1)
- Suffix (1)
- Suffixbildung (1)
- Superlativ (1)
- Supervised Classification (1)
- Swedish (1)
- Swiss-AL (1)
- Syntaktische Analyse (1)
- TEI P5 XML (1)
- TIB (1)
- Technische Informationsbibliothek (TIB) (1)
- Technische Infrastruktur (1)
- Terminologie (1)
- Testdaten (1)
- Text Encoding Initiative (TEI) (1)
- Text Mining (1)
- TextTransfer (1)
- Textbaustein (1)
- Textklassifikation (1)
- Textsorten (1)
- Textverstehen (1)
- Thematische Relation (1)
- Token <Linguistik> (1)
- Topikmodellierung (1)
- Tourismus (1)
- Transfer-Potenzial (1)
- Transitives Verb (1)
- Transitivität (1)
- Transkript (1)
- Transtextualität (1)
- Treebanks (1)
- Twitter (1)
- Twitter <Softwareplattform> (1)
- TüNDRA (1)
- Unterhaltungsmusik (1)
- UseNet (1)
- User Generated Content (1)
- Usuelle Wortverbindungen (1)
- Valenz (1)
- Valenz <Linguistik> (1)
- Variation (1)
- Variationskorpora (1)
- Verb (1)
- Verfügbarkeit (1)
- Vergleichende Interaktionsforschung (1)
- Vergleichende Sprachwissenschaft (1)
- Vergleichskorpora (1)
- Very large corpora (1)
- Videoaufnahmen (1)
- VinKo (1)
- Visualisierung von Transkripten (1)
- Visualisierungsplattform (1)
- Visualization (1)
- Vorhersagbarkeit (1)
- Vorwort (1)
- Webapplikation (1)
- Wikipedia talk pages (1)
- Wissenschaft (1)
- Wissenschaftsgeschichte (1)
- Wissenschaftskommunikation (1)
- Wissenstransfer (1)
- World Wide Web (1)
- Wortlänge (1)
- Wortschatzwandel (1)
- YouTube comments (1)
- Zeitreihenanalyse (1)
- Zeitschrift (1)
- Zeitung (1)
- Zeitungssprache (1)
- Zertifizierung (1)
- Zipf–Mandelbrot law (1)
- ZuMult (1)
- ZuMult data model (1)
- ZuMult-Datenmodell (1)
- Zustandsverb (1)
- Zuverlässigkeit (1)
- Zweitsprache (1)
- Zweitspracherwerb (1)
- acquisition (1)
- action orientation in GFL teaching (1)
- an (1)
- annotated corpora (1)
- annotation guidelines (1)
- annotation schema (1)
- annotation tool (1)
- anonymisation (1)
- anonymization (1)
- anotación de corpus (1)
- application (1)
- arousal (1)
- audio-visual data (1)
- authentic language (1)
- authentic materials (1)
- big data (1)
- category detection (1)
- causal tagger (1)
- centres (1)
- clause union (1)
- collocation analysis (1)
- collocations (1)
- comparable corpus (1)
- compatibility (1)
- composition (1)
- compound family (1)
- compound interpretation (1)
- compression (1)
- computer-mediated communication (CMC) (1)
- comunicación mediada por computadora (CMC) (1)
- construction morphology (1)
- corpus linguistics (1)
- corpus CMC (1)
- corpus access (1)
- corpus analysis tools (1)
- corpus architecture (1)
- corpus creation (1)
- corpus driven approach (1)
- corpus frequency (1)
- corpus infrastructures (1)
- corpus management systems (1)
- corpus querying (1)
- corpus research (1)
- corpus resource (1)
- corpus reusability (1)
- corpus search engine (1)
- corpus search platform (1)
- corpus size (1)
- corpus technology (1)
- corpus treatment and editing (1)
- corpus-based conversation research (1)
- corpus-based methods (1)
- corpus-based resources (1)
- corpus-lexicographic tool (1)
- cross-linguistic data (1)
- curation (1)
- data (1)
- data curation (1)
- data sustainability (1)
- dataset (1)
- deduplication (1)
- dependency parsing (1)
- derivation (1)
- didactic corpus (1)
- digital communication (1)
- digital humanities (1)
- digitally-mediated communication (1)
- discourse dictionary (1)
- distributional semantics (1)
- domain-specific solutions (1)
- electronic lexicography (1)
- emotional valence (1)
- empirical analysis (1)
- empiricism (1)
- empirische Analyse (1)
- exploration of CMDI metadata (1)
- extensibility (1)
- feminisation (1)
- finite state (1)
- finite state tokenization (1)
- format migration (1)
- framing (1)
- frequency distribution (1)
- functionalities of the Database for Spoken German (1)
- funktionale Pragmatik (1)
- gender (1)
- gender and language (1)
- gender equality (1)
- gender linguistics (1)
- genre and register variation (1)
- german (1)
- geschriebenes und gesprochenes Deutsch (1)
- grammar and syntax (1)
- hands-on report (1)
- headword candidates (1)
- help desk (1)
- impact (1)
- impact categories (1)
- information density (1)
- information retrieval (1)
- information theory (1)
- infrastructure technology (1)
- infrastructures and architectures (1)
- intensification (1)
- interactional linguistics (1)
- interlingual (1)
- international comparable corpus (1)
- internetbasierte Kommunikation (1)
- internetbasierte Kommunikation (IBK) (1)
- intralingual (1)
- korpusbasierte Lexikografie (1)
- korpusbasierte Ressource (1)
- korpusbasierte und korpusgestützte Lexikografie (1)
- language (1)
- language corpora (1)
- language data (1)
- language documentation (1)
- language fixedness (1)
- language modelling (1)
- language models (1)
- large-scale corpora (1)
- law (1)
- learner corpora (1)
- learner corpus of adolescent (1)
- lexical data (1)
- lexical level (1)
- lexicographic information classes (1)
- lexicography equality (1)
- lexis (1)
- lexis of spoken German (1)
- liability (1)
- linguistique interactionnelle (1)
- literarische Texte (1)
- log file analysis (1)
- logical/conceptual level (1)
- logistic regression (1)
- longitudinal study (1)
- lyrics (1)
- machine learning methods (1)
- meaning relation (1)
- metacommunication (1)
- metadata analysis (1)
- metadata standards (1)
- methods of data elicitation (1)
- microstructure (1)
- morphological level (1)
- morphology (1)
- multi-turn conversations (1)
- multidisciplinarity (1)
- multilingual corpora (1)
- multilingualism (1)
- multiword expressions (1)
- mündliche Korpora (1)
- naming (1)
- national corpora (1)
- natural language processing (1)
- negation Raising (1)
- neologism detection (1)
- online dictionary (1)
- online interface (1)
- online lexicography (1)
- oral corpus platform (1)
- oral history corpora (1)
- oral language (1)
- oral literacy (1)
- orthography (1)
- parallel corpora (1)
- parser adaptation (1)
- pattern-based lexicography (1)
- patterns (1)
- performativity (1)
- persistent identifiers (1)
- phraseology (1)
- physical/internal level (1)
- polysemy (1)
- pop lyrics (1)
- predictive approach (1)
- privatives (1)
- project report (1)
- propositional argument (1)
- proverb (1)
- quality checking (1)
- quality evaluation (1)
- query building (1)
- query language (1)
- query languages (1)
- reference (1)
- reference corpus (1)
- referencing strategies (1)
- relaciones de respuesta (1)
- relational database (1)
- repository (1)
- research data (1)
- research infrastructures (1)
- research into dictionary use (1)
- research reports (1)
- research tools (1)
- resources (1)
- reusability of research data (1)
- scalability (1)
- search query language (1)
- second language acquisition (1)
- semiotics (1)
- sentence boundary detection (1)
- sentiment (1)
- sharing data (1)
- social relevance (1)
- sociolinguistics (1)
- space-delimited languages (1)
- specialist corpora (1)
- speech representation (1)
- speech thought writing representation (1)
- spoken corpora (1)
- spoken language in interaction (1)
- spoken language transcripts (1)
- spoken vs. written (1)
- stance (1)
- standard (1)
- standardization (1)
- standards (1)
- statistical significance (1)
- subjunctive (1)
- suffix (1)
- sustainability (1)
- syntactic competence (1)
- syntactical level (1)
- syntax (1)
- text classification (1)
- text complexity (1)
- three-tier architecture (1)
- time-series analysis (1)
- transcription (1)
- treebanks (1)
- under-resourced language varieties (1)
- uniform information density (1)
- usability (1)
- user interface (1)
- user interface design (1)
- user support (1)
- user survey (1)
- very large corpora (1)
- view/external level (1)
- virtual collections (1)
- virtual corpus (1)
- visualisation (1)
- visualisation of transcripts (1)
- visualization (1)
- vocabulary growth (1)
- vocabulary of quotation expressions (1)
- vor (1)
- web crawling (1)
- web data (1)
- web service (1)
- wikibasierte Wörterbücher (1)
- word formation in German (1)
- word frequency distribution (1)
- working with transcripts (1)
- youth (1)
- Öffentlichkeit (1)
- Übersetzung (1)
- Übersetzungswissenschaft (1)
Publicationstate
- Veröffentlichungsversion (154)
- Zweitveröffentlichung (90)
- Postprint (19)
- Erstveröffentlichung (1)
Reviewstate
Publisher
- de Gruyter (41)
- European Language Resources Association (19)
- Narr Francke Attempto (14)
- European Language Resources Association (ELRA) (13)
- Institut für Deutsche Sprache (13)
- Leibniz-Institut für Deutsche Sprache (IDS) (13)
- Linköping University Electronic Press (10)
- CLARIN (7)
- Narr (7)
- Peter Lang (6)
In diesem Beitrag werden Komposita mit den relationalen Zweitgliedern Gatte und Gattin aus genderlinguistischer Perspektive untersucht, basierend auf manuell annotiertem zeitungssprachlichen Korpusmaterial. Frauen werden im analysierten Korpus ca. 12-mal häufiger in ihrer ehelichen Rolle versprachlicht als Männer. Statistische Analysen zeigen, dass sie dabei systematisch in ein possessives Verhältnis zum Ehemann gesetzt werden (Arztgattin = Gattin eines Arztes), während Ehemänner in den untersuchten Komposita tendenziell doppelt individualisiert werden (Arztgatte = Gatte, der Arzt ist). Neben den Zweitgliedern geben auch die Genera der beiden Konstituenten Aufschluss über die kodierte Bedeutungsrelation: Genusgleichheit (Kanzlergatte) führt zu einer qualifizierenden, Genusdivergenz (Kanzleringatte) zu einer possessiven Lesart. Die Analyse belegt außerdem die Existenz movierter Kompositumserstglieder – diese sind sogar die häufigste Form zur Benennung weiblicher Personen im Erstglied. Trotzdem herrscht bei der Bezugnahme auf Frauen eine größere Formenvarianz als bei Männern, welche fast ausschließlich mit maskulinen Erstgliedern versprachlicht werden. Damit zeigt die Studie, wie genderlinguistische Perspektiven auch im Bereich der Wortbildung einen neuen Analysezugang bilden.
Redeeinleiter sind sprachliche Ausdrücke unterschiedlicher Wortarten, die relativ zur Redewiedergabe in Voran-, Mittel- oder Nachstellung stehen und eine direkte oder indirekte Redewiedergabe einleiten. Dadurch sind Redeeinleiter sehr vielfältig, womit sie sich als Untersuchungsgegenstand einer Analyse zur lexikalischen Vielfalt von Teilwortschätzen eignen.
Als Datengrundlage der vorliegenden Untersuchung dienen die manuell annotierten direkten und indirekten Redeeinleiter des Redewiedergabe-Korpus. Dieses setzt sich aus fiktionalen und nicht-fiktionalen Textausschnitten, die zwischen 1840–1920 veröffentlicht wurden, zusammen. Ziel der Analyse ist es, zu ermitteln, wie sich der Teilwortschatz der direkten und der der indirekten Redeeinleiter in ihrer lexikalischen Vielfalt voneinander unterscheiden und wie diese Unterschiede zu begründen sind. Dafür wird ein Set an quantitativen Methoden erarbeitet mit dem die lexikalische Vielfalt von Teilwortschätzen bestimmt werden kann und das in zukünftigen Untersuchungen zur lexikalischen Vielfalt als Standardrepertoire herangezogen werden kann.
Für die spezifischen Bedürfnisse der Schreibbeobachtung wurde das Orthografische Kernkorpus (OKK) als virtuelles Korpus in DeReKo entwickelt. Mit derzeit rund 14 Mrd. Token deckt es den Schriftsprachgebrauch in den deutschsprachigen Ländern im Zeitraum von 1995 bis in die Gegenwart ab. Der Zugriff über die Korpusanalyseplattform KorAP erlaubt nicht nur die Nutzung verschiedener Annotationen, sondern über die API-Schnittstellen auch die Einbindung in diverse Auswertungsumgebungen wie RStudio über den RKorAPClient und macht es so für zahlreiche Analyse- und Visualisierungsmöglichkeiten zugänglich.
In a previous study, Aceves and Evans present a large-scale quantitative information-theoretic analysis of parallel corpus data in ~1,000 languages to show that there are apparently strong associations between the way languages encode information into words and patterns of communication, e.g. the configuration of semantic information. During the peer review process, one reviewer raised the question of the extent to which the presented results depend on different corpus sizes (see the Peer Review File). This is a very important question given that most, if not all, of the quantities associated with word frequency distributions vary systematically with corpus size. While Aceves and Evans claim that corpus size does not affect the results presented, I challenge this view by presenting reanalyses of the data that clearly suggest that it does.
In this article, we provide an insight into the development and application of a corpus-lexicographic tool for finding neologisms that are not yet listed in German dictionaries. As a starting point, we used the words listed in a glossary of German neologisms surrounding the COVID-19 pandemic. These words are lemma candidates for a new dictionary on COVID-19 discourse in German. They also provided the database used to develop and test the NeoRate tool. We report on the lexicographic work in our dictionary project, the design and functionalities of NeoRate, and describe the first test results with the tool, in particular with regard to previously unregistered words. Finally, we discuss further development of the tool and its possible applications.
Dieser Werkstattbericht zeigt anhand verschiedener korpusbasierter Ressourcen, wie Fragen zu sprachlichen Phänomenen, die für Sprachlernende nicht oder nur unzureichend dokumentiert sind, empirisch beantwortet werden können. Besonderes Augenmerk wird dabei auf OWIDplusLIVE gelegt. Hierbei handelt es sich um ein Werkzeug zur tagesaktuellen Analyse von Token (einzelne Wortformen/Lemmata) und Bi-/Trigrammen (zwei bzw. drei direkt aufeinander folgende Token). Über eine Anbindung an KorAP können zudem Belege aus dem DeReKo (Deutsches Referenzkorpus) abgerufen und analysiert werden.
The International Comparable Corpus (ICC) (Kirk/Čermáková 2017; Čermáková et al. 2021) is an open initiative which aims to improve the empirical basis for contrastive linguistics by compiling comparable corpora for many languages and making them as freely available as possible as well as providing tools with which they can easily be queried and analysed. In this contribution we present the first release of written language parts of the ICC which includes corpora for Chinese, Czech, English, German, Irish (partly), and Norwegian. Each of the released corpora contains 400k words distributed over 14 different text categories according to the ICC specifications. Our poster covers the design basics of the ICC, its TEI encoding, a demonstration of using the ICC via different query tools, and an outlook on future plans.
Similar to the European Reference Corpus EuReCo (Kupietz et al. 2020), ICC follows the approach of reusing existing linguistic resources wherever possible in order to cover as many languages as possible with realistic effort in as short a time as possible. In contrast to EuReCo, however, comparable corpus pairs are not defined dynamically in the usage phase, but the compositions of the corpora are fixed in the ICC design. The approaches are thus complementary in this respect. The design principles and composition of the ICC are based on those of the International Corpus of English (ICE) (Greenbaum (ed.) 1996), with the deviation that the ICC includes the additional text category blog post and excludes spoken legal texts (see Čermáková et al. 2021 for details). ICC’s fixed-design approach has the advantage that all single-language corpora in the ICC have the same composition with respect to the selected text types and that this guarantees that the selected broad spectrum of potential influencing variables for linguistic variation is always represented. The disadvantage, however, is that this can only be achieved for quite small corpora and that the generalisability of comparative findings based on the ICC corpora will often need to be checked on larger monolingual corpora or translation corpora (Čermáková/Ebeling/Oksefjell Ebeling forthcoming). Arguing that such issues with comparability and representativeness are inevitable, in one way or the other, and need to be dealt with, our poster will discuss and exemplify the text selections in more detail.
The NottDeuYTSch corpus is a freely available collection of YouTube comments written under German-speaking videos by young people between 2008 and 2018. The article uses the NottDeuYTSch corpus to investigate how YouTube comments can be used to produce learning materials and how corpora of Digitally-Mediated Communication can benefit intermediate learners of German. The article details the effects of authentic communication within YouTube comments on teenage learners, examining how they can influence the psycholinguistic factors of motivation, foreign language anxiety, and willingness to communicate. The article also discusses the benefits and limitations of using authentic corpus material for the development of teaching material.