400 Sprache, Linguistik
Refine
Year of publication
Document Type
- Conference Proceeding (358) (remove)
Keywords
- Korpus <Linguistik> (116)
- Computerlinguistik (96)
- Deutsch (65)
- Natürliche Sprache (41)
- Annotation (33)
- Forschungsdaten (32)
- Automatische Sprachanalyse (28)
- Gesprochene Sprache (28)
- Information Extraction (28)
- Maschinelles Lernen (27)
- Datenmanagement (22)
- Metadaten (22)
- Fremdsprachenlernen (19)
- Text Mining (18)
- German (16)
- Sentimentanalyse (15)
- Digital Humanities (13)
- XML (13)
- Französisch (12)
- corpus linguistics (12)
- Automatische Spracherkennung (10)
- Datensatz (10)
- Infrastruktur (10)
- Lebensmittel (10)
- Semantik (10)
- Syntaktische Analyse (10)
- Text Encoding Initiative (10)
- Forschung (9)
- Prosodie (9)
- CLARIN (8)
- Englisch (8)
- Grammatik (8)
- Head-driven phrase structure grammar (8)
- Augenfolgebewegung (7)
- Blickbewegung (7)
- Computerunterstützte Lexikografie (7)
- Datenbank (7)
- Datenqualität (7)
- Dialog (7)
- Experimentelle Psychologie (7)
- HPSG (7)
- Konversationsanalyse (7)
- Lehnwort (7)
- Lexikografie (7)
- Mehrsprachigkeit (7)
- Polarität (7)
- Sprachdaten (7)
- Syntax (7)
- Texttechnologie (7)
- Transkription (7)
- Urheberrecht (7)
- Wörterbuch (7)
- word embeddings (7)
- Artikulatorische Phonetik (6)
- Beleidigung (6)
- Computerunterstützte Kommunikation (6)
- French (6)
- Phonetik (6)
- metadata (6)
- prosody (6)
- Algorithmus (5)
- Archivierung (5)
- Computerunterstützte Lexikographie (5)
- Datenmodell (5)
- Information Retrieval (5)
- Interaktion (5)
- Kontrastive Linguistik (5)
- Polnisch (5)
- Pragmatik (5)
- Propositionale Einstellung (5)
- Standardisierung (5)
- TEI (5)
- Terminologie (5)
- Visualisierung (5)
- corpus processing (5)
- API (4)
- Audiovisuelles Material (4)
- Beschimpfung (4)
- Computerunterstütztes Verfahren (4)
- Data Mining (4)
- Daten (4)
- Diskurs (4)
- Fachsprache (4)
- Interview (4)
- Kempelen, Wolfgang von (4)
- Kommunikation (4)
- Langzeitarchivierung (4)
- Lexikon (4)
- Metadatenmodell (4)
- Methodologie (4)
- Morphologie <Linguistik> (4)
- Negativer Polaritätsausdruck (4)
- Polish (4)
- Recht (4)
- Sakkade (4)
- Social Media (4)
- abusive language (4)
- language learning (4)
- language resources (4)
- natural language processing (4)
- sentiment analysis (4)
- syllable prominence (4)
- Übersetzung (4)
- Akustische Phonetik (3)
- Ambiguität (3)
- Auszeichnungssprache (3)
- Automatische Sprachverarbeitung (3)
- Automatisches Beweisverfahren (3)
- Bibliografie (3)
- Bibliografische Daten (3)
- British English (3)
- Bulgarian (3)
- Bulgarisch (3)
- CLARIN-D (3)
- CMC (3)
- Chatten <Kommunikation> (3)
- Component MetaData Infrastructure (CMDI) (3)
- Component Metadata Infrastructure (CMDI) (3)
- Deutsches Referenzkorpus (DeReKo) (3)
- Empirische Linguistik (3)
- Ethik (3)
- Food item (3)
- Formale Semantik (3)
- Gefangenenliteratur (3)
- GeoBib (3)
- Geoinformationssystem (3)
- Historische Phonetik (3)
- Interoperabilität (3)
- Lautstärke (3)
- Linguistik (3)
- Mundart (3)
- Nationalsozialistische Verbrechen (3)
- Negation (3)
- Normung (3)
- Online-Wörterbuch (3)
- Open Science (3)
- Parser (3)
- Phraseologie (3)
- Repository <Informatik> (3)
- Semasiologie (3)
- Sprachkontakt (3)
- Sprachpolitik (3)
- Sprachproduktion (3)
- Sprachvariante (3)
- Sprachverarbeitung (3)
- Sprachwandel (3)
- Textverstehen (3)
- Tonhöhe (3)
- Ukrainisch (3)
- Vokal (3)
- Web Services (3)
- Worthäufigkeit (3)
- Wortschatz (3)
- Wortstellung (3)
- Zweisprachigkeit (3)
- acoustic correlates (3)
- author name disambiguation (3)
- corpora (3)
- corpus management (3)
- cross-language differences (3)
- electronic lexicography (3)
- gesprochene Sprache (3)
- infrastructure (3)
- legal issues (3)
- machine learning (3)
- phonetics (3)
- pitch range (3)
- pitch variation (3)
- prominence (3)
- research infrastructure (3)
- semantic similarity (3)
- spoken German (3)
- web corpora (3)
- Abfrage (2)
- Affirmativer Polaritätsausdruck (2)
- Anapher <Syntax> (2)
- Anonymisierung (2)
- Artikulation (2)
- Automatische Textanalyse (2)
- Bibliothek (2)
- Bibliothekskatalog (2)
- Bildung (2)
- CMDI (2)
- Dateiformat (2)
- Datenanalyse (2)
- Datenaufbereitung (2)
- Datenerfassung (2)
- Datenerhebung (2)
- Datenformat (2)
- Datenschutz (2)
- Datenschutz-Grundverordnung (2)
- Datenstruktur (2)
- Datenverarbeitung (2)
- Deutsch als Fremdsprache (2)
- Dokumentation (2)
- Elektronisches Wörterbuch (2)
- Enzyklopädie (2)
- Erzählforschung (2)
- Erzähltechnik (2)
- Europäische Union : Datenschutz-Grundverordnung (2)
- Evaluation methodologies (2)
- Experiment (2)
- Fokus <Linguistik> (2)
- Font (2)
- Forschungsmethode (2)
- GDPR (2)
- Geisteswissenschaften (2)
- Geschichtskarte (2)
- Gespräch (2)
- Handlungsstruktur <Literatur> (2)
- Hausa-Sprache (2)
- Hyperlink (2)
- Hypertext (2)
- Implementation (2)
- Indirekte Rede (2)
- Kausalität (2)
- Kollokation (2)
- Kommunikationsstrategie (2)
- Komposition <Wortbildung> (2)
- Kompositum (2)
- Latein (2)
- Leibniz-Institut für Deutsche Sprache (IDS) (2)
- Lernsoftware (2)
- Lexicon (2)
- Lyrics <Lyrik> (2)
- MMAX (2)
- Mehrsprachiges Wörterbuch (2)
- Meinung (2)
- Mensch-Maschine-Kommunikation (2)
- Minderheitensprache (2)
- Morphosyntax (2)
- Mündliche Kommunikation (2)
- Nachhaltigkeit (2)
- Name (2)
- Natural Language Processing (2)
- Natürlichsprachiges System (2)
- Nominalphrase (2)
- Open Source (2)
- Opinion Mining (2)
- Optische Zeichenerkennung (2)
- Personenbezogene Daten (2)
- Programmierung (2)
- Pronomen (2)
- Präposition (2)
- Python <Programmiersprache> (2)
- Rechtsstellung (2)
- Relation extraction (2)
- Reproduzierbarkeit (2)
- Rezeption (2)
- Richtlinie (2)
- Rumänisch (2)
- Schriftsprache (2)
- Schriftstück (2)
- Semantics (2)
- Semantische Analyse (2)
- Sentiment Analysis (2)
- Softwarewerkzeug (2)
- Sozialwissenschaften (2)
- Sprachgebrauch (2)
- Sprechmaschine (2)
- Tempus (2)
- Textanalyse (2)
- Textgestaltung (2)
- Textproduktion (2)
- Textsorte (2)
- Thematische Relation (2)
- Twitter <Softwareplattform> (2)
- Verbalphrase (2)
- Veröffentlichung (2)
- Volltext (2)
- Wikipedia (2)
- Wissenserwerb (2)
- Zulu-Sprache (2)
- annotation scheme (2)
- audiovisual data (2)
- bibliographic metadata (2)
- communicative deviation (2)
- computational models of narrative (2)
- corpus analysis (2)
- corpus annotation (2)
- corpus infrastructures (2)
- corpus-based (2)
- dependency parsing (2)
- feedback (2)
- genre and register variation (2)
- it (2)
- language models (2)
- learner corpus (2)
- learning (2)
- lexical borrowings (2)
- lexical database (2)
- lexicon (2)
- long-term archival (2)
- morphology (2)
- multi-level annotation (2)
- multi-party dialog (2)
- multilingual lexicography (2)
- multiword expressions (2)
- non-native speech (2)
- online lexicography (2)
- parser adaptation (2)
- part-of-speech (POS) (2)
- perception (2)
- perception experiment (2)
- personal data (2)
- priming (2)
- read speech (2)
- reusability (2)
- serif (2)
- speech corpus (2)
- spoken language (2)
- standardization (2)
- stops (2)
- treebanks (2)
- visualisation (2)
- українська мова (2)
- Abfragesprache (1)
- Abweichung (1)
- Acquisition (1)
- Adjektiv (1)
- Adverbial Noun Phrases (AdvNps) (1)
- Adverbiale (1)
- Affirmation (1)
- Afrikaans (1)
- Agency-Theorie (1)
- Agent <Informatik> (1)
- Akustik (1)
- Alveolar (1)
- Annotation of causal language (1)
- Annotation of discourse relations (DRs) (1)
- Annotieren (1)
- Antwort (1)
- Anwendung (1)
- Anwendungsbereich (1)
- Anwendungssystem (1)
- Articulography (1)
- Aspekt <Linguistik> (1)
- Assoziationsmaß (1)
- Audio-video Synchronisation (1)
- Auskunftsanspruch (1)
- Ausrichten <Technik> (1)
- Automatische Klassifikation (1)
- Automatische Lauterkennung (1)
- Automatische Sprachproduktion (1)
- Autor (1)
- Baltikum (1)
- Bangante Sprache (1)
- Bedeutung (1)
- Beispiel (1)
- Benutzer (1)
- Benutzerfreundlichkeit (1)
- Benutzeroberfläche (1)
- Bereinigung (1)
- Berufspraxis (1)
- Bibliographie (1)
- Biografie (1)
- Biografisches Interview (1)
- CLARIAH-DE (1)
- CLARIN infrastructure (1)
- CMC corpora (1)
- CMDI experiences (1)
- CMDI infrastructure use (1)
- CMDI metadata (1)
- CMDI profile creation (1)
- CNL (1)
- Charakterisierung (1)
- Chatbot (1)
- Chunking (1)
- Code (1)
- Common Ground (1)
- Component Metadata Description Infrastructure (1)
- Computerlingustik (1)
- Computerprogramm (1)
- Computerunterstütztes Lernen (1)
- Constraint-Erfüllung (1)
- Controlled Natural Language (CNL) (1)
- Conversation Analysis (1)
- Conversation analysis (1)
- Corpus Pattern Analysis (1)
- Corpus linguistics (1)
- Creative Commons (1)
- Crowdsourcing (1)
- DARIAH-DE (1)
- DHd2023 (1)
- DKPro repository (1)
- DMPTY (1)
- DRs in spoken and written genres (1)
- Darmstadt Knowledge Processing Software Repository (1)
- Data Science (1)
- Datenauswertung (1)
- Datenverwaltung (1)
- Dativ (1)
- Deep learning (1)
- Deixis (1)
- Dependency Parsing (1)
- Dependenz (1)
- Dialectology (1)
- Dialektologie (1)
- Digitale Daten (1)
- Digitaler Sprachassistent (1)
- Digitalisierung (1)
- Diphthong (1)
- Direkte Rede (1)
- Discourse Representation Theory (1)
- Diskursanalyse (1)
- Distribution <Linguistik> (1)
- Distributionsidiosynkrasie (1)
- Document Classification (1)
- Document Images (1)
- Dokument (1)
- Dokumentenserver (1)
- Domain-specific Relation Extraction (1)
- Dominanz (1)
- Dublin Core (1)
- Dzongkha (1)
- E-Science (1)
- EOSC (1)
- ERP (1)
- Edition (1)
- Editor (1)
- Educational software (1)
- Effects (1)
- Einbettung <Linguistik> (1)
- Einsprachiges Wörterbuch (1)
- Ejektiv (1)
- Elektronische Bibliothek (1)
- Elektronische Publikation (1)
- Empfehlung (1)
- Empfehlungssystem (1)
- Endlicher Zustandsraum (1)
- Entlehnung (1)
- Entscheidungsbaum (1)
- Ergänzung <Linguistik> (1)
- Erlebte Rede (1)
- Erzähltheorie (1)
- Erzählung (1)
- Europa (1)
- European Reference Corpus (EuReCo) (1)
- Europäische Kommission. Digital Single Market (1)
- Evaluation (1)
- Expertenmeinung (1)
- FAIR (1)
- FAIR data principles (1)
- FML (1)
- FORGE2021 (1)
- Fachkommunikation (1)
- Fallstudie (1)
- Faux amis (1)
- Feedback (1)
- Fehleranalyse (1)
- Film (1)
- Filmkritik (1)
- Food Domain (1)
- Formalisierung (1)
- Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) (1)
- Forschungsdateninfrastruktur (1)
- Forschungsdatenmanagement (1)
- Forschungseinrichtung (1)
- Forschungsprojekt (1)
- Frage (1)
- Fremdsprachenunterricht (1)
- French-German (1)
- Frequenz (1)
- Friesisch (1)
- Frisian Act (1)
- Funktionelle Kernspintomografie (1)
- Futur (1)
- GUI (1)
- Gamification (1)
- Gebrauchsbasiertheit (1)
- Generalized additive modeling (1)
- Germaans (1)
- German Reference Corpus (DeReKo) (1)
- German, Italian, Spanish (1)
- Germanic (1)
- Germanische Sprachen (1)
- Gesprächsorganisation (1)
- Gesprächsrollen (1)
- Gesture (1)
- Gitksan-Sprache (1)
- Grafische Darstellung (1)
- Grammis (1)
- Graph (1)
- Graph cluster (1)
- Graphdatenbank (1)
- Graphische Benutzeroberfläche (1)
- Graphisches Symbol (1)
- Griechisch (1)
- Haftung (1)
- Handlung <Literatur> (1)
- Hassrede (1)
- Hausa (1)
- Hebrew (1)
- Hermeneutik (1)
- Hilfesystem (1)
- Historsche Sprachsynthese (1)
- Hochliteratur (1)
- Hyperkorrektur (1)
- ISO-Norm (1)
- ISOcat (1)
- ISOcat registry (1)
- Ideologie (1)
- Imageloss Compensation (1)
- Indexierung <Inhaltserschließung> (1)
- Indikator (1)
- Information (1)
- Informationsmanagement (1)
- Informationsverarbeitung (1)
- Inkrementeller Algorithmus (1)
- Integration (1)
- Interaktionsanalyse (1)
- Interdisziplinarität (1)
- Internet (1)
- Interoperability of annotation schemes (1)
- Interviewter (1)
- Irisch (1)
- Italienisch (1)
- Jugendsprache (1)
- Kategorialgrammatik (1)
- Kategorisierung (1)
- Kiezdeutsch (1)
- Klassifikation (1)
- Kochbuch (1)
- Kognitivie Linguistik (1)
- Kollaborative Filterung (1)
- Kollokationsforschung (1)
- Kommunikationsstörung (1)
- Kommunikationsstörungen (1)
- Kommunikative Abweichungen (1)
- Kompensation (1)
- Komplement <Linguistik> (1)
- Komplementierer (1)
- Kompositum <Wortbildung> (1)
- Konditional (1)
- Konfigurationsmanagement (1)
- Konjunktion (1)
- Kontextanalyse (1)
- Kontrastive Grammatik (1)
- Konversation (1)
- Kooperation (1)
- Koordination <Linguistik> (1)
- Korpusaufbereitung (1)
- Korrektur (1)
- Kratzenstein, Christian Gottlieb (1)
- Kurdisch (1)
- Künstliche Intelligenz (1)
- LR infrastructures and architectures (1)
- LRTwiki (1)
- LSP dictionaries (1)
- Langzeitarchierung (1)
- Large Corpora (1)
- Laryngal (1)
- Lateinunterricht (1)
- Latin (1)
- Latin grammar (1)
- Lautquantität (1)
- Lehnwortportal Deutsch (LWPD) (1)
- Lehrmaterial (1)
- Lemma (1)
- Lesekompetenz (1)
- Lettgallen (1)
- Lettisch (1)
- Lexem (1)
- Lexical Database (1)
- Lexical Semantics (1)
- Lexikalische Semantik (1)
- Likelihood-Quotienten-Test (1)
- Linguistic Landscape (1)
- Linguistic processing (1)
- Linked Data (1)
- Literarische Gestalt (1)
- Literaturdatenbank (1)
- Literaturwissenschaft (1)
- Lizenzvergabe (1)
- Logische Partikel (1)
- MARC 21 (1)
- META-SHARE (1)
- MTAS (1)
- Machine Learning (1)
- Mandarin (1)
- Manipulation (1)
- Maschinelle Sprachverarbeitung (1)
- Maschinelle Übersetzung (1)
- Mean reciprocal rank (1)
- Mechanismus der Menschlichen Sprache (1)
- Mehrworteinheit (1)
- Meinungsverb (1)
- Merkel, Angela (1)
- Metadata Management (1)
- Methoden (1)
- Migration (1)
- Mikrostruktur (1)
- Militär (1)
- Mitschrift (1)
- Modality (1)
- Modalität <Linguistik> (1)
- Modalpartikel (1)
- Modifikation <Linguistik> (1)
- Modus (1)
- Monitorkorpus (1)
- Morph Moulder (MoMo) (1)
- Morphology (1)
- Morphology of the Folktale (1)
- Multi-modality (1)
- Multikulturelle Gesellschaft (1)
- Multimedia (1)
- Multimodalität (1)
- N400 (1)
- NFDI section (1)
- NLP pipeline (1)
- NPI (1)
- NaLiDa (1)
- Named Entity Recognition (1)
- Narrative (1)
- Nationalbewusstsein (1)
- Neighbour classifier (1)
- Neue Medien (1)
- Neurolinguistisches Programmieren (1)
- Nominalisierung (1)
- Nordsotho (1)
- Normdatei (1)
- North Frisian (1)
- Nutzungsrecht (1)
- OCR (1)
- OCR-Schrift (1)
- OTRS (1)
- Objekt <Linguistik> (1)
- Objektsatz (1)
- Online-Dienst (1)
- Online-Grammatiken (1)
- Onomasiologie (1)
- Opinion Inference (1)
- Oral history (1)
- Paradigma (1)
- Paronym (1)
- Paronymie (1)
- Parsing (1)
- Parsing Systems (1)
- Part-of-Speech-Tagging (1)
- Partikel (1)
- Partizipation (1)
- Persistent identifier (1)
- Perspektivität (1)
- Perzeptionsexperiment (1)
- Phonatory behavior (1)
- Phonologie (1)
- Phrase <Syntagma> (1)
- Phrasenstruktur (1)
- Phrasenstrukturgrammatik (1)
- Phraseologismus (1)
- Pitch Range (1)
- Polarity Shifter (1)
- Polish dialectology (1)
- Politische Sprache (1)
- Popmusik (1)
- Poroschenko, Petro (1)
- Possessivpronomen (1)
- Pragmatikalisierte Mehrworteinheit (1)
- Projektalltag (1)
- Projektplanung (1)
- Propp system (1)
- Prosodic Matching (1)
- Prosody (1)
- Prosody Transplantation (1)
- Prädikat (1)
- Präteritum (1)
- Pseudonymisierung (1)
- QUEST (1)
- QUEST project (1)
- Qualitative Inhaltsanalyse (1)
- Qualitätssicherung (1)
- Quantitative Linguistik (1)
- Question Answering (1)
- Reaktives System (1)
- Reanalyse (1)
- Rechercheschnittstelle (1)
- Rechtschreibung (1)
- Rechtsfrage (1)
- Rechtsschutz (1)
- Redewiedergabe (1)
- Redigieren (1)
- Reduktionsform (1)
- Reduktionsprozess (1)
- Reflexitität <Linguistik> (1)
- Register <Linguistik> (1)
- Reibelaut (1)
- Relation type (1)
- Replikat (1)
- Research infrastructures (1)
- Rezension (1)
- Romanheft (1)
- Russisch (1)
- Rēzekne (1)
- SABIO-RK (1)
- SOA (1)
- Satz (1)
- Satzanalyse (1)
- Satzende (1)
- Schimpfwort (1)
- Schleswig-Holstein (1)
- Schnittstelle Konstruktionsgrammatik – Phraseologie (1)
- Schwedisch (1)
- Schwäbisch (1)
- Second Language Learning (1)
- Segmentierung (1)
- Semantic Interoperability (1)
- Semantic Web (1)
- Semiotik (1)
- Sentence level (1)
- Sentiment analysis (1)
- Sequentialanalyse (1)
- Server (1)
- Serviceorientierte Architektur (1)
- Situativer Agent (1)
- Skript <Programm> (1)
- Slavic languages (1)
- Slavische Sprachen (1)
- Smiley (1)
- Software (1)
- Softwarewiederverwendung (1)
- Sotho-Sprache (1)
- Soziale Software (1)
- Spanisch (1)
- Sparkling wine (1)
- Speech synthesis (1)
- Sport (1)
- Sport-Interview (1)
- Sprachanalyse (1)
- Sprachanfragen (1)
- Sprache (1)
- Spracherwerb (1)
- Sprachstatistik (1)
- Sprachverarbeitung <Psycholinguistik> (1)
- Sprachverstehen (1)
- Sprechererkennung (1)
- Sprecherwechsel (1)
- Stadtmundart (1)
- Standardsprache (1)
- Statistical methods (1)
- Statistisches Modell (1)
- Stimmgebung (1)
- Storage Requirements (1)
- Strukturbaum (1)
- Strukturmodell (1)
- Subjectivity (1)
- Subjekt <Linguistik> (1)
- Subjektivität (1)
- Summary (1)
- Supervised Classification (1)
- Surface pattern (1)
- Swedish (1)
- Syntagma (1)
- Südwestdeutsch (1)
- TEI encoding (1)
- TEI/XML (1)
- Tabelle (1)
- Take-In-Interaction (1)
- Taktik (1)
- Target relation (1)
- Technologie (1)
- Temporal Reference (1)
- Tenseless Languages (1)
- Terminologiedatenbank (1)
- Terminologiemanagement (1)
- Testdaten (1)
- Text Categorisation (1)
- Text Encoding Initiative (TEI) (1)
- Text data (1)
- Text-to-Speech (1)
- Textbaustein (1)
- Textverarbeitung (1)
- Thailändisch (1)
- Thema-Rhema-Gliederung (1)
- Topic map (1)
- Tourismus (1)
- Treebanks (1)
- Tunnel DP-algorithm (1)
- Tunnel Matrix (1)
- Turn Competition (1)
- Tweet (1)
- Typologie (1)
- UGC (1)
- UIMA (1)
- Ukrainian (1)
- Ukrainian language (1)
- Ukrainian national identity (1)
- Unconnected node (1)
- Universal Dependencies (1)
- Universalgrammatik (1)
- Universitätsbibliothek (1)
- Unterrichtsmethode (1)
- Uralische Sprachen (1)
- Usability (1)
- User Generated Content (1)
- Valenztheorie <Linguistik> (1)
- Variation (1)
- Vereinheitlichung (1)
- Vergleich <Rhetorik> (1)
- Vergleichbarkeit (1)
- Videointerview (1)
- Vietnamese (1)
- Virtual Language Observatory (VLO) (1)
- Vokabellernen (1)
- WOrd eMBedding dATabase (WOMBAT) (1)
- Wahrnehmung (1)
- Warlpiri (1)
- Web (1)
- WebLicht (1)
- Wiederholung (1)
- Wikipedia articles (1)
- Wissensasymmetrie (1)
- Wissenschaft (1)
- Wissensextraktion (1)
- WordNet (1)
- Wortlänge (1)
- XForms (1)
- XML database (1)
- XSL Transformation (1)
- Zeitsemantik (1)
- Zeitung (1)
- Zertifizierung (1)
- Zulu (1)
- Zusammenfassung (1)
- Zuverlässigkeit (1)
- Zweisprachiges Wörterbuch (1)
- abusive comparisons (1)
- abusive emojis (1)
- abusive remarks (1)
- abusive words (1)
- adjectives (1)
- agent prominence (1)
- agent prototypicality (1)
- agent role (1)
- agentivity effect (1)
- algorithms (1)
- ambiguous words (1)
- anaphoric relations (1)
- annotated corpora (1)
- annotation (1)
- annotation guidelines (1)
- annotation tool (1)
- annotation tools (1)
- anonymisation (1)
- anotación multinivel (1)
- antecedence (1)
- application (1)
- application domain (1)
- archiving support (1)
- archiving workflow (1)
- articulography (1)
- artificial intelligence (1)
- aspect (1)
- authority records (1)
- automatic processing (1)
- automatic summarization (1)
- automatische Sprachproduktion (1)
- bibliographic database (1)
- bilingual electronic dictionaries (1)
- bilingual paronyms (1)
- biomedical language processing (1)
- blog corpus (1)
- borrowing (1)
- bound word (1)
- bridging relations (1)
- bridging resolution (1)
- category detection (1)
- causal tagger (1)
- classification (1)
- cluster analysis (1)
- clustering (1)
- cmc corpora (1)
- co-training (1)
- collaborative filtering (1)
- collocation (1)
- collocation analysis (1)
- combinatoric semantics (1)
- communicative strategy (1)
- comparable corpora (1)
- complex preposition (1)
- complex prepositions (CPs) (1)
- computational linguistics (1)
- computer-assisted language learning (1)
- computer-mediated communication (1)
- computer-mediated communication (CMC) (1)
- computerized grammar (1)
- computerunterstützte Lexikographie (1)
- concept scheme (1)
- concept system (1)
- conceptual domain (1)
- conditionals (1)
- constraint solving (1)
- context (1)
- contrastive lexicography (1)
- controlled natural language (1)
- copyright (1)
- corpus compilation (1)
- corpus creation (1)
- corpus de aprendices (1)
- corpus exploitation (1)
- corpus reusability (1)
- cross-linguistic data (1)
- crosswalks (1)
- data (1)
- data category (1)
- data curation (1)
- data migration (1)
- data mining (1)
- data quality (1)
- data repositories (1)
- database applications (1)
- deduplication (1)
- deep learning (1)
- dialect lexicography (1)
- dialectometry (1)
- dialektometrie (1)
- dictionaries (1)
- dictionary design (1)
- dictionary of language contact (1)
- dictionary writing system (1)
- digital humanities (1)
- digital library (1)
- discourse (1)
- discourse processing (1)
- distributional semantics (1)
- document management and text processing (1)
- document processing (1)
- document triage (1)
- easily confused words (1)
- ecolinguistics (1)
- exclusive particles (1)
- experimentation (1)
- exploration of CMDI metadata (1)
- extralexicographic features (1)
- false friends (1)
- finite state (1)
- finite state tokenization (1)
- fonologie (1)
- formal mathematics (1)
- formal semantics (1)
- format migration (1)
- fuck (1)
- fuzziness (1)
- gam (1)
- geschriebene Sprache (1)
- gesture (1)
- grammar development (1)
- grammar-based language learning (1)
- grammatical framework (1)
- graph database (1)
- guidelines (1)
- help desk (1)
- high-variability training (1)
- identity groups (1)
- ideology (1)
- idiom detection (1)
- idiosyncrasy (1)
- impact assessment (1)
- implicit abuse (1)
- implicitly abusive comparisons (1)
- implicitly abusive language (1)
- integrated e-dictionary (1)
- inter-annotator reliability (1)
- inter-rater variability (1)
- interoperability (1)
- intersemiotic translation adequacy (1)
- intonation (1)
- intra-rater variability (1)
- justification (1)
- keyphrase extraction (1)
- knowledge sources (1)
- korpusbasierte Phraseologie (1)
- language contact (1)
- language corpora (1)
- language data (1)
- language documentation (1)
- language legislation (1)
- language planning (1)
- language processing (1)
- language technology (1)
- large corpora (1)
- learner corpora (1)
- learner's dictionary (1)
- legal aspects (1)
- length (1)
- lenguaje oral (1)
- less-resourced languages (1)
- lexical borrowings (1)
- lexical resources (1)
- lexicon graphs (1)
- lexicon structure (1)
- life science (1)
- likelihood ratio test (1)
- linguistic research software (1)
- linguistically based measures (1)
- linked data (1)
- loanword lexicography (1)
- manual database curation (1)
- manual information extraction (1)
- markup language (1)
- mathematical language (1)
- measurement (1)
- mehrdeutige Ausdrucke (1)
- metadata editor (1)
- metadata formats (1)
- metadata quality (1)
- metadata quality assessment (1)
- metadata score (1)
- metadata standards (1)
- methodology (1)
- methodology of lexicography (1)
- methods (1)
- microstructure bilingual dictionaries of linguistics (1)
- minority language protection (1)
- minority language revitalisation (1)
- minority protection (1)
- mobile devices (1)
- modal meaning (1)
- modality (1)
- monospaced font (1)
- morfologie (1)
- movie recommendation (1)
- multi-lingual grammar (1)
- multi-party dialogues (1)
- multi-relational learning (1)
- multidimensional scaling (1)
- multidimensionele skalering (1)
- multidisciplinarity (1)
- multilingual corpora (1)
- multilingual grammar (1)
- multilingual platform (1)
- multilinguality (1)
- n-grams (1)
- narrative (1)
- narrative comparison (1)
- national corpora (1)
- native speech (1)
- negation (1)
- normalisation (1)
- normalization (1)
- online dictionaries (1)
- online dictionaries of linguistics (1)
- onomasiological search (1)
- open source software (1)
- opinion extraction (1)
- opinion mining (1)
- opinion verb (1)
- oral corpora (1)
- oral history corpora (1)
- oral language (1)
- parallel corpora (1)
- persistent identifiers (1)
- phonetic databases (1)
- phonology (1)
- political video interview (1)
- pop lyrics (1)
- possessives (1)
- pragmatic focus (1)
- prediction error (1)
- primary research data repository (1)
- probabilistic approach (1)
- processing pipeline (1)
- product feature extraction (1)
- project report (1)
- pronoun resolution (1)
- proof checking (1)
- proportional font (1)
- pseudonymisation (1)
- quality (1)
- quality checking (1)
- quality evaluation (1)
- quantitative quality metrics (1)
- query (1)
- raising (1)
- random forests (1)
- rating scales (1)
- reading (1)
- reading speed (1)
- recommendation system (1)
- reference corpora (1)
- reference resolution (1)
- register variation (1)
- relation registry (1)
- reply relations (1)
- research data management (1)
- research literature (1)
- resources (1)
- sans-serif (1)
- schema.org (1)
- second language learning (1)
- semantic information management (1)
- semantic interoperability (1)
- semantic roles (1)
- semantic web (1)
- semantische Analyse (1)
- semiotic of dictionaries (1)
- sentence boundary detection (1)
- sentence processing (1)
- sentience (1)
- shared task (1)
- sharing data (1)
- sintaksis (1)
- social media interaction (1)
- societal multilingualism (1)
- software (1)
- software quality management (1)
- space-delimited languages (1)
- speaking machine (1)
- speech data (1)
- spoken corpora (1)
- spoken language corpora (1)
- spoken language data (1)
- spoken language transcripts (1)
- spoken vs. written (1)
- standard (1)
- standards for LRs (1)
- sub-grammar extraction (1)
- sustainable archives (1)
- syllable (1)
- syllable duration (1)
- syntax (1)
- tagging (1)
- text analysis (1)
- text production (1)
- that (1)
- theory of lexicography (1)
- tipologie (1)
- tokenization (1)
- top-down (1)
- tourism (1)
- transcripción (1)
- transcription (1)
- translation exercises (1)
- trosanalise (1)
- turn taking (1)
- typology (1)
- uncertainty (1)
- und (1)
- under-resourced language varieties (1)
- understudied languages (1)
- unrestricted dialog (1)
- urban youth language (1)
- usability (1)
- user guidance (1)
- user preference (1)
- user satisfication (1)
- user support (1)
- utterance interpretation (1)
- variasie (1)
- variation (1)
- video interview (1)
- virtual collections (1)
- visualisering (1)
- vocabulary of quotation expressions (1)
- vowels (1)
- web application (1)
- web-based information system (1)
- word (1)
- word embedding (1)
- word frequency (1)
- word predictability (1)
- word-level alignment (1)
- Äquivalenztheorien (1)
- Öffentlichkeit (1)
- Übersetzungswissenschaft (1)
- żeby (1)
- відеоінтерв’ю (1)
- комунікативна девіація (1)
- комунікативна невдача (1)
- комунікативна стратегія (1)
- німецька мова (1)
- політичне телеінтерв’ю (1)
- українська національна ідентичність (1)
Publicationstate
- Veröffentlichungsversion (259)
- Zweitveröffentlichung (50)
- Postprint (34)
Reviewstate
- Peer-Review (252)
- (Verlags)-Lektorat (42)
- Peer-review (8)
- Peer review (1)
Publisher
- Association for Computational Linguistics (33)
- European Language Resources Association (29)
- European Language Resources Association (ELRA) (14)
- Zenodo (13)
- CLARIN (11)
- Linköping University Electronic Press (10)
- International Speech Communication Association (9)
- Leibniz-Institut für Deutsche Sprache (9)
- Lexical Computing CZ s.r.o. (7)
- Springer (7)
Besides English, Afrikaans is considered “the [Germanic] language which deviates grammatically the farthest from the others” (Harbert 2007: 17). But how exactly do we measure “grammatical deviation”, and how deviant is Afrikaans really if we compare it not just to other standard languages but also to non-standard varieties? The present contribution aims to address those questions combining functional-typological and dialectometric perspectives. We first select data for 28 Germanic varieties showing vastly different speaker numbers, grades of standardisation and amounts of language contact. Based on 48 (micro)typological variables from syntax, morphology and phonology, we perform cluster analysis and multidimensional scaling and present ways of visualizing and interpreting the results. Inter alia, the analyses show a major divide between Continental West Germanic and North Germanic (as might be expected) and they also identify a number of outliers, including English and pidgin and creole languages such as Russenorsk or Rabaul Creole German. Afrikaans appears to cluster with the other West Germanic languages rather than the outliers. Within West Germanic, however, it does indeed emerge as rather deviant and, according to our metric, it is, for example, typologically closer to other high-contact varieties such as Yiddish than it is to Dutch.
We present a simple tool for extracting text and markup information from printouts of (not only) scientific documents. While the heavy-lifting OCR is done by off-the-shelf tesseract, our focus is on detection, extraction, and basic categorization of color-highlighted text sections, as well as on providing a framework for downstream processing of extraction results. The tool can be useful for document analysis tasks that must, or benefit from being able to, use printed paper.
Статтю присвячено комунікативним девіаціям (невдачам) на матеріалі українських і німецьких телеінтерв’ю з П. Порошенком та А. Меркель. Встановлено, що спілкування осіб з різними комунікативними цілями і стратегіями – головні причини девіацій. Проаналізовано комунікативні невдачі, враховуючи позиції адресанта й адресата, а також глядача даних інтерв’ю, визначено спільні та відмінні стратегії у випадку комунікативних девіацій в українській і німецькій лінгвокультурах.
Статтю присвячено дослідженню комунікативних невдач у мовленнєвому жанрі відеоінтерв’ю крізь призму української національної ідентичності. Визначено тематику, типи і жанрово-мовну специфіку українського відеоінтерв’ю як зразка діалогічного мовлення. Встановлено специфіку комунікативних невдач у цьому жанрі (зі спортсменами, політиками і культурними діячами) з огляду на позиції комунікантів, структурні рівні досліджуваного жанру та максими спілкування.
KoMuX, der Kompositamuster-Explorer, (www.owid.de/plus/komux) ist eine Webanwendung, die es ermöglicht, mehr als 50.000 nominale Komposita des Deutschen gezielt nach abstrakten oder lexikalisch-teilspezifizierten Mustern zu durchsuchen. Unterschiedliche Visualisierungen helfen dabei, Strukturen und Zusammenhänge innerhalb der Ergebnismenge zu erfassen.
We present a collection of (currently) about 5.500 commands directed to voice-controlled virtual assistants (VAs) by sixteen initial users of a VA system in their homes. The collection comprises recordings captured by the VA itself and with a conditional voice recorder (CVR) selectively capturing recordings including the VA-directed commands plus some surrounding context. Next to a description of the collection, we present initial findings on the patterns of use of the VA systems during the first weeks after installation, including usage timing, the development of usage frequency, distributions of sentence structures across commands, and (the development of) command success rates. We discuss the advantages and disadvantages of the applied collection-specific recording approach and describe potential research questions that can be investigated in the future, based on the collection, as well as the merit of combining quantitative corpus linguistic approaches with qualitative in-depth analyses of single cases.
"Das im Januar 2022 gestartete Projekt "Sprachanfragen" (https://www.ids-mannheim.de/gra/projekte2/sprachanfragen/) verfolgt erstmalig das Ziel, Sprachanfragedaten zu erfassen, aufzubereiten und ein wissenschaftsöffentliches Monitorkorpus aus ihnen zu erstellen. Dazukommend wird eine Rechercheschnittstelle entwickelt, mit der die Sprachanfragen systematisch wissenschaftlich analysierbar gemacht werden. Das Poster gibt einen Überblick über das Projekt, zeigt erste Ergebnisse und bietet einen Ausblick auf Überlegungen zur Konzeption eines Chatbots zur automatisierten Beantwortung von Sprachanfragen." Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.
Seit Mitte der 1990er Jahre wird am Institut für deutsche Sprache (IDS) in Mannheim erforscht, wie der hochkomplexe Gegenstandsbereich „Grammatik“ unter Ausnutzung hypertextueller Navigationsstrukturen wissenschaftlich fundiert und anschaulich vermittelt werden kann. Eine zentrale Bedeutung kommt folglich einer konsistenten, theorieübergreifenden Vernetzung sämtlicher Textinhalte zu. Um eine automatisierbare Bezugnahme zwischen mit unterschiedlichem terminologischem Vokabular formulierten, aber das gleiche sprachliche Phänomen beschreibenden Inhalten zu befördern, bildet eine onomasiologisch konzipierte Terminologiedatenbank das Rückgrat des Online-Systems. Der Beitrag beschreibt Konzeption und Aufbau der skizzierten linguistischen Fachterminologie.