Computerlinguistik
Refine
Year of publication
Document Type
- Conference Proceeding (302)
- Part of a Book (126)
- Article (87)
- Book (26)
- Working Paper (16)
- Other (15)
- Report (11)
- Contribution to a Periodical (7)
- Doctoral Thesis (7)
- Master's Thesis (4)
Language
- English (422)
- German (186)
- Multiple languages (2)
- French (1)
Keywords
- Computerlinguistik (205)
- Korpus <Linguistik> (166)
- Annotation (78)
- Deutsch (76)
- Automatische Sprachanalyse (69)
- Forschungsdaten (50)
- Natürliche Sprache (49)
- Digital Humanities (42)
- Gesprochene Sprache (40)
- Maschinelles Lernen (33)
- XML (33)
- Datenmanagement (32)
- Infrastruktur (30)
- Metadaten (30)
- Information Extraction (28)
- Text Mining (23)
- Transkription (23)
- Standardisierung (22)
- Sprachdaten (20)
- Automatische Sprachverarbeitung (19)
- Forschung (19)
- CLARIN (18)
- Automatische Spracherkennung (16)
- Grammatik (16)
- Semantische Analyse (16)
- Texttechnologie (16)
- Englisch (15)
- Sentimentanalyse (15)
- Syntaktische Analyse (15)
- Sprachverarbeitung (14)
- Text Encoding Initiative (14)
- Datensatz (13)
- Visualisierung (13)
- Auszeichnungssprache (12)
- CLARIAH-DE (12)
- Forschungsinfrastruktur (12)
- Frame-Semantik (12)
- gesprochene Sprache (12)
- Beleidigung (11)
- Computerunterstützte Lexikografie (11)
- Datenbank (11)
- Digitalisierung (11)
- Fremdsprachenlernen (11)
- Geisteswissenschaften (11)
- Linguistische Datenverarbeitung (11)
- Polarität (11)
- Propositionale Einstellung (11)
- Syntax (11)
- Computerunterstützte Kommunikation (10)
- Information Retrieval (10)
- Linguistik (10)
- Semantik (10)
- Terminologie (10)
- sentiment analysis (10)
- Informationssystem (9)
- Langzeitarchivierung (9)
- Social Media (9)
- research infrastructure (9)
- Datenqualität (8)
- Datenverarbeitung (8)
- Edition (8)
- German (8)
- Hypertext (8)
- Korpuslinguistik (8)
- Lebensmittel (8)
- Parser (8)
- Sozialwissenschaften (8)
- Textproduktion (8)
- Archivierung (7)
- Sprachstatistik (7)
- Textlinguistik (7)
- machine learning (7)
- metadata (7)
- Automatische Textanalyse (6)
- Data Mining (6)
- Datenaufbereitung (6)
- Datenformat (6)
- Dialog (6)
- Digitale Edition (6)
- Germanistik (6)
- Grammis (6)
- Künstliche Intelligenz (6)
- Lexikon (6)
- Linguistische Informationswissenschaft (6)
- Maschinelle Übersetzung (6)
- Morphologie <Linguistik> (6)
- Ontologie <Wissensverarbeitung> (6)
- Opinion Mining (6)
- Recht (6)
- SGML (6)
- Semasiologie (6)
- Strukturbaum (6)
- Urheberrecht (6)
- language resources (6)
- Algorithmus (5)
- Argumentstruktur (5)
- CLARIN-D (5)
- Computerunterstützte Lexikographie (5)
- Computerunterstütztes Verfahren (5)
- Daten (5)
- Datenanalyse (5)
- Datenmodell (5)
- Datenschutz (5)
- Datenschutz-Grundverordnung (5)
- E-Learning (5)
- Enzyklopädie (5)
- FrameNet (5)
- Interoperabilität (5)
- Lexikografie (5)
- Lyrics <Lyrik> (5)
- Maschinelle Sprachverarbeitung (5)
- Methodologie (5)
- Multimodalität (5)
- Politische Sprache (5)
- Software (5)
- Sprachwandel (5)
- TEI (5)
- Textverarbeitung (5)
- Web Services (5)
- natural language processing (5)
- semantic similarity (5)
- API (4)
- Audiovisuelles Material (4)
- Austauschformat (4)
- Basisformat des Deutschen Textarchivs (DTABf) (4)
- Beschimpfung (4)
- Computerunterstütztes Lernen (4)
- Datenerhebung (4)
- Datenstruktur (4)
- Diskursanalyse (4)
- Elektronische Publikation (4)
- Empirische Linguistik (4)
- Ethik (4)
- Fachsprache (4)
- Fehleranalyse (4)
- Gefangenenliteratur (4)
- Geoinformationssystem (4)
- Gesprächsanalyse (4)
- Institut für Deutsche Sprache <Mannheim> (4)
- Latein (4)
- Mann, Thomas (4)
- Metadatenmodell (4)
- Nationalsozialistische Verbrechen (4)
- Natürlichsprachiges System (4)
- Negation (4)
- Neue Medien (4)
- Online-Wörterbuch (4)
- Open Science (4)
- Open Source (4)
- Pronomen (4)
- Rechtschreibung (4)
- Repository <Informatik> (4)
- Schriftsprache (4)
- Semantisches Netz (4)
- Sentiment Analysis (4)
- Softwarewerkzeug (4)
- Sprache (4)
- TextGrid (4)
- Textanalyse (4)
- Verb (4)
- Visual Linguistics (4)
- Wissenschaftssprache (4)
- Wörterbuch (4)
- abusive language (4)
- computerunterstützte Lexikographie (4)
- corpus linguistics (4)
- spoken language (4)
- word embeddings (4)
- Abfragesprache (3)
- Adjektiv (3)
- Automatisches Beweisverfahren (3)
- Bibliografie (3)
- Bibliografische Daten (3)
- Bibliothekskatalog (3)
- Component MetaData Infrastructure (CMDI) (3)
- Component Metadata Infrastructure (CMDI) (3)
- Concurrent Markup/Overlap (3)
- Dependenzgrammatik (3)
- Digitale Daten (3)
- Digitale Sprachressourcen (3)
- Direkte Rede (3)
- Diskurs (3)
- Elektronisches Wörterbuch (3)
- Entscheidungsbaum (3)
- Erzählforschung (3)
- Fallstudie (3)
- Formale Semantik (3)
- Forschungsdatenmanagement (3)
- Forschungseinrichtung (3)
- Forschungsmethode (3)
- Forschungsprojekt (3)
- GeoBib (3)
- Geschichtskarte (3)
- Handlungsstruktur <Literatur> (3)
- ISO-Norm (3)
- Informationsstruktur (3)
- Interaktion (3)
- Internet (3)
- Klassifikation (3)
- Konstruktionsgrammatik (3)
- Konversationsanalyse (3)
- Kooperation (3)
- Latin (3)
- Leibniz-Institut für Deutsche Sprache (IDS) (3)
- Lernsoftware (3)
- Linked Data (3)
- Mehrsprachigkeit (3)
- Mensch-Maschine-Kommunikation (3)
- Multimedia (3)
- NFDI (3)
- Name (3)
- Named Entity Recognition (3)
- Nationale Forschungsdateninfrastruktur (NFDI) e.V. (3)
- Natural Language Processing (3)
- Negativer Polaritätsausdruck (3)
- Nominalphrase (3)
- Normung (3)
- Nutzungsrecht (3)
- Personenbezogene Daten (3)
- Phraseologie (3)
- Popmusik (3)
- Segmentierung (3)
- Studium (3)
- Technische Infrastruktur (3)
- Text+ (3)
- Textverstehen (3)
- Valenz <Linguistik> (3)
- Wikipedia (3)
- Wissenserwerb (3)
- Wissensvermittlung (3)
- XML (Extensible Markup Language) (3)
- author name disambiguation (3)
- computational models of narrative (3)
- corpus (3)
- corpus analysis (3)
- digital research infrastructure (3)
- infrastructure (3)
- lexicon (3)
- morphology (3)
- multiword expressions (3)
- oral corpora (3)
- research data management (3)
- standardization (3)
- transcription (3)
- treebanks (3)
- Übersetzung (3)
- ASR (2)
- Abfrage (2)
- Adverb (2)
- Anapher <Syntax> (2)
- Automatic recognition of speech (2)
- Bantusprachen (2)
- Benutzeroberfläche (2)
- Bibliothek (2)
- CELEX (2)
- CLARIAH (2)
- Clarin (2)
- Codierung (2)
- Computerlingustik (2)
- Constraint-Erfüllung (2)
- DHd2023 (2)
- DSSSL (2)
- DTA-Basisformat (2)
- DTA-Basisformat für Manuskripte (DTABf-M) (2)
- Data Science (2)
- Datenerfassung (2)
- Deixis (2)
- Deutsches Referenzkorpus (DeReKo) (2)
- Digitale Geisteswissenschaften (2)
- Dokumentation (2)
- Einführung (2)
- Empfehlungssystem (2)
- Empirische Forschung (2)
- Evaluation methodologies (2)
- FAIR (2)
- FAIR data principles (2)
- FORGE2021 (2)
- Formale Sprache (2)
- Frage-Antwort-System (2)
- Frame semantics (2)
- Frame-Theorie (2)
- Französisch (2)
- Frühneuhochdeutsch (2)
- Fußball (2)
- Generalversammlung (2)
- Gesamtausgabe (2)
- HPSG (2)
- HTML (2)
- Haftung (2)
- Handschrift (2)
- Head-driven phrase structure grammar (2)
- Herzog August Bibliothek (2)
- Hyperlink (2)
- Hypermedia (2)
- ISO/TEI (2)
- Indirect speech (2)
- Indirekte Rede (2)
- Informationsverarbeitung (2)
- Interdisziplinarität (2)
- Interoperability (2)
- Jugendsprache (2)
- Kausalität (2)
- Kollokation (2)
- Kommunikation (2)
- Komposition <Wortbildung> (2)
- Kompositum (2)
- Kontrastive Grammatik (2)
- Korrektur (2)
- Lemma (2)
- Lexicon (2)
- Lexikalische Semantik (2)
- Literaturwissenschaft (2)
- MMAX (2)
- Machine Learning (2)
- Meinung (2)
- Meinungsverb (2)
- Metapher (2)
- Morphem (2)
- Morphologie (2)
- Morphology of the Folktale (2)
- Nachhaltigkeit (2)
- Nationale Forschungsdateninfrastruktur (NFDI) (2)
- Natural language processing (2)
- Northern Sotho (2)
- Notation (2)
- OCR-Schrift (2)
- Online-Ressource (2)
- Opinion Inference (2)
- Parlamentsdebatte (2)
- Pedi-Sprache (2)
- Plurizentrische Sprache (2)
- Polarity classification (2)
- Programmiersprache (2)
- Programmierung (2)
- Prosa (2)
- Prose (2)
- Python <Programmiersprache> (2)
- R <Programm> (2)
- Rechtsstellung (2)
- Redeerwähnung (2)
- Redigieren (2)
- Reproduzierbarkeit (2)
- Resources (2)
- Rezension (2)
- Rezeption (2)
- Richtlinie (2)
- Ripuarian (2)
- Schimpfwort (2)
- Semantic Web (2)
- Semantics (2)
- Semantische Relation (2)
- Sentiment Analyse (2)
- Sentiment analysis (2)
- Sportsprache (2)
- Sprachanalyse (2)
- Sprachgeografie (2)
- Sprachtypologie (2)
- Sprachvariante (2)
- Standard (2)
- Studiengang (2)
- Text Encoding Initiative (TEI) (2)
- Text Technology (2)
- Text classification (2)
- Textsorte (2)
- Textstruktur (2)
- Topic map (2)
- Treebanks (2)
- Twitter (2)
- Twitter <Softwareplattform> (2)
- UGC (2)
- Universal Dependencies (2)
- Universitätsbibliothek (2)
- Verbalphrase (2)
- Veröffentlichung (2)
- Virtual Language Observatory (VLO) (2)
- Virtuelle Forschungsumgebung (2)
- Vollversammlung (2)
- Web (2)
- WebLicht (2)
- Wissensgraph (2)
- Wissenspräsentation (2)
- Wissensrepräsentation (2)
- Wissenstechnik (2)
- World Wide Web (2)
- Worthäufigkeit (2)
- Zulu (2)
- Zulu-Sprache (2)
- annotation (2)
- annotation guidelines (2)
- annotation scheme (2)
- annotation tool (2)
- audiovisual data (2)
- automatic transcription (2)
- automatische Annotation (2)
- bibliographic metadata (2)
- computational linguistics (2)
- computer-assisted language learning (2)
- computer-mediated communication (CMC) (2)
- constructicography (2)
- controlled natural language (2)
- copyright (2)
- corpus curation (2)
- data migration (2)
- data repositories (2)
- digital humanities (2)
- digitale Infrastruktur (2)
- general assembly (2)
- grammatical information system (2)
- grammatical terminology (2)
- humanities (2)
- impact assessment (2)
- interoperability (2)
- it (2)
- language documentation (2)
- language models (2)
- language technology (2)
- legal issues (2)
- lexical database (2)
- lexical semantics (2)
- long-term archival (2)
- multi-level annotation (2)
- multi-party dialog (2)
- opinion frames (2)
- opinion mining (2)
- part-of-speech ontology (2)
- pluricentric (2)
- pronoun resolution (2)
- research data (2)
- reusability (2)
- semantic role labeling (2)
- spoken German (2)
- standards (2)
- word structure (2)
- 2008 (1)
- Acquisition (1)
- Active Learning (1)
- Active learning (1)
- Adjective (1)
- Adverbiale (1)
- Affirmativer Polaritätsausdruck (1)
- Affixoid (1)
- Afrikanische Sprachen (1)
- Agent <Informatik> (1)
- Alltagssituation (1)
- Ambiguität (1)
- Analytische Methode (1)
- Analytischen Datenerschließung (1)
- Anapher <Rhetorik> (1)
- Angewandte Linguistik (1)
- Annotation guidelines (1)
- Annotation of causal language (1)
- Annotation of discourse relations (DRs) (1)
- Annotations (1)
- Annotieren (1)
- Anonymisierung (1)
- Antwortrelationen (1)
- Antwortstrukturen (1)
- Anwendung (1)
- Anwendungsbereich (1)
- Anwendungssystem (1)
- Apostroph (1)
- Arbeitsgruppe (1)
- Archiv für Gesprochenes Deutsch (AGD) (1)
- Argument (1)
- Argument structure (1)
- Audio-video Synchronisation (1)
- August, Braunschweig-Lüneburg, Herzog, 1579-1666 (1)
- Ausrichten <Technik> (1)
- Autocorrelated errors (1)
- Automatische Indexierung (1)
- Automatische Klassifikation (1)
- Automatische Sprachanalyse; (1)
- Automatische Sprachproduktion (1)
- Automatische Worterkennung (1)
- Autor (1)
- Außeruniversitäre staatliche Forschungseinrichtung (1)
- BERT (1)
- Bantu morphology (1)
- Basislemmaliste (1)
- Baumgrammatik (1)
- Bayesian inference (1)
- Beispiel (1)
- Benennung (1)
- Benutzer (1)
- Benutzerfreundlichkeit (1)
- Benutzerführung (1)
- Bereinigung (1)
- Bericht (1)
- Best-Practice (1)
- Bibliothek der Neologie (1)
- Bootstrapping methods (1)
- British National Corpus (1)
- Brown clustering (1)
- C++ (1)
- CART (1)
- CLARIN Knowledge Sharing Infrastructure (1)
- CLARIN Legal Issues Committee (CLIC) (1)
- CLARIN infrastructure (1)
- CMC (1)
- CMC Corpora (1)
- CMDI (1)
- CMDI experiences (1)
- CMDI infrastructure use (1)
- CMDI metadata (1)
- CMDI profile creation (1)
- CNL (1)
- CQLF (1)
- CSC (1)
- Charakterisierung (1)
- Chatbot (1)
- Chunking (1)
- Clarín (1)
- Cluster <Datenanalyse> (1)
- CoRDI 2023 (1)
- Code (1)
- Cognitive Bootstrapping (1)
- Collocations (1)
- Community-Hub (1)
- Competence Theories (1)
- Component Metadata Description Infrastructure (1)
- Compterdichtung (1)
- Compterunterstützte Lexikografie (1)
- Computational linguistics (1)
- Computationelle Semantik (1)
- Computer-Assisted Language Learning (CALL) (1)
- Computergestützte Lexikographie (1)
- Computerlinguistik ; Texttypus (1)
- Computerprogramm (1)
- Computerunterstützte Kommunikationn (1)
- Computerunterstützter Unterricht (1)
- Computeruntertützte Lexikographie (1)
- Computing in the Humanities (1)
- Concurrency (1)
- Concurrent markup (1)
- Controlled Natural Language (CNL) (1)
- Conversation analysis (1)
- Copyright (1)
- Corpora (1)
- Corpora (Linguistics) (1)
- Corporate Identity (1)
- Corpus Analysis (1)
- Corpus Tools (1)
- Corpus linguistics (1)
- Corpus-based retrieval (1)
- Creative Commons (1)
- Crowdsourcing (1)
- DARIAH (1)
- DARIAH-DE (1)
- DKPro repository (1)
- DMPTY (1)
- DRs in spoken and written genres (1)
- DTD (1)
- DaF-Unterricht (1)
- DaZ-Unterricht (1)
- Darmstadt Knowledge Processing Software Repository (1)
- Data Governance Act (1)
- Data Innovation Board (1)
- Data Vizualization (1)
- Data altruism (1)
- Database Management Systems (1)
- Dateiformat (1)
- Datenaustausch (1)
- Datenauswertung (1)
- Datenbank für Gesprochenes Deutsch (1)
- Datenbanksystem (1)
- Datendomäne Sammlungen (1)
- Datenkompetenz (1)
- Datenkonvertierung (1)
- Datenspeicherung (1)
- Datentransformation (1)
- Datenvernetzung (1)
- Dativ (1)
- Deep learning (1)
- Dependency Parsing (1)
- Deutsche Grammatik (1)
- Deutsches Referenzkorpus zur internetbasierten Kommunikation (DeRiK) (1)
- Deutsches Textarchiv (1)
- Deutschland (1)
- Deutschland. Bundesministerium für Bildung und Forschung (1)
- Developmental Robotics (1)
- Diachronie (1)
- Dialogisches Prinzip (1)
- Diarium (1)
- Dictionaries (1)
- Digital Humanities Studium (1)
- Digital Library (1)
- Digitale Diskursanalyse (1)
- Digitale Forschungsdaten (1)
- Digitale Forschungsinfrastruktur (1)
- Digitale Lehre (1)
- Digitale Revolution (1)
- Digitale Werkzeuge (1)
- Digitales Wörterbuch der deutschen Sprache (1)
- Digitales Wörterbuch der deutschen Sprache (DWDS) (1)
- Diminutiv (1)
- Direct Speech (1)
- Direct speech (1)
- Disambiguation (1)
- Disambiguierung (1)
- Discourse Representation Theory (1)
- Discourse parsing (1)
- Discourse relations (1)
- Distanz (1)
- Disziplin <Wissenschaft> (1)
- DocBook (1)
- Document Classification (1)
- Document Lifecycle (1)
- Document structure (1)
- Documentation (1)
- Dokumentenserver (1)
- Dokumentenverarbeitung (1)
- Dokumentenverwaltungssystem (1)
- Dokumentgrammatik (1)
- Dokumentverarbeitung (1)
- Domain-specific Relation Extraction (1)
- Dublin Core (1)
- Dänisch (1)
- E-Science (1)
- E-Tutorial (1)
- EOSC (1)
- EdMa (1)
- Editionsmatrix (1)
- Editor (1)
- Educational software (1)
- Effects (1)
- Elektronische Bibliothek (1)
- Empfehlung (1)
- Empirical database (1)
- Empirik (1)
- Entwicklung (1)
- Erlebte Rede (1)
- Error analysis (1)
- Error classification (1)
- Erzähltheorie (1)
- Erzählung (1)
- European Strategy for Data (1)
- Europäische Union (1)
- Europäische Union : Datenschutz-Grundverordnung (1)
- Evaluation (1)
- Experiment (1)
- Expertenmeinung (1)
- Expressionismus (1)
- FAIR Index (1)
- FAIR data (1)
- FML (1)
- FO prediction (1)
- FSR (1)
- Fairness (1)
- Feature engineering (1)
- Features (1)
- Federated Content Search (FCS) (1)
- Feedback (1)
- Film (1)
- Filmkritik (1)
- Food Domain (1)
- Food domain (1)
- Formalisierung (1)
- Forschungsbericht (1)
- Forschungsdateninfrastruktur (1)
- Forschungsfinanzierung (1)
- Forschungsgeschichte (1)
- Forschungsimpact (1)
- Forschungsinfrastrukturen (1)
- Forschungsprozess (1)
- Forschungsverbund (1)
- Fremdsprache (1)
- Fremdsprachenunterricht (1)
- French (1)
- Fugenelement (1)
- Funktionale Grammatik (1)
- Förderung (1)
- GDPR (1)
- GIS (1)
- GUI (1)
- Gamification (1)
- Gefühlsausdruck (1)
- Geistes- und Sozialwissenschaften (1)
- Gemeinsame Normdatei (GND) (1)
- Gemeinschaft (1)
- Generic Document Structure (1)
- Generic Search (GS) (1)
- GeoHumantities (1)
- German data (1)
- German grammar (1)
- German reference corpus (1)
- Geschichte (1)
- Geschichtswissenschaft (1)
- Gigafida 2.1 corpus (1)
- Grammatikalisation (1)
- Grammatiktheorie (1)
- Graph (1)
- Graphdatenbank (1)
- Graphentheoretische Analyse (1)
- Graphische Benutzeroberfläche (1)
- Graphisches Symbol (1)
- Gütekriterien (1)
- HTML (Hypertext Markup Language) (1)
- Hainhofer, Philipp (1)
- Hamlet (1)
- Handlung <Literatur> (1)
- Hassrede (1)
- Hermeneutik (1)
- Hierarchical modeling (1)
- Higher Education (1)
- Hilfesystem (1)
- Historical Maps (1)
- Historische Lexikografie (1)
- Holocaust (1)
- Human Robot Interaction (HRI) (1)
- Häufigkeitsverteilung (1)
- IDS (1)
- IR (1)
- ISO (1)
- ISO/TC 37/SC 4 (1)
- ISOcat (1)
- ISOcat registry (1)
- IT infrastructure (1)
- Identität (1)
- Imageloss Compensation (1)
- Impact-Indikatoren (1)
- Index Generation (1)
- Individual differences (1)
- Informatik (1)
- Information (1)
- Information Science (1)
- Information-Retrieval-System (1)
- Informations- und Dokumentationswissenschaft (1)
- Informationsgesellschaft (1)
- Informationsintegration (1)
- Informationsmanagement (1)
- Informationsmarkt (1)
- Informationsmodellierung (1)
- Informationsversorgung (1)
- Informationswissenschaft (1)
- Infrastrukturplanung (1)
- Inkrementeller Algorithmus (1)
- Innovation (1)
- Institut für Corpuslinguistik und Texttechnologie (ICLTT) (1)
- Institut für Deutsche Sprache (1)
- Integer Linear Program (1)
- Integration (1)
- Intensivierung (1)
- Interaktionsanalyse (1)
- Interoperability of annotation schemes (1)
- Irisch (1)
- Jahrestagung GLDV (1)
- Jugendlicher (1)
- Kant, Immanuel (1)
- Kategorisierung digitaler Editionen (1)
- Kind / Sprachentwicklung (1)
- Knowledge Acquisition (1)
- Knowledge Graph (1)
- Knowledge Level Descriptions (1)
- KoGra-R (1)
- Kochbuch (1)
- Kognitive Entwicklung (1)
- Kognitive Linguistik (1)
- Kollaborative Filterung (1)
- Kommentar (1)
- Kommunikationsanalyse (1)
- Kompositum <Wortbildung> (1)
- Konfigurationsmanagement (1)
- Kongress (1)
- Konsonant (1)
- Konstruktion <Linguistik> (1)
- Kontextanalyse (1)
- Kontrastive Linguistik (1)
- Kontrastive Syntax (1)
- Kontrollierte Sprache (1)
- Konvention (1)
- Koordination <Linguistik> (1)
- KorAP (1)
- Korpusanalyse (1)
- Korpusanalyseplattform (KorAP) (1)
- Korpusannotation (1)
- Korpusaufbereitung (1)
- Korpuskompilierung (1)
- Korpustechnologie (1)
- Kritische Editionen (1)
- Kulturwandel (1)
- Kulturwissenschaften (1)
- LFG (1)
- LMF (1)
- LR infrastructures and architectures (1)
- LRTwiki (1)
- Labeling approach (1)
- Language (1)
- Language resources (1)
- Language technology (1)
- Langzeitarchierung (1)
- Large Corpora (1)
- Large Language Models (1)
- Lateinunterricht (1)
- Latin grammar (1)
- Latin morphology (1)
- Latin syntax (1)
- Lebenslauf (1)
- Lehnwort (1)
- Lehre (1)
- Lehrmaterial (1)
- Leibniz-WissenschaftsCampus Mannheim/Heidelberg (1)
- Lernorganisation (1)
- Lexem (1)
- Lexical Database (1)
- Lexical Semantics (1)
- Lexical functional grammar (1)
- Lexikalisch funktionale Grammatik (1)
- Lexikostatistik (1)
- Likelihood-Quotienten-Test (1)
- Lindenberg-Archiv (1)
- Linearität (1)
- Linguistic Retrieval (1)
- Linguistic annotation (1)
- Linguistic annotations (1)
- Linguistically informed feature engineering (1)
- Literarische Gestalt (1)
- Literaturdatenbank (1)
- Literature (1)
- Literaturverwaltung (1)
- Lizenz (1)
- Lizenzierung (1)
- Logical Document Structure (1)
- Long-Term Archiving (1)
- MARC 21 (1)
- META-SHARE (1)
- MOLEX-Generator (1)
- MTAS (1)
- Machine Learning Algorithms (1)
- Machine Leraning (1)
- Machine learning (1)
- Machine translating (1)
- Magisterarbeit (1)
- Malaga (1)
- Markup Languages & Programming (1)
- Mathematische Linguistik (1)
- Mehrsprachiges Wörterbuch (1)
- Mehrsprachigkeitsforschung (1)
- Mehrworteinheit (1)
- Metadata (1)
- Methode (1)
- Methoden (1)
- Methodik (1)
- Mitschrift (1)
- Modalverb (1)
- Modellierung (1)
- Monitorkorpus (1)
- Morph Moulder (MoMo) (1)
- Morphemanalyse (1)
- Morphologie<Linguistik> (1)
- Morphology (1)
- Morphosyntax (1)
- Multi-Strategy Learning (1)
- Multi-layer Annotation (1)
- Multinomial modeling (1)
- MySQL (1)
- Mündliche Kommunikation (1)
- Mündlichkeit (1)
- N-Gramm (1)
- NFDI section (1)
- NLP pipeline (1)
- NaLiDa (1)
- Namespaces (1)
- Naming (1)
- Narrative (1)
- Natural Language Processing (NLP) (1)
- Neologie (1)
- Neuhochdeutsch (1)
- Neurolinguistisches Programmieren (1)
- Nominalflexion (1)
- Non-native speaker (1)
- Nordsotho (1)
- Norm <Ethik> (1)
- Normdatei (1)
- Normdaten (1)
- Norwegisch (1)
- NottDeuYTSch Corpus (1)
- Nähe (1)
- OAuth (1)
- OTRS (1)
- Online-Datenbank (1)
- Online-Informationssystem (1)
- Online-Marketing (1)
- Onlinekommentare (1)
- Ontologie (1)
- Ontology development (1)
- Open Access (1)
- Open Data (1)
- Open Information (1)
- Optische Zeichenerkennung (1)
- Oral history (1)
- Organisation (1)
- Ortsverteilt (1)
- PCFG (1)
- POS Tagging (1)
- Parsing (1)
- Parsing Systems (1)
- Parts of speech (1)
- Persistent identifier (1)
- Phonetik (1)
- Phrasenstruktur (1)
- Phraseologismus (1)
- Polarity Shifter (1)
- Polarity items (1)
- Polaritätsprofil (1)
- Politiker (1)
- Politische Kommunikation (1)
- Portugiesisch (1)
- Preservation (1)
- Privatsphäre (1)
- ProGr@mm (1)
- Processing (1)
- Programmieren <Informatik> (1)
- Projektalltag (1)
- Projektplanung (1)
- Prolog (1)
- Propp system (1)
- Propp, Vladimir Jakovlevič (1)
- Prosodie (1)
- Provider (1)
- Prozessierung (1)
- Prädikat (1)
- Prädikatives Adjektiv (1)
- Präposition (1)
- Präsident (1)
- Psychologie (1)
- Public sector information (1)
- QUEST (1)
- QUEST project (1)
- Qualitative Inhaltsanalyse (1)
- Qualität (1)
- Qualitätssicherung (1)
- Quantitative Analyse (1)
- Quantitative Linguistik (1)
- Querying (1)
- Question Answering (1)
- Question Answering System (1)
- R package (1)
- RDF <Informatik> (1)
- RDM (1)
- RSS <Informatik> (1)
- Reaktives System (1)
- Rechercheschnittstelle (1)
- Rechtsfrage (1)
- Rechtsschutz (1)
- Redewiedergabe (1)
- Reduplikation (1)
- Reference Corpora (1)
- Register <Linguistik> (1)
- Replication (1)
- Research Data Infrastructure (RDI) (1)
- Research infrastructure (1)
- Research infrastructures (1)
- Ressourcen (1)
- Robot Language (1)
- Robotik (1)
- Russisch (1)
- SABIO-RK (1)
- SALSA corpus (1)
- SGML (Standard Generalized Markup Language) (1)
- SIS (1)
- SKOS (1)
- SOA (1)
- SQL (1)
- SSH (1)
- Satz (1)
- Satzanalyse (1)
- Satzende (1)
- Schema Languages (1)
- Schemasprache (1)
- Schreibvariante (1)
- Schriftlichkeit (1)
- Schriftstück (1)
- Schulbuch (1)
- Schwedisch (1)
- Segment (1)
- SemEval (1)
- Semantic Analysis (1)
- Semantic analysis (1)
- Semantic role labelling (1)
- Semi-automatic annotation (1)
- SentiFrameNet (1)
- Sequenz (1)
- Server (1)
- Service provider (1)
- Service-Handbücher (1)
- Serviceintegration (1)
- Serviceorientierte Architektur (1)
- Shakespeare, William (1)
- Sign-Based Construction Grammar (1)
- Simultanübersetzen (1)
- Situativer Agent (1)
- Skalierbarkeit (1)
- Skript <Programm> (1)
- Slips (1)
- Slowenisch (1)
- Smiley (1)
- Social media (1)
- Social sciences and humanities (1)
- Software Engineering (1)
- Softwaresystem (1)
- Softwarewiederverwendung (1)
- Sotho-Sprache (1)
- Soziale Software (1)
- Spanisch (1)
- Spanish (1)
- Spoken Language Data (1)
- Sprachanfragen (1)
- Sprachbasierte Forschung (1)
- Sprachbasierte Forschungsdaten (1)
- Sprachentwicklung (1)
- Spracherkennung (1)
- Spracherwerb (1)
- Sprachgebrauch (1)
- Sprachgeschichte (1)
- Sprachpflege (1)
- Sprachressource (1)
- Sprachtechnologie (1)
- Sprachvariation (1)
- Sprachverstehen (1)
- Sprachwechsel (1)
- Sprachwissenschaft (1)
- Sprachübersetzung (1)
- Spurious regression (1)
- Standard <Normung> (1)
- Standardsprache (1)
- Statistical Learning (1)
- Statistical methods (1)
- Statistische Analyse (1)
- Stilistik (1)
- Storage Requirements (1)
- Strukturierung (1)
- Strukturmodell (1)
- Subjectivity (1)
- Subjektivität (1)
- Such- und Recherchesysteme (1)
- Summary (1)
- Supervised Classification (1)
- Sustainability (1)
- Systemtechnik (1)
- TBX (1)
- TEI LingSIG (1)
- TEI XML (1)
- TEI-Lex0 (1)
- TEI/XML (1)
- TIB (1)
- Tabelle (1)
- Tagging (1)
- Technische Informationsbibliothek (TIB) (1)
- Technischer Fortschritt (1)
- Terminologie-Mappings (1)
- Testproduktion (1)
- Text (1)
- Text Categorisation (1)
- Text data (1)
- Text technology (1)
- Text-to-Speech (1)
- TextTransfer (1)
- Textanalyse ; Diskursanalyse ; Computerlinguistik (1)
- Textauszeichnung (1)
- Textbasierte Forschungsdaten (1)
- Textdaten (1)
- Textkorpus (1)
- Textplus NFDI (1)
- Textsorten (1)
- Textverstehendes System (1)
- Thematische Rolle (1)
- Titling (1)
- Tokenisierung (1)
- Transfer-Potenzial (1)
- Transkritpion (1)
- Trees/Graphs (1)
- Tunnel DP-algorithm (1)
- Tunnel Matrix (1)
- Tweet (1)
- UIMA (1)
- Uncertainty (1)
- Ungenauigkeit (1)
- Unifikationsgrammatik (1)
- Universalgrammatik (1)
- Universität zu Köln (1)
- Unterricht (1)
- Unterrichtsmethode (1)
- Uralische Sprachen (1)
- Usability (1)
- User Generated Content (1)
- Valences (1)
- Validating (1)
- Variation (1)
- Varietätenlinguistik (1)
- Ventspils University of Applied Sciences (VUAS) (1)
- Verbalagression (1)
- Verdatung (1)
- Verdatungspraktik (1)
- Verdatungstechnik (1)
- Vereinheitlichung (1)
- Vergleich <Rhetorik> (1)
- Vergleichbarkeit (1)
- Versdichtung (1)
- Verwandtschaftsbezeichnung (1)
- Very Large Corpora (1)
- Videaufzeichnung (1)
- Virtuelle Forschungsumgebungen (1)
- Virtuelle Hochschule (1)
- Vokabellernen (1)
- Volltext (1)
- Vorgehensmodell (1)
- WOrd eMBedding dATabase (WOMBAT) (1)
- WSD (1)
- Website (1)
- Wien <2018> (1)
- Wikipedia articles (1)
- Wissenschaft (1)
- Wissenschaftler (1)
- Wissenschaftsforschung (1)
- Wissensextraktion (1)
- Wissensextration (1)
- Wissenstransfer (1)
- Wissensverarbeitung (1)
- WordNet (1)
- World Wide Web 2.0 (1)
- Wortart (1)
- Wortbildung (1)
- Wortliste (1)
- Wortschatz (1)
- Wortsegmentierung (1)
- Wortstellung (1)
- Wortverbindung (1)
- Writing process (1)
- Writing research (1)
- Writing technology (1)
- Wörterbuch der deutschen Gegenwartssprache (WDG) (1)
- XForms (1)
- XML applications (1)
- XQuery (1)
- XSL Transformation (1)
- XSLT (1)
- YouTube (1)
- Zeichensetzung (1)
- Zertifizierung (1)
- Zusammenfassung (1)
- Zuverlässigkeit (1)
- Zweisprachigkeit (1)
- Zweitsprache (1)
- abusive comparisons (1)
- abusive emojis (1)
- abusive remarks (1)
- abusive words (1)
- access structure (1)
- adjectives (1)
- african languages dictionaries (1)
- afrikataalwoordeboeke (1)
- algorithms (1)
- ambiguous words (1)
- anaphor (1)
- anaphoric relations (1)
- annotated corpora (1)
- annotation tools (1)
- anonymisation (1)
- anotación de corpus (1)
- anotación multinivel (1)
- antecedence (1)
- application (1)
- application domain (1)
- arbitrary scripts (1)
- archiving support (1)
- archiving workflow (1)
- argument structure (1)
- artificial intelligence (1)
- authority records (1)
- automatic processing (1)
- automatic summarization (1)
- automatic term extraction (1)
- automatische linguistische Annotation (1)
- biomedical language processing (1)
- bridging relations (1)
- bridging resolution (1)
- business data (1)
- business research (1)
- búsqueda (1)
- category detection (1)
- causal tagger (1)
- classification (1)
- clustering (1)
- cmc corpora (1)
- co-training (1)
- collaborative filtering (1)
- collo-profile (1)
- community engagement (1)
- compuer-assisted language learning (1)
- computational language models (1)
- computer-mediated communication (1)
- computerized grammar (1)
- comunicación mediada por computadora (CMC) (1)
- concept scheme (1)
- concept system (1)
- concept system visualization (1)
- conceptual domain (1)
- constraint optimization (1)
- constraint satisfaction (1)
- constraint solving (1)
- construction grammar (1)
- constructional meaning (1)
- copulatives (1)
- corpora (1)
- corpus CMC (1)
- corpus annotation (1)
- corpus construction (1)
- corpus creation (1)
- corpus de aprendices (1)
- corpus exploitation (1)
- corpus size (1)
- corpus-based evaluation (1)
- crosswalks (1)
- curation (1)
- data (1)
- data category (1)
- data curation (1)
- data deposition (1)
- data dissemination (1)
- data mining (1)
- data provision (1)
- data quality (1)
- data referencing (1)
- database (1)
- database applications (1)
- decision tree structure (1)
- deep learning (1)
- deep-level morphological analyses (1)
- deep-structure morphological analyses (1)
- dependency parsing (1)
- derivation (1)
- diachronic change (1)
- diachronic variation in language use (1)
- dialog (1)
- diary omission (1)
- dictionary design (1)
- dictionary encoding (1)
- dictionary use (1)
- digital collocation database (1)
- digital library (1)
- disambiguation (1)
- discourse (1)
- discourse deixis (1)
- discourse parsing (1)
- discourse processing (1)
- discourse-level associations (1)
- discovering collocations in corpora (1)
- dissemination (1)
- document management and text processing (1)
- document processing (1)
- document triage (1)
- duration prediction (1)
- eHumanities (1)
- economic data (1)
- electronic dictionaries (1)
- elektroniese woordeboeke (1)
- entropy (1)
- error collection (1)
- ethics (1)
- evolution of Scientific English (1)
- experimentation (1)
- exploration of CMDI metadata (1)
- feature structure representation (1)
- feedback (1)
- formal mathematics (1)
- format migration (1)
- formats (1)
- fuck (1)
- fuzziness (1)
- gebruikersleiding (1)
- genre and register variation (1)
- geschriebene Sprache (1)
- global structural information (1)
- gold standard corpus (1)
- gradable adjectives (1)
- grammar (1)
- grammar acquisistion (1)
- grammar development (1)
- grammar engineering (1)
- grammar learning (1)
- grammar testing (1)
- grammar-based language learning (1)
- grammatical KOS (1)
- grammatical complexity (1)
- grammatical framework (1)
- help desk (1)
- historical encyclopedias (1)
- hosting provider (1)
- human annotation studies (1)
- humanities and social sciences (1)
- identity groups (1)
- idiom detection (1)
- impact (1)
- impact categories (1)
- impact indicator (1)
- implicit abuse (1)
- implicitly abusive comparisons (1)
- implicitly abusive language (1)
- information density (1)
- information extraction (1)
- information infrastructure (1)
- information presentation devices (1)
- inligtingsaanbiedingsinstrumente (1)
- innovation (1)
- instructional imteratives (1)
- intensification (1)
- interactional linguistics (1)
- interactive editing (1)
- interaktives Editieren (1)
- internetbasierte Kommunikation (IBK) (1)
- intersemiotic translation adequacy (1)
- iso24613 (1)
- keuse-boomstruktuur (1)
- keyphrase extraction (1)
- kinship terminology (1)
- knowledge sources (1)
- kopulatiewe (1)
- language based research (1)
- language complexity (1)
- language corpora (1)
- language data (1)
- language fixedness (1)
- language status (1)
- learner corpora (1)
- learner corpus (1)
- learning (1)
- legal aspects (1)
- leksikografiese model (1)
- lenguaje oral (1)
- lexical markup framework (1)
- lexical resources (1)
- lexical-functional grammar (1)
- lexicographic model (1)
- lexicography (1)
- lexicon generation (1)
- lexicon graph (1)
- lexicon graphs (1)
- lexicon model (1)
- lexicon model formalism (1)
- lexicon structure (1)
- liability (1)
- license (1)
- life science (1)
- lightweight annotation (1)
- likelihood ratio test (1)
- linguistic annotation (1)
- linguistic change (1)
- linguistic diversity (1)
- linguistic research software (1)
- linguistic technology (1)
- linguistic variation (1)
- linguistique interactionnelle (1)
- linked data (1)
- locally uninstantiated arguments (1)
- macrostructure (1)
- makrostruktuur (1)
- mantenimiento (1)
- manual database curation (1)
- manual information extraction (1)
- markup framework (1)
- markup language (1)
- maschinelle Lexikografie (1)
- mathematical language (1)
- measurement (1)
- metadata editor (1)
- metadata formats (1)
- metadata quality (1)
- metadata quality assessment (1)
- metadata score (1)
- metadata standards (1)
- microstructure (1)
- mikrostruktuur (1)
- modality (1)
- modellbasiertes inkrementelles Knowledge Engineering (1)
- morphemic categories (1)
- morpho-syntactic database (1)
- morphological analyses (1)
- movie recommendation (1)
- multi-layer annotation (1)
- multi-party dialogues (1)
- multi-relational learning (1)
- multidisciplinarity (1)
- multifunctional lexical resource (1)
- multifunksionele leksikale bron (1)
- multilingual grammar (1)
- mysql (1)
- n-grams (1)
- narrative (1)
- narrative comparison (1)
- natürlichsprachliche Systeme (1)
- negation content words (1)
- negation modeling (1)
- null complementation (1)
- open science (1)
- open source software (1)
- opinion extraction (1)
- opinion inference (1)
- opinion role extraction (1)
- opinion verb (1)
- opinion verbs (1)
- oral history corpora (1)
- oral language (1)
- orthography (1)
- parser adaptation (1)
- parser evaluation (1)
- parsing (1)
- part-of-speech (POS) (1)
- pattern-based lexicography (1)
- perceptual evaluation (1)
- persistent identifiers (1)
- personal data (1)
- phraseology (1)
- polarity sensitive items (1)
- polarity shifter (1)
- pop lyrics (1)
- postlexical processes (1)
- predicative adjectives (1)
- prepositions (1)
- primary research data repository (1)
- processing pipeline (1)
- product feature extraction (1)
- promotion of junior researchers (1)
- proof checking (1)
- quality checking (1)
- quality evaluation (1)
- quantitative quality metrics (1)
- query (1)
- query languages (1)
- recommendation system (1)
- recursos (1)
- reduplication construction (1)
- reference resolution (1)
- register (1)
- register variation (1)
- relaciones de respuesta (1)
- relation registry (1)
- reply relations (1)
- resources (1)
- rhetorical structure (1)
- scalar rhetoric (1)
- search systems (1)
- selection of textual sources (1)
- semantic information management (1)
- semantic interoperability (1)
- semantic web (1)
- semantische Analyse (1)
- semiotics (1)
- sentence boundary detection (1)
- sentiment polarity (1)
- separation of adjectives (1)
- service integration (1)
- service interoperability (1)
- service provider (1)
- shared task (1)
- sharing data (1)
- skills training (1)
- social media interaction (1)
- software (1)
- software quality management (1)
- software tools (1)
- sostenibilidad (1)
- speech thought writing representation (1)
- spoken corpora (1)
- spoken language data (1)
- spoken language transcripts (1)
- standards for LRs (1)
- statistical complexity (1)
- sub-grammar extraction (1)
- subjectivity (1)
- survey (1)
- sustainable archives (1)
- symbolic prosody prediction (1)
- tagging (1)
- teksproduksie (1)
- teksresepsie (1)
- template detection (1)
- term base exchange format (1)
- terminological ontology (1)
- terminological structurer (1)
- text (1)
- text analysis (1)
- text analytics (1)
- text classification (1)
- text parsing (1)
- text production (1)
- text reception (1)
- text-to-speech (1)
- that (1)
- toegangstruktuur (1)
- transcripción (1)
- translation exercises (1)
- translation studies (1)
- translation tools (1)
- translators (1)
- treebank (1)
- under-resourced language varieties (1)
- unrestricted dialog (1)
- usability (1)
- use cases (1)
- user communities (1)
- user guidance (1)
- user preference (1)
- user satisfication (1)
- user support (1)
- valency (1)
- vehicular language (1)
- verwantskapsterminologie (1)
- virtual collections (1)
- virtuelle Forschungsumgebung (1)
- web application (1)
- web service (1)
- web-based information system (1)
- woordeboekontwerp (1)
- word embedding (1)
- word frequency distribution (1)
- word sense alignment (1)
- word trees (1)
- word-level alignment (1)
- word-sense disambiguation (1)
- youth language (1)
- Öffentliche Meinung (1)
- Öffentlichkeit (1)
Publicationstate
- Veröffentlichungsversion (373)
- Zweitveröffentlichung (108)
- Postprint (55)
- Preprint (2)
- (Verlags)-Lektorat (1)
- Erstveröffentlichung (1)
Reviewstate
Publisher
- Association for Computational Linguistics (40)
- European Language Resources Association (32)
- de Gruyter (30)
- Springer (26)
- European Language Resources Association (ELRA) (23)
- Institut für Deutsche Sprache (21)
- Zenodo (17)
- Linköping University Electronic Press (13)
- The Association for Computational Linguistics (11)
- CLARIN (9)
A constructicon, i.e., a structured inventory of constructions, essentially aims at documenting functions of lexical and grammatical constructions. Among other parameters, so-called constructional collo-profiles, as introduced by Herbst (2018, 2020), are conclusive for determining constructional meanings. They provide information on how relevant individual words are for construction slots, they hint at usage preferences of constructions and serve as a helpful indicator for semantic peculiarities of constructions. However, even though collo-profiles constitute an indispensable component of constructicon entries, they pose major challengers for constructicographers: For a constructicographic enterprise it is not feasible to conduct collostructional analyses for hundreds or even thousands of constructions. In this article, we introduce a procedure based on the large language model BERT that allows to predict collo-profiles without having to extensively annotate instances of constructions in a given corpus. Specifically, by discussing the constructions X macht Y ADJP (‘x makes Y ADJ’, e.g. he drives him crazy) and N1 PREP N1 (e.g., bumper to bumper, constructions over constructions), we show how the developed automated system generates collo-profiles based on a limited number of annotated instances. Finally, we place collo-profiles alongside other dimensions of constructional meanings included in the German Constructicon.
In a previous study, Aceves and Evans present a large-scale quantitative information-theoretic analysis of parallel corpus data in ~1,000 languages to show that there are apparently strong associations between the way languages encode information into words and patterns of communication, e.g. the configuration of semantic information. During the peer review process, one reviewer raised the question of the extent to which the presented results depend on different corpus sizes (see the Peer Review File). This is a very important question given that most, if not all, of the quantities associated with word frequency distributions vary systematically with corpus size. While Aceves and Evans claim that corpus size does not affect the results presented, I challenge this view by presenting reanalyses of the data that clearly suggest that it does.
This contribution summarizes the lessons learned from the organization of a joint conference on text analytics research by the Business, Economic, and Related Data (BERD@NFDI) and Text+ consortia within the National Research Data Infrastructure (NFDI) in Germany. The collaboration aimed to identify common ground and foster interdisciplinary dialogue between scholars in the humanities and in the business domain. The lessons learned include the importance of presenting research questions using textual data to establish common ground, similarities in methodology for processing textual data between the consortia, similarities in research data management, and the need for regular interconsortial discussions on textual analysis methods and data. The collaboration proved valuable for interdisciplinary dialogue within the NFDI, and further collaboration between the consortia is planned.
"Reproducibility crisis" and "empirical turn" are only two keywords when it comes to providing reasons for research data management. Research data is omnipresent and with the more and more automatic data processing procedures, they become even more important. However, just because new methods require data and produce data, this does not mean that data are easily accessible, reusable or even make a difference in the CV of a researcher, even if a large portion of research goes into data creation, acquisition, preparation, and analysis. In this talk I will present where we find data in the research process, where we may find appropriate support for data management and advocate for a procedure for including it in research publications and resumes.
This presentation relies on work within the BMBF-funded project CLARIN-D. It also builds on work within the German National Research Data Infrastructure (NFDI) consortium Text+, DFG project number 460033370.
KoMuX, der Kompositamuster-Explorer, (www.owid.de/plus/komux) ist eine Webanwendung, die es ermöglicht, mehr als 50.000 nominale Komposita des Deutschen gezielt nach abstrakten oder lexikalisch-teilspezifizierten Mustern zu durchsuchen. Unterschiedliche Visualisierungen helfen dabei, Strukturen und Zusammenhänge innerhalb der Ergebnismenge zu erfassen.
Retro-sequence
(2023)
The Data Governance Act was proposed in late 2020 as part of the European Strategy for Data, and adopted on 30 May 2022 (as Regulation 2022/868). It will enter into application on 24 September 2023. The Data governance Act is a major development in the legal framework affecting CLARIN and the whole language community. With its new rules on the re-use of data held by the public sector bodies and on the provision of data sharing services, and especially its encouragement of data altruism, the Data Governance Act creates new opportunities and new challenges for CLARIN ERIC. This paper analyses the provisions of the Data Governance Act, and aims at initiating the debate on how they will impact CLARIN and the whole language community.
Linguistische Studien arbeiten häufig mit einer Differenzierung zwischen gesprochener und geschriebener Sprache bzw. zwischen Kommunikation der Nähe und Distanz. Die Annahme eines Kontinuums zwischen diesen Polen bietet sich für eine Verortung unterschiedlichster Äußerungsformen an, inklusive unkonventioneller Textsorten wie etwa Popsongs. Wir konzipieren, implementieren und evaluieren ein automatisiertes Verfahren, das mithilfe unkorrelierter Entscheidungsbäume entsprechende Vorhersagen auf Textebene durchführt. Für die Identifizierung der Pole definieren wir einen Merkmalskatalog aus Sprachphänomenen, die als Markierer für Nähe/Mündlichkeit bzw. Distanz/Schriftlichkeit diskutiert werden, und wenden diesen auf prototypische Nähe-/Mündlichkeitstexte sowie prototypische Distanz-/Schrifttexte an. Basierend auf der sehr guten Klassifikationsgüte verorten wir anschließend eine Reihe weiterer Textsorten mithilfe der trainierten Klassifikatoren. Dabei erscheinen Popsongs als „mittige Textsorte“, die linguistisch motivierte Merkmale unterschiedlicher Kontinuumsstufen vereint. Weiterhin weisen wir nach, dass unsere Modelle mündlich kommunizierte, aber vorab oder nachträglich verschriftlichte Äußerungen wie Reden oder Interviews vollkommen anders verorten als prototypische Gesprächsdaten und decken Klassifikationsunterschiede für Social-Media-Varianten auf. Ziel ist dabei nicht eine systematisch-verbindliche Einordung im Kontinuum, sondern eine empirische Annäherung an die Frage, welche maschinell vergleichsweise einfach bestimmbaren Merkmale („shallow features“) nachweisbar Einfluss auf die Verortung haben.
"Das im Januar 2022 gestartete Projekt "Sprachanfragen" (https://www.ids-mannheim.de/gra/projekte2/sprachanfragen/) verfolgt erstmalig das Ziel, Sprachanfragedaten zu erfassen, aufzubereiten und ein wissenschaftsöffentliches Monitorkorpus aus ihnen zu erstellen. Dazukommend wird eine Rechercheschnittstelle entwickelt, mit der die Sprachanfragen systematisch wissenschaftlich analysierbar gemacht werden. Das Poster gibt einen Überblick über das Projekt, zeigt erste Ergebnisse und bietet einen Ausblick auf Überlegungen zur Konzeption eines Chatbots zur automatisierten Beantwortung von Sprachanfragen." Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.
Mit dem cGAT-Handbuch stellt das FOLK-Projekt eine Richtlinie für das computergestützte Transkribieren nach GAT 2 zur Verfügung. Das Handbuch wurde anhand der Transkriptionspraxis in FOLK entwickelt und enthält eine Vielzahl von authentischen Beispielen, die mit dem zugehörigen Audio auch über die Datenbank für Gesprochenes Deutsch (DGD) abgerufen werden können.