Refine
Year of publication
- 2020 (229) (remove)
Document Type
- Article (88)
- Part of a Book (83)
- Conference Proceeding (23)
- Other (13)
- Book (12)
- Part of Periodical (7)
- Working Paper (2)
- Report (1)
Is part of the Bibliography
- yes (229) (remove)
Keywords
- Deutsch (60)
- Korpus <Linguistik> (50)
- COVID-19 (34)
- Neologismus (28)
- Sprachgebrauch (28)
- Gesprochene Sprache (22)
- Forschungsdaten (20)
- Wortschatz (19)
- Konversationsanalyse (14)
- Lexikostatistik (14)
- Worthäufigkeit (13)
- Grammatik (12)
- Interaktion (12)
- Terminologie (12)
- Wörterbuch (10)
- Annotation (9)
- Sprachvariante (9)
- Computerlinguistik (8)
- Datenmanagement (8)
- Deutschland (7)
- German (7)
- Soziolinguistik (7)
- Sprache (7)
- Sprachwandel (7)
- Wortbildung (7)
- Automatische Spracherkennung (6)
- Fachsprache (6)
- Geschlechtergerechte Sprache (6)
- Leibniz-Institut für Deutsche Sprache (IDS) (6)
- Lexikografie (6)
- Mundart (6)
- Online-Medien (6)
- Vielfalt (6)
- Diskurs (5)
- Geschlecht (5)
- Geschlechtsunterschied (5)
- Gesprächsforschung (5)
- Maschinelles Lernen (5)
- Natürliche Sprache (5)
- Personenbezeichnung (5)
- Social Media (5)
- Sprachkritik (5)
- Sprachliche Minderheit (5)
- Syntax (5)
- Theaterprobe (5)
- Argumentstruktur (4)
- Bühnenanweisung (4)
- Computerunterstützte Lexikografie (4)
- Darstellendes Spiel (4)
- Diskursanalyse (4)
- Identität (4)
- Kommunikation (4)
- Kommunikationsanalyse (4)
- Lemma (4)
- Online-Wörterbuch (4)
- Paronym (4)
- Pragmatik (4)
- Rechtschreibung (4)
- Semantik (4)
- Soziale Medien (4)
- Sprachgeografie (4)
- Sprachpolitik (4)
- Weihnachten (4)
- Wortstellung (4)
- Zweisprachigkeit (4)
- corpus (4)
- Audiovisuelles Material (3)
- Automatische Sprachanalyse (3)
- Bedeutung (3)
- Computerunterstützte Kommunikation (3)
- Datenschutz-Grundverordnung (3)
- Deutsche (3)
- Digital Humanities (3)
- Einwanderer (3)
- Empirische Linguistik (3)
- Flexion (3)
- Frage (3)
- Fremdwort (3)
- Genus (3)
- Germanist (3)
- Globalisierung (3)
- Glossar (3)
- Institut für Deutsche Sprache (3)
- Interaktionsanalyse (3)
- Internetkommunikation (3)
- Kasus (3)
- Komposition <Wortbildung> (3)
- Kongressbericht (3)
- Lehnwort (3)
- Linguist (3)
- Linguistic Landscape (3)
- Meinungsäußerung (3)
- Methodologie (3)
- Minderheitensprache (3)
- Nachruf (3)
- Name (3)
- Phraseologie (3)
- Präsidentenwahl (3)
- Recht (3)
- Russisch (3)
- Spracheinstellungen (3)
- Spracherwerb (3)
- Sprachstatistik (3)
- Sprecherwechsel (3)
- Stereotyp (3)
- Text Encoding Initiative (3)
- USA (3)
- Visualisierung (3)
- Wahlverhalten (3)
- interactional linguistics (3)
- neologisms (3)
- oral corpora (3)
- ASR (2)
- Adverb (2)
- Alternative für Deutschland (2)
- Anglizismus (2)
- Beleidigung (2)
- Beschränkung (2)
- CLARIN (2)
- Coaching (2)
- Computerspiel (2)
- Datenformat (2)
- Datenqualität (2)
- Dialektologie (2)
- Digitalisierung (2)
- Direktiv (2)
- Englisch (2)
- Ethik (2)
- Europa (2)
- Framing-Effekt (2)
- Fremdsprache (2)
- Fremdsprachenlernen (2)
- Fremdsprachenunterricht (2)
- Grammis (2)
- Historische Sprachwissenschaft (2)
- Instruktionen (2)
- Inszenierung (2)
- Interdisziplinarität (2)
- Interjektion (2)
- Internationale Gesellschaft für Dialektologie des Deutschen. Kongress (6. : 2018 : Marburg) (2)
- Isolationismus (2)
- Kaukasus (Süd) (2)
- Kognition (2)
- Kongress (2)
- Konstruktionsgrammatik (2)
- Kontrastive Syntax (2)
- Kooperation (2)
- Korpuslinguistik (2)
- Lexikographie (2)
- Lothringen (2)
- Metadatenmodell (2)
- Methodik (2)
- Monographie (2)
- Nationalsozialismus (2)
- Nomen (2)
- Objekt <Linguistik> (2)
- Online-Dienst (2)
- Open Access (2)
- Open Data (2)
- Open Science (2)
- Orchesterprobe (2)
- Pandemie (2)
- Personenbezogene Daten (2)
- Phonologie (2)
- Plurizentrische Sprache (2)
- Prosodie (2)
- Präposition (2)
- Präpositionalobjekt (2)
- Psychotherapie (2)
- Qualität (2)
- Rat für Deutsche Rechtschreibung (2)
- Redeerwähnung (2)
- Regionalsprache (2)
- Repository <Informatik> (2)
- Rezension (2)
- Ripuarian (2)
- SARS-CoV-2 (2)
- Schule (2)
- Soziale Distanz (2)
- Sprachhandeln (2)
- Sprachkompetenz (2)
- Sprachkontakt (2)
- Sprachtest (2)
- Statistische Analyse (2)
- Subjektivität (2)
- TEI (2)
- Textproduktion (2)
- Theaterstück (2)
- Umfrage (2)
- Urheberrecht (2)
- Variation (2)
- Verb (2)
- Verständlichkeit (2)
- Wahrnehmung (2)
- Web Services (2)
- Wichtigkeit (2)
- Wirtschaftssprache (2)
- Wortverbindung (2)
- agentivity (2)
- annotation (2)
- automatic transcription (2)
- conversation analysis (2)
- corpus curation (2)
- corpus linguistics (2)
- identity (2)
- impact assessment (2)
- linguistic data (2)
- linguistic diversity (2)
- linguistic gender equality (2)
- machine learning (2)
- microstructure (2)
- online dictionary (2)
- online lexicography (2)
- pluricentric (2)
- research infrastructure (2)
- spoken German (2)
- spoken language (2)
- ASD (1)
- Abfrage (1)
- Abfragesprache (1)
- Ableitung <Linguistik> (1)
- Adjektiv (1)
- Adjektivflexion (1)
- Agentiv (1)
- Ahnung (1)
- Akademischer Grad (1)
- Alltagskommunikation (1)
- Alltagssprache (1)
- Altenbild (1)
- Alter (1)
- Annotation of causal language (1)
- Archiv (1)
- Attribut (1)
- Attributives Adjektiv (1)
- Attributives Partizip (1)
- Ausgrenzung (1)
- Autismus (1)
- Automatische Sprachverarbeitung (1)
- Bairisch (1)
- Barack Obama (1)
- Bauer <Motiv> (1)
- Bayrisch (1)
- Bedeutungswandel (1)
- Bedrohungsvorstellung (1)
- Begrüßung (1)
- Benutzerfreundlichkeit (1)
- Benutzeroberfläche (1)
- Beurteilung (1)
- Briefstil (1)
- CLARIAH (1)
- CLARIAH-DE (1)
- CLARIN-D (1)
- CMC (1)
- CQLF (1)
- Change (1)
- Chatten (Kommunikation) (1)
- Clusters (1)
- Computergestützte Lexikographie (1)
- Conversation Analysis (1)
- Corona-Epidemie (1)
- Corona-Party (1)
- Coronakrise (1)
- Corpus Analysis (1)
- Corpus Tools (1)
- DARIAH (1)
- DARIAH-DE (1)
- Dank (1)
- Data Vizualization (1)
- Dateiformat (1)
- Demonstrativpronomen (1)
- Dependency Parsing (1)
- Dependenzgrammatik (1)
- Deutsch als Fremdsprache (DaF) (1)
- Deutsch in Namibia (DNam) (1)
- Deutsche Grammatik (1)
- Deutsches Referenzkorpus (DeReKo) (1)
- Deutschunterricht (1)
- Dialektbewertung (1)
- Dialektkompetenz (1)
- Dialog (1)
- Digitale Revolution (1)
- Diskursive Psychologie (1)
- Dispositiv (1)
- Doktorand (1)
- Dokumentenserver (1)
- Donald Trump (1)
- Dreißigjähriger Krieg (1)
- Drittes Reich (1)
- Duden, Rechtschreibung der deutschen Sprache (2020) (1)
- Dynamische Psychotherapie (1)
- Dänisch (1)
- EOSC (1)
- Einbettung <Linguistik> (1)
- Einsprachiges Wörterbuch (1)
- Einstellung (1)
- Elektronisches Wörterbuch (1)
- Eltern (1)
- Emergenz (1)
- Engel, Ulrich (1)
- Entropie (1)
- Enzyklopädie (1)
- Ereignis (1)
- Ergänzung <Linguistik> (1)
- Erholung (1)
- Erwartung (1)
- Erzähltechnik (1)
- Ethnische Gruppe (1)
- Ethnische Identität (1)
- European Reference Corpus (EuReCo) (1)
- Evaluation (1)
- Faulenzen (1)
- Feiertag (1)
- Feldpost (1)
- Formulierung (1)
- Forschungsimpact (1)
- Frame-Semantik (1)
- Frosch, Helmut (1)
- Frühe Neuzeit (1)
- Frühneuhochdeutsch (1)
- Funktion (1)
- GDPR (1)
- Gedächtnis (1)
- Gender (1)
- Gender Mainstreaming (1)
- Gendergerechte Sprache (1)
- Geriatrie (1)
- German Americans (1)
- German definitions on garments (1)
- German reference corpus (1)
- Germanic (1)
- Germanische Sprachen (1)
- Germanistik (1)
- Geschichte (1)
- Geschichte 1500-1600 (1)
- Geschichte 1600-1700 (1)
- Geschichte 1886-1943 (1)
- Geschichte 1933-1945 (1)
- Geschlechterrolle (1)
- Gesprochenes Deutsch (1)
- Gestik (1)
- Gott (1)
- Grafen von Platen (1)
- Graphemik (1)
- Graphentheoretische Analyse (1)
- Grundsatzprogramm (1)
- Grundwortschatz (1)
- Hausunterricht (1)
- Heimarbeit (1)
- Hessisch (1)
- Hilfesystem (1)
- Historische Lexikografie (1)
- Historische Soziolinguistik (1)
- Hochdeutsch (1)
- Hochliteratur (1)
- IDS (1)
- ISO (1)
- ISO-Norm (1)
- Immigrants (1)
- Impact-Indikatoren (1)
- Information Retrieval (1)
- Informationsaustausch (1)
- Informationssystem (1)
- Instruktionsmatrix (1)
- Interaktionslinguistik (1)
- Interaktionsordnung (1)
- Interdisciplinarity (1)
- International Conference on Language Resources and Evaluation (12. : 2020 : Marseille) (1)
- Internet (1)
- Interoperabilität (1)
- Intersektionalität (1)
- Interventionen (1)
- Isolationism (1)
- Jensen-Shannon divergence (1)
- Jesus Christus (1)
- Junktion (1)
- Kausalität (1)
- Kind (1)
- Kindesmisshandlung (1)
- Klassifikation (1)
- Klimaänderung (1)
- Kommunikativer Sinn (1)
- Komplementierer (1)
- Kompositum (1)
- Kompositum <Wortbildung> (1)
- Komödie (1)
- Konferenz (1)
- Kontrastive Linguistik (1)
- Kontrastive Phraseologie (1)
- Kontrastive Pragmatik (1)
- Konversationanalyse (1)
- Korpusanalyse (1)
- Kreativität (1)
- Kritische Diskursanalyse (1)
- Kultur (1)
- Kultureinfluss (1)
- Kurzwort <Linguistik> (1)
- Langzeitarchivierung (1)
- Large Corpora (1)
- Latein (1)
- Leibniz-Institut für deutsche Sprache (Mannheim). Jahrestagung (56. : 2020 : Mannheim) (1)
- Lesbarkeit (1)
- Let's Play (1)
- Lexem (1)
- Lexical Semantics (1)
- Lexicon (1)
- Lexik des Gesprochenen (1)
- Lexikalische Semantik (1)
- Linguistik (1)
- Literatur (1)
- Local and global effectiveness (1)
- Logistische Regression (1)
- Loriot (1)
- Lyrics <Lyrik> (1)
- MTAS (1)
- Makrostruktur (1)
- Maschinelle Übersetzung (1)
- Maske (1)
- Massenmedien (1)
- Medienforschung (1)
- Medizin (1)
- Mehrsprachigkeit (1)
- Mehrworteinheit (1)
- Mental Lexicon (1)
- Messung (1)
- Metapher (1)
- Migration (1)
- Mikrostruktur (1)
- Mikrozensus (1)
- Minderheit (1)
- Modalpartikel (1)
- Morphologie <Linguistik> (1)
- Morphosyntax (1)
- Multimedialität (1)
- Multimodalität (1)
- Mundart Schwäbisch <Kaukasus> (1)
- Müßiggang (1)
- Nachhaltigkeit (1)
- Nachschlagewerk (1)
- Named Entity Recognition (1)
- Namibia (1)
- Narrativität (1)
- Nationale Identität (1)
- Negation (1)
- Negativer Polaritätsausdruck (1)
- Netzwerk (1)
- Neurologie (1)
- Niederdeutsch (1)
- Nominalkompositum (1)
- Nominalphrase (1)
- Norddeutsch (1)
- Normalität (1)
- Nutzung (1)
- Nutzungsrecht (1)
- OAuth (1)
- OTRS (1)
- On the fly (1)
- On the fly-Implementierungen (1)
- On the fly-Instruktionen (1)
- Onlinelexikografie (1)
- Ontologie (1)
- Oral history (1)
- Orthografie (1)
- Paronyme (1)
- Paronymie (1)
- Parser (1)
- Partikelverb (1)
- Perspektivität (1)
- Perzeptionsexperiment (1)
- Pest (1)
- Pflegeheim (1)
- Phonetik (1)
- Plattdeutsch (1)
- Plural (1)
- Polarity Shifter (1)
- Polarität (1)
- Politische Kommunikation (1)
- Politische Sprache (1)
- Polnisch (1)
- Popmusik (1)
- Post (1)
- Pragmatikalisierte Mehrworteinheit (1)
- Privacy by Design (1)
- Prototyp <Linguistik> (1)
- Prävention (1)
- Psychisches Trauma (1)
- Psychologische Diagnostik (1)
- Publikationsfonds (1)
- Questioning sequences (1)
- R <Programm> (1)
- RSS newsfeed corpus (1)
- Reality-TV (1)
- Rechtsversetzung (1)
- Redewendung (1)
- Reduktionsform (1)
- Reduktionsprozess (1)
- Reference Corpora (1)
- Referenz <Linguistik> (1)
- Regelwerk (1)
- Rezeption (1)
- Rezeptionsforschung (1)
- Rhetorik (1)
- Richtlinie (1)
- Riecke, Jörg (1)
- Ritual (1)
- Romanheft (1)
- Russlanddeutsche (1)
- Satzende (1)
- Schriftsprache (1)
- Schutz (1)
- Schweiz (1)
- Schweizer (1)
- Scrabble (1)
- Selbst (1)
- Sentiment Analysis (1)
- Service provider (1)
- Simultane Verzahnung (1)
- Sitta, Horst (1)
- Softwarewerkzeug (1)
- Soziale Identität (1)
- Soziale Interaktion (1)
- Sozialer Prozess (1)
- Spiel (1)
- Spielprobe (1)
- Sprachanalyse (1)
- Sprachdaten (1)
- Sprachdiskurse (1)
- Sprachgeographie (1)
- Sprachgeschichte (1)
- Sprachinsel (1)
- Sprachpflege (1)
- Sprachstörung (1)
- Sprachtypologie (1)
- Sprachwahrnehmung (1)
- Standardisierung (1)
- Standardsprache (1)
- Statistik (1)
- Stichprobenumfang (1)
- Stilmittel (1)
- Strukturanalyse (1)
- Strukturbaum (1)
- Student (1)
- Studentin (1)
- Substantiv (1)
- Sukzessive Verzahnung (1)
- Superlativ (1)
- Supervised Classification (1)
- Symptom (1)
- Systemrelevanz (1)
- Sächsisch (1)
- T-shirt lexicography (1)
- TIB (1)
- TSPP Model (1)
- Technische Informationsbibliothek (TIB) (1)
- Testdaten (1)
- Text Mining (1)
- TextTransfer (1)
- Textanalyse (1)
- Textbaustein (1)
- Textlinguistik (1)
- Textsorte (1)
- Textverstehen (1)
- Theater (1)
- Tiefenpsychologisch fundierte Psychotherapie (1)
- Transfer-Potenzial (1)
- Transitionspraktiken (1)
- Twitter (1)
- Twitter <Softwareplattform> (1)
- Türkisch (1)
- UGC (1)
- Umgangssprache (1)
- Umtexte (1)
- Universal Dependencies (1)
- Unpersönliches Passiv (1)
- User Generated Content (1)
- Verbal fluency (1)
- Verein Deutsche Sprache (1)
- Vermutung <Linguistik> (1)
- Vernetzungsstrukturen (1)
- Verschwörungstheorie (1)
- Verwaltungssprache (1)
- Veränderungsmessung (1)
- Videoaufzeichnung (1)
- Volltext (1)
- Vorlesung (1)
- Vortragstechnik (1)
- Vorwort (1)
- WCC (1)
- Web (1)
- Welle (1)
- Wertvorstellung (1)
- Wissenschaft (1)
- Wissenschaftsentwicklung (1)
- Wissenschaftsgemeinschaft Gottfried Wilhelm Leibniz (1)
- Wissenschaftskommunikation (1)
- Wissenschaftssprache (1)
- Wissensmanagement (1)
- Wissenstransfer (1)
- World War I (1)
- World War II (1)
- Wortart (1)
- Wortwiederholung (1)
- Wumms (1)
- YouTube (1)
- Zipf's law (1)
- Zipfsches Gesetz (1)
- Zufällige Effekte (1)
- Zusammenkunft (1)
- Zuverlässigkeit (1)
- Zweisprachiges Wörterbuch (1)
- acceptability judgments (1)
- acute hospital (1)
- adjective (1)
- adverb formation (1)
- age stereotypes (1)
- agency (1)
- annotation guidelines (1)
- annotation tool (1)
- application (1)
- argument saturation (1)
- attribute (1)
- attributive participle (1)
- audio-visual data (1)
- begeistern (1)
- category detection (1)
- causal tagger (1)
- clarity (1)
- cmc corpora (1)
- cognitive impairment (1)
- communication (1)
- complement clause (1)
- complementizer (1)
- computational language models (1)
- contextual framework (1)
- cooperation (1)
- copyright (1)
- coronavirus (1)
- corpora (1)
- corpus CMC (1)
- corpus analysis (1)
- corpus creation (1)
- corpus study (1)
- correlate (1)
- courses of action (1)
- cross-linguistic data (1)
- cultural diversity (1)
- curation (1)
- das <Wort> (1)
- data (1)
- data quality (1)
- data visualization (1)
- demonstrative (1)
- deskriptive Terminologiearbeit (1)
- diachronic variation in language use (1)
- dialecte mosellan (1)
- dictionary documentation (1)
- dictionary of neologisms (1)
- digital humanities (1)
- domain-specific solutions (1)
- eben (1)
- einsprachiges Wörterbuch (1)
- elderspeak (1)
- electronic dictionary (1)
- evolution of Scientific English (1)
- expectation (1)
- factuality (1)
- feature matching (1)
- flagging (1)
- form of communication (1)
- format migration (1)
- framing (1)
- functional status (1)
- funktionale Spezialisierung (1)
- general dictionary (1)
- generalized divergence (1)
- generalized entropy (1)
- german (1)
- germanophone (1)
- govorni njemački u interakciji (1)
- grammatische Terminologie (1)
- gratitude (1)
- help desk (1)
- impact (1)
- impersonal passive (1)
- indefinite pronoun man ´one´ (1)
- inflected form (1)
- inflection (1)
- instructions (1)
- interactional history (1)
- interactional semantics (1)
- interakcijsko jezikoslovlje (1)
- intergroup relations (1)
- internet lexicography (1)
- interoperability (1)
- interpretation (1)
- intersectionality (1)
- language (1)
- language attitudes (1)
- language contact (1)
- language discourse (1)
- language fixedness (1)
- language resource (1)
- language resources (1)
- language view (1)
- law (1)
- le bilinguisme (1)
- lecture (1)
- legal issues (1)
- leksikografski izvori (1)
- lexical confusion (1)
- lexical variation (1)
- lexicographical neology (1)
- lexicographical resource (1)
- lexicology of spoken language (1)
- lexikalische Variation (1)
- lexikografische Dokumentation (1)
- liability (1)
- linguistic change (1)
- linguistique interactionnelle (1)
- linking (1)
- loan words (1)
- loanwords (1)
- logistic regression (1)
- logistische Regression (1)
- long-term archival (1)
- macrostructure (1)
- meaning change (1)
- media technology (1)
- metadata (1)
- migration (1)
- mikrostruktura (1)
- modal particles (1)
- modalne čestice (1)
- mrežni rječnik (1)
- multidisciplinarity (1)
- multilingual corpora (1)
- multimediality (1)
- multimodality (1)
- multiword expressions (1)
- naming (1)
- national corpora (1)
- natural language processing (1)
- neological lexicography (1)
- neologism (1)
- noun phrase (1)
- offers (1)
- operationalized psychodynamic diagnosis (1)
- oral history corpora (1)
- orthography (1)
- outer texts (1)
- paronyms (1)
- pattern-based lexicography (1)
- personal data (1)
- phraseology (1)
- pop lyrics (1)
- positioning (1)
- prepositional clause (1)
- presentation (1)
- primary preposition (1)
- print lexicography (1)
- psychoanalysis (1)
- psychotherapy (1)
- query (1)
- query languages (1)
- random effects model (1)
- readability (1)
- recruitment (1)
- reference corpora (1)
- register variation (1)
- relation langue locale et langue standard (1)
- repositories (1)
- repository (1)
- requesting examples (1)
- requests (1)
- research data (1)
- resources (1)
- rhetoric (1)
- right-dislocation (1)
- sample size (1)
- schwache Flexion (1)
- scientific communication (1)
- self (1)
- sentence boundary detection (1)
- sentiment (1)
- sequentiality (1)
- social cognition (1)
- social interaction (1)
- socio-demographic features (1)
- software (1)
- soziodemografische Merkmale (1)
- specialized lexicography (1)
- speech representation (1)
- speech thought writing representation (1)
- spoken German in interaction (1)
- spoken language data (1)
- spoken language transcripts (1)
- sprachlicher Zweifel (1)
- stance (1)
- standardization (1)
- standards (1)
- starke Flexion (1)
- stereotypes (1)
- such-Verben (1)
- superlative (1)
- systemrelevant (1)
- technology watch (1)
- text length (1)
- thanking (1)
- theater (1)
- treebanks (1)
- under-resourced language varieties (1)
- usability (1)
- user support (1)
- variation (1)
- verbale Interaktion (1)
- vernacular lexicography (1)
- vocabulary (1)
- web corpora (1)
- web crawling (1)
- web data (1)
- web service (1)
- weil (1)
- word order (1)
- zero derivation (1)
- Älterer Mensch (1)
- Öffentlichkeit (1)
- Österreichisch (1)
- Übersetzungswissenschaft (1)
Publicationstate
- Veröffentlichungsversion (114)
- Zweitveröffentlichung (81)
- Postprint (14)
- Ahead of Print (1)
Reviewstate
- (Verlags)-Lektorat (86)
- Peer-Review (85)
Publisher
- Leibniz-Institut für Deutsche Sprache (IDS) (44)
- European Language Resources Association (19)
- de Gruyter (18)
- Narr Francke Attempto (17)
- CLARIN (6)
- Gesellschaft für deutsche Sprache e.V. (6)
- Heidelberg University Publishing (6)
- Spektrum der Wissenschaft Verlagsgesellschaft (5)
- Benjamins (4)
- Erich Schmidt (4)
This paper reports on recent developments within the European Reference Corpus EuReCo, an open initiative that aims at providing and using virtual and dynamically definable comparable corpora based on existing national, reference or other large corpora. Given the well-known shortcomings of other types of multilingual corpora such as parallel/translation corpora (shining-through effects, over-normalization, simplification, etc.) or web-based comparable corpora (covering only web material), EuReCo provides a unique linguistic resource offering new perspectives for fine-grained contrastive research on authentic cross-linguistic data, applications in translation studies and foreign language teaching and learning.
The 12th Web as Corpus workshop (WAC-XII) looks at the past, present, and future of web corpora given the fact that large web corpora are nowadays provided mostly by a few major initiatives and companies, and the diversity of the early years appears to have faded slightly. Also, we acknowledge the fact that alternative sources of data (such as data from Twitter and similar platforms) have emerged, some of them only available to large companies and their affiliates, such as linguistic data from social media and other forms of the deep web. At the same time, gathering interesting and relevant web data (web crawling) is becoming an ever more intricate task as the nature of the data offered on the web changes (for example the death of forums in favour of more closed platforms).
As immigration and mobility increases, so do interactions between people from different linguistic backgrounds. Yet while linguistic diversity offers many benefits, it also comes with a number of challenges. In seven empirical articles and one commentary, this Special Issue addresses some of the most significant language challenges facing researchers in the 21st century: the power language has to form and perpetuate stereotypes, the contribution language makes to intersectional identities, and the role of language in shaping intergroup relations. By presenting work that aims to shed light on some of these issues, the goal of this Special Issue is to (a) highlight language as integral to social processes and (b) inspire researchers to address the challenges we face. To keep pace with the world’s constantly evolving linguistic landscape, it is essential that we make progress toward harnessing language’s power in ways that benefit 21st century globalized societies.
In this Paper, we describe a schema and models which have been developed for the representation of corpora of computer-mediated communicatin (CMC corpora) using the representation framework provided by the Text Encoding Initiative (TEI). We characterise CMC discourse as dialogic, sequentially organised interchange between humans and point out that many features of CMC are not adequately handled by current corpus encoding schemas and tools. We formulate desiderata for a representation of CMC in encoding schemes and argue why the TEI is a suitable framework for the encoding of CMC corpora. We propose a model of basic CMC units (utterances, posts, and nonverbal activities) and the macro- and micro-level structures of interactions in CMC environments. Based on these models, we introduce CMC-core, a TEI customisation for the encoding of CMC corpora, which defines CMC-specific encoding features on the four levels of elements, model classes, attribute classes, and modules of the TEI infrastructure. The description of our customisation is illustrated by encoding examples from corpora by researchers of the TEI SIG CMC, representing a variety of CMC genres, i.e. chat, wiki talk, twitter, blog, and Second Life interactions. The material described, i.e. schemata, encoding examples, and documentation, is available from the of the TEI CMC SIG Wiki and will accompany a feature request to the TEI council in late 2019.
We present recognizers for four very different types of speech, thought and writing representation (STWR) for German texts. The implementation is based on deep learning with two different customized contextual embeddings, namely FLAIR embeddings and BERT embeddings. This paper gives an evaluation of our recognizers with a particular focus on the differences in performance we observed between those two embeddings. FLAIR performed best for direct STWR (F1=0.85), BERT for indirect (F1=0.76) and free indirect (F1=0.59) STWR. For reported STWR, the comparison was inconclusive, but BERT gave the best average results and best individual model (F1=0.60). Our best recognizers, our customized language embeddings and most of our test and training data are freely available and can be found via www.redewiedergabe.de or at github.com/redewiedergabe.
In der Diskussion um Methodologie und Methoden finden unterschiedliche
wissenschaftliche Arbeitsbereiche und Forschungsaktivitäten stets einen gemeinsamen Nenner. Ulrike Froschauer hat sich lange Jahre ausführlich und intensiv mit den Fragestellungen der Organisationssoziologie beschäftigt. Die vorliegenden Buchveröffentlichungen wie beispielsweise „Organisationen in Bewegung. Beiträge zur interpretativen Organisationsanalyse“ (2012) oder „Organisationen im Wechselspiel von Dynamik und Stabilität“ (2015) geben einen guten Zugang zu ihrem wissenschaftlichen Wirken. Das Arbeitsfeld unserer Forschungsgruppe ist ein anderes, nämlich das der Medienwissenschaft, speziell der Medienrezeptionsforschung. In den 1980er Jahren haben wir hierzu das integrationswissenschaftliche Modell der „Strukturanalytischen Rezeptionsforschung“ entwickelt und dieses über die Jahre hinweg an unterschiedlichen Forschungsorten in zahlreichen Einzelstudien weiter ausgearbeitet. Verbunden hat uns, die Wiener Organisationssoziologin Ulrike Froschauer und die Baseler Mediensoziolog_innen, das anhaltende Interesse an method(-olog-)ischen Fragen.
Die vorgestellte Studie untersucht die Anteile unterschiedlicher Redewiedergabeformen im Vergleich zwischen zwei Literaturtypen von gegensätzlichen Enden des Spektrums: Hochliteratur – definiert als Werke, die auf der Auswahlliste von Literaturpreisen standen – und Heftromanen, massenproduzierten Erzählwerken, die zumeist über den Zeitschriftenhandel vertrieben werden und früher abwertend als „Romane der Unterschicht” (Nusser 1981) bezeichnet wurden. Unsere These ist, dass sich diese Literaturtypen hinsichtlich ihrer Erzählweise unterscheiden, und sich dies in den verwendeten Wiedergabeformen niederschlägt. Der Fokus der Untersuchung liegt auf der Dichotomie zwischen direkter und nicht-direkter Wiedergabe, die schon in der klassischen Rhetorik aufgemacht wurde.
Individuals with Autism Spectrum Disorder (ASD) experience a variety of symptoms sometimes including atypicalities in language use. The study explored diferences in semantic network organisation of adults with ASD without intellectual impairment. We assessed clusters and switches in verbal fuency tasks (‘animals’, ‘human feature’, ‘verbs’, ‘r-words’) via curve ftting in combination with corpus-driven analysis of semantic relatedness and evaluated socio-emotional and motor action related content. Compared to participants without ASD (n=39), participants with ASD (n=32) tended to produce smaller clusters, longer switches, and fewer words in semantic conditions (no p values survived Bonferroni-correction), whereas relatedness and content were similar. In ASD, semantic networks underlying cluster formation appeared comparably small without afecting strength of associations or content.
Das Theonym Gott für den christlichen Gott weist im Frühneuhochdeutschen eine Reihe ungewöhnlicher grammatischer Eigenschaften auf, die in diesem Beitrag korpusbasiert untersucht werden. Zum einen hat es sich von seiner appellativischen Herkunft emanzipiert, wie beispielsweise am fehlenden Artikel deutlich wird, zum anderen nutzt es aber das für einen Namen ungewöhnliche es-Flexiv im Genitiv (Pauls, Gottes) und tritt, wie unbelebte Appellative, als Genitivattribut dominant nachgestellt auf (Haus __ Gottes). In der Schreibung bildet sich die Doppelmajuskel <GOtt> heraus, die es bis ins 18. Jh. visuell von der übrigen Lexik abhebt. Damit weist das Theonym im Frühneuhochdeutschen eine Sondergrammatik auf, in abgeschwächter Form besteht sie bis heute fort. Der Beitrag argumentiert dafür, dass es sich um ein Resultat besonderer kommunikativer Relevanz handelt.