Refine
Year of publication
- 2012 (257) (remove)
Document Type
- Part of a Book (115)
- Article (82)
- Conference Proceeding (35)
- Part of Periodical (11)
- Book (10)
- Other (2)
- Doctoral Thesis (1)
- Review (1)
Has Fulltext
- yes (257) (remove)
Is part of the Bibliography
- no (257) (remove)
Keywords
- Deutsch (116)
- Korpus <Linguistik> (25)
- Konversationsanalyse (18)
- Computerlinguistik (16)
- Englisch (11)
- Interaktion (10)
- Kontrastive Grammatik (10)
- Sprachgebrauch (10)
- Diskursanalyse (9)
- Sprachwandel (9)
- Deutschland (8)
- Grammatik (8)
- Kommunikation (8)
- Sprachkontakt (8)
- Standardisierung (8)
- Kolloquium (7)
- Metadaten (7)
- Multimodalität (7)
- Sprache (7)
- Syntax (7)
- Verb (7)
- Genitiv (6)
- Interaktionsanalyse (6)
- Lexikographie (6)
- Neuerscheinungen (6)
- Newsletter (6)
- Projekte (6)
- Semantik (6)
- Sprachpolitik (6)
- Wörterbuch (6)
- Annotation (5)
- Arzt (5)
- Datenmanagement (5)
- Eheschließung (5)
- Europa (5)
- Gesprochene Sprache (5)
- Information Extraction (5)
- Infrastruktur (5)
- Kontrastive Linguistik (5)
- Korpuslinguistik (5)
- Linguistik (5)
- Mehrsprachigkeit (5)
- Natürliche Sprache (5)
- Polnisch (5)
- Akzent (4)
- Aussiedler (4)
- Biografisches Interview (4)
- Digitalisierung (4)
- Forschung (4)
- Französisch (4)
- Institut für Deutsche Sprache <Mannheim> (4)
- Internet (4)
- Kasus (4)
- Kolonialismus (4)
- Kongressbericht (4)
- Kritische Diskursanalyse (4)
- Lebensmittel (4)
- Mannheim <2012> (4)
- Migration (4)
- Minderheitensprache (4)
- Patient (4)
- Rezension (4)
- Soziolinguistik (4)
- Wortschatz (4)
- conversation analysis (4)
- Adjektiv (3)
- Bedeutung (3)
- CLARIN (3)
- Dialektologie (3)
- Finite Verbform (3)
- Forschungsdaten (3)
- Fremdsprache (3)
- Hörgerät (3)
- Hörschädigung (3)
- Italienisch (3)
- Medien (3)
- Morphologie (3)
- Mundart (3)
- Mundart Russlanddeutsch (3)
- Negation (3)
- Nominalphrase (3)
- Phraseologismus (3)
- Russlanddeutsche (3)
- Sprachgeschichte (3)
- Sprachkritik (3)
- Sprachvariante (3)
- Textgrammatik (3)
- Türkin (3)
- Ungarisch (3)
- Verumfokus (3)
- Wortbildung (3)
- elexiko (3)
- hearing aid use (3)
- hearing impairment (3)
- interaction (3)
- Altenbild (2)
- Archivierung (2)
- Attribut (2)
- Aufsatzsammlung (2)
- Automatische Sprachanalyse (2)
- Biografieforschung (2)
- Bruno Strecker (2)
- Component Metadata Infrastructure (CMDI) (2)
- Computerunterstützte Kommunikation (2)
- Computerunterstützte Lexikographie (2)
- Conversational alignment (2)
- Dativ (2)
- Deklination (2)
- Deutschunterricht (2)
- Diskursethik (2)
- Einwanderer (2)
- Erzählforschung (2)
- Forschungsprojekt (2)
- Frame-Semantik (2)
- Fremdsprachenlernen (2)
- Fremdsprachenunterricht (2)
- Fremdwort (2)
- Gefühl (2)
- German (2)
- Handlungsstruktur <Literatur> (2)
- Informationsstruktur (2)
- Internetwörterbuch (2)
- Kommunikationsforschung (2)
- Kommunikationsverhalten (2)
- Konjunktion (2)
- Konrad-Duden-Preis 2012 (2)
- Kulturwandel (2)
- Language attitude (2)
- Lehrer (2)
- Lemma (2)
- Linguistic Landscape (2)
- Migrationslinguistik (2)
- Neologismus (2)
- Niederländisch (2)
- Online-Wörterbuch (2)
- Ontologie <Wissensverarbeitung> (2)
- Pazifischer Ozean <Süd> (2)
- Phraseologie (2)
- Pitch contour (2)
- Pitch matching (2)
- Politische Kommunikation (2)
- Politische Willensbildung (2)
- Pragmatik (2)
- Prosodic similarity (2)
- Prosodie (2)
- Recherche (2)
- Russisch (2)
- Schriftsprache (2)
- Schwerhörigkeit (2)
- Sentimentanalyse (2)
- Sprachentwicklung (2)
- Spracherhaltung (2)
- Sprachinsel (2)
- Sprachkompetenz (2)
- Sprachtypologie (2)
- Sprichwort (2)
- Sprichwortforschung (2)
- Standardsprache (2)
- Stichwörter (2)
- Synonym (2)
- TEI (2)
- Tonhöhe (2)
- Tweed (2)
- Unterricht (2)
- Unterrichtskommunikation (2)
- Virtuelle Kommunikation (2)
- Wandel (2)
- Wissenschaftskommunikation (2)
- Wortstellung (2)
- XML (2)
- computational models of narrative (2)
- computerunterstützte Lexikographie (2)
- kontrastive Linguistik (2)
- language policy (2)
- minority language (2)
- multimodality (2)
- perception experiment (2)
- read speech (2)
- sentiment analysis (2)
- Übersetzung (2)
- AToL-Skala (1)
- Achtundsechziger (1)
- Adjunkt <Linguistik> (1)
- Adverb (1)
- Adverbiale (1)
- Affigierung (1)
- Akkusativ (1)
- Akzentuierung (1)
- Alemannisch (1)
- Alter (1)
- Amalgamierung <Linguistik> (1)
- Amazonia (1)
- Amtssprache (1)
- Anglizismus (1)
- Apostroph (1)
- Arabismus <Linguistik> (1)
- Arbeitskreis Linguistische Pragmatik (1)
- Arbeitsplatz (1)
- Arbeitstagung (1)
- Arbeitstagung IDS (1)
- Argument <Linguistik> (1)
- Artikel (1)
- Arzt-Patient-Interaktion (1)
- Augenfolgebewegung (1)
- Aussprache (1)
- Auszeichnungssprache (1)
- Automatische Textanalyse (1)
- Baden-Württemberg (1)
- Baltikum (1)
- Bantusprachen (1)
- Beeinflussung (1)
- Belehrung (1)
- Benutzerforschung (1)
- Benutzerführung (1)
- Benutzung (1)
- Berufliche Qualifikation (1)
- Best-Practice (1)
- Bestimmter Artikel (1)
- Betriebliche Ausbildung (1)
- Bewegungsverb (1)
- Bibliographie (1)
- Bibliothek (1)
- Bilingualismus (1)
- Bioethik (1)
- Biographisches Interview (1)
- CLARIN-D (1)
- CMDI experiences (1)
- CMDI infrastructure use (1)
- CMDI profile creation (1)
- Cleft-Erweiterung (1)
- Computer-Assisted Language Learning (CALL) (1)
- Computerunterstütztes Lernen (1)
- Computervermittelte Kommunikation (1)
- Concurrency (1)
- Cyber-Mobbing (1)
- Database Management Systems (1)
- Datenbank (1)
- Datenverarbeitung (1)
- Demonstrativpronomen (1)
- Denglisch (1)
- Dereko (1)
- Deusch (1)
- Deutsch als Fremdsprache (1)
- Deutsch-Neuguinea (1)
- Deutsche Gebärdensprache (DGS) (1)
- Deutsches Referenzkorpus (DeReKo) (1)
- Deutsches Referenzkorpus zur internetbasierten Kommunikation (DeRiK) (1)
- Deutschland <Bundesrepublik> (1)
- Dialekt (1)
- Digitale Daten (1)
- Digitale Sprachressourcen (1)
- Digitalization (1)
- Diphthong (1)
- Direktiv <Akkusativ> (1)
- Diskurs (1)
- Diskursforschung (1)
- Diskursivität (1)
- Dokumentation (1)
- Domain-specific Relation Extraction (1)
- Editor (1)
- Einstellung (1)
- Elektronisches Buch (1)
- Elektronisches Wörterbuch (1)
- Emblem (1)
- Empirische Linguistik (1)
- Entscheidungsbaum (1)
- Estnisch (1)
- Ethik (1)
- Ethnolinguistik (1)
- Ethnologie (1)
- Experiment (1)
- Facebook (1)
- Fachsprache (1)
- Fernsehunterhaltung (1)
- Fiktion (1)
- Flexion (1)
- Flexionsendung (1)
- Flirt (1)
- Flurname (1)
- Fokus (1)
- Food Domain (1)
- Food item (1)
- Formalisierung (1)
- Forschungsberichte (1)
- Forschungsmethode (1)
- Frame semantics (1)
- Frau (1)
- Frequenz (1)
- Fugenelement (1)
- Funktionale Grammatik (1)
- Gehen als situierte Praktik (1)
- Geisteswissenschaften (1)
- Geminata (1)
- Generationenbeziehung (1)
- Genitivattribut (1)
- Germanistik (1)
- Germanistische Sprachwissenschaft (1)
- Geräuschverb (1)
- Geschichte 1918 (1)
- Geschichte 1945-1955 (1)
- Geschichte 1967-1968 (1)
- Geschichte <1800-1899> (1)
- Geschichtswissenschaft (1)
- Gesellschaft (1)
- Gesprächsanalyse (1)
- Gesprächseröffnung (1)
- Gestik (1)
- Gestural matching (1)
- Gesture (1)
- Gleitlaut (1)
- Glottisverschlusslaut (1)
- Google (1)
- Gottesdienst (1)
- Grammatikregel (1)
- Gravity's Rainbow (1)
- Griechenland (1)
- Hausa (1)
- Hieroglyphe (1)
- Hilfeplan (1)
- Hörverlust (1)
- ISO/TC 37/SC 4 (1)
- ISOcat (1)
- ISOcat registry (1)
- Ideologie (1)
- Informationsgesellschaft (1)
- Informationsvermittlung (1)
- Institut für Corpuslinguistik und Texttechnologie (ICLTT) (1)
- Institut für Deutsche Sprache (1)
- Internationalität (1)
- Interoperabilität (1)
- Interview (1)
- Intonation (1)
- Intonation <Linguistik> (1)
- Jahrestagung IDS (1)
- Jugendhilfe (1)
- Jugendlicher (1)
- Jugendsprache (1)
- Kindersprache (1)
- Kirchenraum (1)
- Kochbuch (1)
- Kognition (1)
- Koloniallinguistik (1)
- Kommunikationsstrategie (1)
- Kommunikationstraining (1)
- Kongress (1)
- Konjugation (1)
- Konnektor (1)
- Konsekutivsatz (1)
- Konstruktion <Linguistik> (1)
- Konstruktionsgrammatik (1)
- Kontrastive Morphologie (1)
- Kontrastive Phonetik (1)
- Kontrastive Phonologie (1)
- Kontrastive Syntax (1)
- Koordination (1)
- Korpora (1)
- Korpusanalyseplattform (KorAP) (1)
- Kultur (1)
- Kulturwissenschaft (1)
- Kulturwissenschaften (1)
- Körpersprache (1)
- Künstliche Intelligenz (1)
- Langzeitarchivierung (1)
- Latgalian (1)
- Latvia (1)
- Lehnwort (1)
- Lehrersprache (1)
- Lernprozess (1)
- Lettisch (1)
- Lexem (1)
- Lexik (1)
- Lexikografie (1)
- Lexikograph (1)
- Lingua Franca (1)
- Linguistic Retrieval (1)
- Linguistic annotation (1)
- Linguistic processing (1)
- Linke Peripherie (1)
- Literaturverwaltung (1)
- Logische Partikel (1)
- Lokativ (1)
- Long-Term Archiving (1)
- Längsschnittuntersuchung (1)
- META-SHARE (1)
- MLSA (1)
- Markiertheit (1)
- Maschinelles Lernen (1)
- Massenmedien (1)
- Mean reciprocal rank (1)
- Mediatisierung (1)
- Medizin (1)
- Mehrworteinheit (1)
- Meinung (1)
- Metapher (1)
- Methodologie (1)
- Migrationshintergrund (1)
- Migrationsvarietät (1)
- Mimik (1)
- Modality (1)
- Modalverb (1)
- Modewort (1)
- Morphem (1)
- Morphologie <Linguistik> (1)
- Morphology of the Folktale (1)
- Multi-layer Annotation (1)
- Multimedia (1)
- Muttersprache (1)
- Möglichkeit (1)
- NaLiDa (1)
- Nationalitätenpolitik (1)
- Needs assessment (1)
- Neue Medien (1)
- Nichtverbale Kommunikation (1)
- Niederdeutsch (1)
- Niederrhein (1)
- Normung (1)
- Northern Sotho (1)
- Numerus (1)
- OWID (1)
- Online dictionary (1)
- Operator-Skopus-Struktur (1)
- Ortsname (1)
- Partizipation (1)
- Pedi-Sprache (1)
- Periphrase (1)
- Persistent identifier (1)
- Persuasion (1)
- Pfälzisch (1)
- Phonetik (1)
- Plural (1)
- Politik (1)
- Politische Sprache (1)
- Portugiesisch (1)
- Possessivität (1)
- Pro-Form (1)
- Produktanalyse (1)
- Produktionsanalyse (1)
- Progressiv (1)
- Pronomen (1)
- Propositionale Einstellung (1)
- Propp system (1)
- Prosodic repetition (1)
- Proust, Marcel (1)
- Präposition (1)
- Präsentation (1)
- Psycholinguistik (1)
- Psychologie (1)
- Pynchon, Thomas (1)
- Quantitative Analyse (1)
- Quellenkunde (1)
- Rahmen (1)
- Raum (1)
- Raum als interaktive Ressource (1)
- Raumwahrnehmung (1)
- Reality-TV (1)
- Rechtschreibung (1)
- Redaktionssystem (1)
- Regiolekt (1)
- Regionalsprache (1)
- Rektion (1)
- Relation type (1)
- Relativpronom (1)
- Relativsatz (1)
- Repository <Informatik> (1)
- Reproduzierbarkeit (1)
- Russland (1)
- SALSA (1)
- SOA (1)
- Satz (1)
- Satzanfang (1)
- Satzeröffnung (1)
- Satzverbindung (1)
- Satzverknüpfung (1)
- Schriftlichkeit (1)
- Schuld (1)
- Schuldenkrise (1)
- Schüler (1)
- Semantic role labelling (1)
- Semi-automatic annotation (1)
- SentiFrameNet (1)
- Sequentialanalyse (1)
- Server (1)
- Serviceorientierte Architektur (1)
- Sibirien (1)
- Sichtbarkeit (1)
- Slawistik (1)
- Soziale Identität (1)
- Sozialer Wandel (1)
- Sozialpsychologie (1)
- Sozialwissenschaften (1)
- Soziolekt (1)
- Sparkling wine (1)
- Spezialbibliothek (1)
- Spoken Language Data (1)
- Sprachanalse (1)
- Spracheinstellung (1)
- Spracheinstellungen (1)
- Sprachförderung (1)
- Sprachgeografie (1)
- Sprachkonflikt (1)
- Sprachkorpora (1)
- Sprachkrise (1)
- Sprachstatistik (1)
- Sprachstudie (1)
- Sprachunterricht (1)
- Sprachvarianten (1)
- Sprachvariation (1)
- Sprachverbreitung (1)
- Sprachvergleich (1)
- Sprachverstehen (1)
- Sprachwechsel (1)
- Sprecher (1)
- Sprecherwechsel (1)
- Standard (1)
- Stereotyp (1)
- Studentenbewegung (1)
- Substantiv (1)
- Suffix (1)
- Teilhabe (1)
- Temporal Reference (1)
- Tempus (1)
- Tenseless Languages (1)
- Terminologie (1)
- Terminologielehre (1)
- Text Encoding Initiative (1)
- Text Mining (1)
- Textkorpus (1)
- Textlinguistik (1)
- Textproduktion (1)
- Textsorte (1)
- Textualität (1)
- Texzgrammatik (1)
- Thematische Relation (1)
- Topik-Drop (1)
- Topikalisierung (1)
- Tourismus (1)
- Tschechisch (1)
- Turing Galaxy (1)
- Türkisch (1)
- Türkisch für Anfänger <Fernsehsendung> (1)
- Türkische Einwanderin (1)
- Unbestimmter Artikel (1)
- Unternehmen (1)
- Unterstützung (1)
- Valenz (1)
- Valenz <Verb> (1)
- Vergleichbarkeit (1)
- Verlaufsform (1)
- Verlinkung (1)
- Vernetzungsmanager (1)
- Verstehen (1)
- Verwandtschaftsbezeichnung (1)
- Very Large Corpora (1)
- Virtuelle Realität (1)
- WSD (1)
- Wahlkampf (1)
- Web Services (1)
- WebLicht (1)
- Website (1)
- Werbegrafik (1)
- Werbekultur (1)
- Werbung (1)
- Wissenschaftlicher Text (1)
- Wissenschaftssprache (1)
- Wissenspräsentation (1)
- Wissensvermittlung (1)
- Wortverbindung (1)
- Wörter des Jahres (1)
- Wörterbuchkorpus (1)
- XForms (1)
- XQuery Full Text (1)
- Zeichensetzung (1)
- Zeichensprache (1)
- Zeitungssprache (1)
- Zivilgesellschaft (1)
- Zulu (1)
- Zulu-Sprache (1)
- acoustic correlates (1)
- annotation (1)
- archiving support (1)
- archiving workflow (1)
- artefacts (1)
- automation (1)
- bestenfalls (1)
- church service (1)
- combination of methods (1)
- common language (1)
- communication in sciences (1)
- concept scheme (1)
- concept system (1)
- conceptual domain (1)
- context (1)
- coordination (1)
- copulatives (1)
- corpus analysis (1)
- corpus construction (1)
- corpus linguistics (1)
- couple interaction (1)
- cultural effects (1)
- cultural revolution (1)
- cultural skills (1)
- data category (1)
- database (1)
- decision tree structure (1)
- deutsch (1)
- dictionary design (1)
- dictionary software (1)
- dictionary writing system (1)
- electronic dictionaries (1)
- elektroniese woordeboeke (1)
- elektronische Lexikografie (1)
- ethnography (1)
- europäische Sprachen (1)
- fixation duration (1)
- gebruikersleiding (1)
- grammar-pragmatics-correlations (1)
- grammis (1)
- griechisch (1)
- household work (1)
- information presentation devices (1)
- infrastructure (1)
- inligtingsaanbiedingsinstrumente (1)
- inter-rater variability (1)
- intra-rater variability (1)
- keuse-boomstruktuur (1)
- kinship terminology (1)
- kontrastive Morphologie (1)
- kopulatiewe (1)
- kosten (1)
- language activism (1)
- language contact (1)
- language functions (1)
- language ideology (1)
- language variation (1)
- lecker (1)
- lexicographic working environment (1)
- lexikography (1)
- markup language (1)
- metadata (1)
- metadata editor (1)
- methods (1)
- modality (1)
- morpho-syntactic database (1)
- multilingual matter (1)
- multimodal interaction analysis (1)
- natural language processing (1)
- neologism (1)
- networking (1)
- normalisation (1)
- normalization (1)
- noun phrase (1)
- onomastics (1)
- part-of-speech ontology (1)
- phraseology (1)
- politische Kommunikation (1)
- primary research data repository (1)
- prominence (1)
- prosody (1)
- qualitative Medienforschung (1)
- rapid serial visual presentation (1)
- reading time (1)
- reductive grammar (1)
- relation registry (1)
- research infrastructure (1)
- semiotic mediation (1)
- sequential analysis (1)
- software tools (1)
- space as interactive resource (1)
- special language (1)
- standardization (1)
- subjectivity (1)
- survey (1)
- syllable duration (1)
- syllable prominence (1)
- tagging (1)
- teksproduksie (1)
- teksresepsie (1)
- text production (1)
- text reception (1)
- time reckoning (1)
- transcription (1)
- tun (1)
- tun-Periphrase (1)
- turn (1)
- ung-Nominalisierung (1)
- user guidance (1)
- verwantskapsterminologie (1)
- walking as situated prac-tice (1)
- web-based information system (1)
- woordeboekontwerp (1)
- word order (1)
- Ägypten (1)
- Ägyptisch (1)
Publicationstate
- Veröffentlichungsversion (99)
- Zweitveröffentlichung (23)
- Postprint (12)
Reviewstate
Publisher
- de Gruyter (37)
- Institut für Deutsche Sprache (31)
- Narr (16)
- European Language Resources Association (8)
- Lang (8)
- De Gruyter (7)
- European Language Resources Association (ELRA) (5)
- Verl. für Gesprächsforschung (5)
- Akademie Verlag (4)
- Springer (4)
This special issue of the Journal on Ethnopolitics and Minority Issues in Europe (JEMIE) brings together some of the participants of the symposium Political and Economic Resources and Obstacles of Minority Language Maintenance organized by the Language Survival Network ‘POGA’ at Tallinn University, Estonia, in December 2010. More than 20 scholars representing linguistics, anthropology, social sciences and law participated in the symposium, to present papers and discuss questions related to minority language loss, maintenance and revitalization. The six case studies contained in this special issue look at different minorities and regions in the European Union, Russia and the US. The linguistic communities discussed are the Russian-, Võru/Seto- and Latgalian-speaking minorities of Estonia and Latvia; the Welsh- and Breton-speaking communities of the Celtic language; the Russian Finno-Ugrian people with regional autonomies; and the native American groups of the Delaware/Cherokee and the Oneida. The reader will find articles relating to interdisciplinary research approaches in and on minority languages and minority language communities.
When we first started the project of looking at minority languages through a linguistic landscape lens, we felt that the visibility of minority languages in public space had been insufficiently dealt with in traditional minority language research. A linguistic landscape approach, as it had developed over the last years, would constitute a valuable path to explore, by looking at the ‘same old issues’ of language contact and language conflict from a specific angle. We were convinced that fresh linguistic landscape data would be able to provide innovative and useful insights into ‘patterns of language […] use, official language policies, prevalent language attitudes, [and] power relations between different linguistic groups’ (Backhaus 2007, p. 11). The linguistic landscape approach, as presented by the different authors in this volume, has clearly proven to be a heuristic appropriate and relevant for a wide range of minority language situations. More specifically, the ideas and analyses in the different chapters do contribute to a further understanding of minority languages and their speakers. They deepen our comprehension of language policies, power relations and ideologies in minority language settings.
Für die Grammatikschreibung des Deutschen ist die Negation eine Herausforderung. Das betrifft schon das Inventar der Negationsausdrücke wie nicht, kein oder niemand. In welchem Verhältnis stehen sie zueinander, und wann wird welcher Negationsausdruck gewählt? Die Negationspartikel nicht kann in den meisten Sätzen unterschiedliche Stellungen einnehmen, womit subtile Bedeutungsunterschiede einhergehen. Welchen genauen syntaktischen Status nicht hat, ist bis heute umstritten. Die Negation interagiert auch eng mit der Informationsstruktur, die unter anderem durch Intonation und Akzentuierung ausgedrückt wird. Die Intonation negierter Äußerungen und ihre Auswirkungen auf die Bedeutung werden in diesem Buch besonders gründlich behandelt. Schließlich sind zur Bedeutung der Negation selbst noch wichtige Fragen zu klären, unter anderem die, welche semantischen Objekte überhaupt negiert werden können und was genau durch ihre Negation bewirkt wird.
Das Buch versucht eine Gesamtschau der Grammatik der Negation im Deutschen, die für Fachwissenschaftler, für Studierende und für allgemein Sprachinteressierte, etwa für Lehrende des Deutschen als Mutter- und Fremdsprache, zugänglich sein soll. Die begrifflichen und methodischen Voraussetzungen aller Teile werden leserfreundlich eingeführt. Dadurch ist das Buch auch als Lehrwerk für die Gebiete Syntax, Informationsstruktur und Satzsemantik des Deutschen im Linguistikstudium verwendbar.
This chapter explores the Linguistic Landscape of six medium-size towns in the Baltic States with regard to languages of tourism and to the role of English and Russian as linguae francae. A quantitative analysis of signs and of tourism web sites shows that, next to the state languages, English is the most dominant language. Yet, interviews reveal that underneath the surface, Russian still stands strong. Therefore, possible claims that English might take over the role of the main lingua franca in the Baltic States cannot be maintained. English has a strong position for attracting international tourists, but only alongside Russian which remains important both as a language of international communication and for local needs.
Was halten die Deutschen von ihrer Muttersprache? Wie denken sie über andere Sprachen und deutsche Dialekte (siehe auch Schoel / Stahlberg in diesem Band)? Wie nehmen sie Veränderungen ihrer Sprache wahr und was halten sie von fremdsprachlichen Einflüssen, wie z. B. der Verwendung von Anglizismen? Sind Deutsche, umgekehrt betrachtet, besonders kritisch, wenn andere Deutsche Englisch sprechen? Und wie bewerten sie andere Personen, die z.B. einen französischen oder russischen Akzent im Deutschen besitzen? Mit all diesen Fragen hat sich das vorliegende Teilprojekt im Rahmen dieses von der Volkswagenstiftung geförderten Forschungsprojekts beschäftigt. Ausgehend von sozialpsychologischen Theorien und Methoden, wurden Spracheinstellungen in Deutschland näher untersucht.
Towards a part-of-speech ontology: encoding morphemic units of two South African Bantu languages
(2012)
This article describes the design of an electronic knowledge base, namely a morpho-syntactic database structured as an ontology of linguistic categories, containing linguistic units of two related languages of the South African Bantu group: Northern Sotho and Zulu. These languages differ significantly in their surface orthographies, but are very similar on the lexical and sub-lexical levels. It is therefore our goal to describe the morphemes of these languages in a single common database in order to outline and interpret commonalities and differences in more detail. Moreover, the relational database which is developed defines the underlying morphemic units (morphs) for both languages. It will be shown that the electronic part-of-speech ontology goes hand in hand with part-of-speech tagsets that label morphemic units. This database is designed as part of a forthcoming system providing lexicographic and linguistic knowledge on the official South African Bantu languages.
Electronic dictionaries should support dictionary users by giving them guidance in text production and text reception, alongside a user-definable offer of lexicographic data for cognitive purposes. In this article, we sketch the principles of an interactive and dynamic electronic dictionary aimed at text production and text reception guiding users in innovative ways, especially with respect to difficult, complicated or confusing issues. The lexicographer has to do a very careful analysis of the nature of the possible problems to suggest an optimal solution for a specific problem. We are of the opinion that there are numerous complex situations where users need more detailed support than currently available in e-dictionaries, enabling them to make valid and correct choices. For highly complex situations, we suggest guidance through a decision tree-like device. We assume that the solutions proposed here are not specific to one language only but can, after careful analysis, be applied to e-dictionaries in different languages across the world.
Over the past decades, problems related to linguistic minorities and their well-being, as well as to minority languages and their maintenance, have developed as an independent branch of minority studies. Studies of language in society and sociolinguistics, strategies of minority language survival and the empowerment of their speakers have produced a considerable output of case studies and theoretical writings.In this multifaceted field of investigation, language use, language practices, language policies and language politics represent interrelated aspects of social and linguistic relations that cannot be meaningfully addressed from a point of view of one scientific discipline only. This is specially the case when one wants to understand processes of language loss and maintenance, or the revitalization and empowerment of a language community. Such processes are linguistic expressions of complex social settings, and reflect group and individual identities that in turn express changing systems of collective values, human networks, fashions and social practices.
This article discusses the situation of the Latgalian language in Latvia today. It first provides an overview of languages in Latvia, followed by a historical and contemporary sketch of the societal position of Latgalian and by an account of current Latgalian language activism. On this basis, the article then applies schemes of language functions and of evaluations of the societal position of minority languages to Latgalian. Given the range of functions that Latgalian fulfils today and the wishes and attempts by activists to expand these functions, the article argues that it is surprising that so little attention is given to Latgalian in mainstream Latvian and international sociolinguistic publications. In this light, the fate of the language is difficult to prognose, but a lot depends on whether the Latvian state will clarify its own unclear perception of policies towards Latgalian and on how much attention it will receive in the future.
In Fachsprache 1–2/2011 Czicza and Hennig proposed a model that explains correlations between grammatical features and pragmatic conditions in communication in sciences. This model now serves as a basis for the practical analysis of the scientific degree of any written text. The authors present a method of analyzing written texts concerning the four parameters ‚economy’‚ precision’, ‚impersonalization’ and ‚discussion’. The method is being developed by the analysis of a prototypical scientific article on the one hand and a non-scientific text on the other hand. The two texts serve as the two poles of the scale of scientificity. Finally, the applicability of the model and its operationalization is being illustrated by the analysis of two examples of texts that are located between the two poles (one popular scientific text and one juridical teaching article).
In this chapter, I will focus on the phenomenon of drop out, i.e., withdrawal from the turn due to overlapping talk, in order to reflect on the link between “unfinished” turns and participation framework. With the help of a sequential and multimodal analysis inspired by the conversation analytical approach, I will show that dropping out from a turn is strongly linked to the availability displayed by potential recipients of a turn-at-talk. Although conversation analysis has described in detail the systematics of overlapping talk, especially of its onset (Jefferson 1973, 1983, 1986) and its resolution (Scheg-loff 2000; Jefferson 2004), the phenomenon of withdrawal from a turn due to simultaneous talk has not been investigated in detail. While it seems to bedifficult to describe this interactional practice by referring exclusively to syntactic features (incompleteness of the turn), I suggest looking at turn withdrawal from a multimodal perspective (e.g. Goodwin 1980, 1981; Mondada2007a; Schmitt 2005), taking into account visible resources like gaze or gesture. The problem of continuing or stopping a turn-in-progress in overlapping talk can be closely linked to the participation framework (Goodwin and Goodwin 2004), as speakers do visibly take into account their recipient’s availability and coordinate their turn construction with the dynamic changes of the participation framework and the interactional space.
Ce chapitre s’intéresse à la façon dont les changements de langue dans des réunions sont gérés par les parties co-présentes qui les traitent comme posant des problèmes de participation, en s’orientant vers le fait que le choix d’une langue particulière peut avoir comme effet d’augmenter ou bien de diminuer la participation de certains ou de tous les membres co-présents. Le choix d’une langue plutôt que d’une autre est étudié comme répondant à un problème des membres et comme une décision prise par eux, exhibant la manière dont ils s’orientent vers ses conséquences et dont ils élaborent sa justification et légitimité. Dans ce sens, le choix de l’anglais ou de plusieurs langues co-existantes voire alternantes n’a pas en soi une valeur positive ou négative en termes de participation, d’adéquation ou d’efficacité, mais a une valeur qui est située et occasionnée, dépendant des formats spécifiques de participation, des compétences reconnues localement et de la manière dont l’interaction est organisée. Afin d’explorer de manière systématique cette articulation entre choix de langue et participation, nous allons nous pencher sur un phénomène particulier et récurrent. Il s’agit de l’annonce qui projette un changement de langue et qui peut prendre une forme telle que “now we will switch into English so that you can participate”. Nous l’analyserons en tenant compte de la position séquentielle où elle est produite, de son format, de la façon dont elle est adressée à une partie ou à la totalité des co-présents, et de l’action spécifique qui y est accomplie. Nous étudierons aussi la manière dont elle est reçue, ses effets sur le cadre de participation, ainsi que les catégorisations qui en découlent. On montrera ainsi la relation de configuration mutuelle qui s’établit entre choix de langue et cadre de participation. Nos analyses seront développées sur la base de plusieurs corpus de rencontres professionnelles internationales enregistrées en audio et en vidéo sur plusieurs terrains. Les données vidéo nous invitent à considérer non seulement la dimension linguistique des cadres participatifs et des changements de langue, mais aussi leur organisation multimodale : l’organisation incarnée (embodied) du code-switching n’a pratiquement pas encore été explorée et la participation incarnée reste sous-étudiée, ainsi que son lien avec des espaces interactionnels spécifiques. Ce chapitre montre que les détails multimodaux sont cruciaux pour la compréhension des liens entre plurilinguisme et participation en tant que dynamiques occasionnées, contingentes et émergentes.
The current state of the art for metadata provision allows for a very flexible approach, catering for the needs of different archives and communities, referring to common data category registries that describe the meaning of a data category at least to authors of metadata. Component models for metadata provisions are for example used by CLARIN and META-SHARE, but there is also an increased flexibility in other metadata schemas such as Dublin Core, which is usually not seen as appropriate for meaningful description of language resources.
Making resources available for others and putting this to a second use in other projects has never been more widely accepted as a sensible efficient way to avoid a waste of efforts and resources. However, when it comes to the details, there is still a vast number of problems. This workshop has aimed at being a forum to address issues and challenges in the concrete work with metadata for LRs, not restricted to a single initiative for archiving LRs. It has allowed for exchange and discussion and we hope that the reader finds the articles here compiled interesting and useful.
This paper describes the ongoing work to integrate WebLicht into the CLARIN infrastructure. It introduces the CLARIN infrastructure for scholars in the humanities and social sciences as well as WebLicht - an orchestration and execution environment that is built upon Service Oriented Architecture principles. The integration of WebLicht into the CLARIN infrastructure involves adapting it to the standards and practices used within CLARIN, including distributed repositories, CMDI metadata, and persistent identifiers.
The ISOcat registry reloaded
(2012)
The linguistics community is building a metadata-based infrastructure for the description of its research data and tools. At its core is the ISOcat registry, a collaborative platform to hold a (to be standardized) set of data categories (i.e., field descriptors). Descriptors have definitions in natural language and little explicit interrelations. With the registry growing to many hundred entries, authored by many, it is becoming increasingly apparent that the rather informal definitions and their glossary-like design make it hard for users to grasp, exploit and manage the registry’s content. In this paper, we take a large subset of the ISOcat term set and reconstruct from it a tree structure following the footsteps of schema.org. Our ontological re-engineering yields a representation that gives users a hierarchical view of linguistic, metadata-related terminology. The new representation adds to the precision of all definitions by making explicit information which is only implicitly given in the ISOcat registry. It also helps uncovering and addressing potential inconsistencies in term definitions as well as gaps and redundancies in the overall ISOcat term set. The new representation can serve as a complement to the existing ISOcat model, providing additional support for authors and users in browsing, (re-)using, maintaining, and further extending the community’s terminological metadata repertoire.
Creating and maintaining metadata for various kinds of resources requires appropriate tools to assist the user. The paper presents the metadata editor ProFormA for the creation and editing of CMDI (Component Metadata Infrastructure) metadata in web forms. This editor supports a number of CMDI profiles currently being provided for different types of resources. Since the editor is based on XForms and server-side processing, users can create and modify CMDI files in their standard browser without the need for further processing. Large parts of ProFormA are implemented as web services in order to reuse them in other contexts and programs.
This paper presents the system architecture as well as the underlying workflow of the Extensible Repository System of Digital Objects (ERDO) which has been developed for the sustainable archiving of language resources within the Tübingen CLARIN-D project. In contrast to other approaches focusing on archiving experts, the described workflow can be used by researchers without required knowledge in the field of long-term storage for transferring data from their local file systems into a persistent repository.
The paper’s purpose is to give an overview of the work on the Component Metadata Infrastructure (CMDI) that was implemented in the CLARIN research infrastructure. It explains, the underlying schema, the accompanying tools and services. It also describes the status and impact of the CMDI developments done within the CLARIN project and past and future collaborations with other projects.
The Component Metadata Infrastructure (CMDI) in a project on sustainable linguistic resources
(2012)
The sustainable archiving of research data for predefined time spans has become increasingly important to researchers and is stipulated by funding organizations with the obligatory task of being observed by researchers. An important aspect in view of such a sustainable archiving of language resources is the creation of metadata, which can be used for describing, finding and citing resources. In the present paper, these aspects are dealt with from the perspectives of two projects: the German project for Sustainability of Linguistic Data at the University of Tubingen (NaLiDa, cf. http://www.sfs.uni-tuebingen.de/nalida) and the Dutch-Flemish HLT Agency hosted at the Institute for Dutch Lexicology (TST-Centrale, cf.http://www.inl.nl/tst-centrale). Both projects unfold their approaches to the creation of components and profiles using the Component Metadata Infrastructure (CMDI) as underlying metadata schema for resource descriptions, highlighting their experiences as well as advantages and disadvantages in using CMDI.
This paper describes the status of the standardization efforts of a Component Metadata approach for describing Language Resources with metadata. Different linguistic and Language & Technology communities as CLARIN, META-SHARE and NaLiDa use this component approach and see its standardization of as a matter for cooperation that has the possibility to create a large interoperable domain of joint metadata. Starting with an overview of the component metadata approach together with the related semantic interoperability tools and services as the ISOcat data category registry and the relation registry we explain the standardization plan and efforts for component metadata within ISO TC37/SC4. Finally, we present information about uptake and plans of the use of component metadata within the three mentioned linguistic and L&T communities.
In two eye-tracking experiments, we investigated the relationship between the subject preference in the resolution of subject-object ambiguities in German embedded clauses and semantic word order constraints (i.e., prominence hierarchies relating to the specificity/referentiality of noun phrases, case assignment and thematic role assignment). Our central research question concerned the timecourse with which prominence information is used and particularly whether it modulates the subject preference. In both experiments, we replicated previous findings of reanalysis effects for object-initial structures. Our findings further suggest that noun phrase prominence does not alter initial parsing strategies (viz., the subject preference), but rather modulates the ease of later reanalysis processes. In Experiment 1, the object case assigned by the verb did not affect the ease of reanalysis. However, the syntactic reanalysis was rendered more difficult when the order of the two arguments violated the specificity/referentiality hierarchy. Experiment 2 revealed that the initial subject preference also holds for verbs favoring an object-initial base order (i.e., dative object-experiencer verbs). However, the advantage for subject-initial sentences is neutralized in relatively late processing stages when the thematic role hierarchy and the specificity hierarchy converge to promote scrambling.
„XYZ hat dich angestupst". Romantische Erstkontakte bei Facebook - ein Schnittstellenphänomen?
(2012)
Am Kontaktaufnahmeverhalten in Sozialen Netzwerken - so die These des vorliegenden Aufsatzes - kann nachvollzogen werden, wie kommunikative Verhaltensformen in romantischen Kontexten aus On- und Offline-Welt Zusammenwirken und einander ergänzen. Anders als Online-Kontaktbörsen dienen Soziale Netzwerke in erster Linie der Pflege bereits offline bestehender sozialer Kontakte. Dennoch werden sie auch genutzt, um neue Kontakte zu etablieren, und als eine virtuelle Erweiterung einer Offline-Lebenswelt begriffen, in der fremde, aber als attraktiv kategorisierte Profilidentitäten' kontaktiert werden können. Mit (sprachlichen) Strategien wird einerseits das für Offline-Situationen typische Flirtverhalten simuliert, andererseits aber auf das charakteristische Vorgehen in Online-Kontaktbörsen zurückgegriffen. Auf der Basis solcher Beobachtungen werden Soziale Netzwerke als neuer Kommunikationsraum gedeutet, in dem Online- und Offline-Welt diffundieren - eine These, die aufschlussreich ist für eine Theorie kirchlicher Praxis in den Kommunikationsräumen des Web 2.0.
Numerus
(2012)
Corpora with high-quality linguistic annotations are an essential component in many NLP applications and a valuable resource for linguistic research. For obtaining these annotations, a large amount of manual effort is needed, making the creation of these resources time-consuming and costly. One attempt to speed up the annotation process is to use supervised machine-learning systems to automatically assign (possibly erroneous) labels to the data and ask human annotators to correct them where necessary. However, it is not clear to what extent these automatic pre-annotations are successful in reducing human annotation effort, and what impact they have on the quality of the resulting resource. In this article, we present the results of an experiment in which we assess the usefulness of partial semi-automatic annotation for frame labeling. We investigate the impact of automatic pre-annotation of differing quality on annotation time, consistency and accuracy. While we found no conclusive evidence that it can speed up human annotation, we found that automatic pre-annotation does increase its overall quality.
Zur Erforschung der generationsbedingten Variation im pfälzischen Sprachinseldialekt am Niederrhein
(2012)
Knowledge Acquisition with Natural Language Processing in the Food Domain: Potential and Challenges
(2012)
In this paper, we present an outlook on the effectiveness of natural language processing (NLP) in extracting knowledge for the food domain. We identify potential scenarios that we think are particularly suitable for NLP techniques. As a source for extracting knowledge we will highlight the benefits of textual content from social media. Typical methods that we think would be suitable will be discussed. We will also address potential problems and limits that the application of NLP methods may yield.
In this paper, we examine methods to extract different domain-specific relations from the food domain. We employ different extraction methods ranging from surface patterns to co-occurrence measures applied on different parts of a document. We show that the effectiveness of a particular method depends very much on the relation type considered and that there is no single method that works equally well for every relation type. As we need to process a large amount of unlabeled data our methods only require a low level of linguistic processing. This has also the advantage that these methods can provide responses in real time.
In this paper, we describe MLSA, a publicly available multi-layered reference corpus for German-language sentiment analysis. The construction of the corpus is based on the manual annotation of 270 German-language sentences considering three different layers of granularity. The sentence-layer annotation, as the most coarse-grained annotation, focuses on aspects of objectivity, subjectivity and the overall polarity of the respective sentences. Layer 2 is concerned with polarity on the word- and phrase-level, annotating both subjective and factual language. The annotations on Layer 3 focus on the expression-level, denoting frames of private states such as objective and direct speech events. These three layers and their respective annotations are intended to be fully independent of each other. At the same time, exploring for and discovering interactions that may exist between different layers should also be possible. The reliability of the respective annotations was assessed using the average pairwise agreement and Fleiss’ multi-rater measures. We believe that MLSA is a beneficial resource for sentiment analysis research, algorithms and applications that focus on the German language.
We present a gold standard for semantic relation extraction in the food domain for German. The relation types that we address are motivated by scenarios for which IT applications present a commercial potential, such as virtual customer advice in which a virtual agent assists a customer in a supermarket in finding those products that satisfy their needs best. Moreover, we focus on those relation types that can be extracted from natural language text corpora, ideally content from the internet, such as web forums, that are easy to retrieve. A typical relation type that meets these requirements are pairs of food items that are usually consumed together. Such a relation type could be used by a virtual agent to suggest additional products available in a shop that would potentially complement the items a customer has already in their shopping cart. Our gold standard comprises structural data, i.e. relation tables, which encode relation instances. These tables are vital in order to evaluate natural language processing systems that extract those relations.
In this paper, we examine methods to automatically extract domain-specific knowledge from the food domain from unlabeled natural language text. We employ different extraction methods ranging from surface patterns to co-occurrence measures applied on different parts of a document. We show that the effectiveness of a particular method depends very much on the relation type considered and that there is no single method that works equally well for every relation type. We also examine a combination of extraction methods and also consider relationships between different relation types. The extraction methods are applied both on a domain-specific corpus and the domain-independent factual knowledge base Wikipedia. Moreover, we examine an open-domain lexical ontology for suitability.
In this paper, we compare three different generalization methods for in-domain and cross-domain opinion holder extraction being simple unsupervised word clustering, an induction method inspired by distant supervision and the usage of lexical resources. The generalization methods are incorporated into diverse classifiers. We show that generalization causes significant improvements and that the impact of improvement depends on the type of classifier and on how much training and test data differ from each other. We also address the less common case of opinion holders being realized in patient position and suggest approaches including a novel (linguistically-informed) extraction method how to detect those opinion holders without labeled training data as standard datasets contain too few instances of this type.
We present an experimental approach to determining natural dimensions of story comparison. The results show that untrained test subjects generally do not privilege structural information. When asked to justify sameness ratings, they may refer to content, but when asked to state differences, they mostly refer to style, concrete events, details and motifs. We conclude that adequate formal models of narratives must represent such non-structural data.
Deutsch hat neben dem definiten Artikel und dem indefiniten Artikel noch zwei weitere indefinite Artikel, bzw. Gebrauchsweisen von Ausdrücken, die einem Artikelgebrauch sehr nahe kommen: (i) der indefinite Gebrauch des Demonstratives „dies“ und (ii) das aus „so“ und dem indefiniten Artikel verschmolzene „son“. In der vorliegenden Arbeit werden die referenziellen Eigenschaften dieser beiden indefiniten Demonstrativpronomen bezüglich ihrer Referentialität, Spezifizität und Diskursprominenz mit denen des indefiniten Artikels verglichen. Es kann gezeigt werden, dass indefinite Demonstrativpronomen deutlich stärkere referenzielle Eigenschaften in diesen Bereichen haben als der indefinite Artikel. Abschließend wird die Untersuchung auf Demonstrative weiterer Sprachen ausgedehnt, um so nach sprachübergreifenden Prinzipien dieser Ausdrücke und ihrer indefiniten Gebrauchsweisen zu suchen.
Der nachfolgende Beitrag untersucht Form-Funktionsbeziehungen in einem spezifischen Bereich adverbialer Modifikation im Deutschen und Türkischen, nämlich bei den ereignisinternen Adjunkten. Abschnitt 1 entwickelt — mit übereinzelsprachlichem Gültigkeitsanspruch — die Begrifflichkeiten, anhand derer die Untersuchung vorgenommen wird. Abschnitt 2 wendet diese auf das Deutsche und das Türkische an. Abschnitt 3 formuliert ein kontrastives Zwischenergebnis, das in Abschnitt 4 mittels des Versuchs der Identifikation typologischer Korrelate der festgestellten Unterschiede zu einer typologischen Hypothese erweitert wird.
Der Beitrag ist dem holistischen sprachtypologischen Programm verpflichtet, das die Systematiken aufzeigen will, die den identifizierten sprachlichen Strukturen unterliegen und das diese Systematiken als Instanzen allgemeinerer Prinzipien der Variation und Übereinstimmung von sprachlichen Systemen darstellen will. Es wird beschreibend vorgegangen; aus der Beschreibung soll ein Verständnis des Gegenstands erzielt werden. Als deskriptives Werkzeug dienen die Begrifflichkeiten der funktionalen Typologie und der Semantik.
Die Auseinandersetzung mit dem Untersuchungsgegenstand „ereignisinterne Adjunkte“ geschieht in dem für typologische Untersuchungen höchst engen Rahmen der Untersuchung von nur zwei Sprachen. Dies hat Vorteile, die sich insbesondere auf die angelegte Breite und den primär semantischen Ausgangspunkt der Untersuchung beziehen. Es hat gleichzeitig Nachteile, die sich vor allem auf die Verallgemeinerbarkeit oder implikative Kraft der identifizierten Zusammenhänge beziehen. Die Vorteile gilt es zu nutzen, die Nachteile zu beachten.
Wortstellung und Satztypmarkierung im Deutschen und im Ungarischen. Parallelen und Diskrepanzen
(2012)
Das Deutsche und das Ungarische stellen für die kontrastive Grammatikforschung in der europäischen Linguistik insofern besonders interessante Vergleichssprachen dar, als sie einerseits genealogisch und typologisch große Unterschiede aufweisen, andererseits aber in den letzten Tausend Jahren durch das enge Zusammenleben im mitteleuropäischen Kulturraum auch auffällige Konvergenztendenzen zeigen, die mehrheitlich mit der unidirektionalen Wirkung des Deutschen auf das Ungarische zu erklären sind (vgl. Kiss 2003).
Im vorliegenden Beitrag werden nach einem überblicksartigen Vergleich relevanter Wortstellungstypen der beiden Sprachen besonders ausgewählte Interrogativsatztypen kontrastiert, die sowohl typologisch bedingte Diskrepanzen als auch bestimmte, auf einer abstrakten Ebene nachweisbare Parallelen aufweisen. Neben dem systematischen Vergleich werden exemplarisch auch mit Hilfe ausgewählter Korpusbelege veranschaulichte Performanzphänomene behandelt, um Konvergenzen im Sprachgebrauch zu zeigen.
In der linguistischen Forschung wird häufig auf die besondere informationsstrukturelle Funktion der Randpositionen des Satzes hingewiesen: Diese sind nicht nur für die Gewichtung des satzinternen Materials nach Hintergrund und Vordergrund relevant, sondern tragen auch zur Sicherung der Kohärenz im Diskurs bei. Dabei wird vor allem mit Hinweis auf kognitive und funktionale Prinzipien die universelle Gültigkeit der Topik-Fokus-Abfolge betont, mit der initialen (oder frühen) Platzierung des kontextuell verankerten Satzgegenstandes (des so genannten Topiks) und der späteren Erwähnung der Kernaussage (des Fokus).
In dem vorliegenden Artikel wird die Relevanz des linken Satzrandes für die Herstellung des Diskurszusammenhanges und die Universalität der Topik-Fokus-Ordnung überprüft. Zum einen scheint die Funktion des Satzanfangs komplex: Mit dem ersten Glied der Aussagesätze wird nämlich in vielen Sprachen nicht nur an etwas Gesagtes angeschlossen, sondern kann auch etwas Wichtiges hervorgehoben werden. Zum anderen sind die Unterschiede zwischen den Sprachen beträchtlich, was auf den Einfluss struktureller Gegebenheiten hindeutet.
Zur Lösung der Probleme wird ein neues informationsstrukturelles Prinzip vorgeschlagen, das auf der „C-Markiertheit“ (Kohärenzmarkiertheit) der Konstituenten aufbaut. Demnach sind nicht nur kontextuell gegebene, sondern auch kontrastive Elemente relevant für die Herstellung der Kohärenz (und somit C-markiert), da diese die Zuordnung zu ähnlichen oder identischen Mengen bzw. Skalen voraussetzen. Als universelle Strategie der pragmatischen Ordnung ist somit der so genannte „C-Constraint“ zu betrachten, der die initiale Platzierung der C-markierten Konstituenten vorschreibt, unabhängig von ihrem Topik- oder Fokusstatus.
Der typologischen Vielfalt bezüglich der Besetzung des linken Satzrandes wird durch die Beachtung relevanter struktureller Parameter in sieben genetisch und typologisch unterschiedlichen europäischen Sprachen (Deutsch, Englisch, Schwedisch, Französisch, Russisch, Finnisch, Ungarisch) — und durch die Aufstellung der so genannten „C-Hierarchie“ — Rechnung getragen. Deren drei Hauptkategorien weisen bezüglich der Zulassung von C-markierten kontrastiven Elementen und von unterschiedlichen Typen nicht C-markierter Fokusglieder am Satzanfang eine bedeutende Variation auf.
Dieser Beitrag versucht, eine Einschätzung der Einsatzmöglichkeiten für automatische Analysemethoden aus der aktuellen computerlinguistischen Forschung für die sprachvergleichende Grammatikforschung vorzunehmen. Zur Illustration werden die Ergebnisse einer computerlinguistischen Studie für die vergleichende Untersuchung von Spaltsatzkonstruktionen in verschiedenen Sprachen wiedergegeben und ausführlich diskutiert. Der Korpuszugang erfolgt in diesem Rahmen auf Basis einer vollautomatischen syntaktischen Analyse, die dann noch zusätzlich durch eine statistische Wortalignierung kontrastiv auf Parallelkorpora beleuchtet werden kann. Neben der Vorstellung der bereits bestehenden automatischen Annotationsmöglichkeiten, die in meinen Augen vielversprechende Wege für den sprachwissenschaftlichen Korpuszugang eröffnen, ist die Hoffnung, dass dieser Beitrag durch die abschließende Diskussion zu dem Bewusstsein beiträgt, dass eine tiefere, organischere Verbindung der beiden sprachwissenschaftlichen Disziplinen möglich ist: dann nämlich, wenn der Korpuszugang nicht mit statischen, vordefinierten Werkzeugen erfolgt, deren Verhalten durch die Grammatikforscherin oder den Grammatikforscher nicht beeinflusst werden kann, sondern wenn ein interaktiver Werkzeuggebrauch erfolgt, der von den vielfältigen Anpassungsmöglichkeiten mit den zugrunde liegenden maschinellen Lernverfahren Gebrauch macht.
Zur Standortbestimmung der Kontrastiven Linguistik innerhalb der vergleichenden Sprachwissenschaft
(2012)
Das Programm der Kontrastiven Linguistik wurde in den sechziger und siebziger Jahren mit der Zielsetzung formuliert, durch systematische Einbeziehung von Gemeinsamkeiten und Kontrasten zwischen Muttersprache und zu erlernender Fremdsprache den Fremdsprachenunterricht effektiver zu gestalten. Nach einigen Jahren enthusiastischer Aufnahme und Bearbeitung setzte jedoch eine allgemeine Ernüchterung und Enttäuschung ein, so dass dieses Programm eher eine bescheidene Randexistenz im Rahmen der vergleichenden Sprachwissenschaft führte und erst in den letzten Jahren unter etwas veränderten Vorzeichen wieder aufgenommen wurde. Drei Gründe waren meiner Meinung nach für diese Desillusionierung verantwortlich: (a) Die Kontrastive Linguistik wurde als Theorie des Zweitspracherwerbs gesehen und somit mit völlig unrealistischen Erwartungen verknüpft, (b) In der Erstellung der deskriptiven Grundlagen dieses Programms, d.h. in der Erstellung umfassender vergleichender Grammatiken für relevante Sprachenpaare, wurden nur wenig überzeugende Fortschritte gemacht, (c) Es fehlte eine Standortbestimmung der Kontrastiven Linguistik im Rahmen der vergleichenden Sprachwissenschaft, aus der deutlich hervorgeht, was die Möglichkeiten und Grenzen dieses Typs von Sprachvergleich sind. Nachdem sich heute die Situation bezüglich der beiden ersten Punkte erheblich verbessert hat (u.a. auch durch einschlägige Arbeiten des IDS), widme ich mich in meinem Beitrag dem dritten Punkt: Durch eine systematische Gegenüberstellung der Kontrastiven Sprachwissenschaft mit den anderen Spielarten der vergleichenden Sprachwissenschaft sollen die Erkenntnismöglichkeiten und Grenzen der verschiedenen Ansätze zum Vergleich von Sprachen bestimmt werden, so dass die Kontrastive Linguistik durch diese Gegenüberstellung klare Konturen erhält. Im Rahmen dieser Gegenüberstellung wird eine Vielzahl von Beobachtungen zum Deutschen aus der Sicht des Englischen und anderer Sprachen gemacht. Für die Kontrastive Linguistik (KL) ergibt sich abschließend das folgende Profil:
— Synchronie: Die KL ist primär synchron orientiert.
— Granularität: Ihr Gegenstand sind feinkörnige Beobachtungen zu Kontrasten zwischen Sprachen.
— Skopus: Die KL beschäftigt sich vor allem mit umfassenden Vergleichen von Sprachpaaren.
— Perspektivierung: Ihr Mehrwert besteht u.a. darin, dass eine Sprache aus der Perspektive einer anderen beschrieben wird. Aus dieser Perspektivenwahl ergeben sich neue Beobachtungen.
— Zielsetzung: Ihre Zielsetzung sind weitreichende, falsifizierbare Verallgemeinerungen über Kontraste. Die Wahl eines theoretischen Rahmens ist sekundär.
Im vorliegenden Beitrag werden einige zentrale Aspekte der kontrastiven Wortbildungsforschung anhand von Beispielen aus dem niederländisch-deutschen Sprachvergleich besprochen. Als nah verwandte Sprachen zeigen das Niederländische und das Deutsche zwar vergleichbare Strukturen der Komposition und der Derivation, bei näherem Hinsehen sind es aber vor allem die vielfältigen Divergenzen, die ins Auge fallen. Im ersten Teil des Artikels werden verschiedenartige Beispiele für solche Divergenzen besprochen. Anschließend geht es um gegenläufige Entwicklungen, die zu Konvergenz zwischen beiden Sprachen führen. Anhand einer Analyse von Zusammensetzungen vom Typ „wassergekühlt“ (ndl. „watergekoeld“) wird für eine stärkere Berücksichtigung von Konvergenzfaktoren in der kontrastiven Linguistik plädiert. Der zweite Teil des Artikels enthält eine detaillierte Fallstudie zur Adjektivbildung mit dem niederländischen Suffix „-achtig“ und dem deutschen „-haft“, die den Zusammenhang von diachronen Entwicklungen und synchronen Kontrasten aufzeigt. Zudem zeigt sie Konsequenzen und Implikationen der vergleichenden Analyse für die Theorie des Lexikons und der Wortbildung auf. Im Mittelpunkt stehen dabei Rainers (2003) Idee der ,semantischen Fragmentierung‘ von Wortbildungsmustern und die Konzeption eines ,hierarchischen Lexikons‘, wie sie unter anderem von Jackendoff (2008) oder Booij (2010) vertreten wird.
Die genaue Charakterisierung der möglichen Wechselwirkungen zwischen Syntax und Morphologie stellt eine der zentralen Forschungsfragen der Sprachwissenschaft dar. Die hier betrachteten Verschmelzungsformen bieten sich als Fallstudie für die Syntax-Morphologie-Schnittstelle an, da Verschmelzungsformen von Präposition und Artikel wie „du“/ „au“ im Französischen oder „am“/ „zum“ im Deutschen paradigmatisch Sequenzen gegenüberstehen, in denen eine nicht-reduzierte Präposition mit einem vollen Artikel kombiniert wird („de la“/ „à la“; bzw. „an dem“/ „zu dem“). Für die Analyse dieser Formen muss also untersucht werden, inwiefern die Verwendung von Verschmelzungsformen gegenüber unreduzierten Abfolgen Änderungen in der Syntax nach sich zieht. In diesem Beitrag werde ich zeigen, dass die Wechselbeziehungen zwischen Verschmelzungsform und Syntax im Französischen und Deutschen unterschiedlicher Natur sind. Französische und deutsche Verschmelzungsformen unterscheiden sich in ihren morphologischen, semantischen und syntaktischen Eigenschaften. Hier sollen zwei Eigenschaften genauer untersucht werden: (i) die Kombinierbarkeit von Verschmelzungsformen und Nominalphrasen mit restriktiven Relativsätzen im Deutschen („?im/in dem Haus, das gerade renoviert wird“), und (ii) die Koordinationsmöglichkeiten von Präpositionalphrasen mit Verschmelzungsformen im Französischen und im Deutschen. Es ist bekannt, dass Verschmelzungsformen im Französischen die Koordinationsmöglichkeiten der beteiligten Nominalphrasen einschränken. Vergleichbare Wechselwirkungen zwischen Verschmelzungsform und Koordination sind im Deutschen jedoch nicht zu beobachten, wie anhand von Koordinationsdaten aus dem COSMAS II-Korpus belegt werden kann.
Dieser Beitrag beschäftigt sich mit einem Vergleich der englischen wh-Clefts und deren Entsprechungen im Deutschen, den ,Sperrsätzen‘ oder ‚w-Clefts‘. Auf Grundlage einer umfangreichen Korpusstudie werden zunächst Unterschiede in der Verteilung bestimmter w/h-Cleftsatztypen ermittelt. Ein generelles quantitatives Übergewicht der englischen wh-Clefts gegenüber den deutschen w-Clefts wird mit der flexibleren Wortstellung des Deutschen in Verbindung gebracht. Spezifisch werden die beobachteten Asymmetrien durch Unterschiede in der Möglichkeit der Erfüllung bestimmter struktureller Bedingungen erklärt. Vier Motivationen für die Bildung von Cleftsätzen werden identifiziert: (i) lineare Synchronisierung von Informationsstruktur und Syntax, (ii) strukturelle Trennung von Quaestio (= im Diskurs gegebener Frage) und Responsio (= Antwort auf die Quaestio), (iii) Trennung von propositionalem Gehalt und Äußerungskommentar (,Ebenentrennung‘) und (iv) Rechtslastigkeit (Behaghels ‚Gesetz der wachsenden Glieder‘). Während all diese Faktoren die Bildung von wh-Cleftsätzen im Englischen zu begünstigen scheinen, sind deutsche w-Clefts meist durch den in (ii) genannten Faktor motiviert. Die anderen Motivationen führen seltener zur Bildung von w-Cleftsätzen als im Englischen, da die entsprechenden strukturellen Effekte auch ohne Cleftsatzbildung — z.B. in einem kanonischen Verbzweitsatz — erzielt werden können.
In diesem Aufsatz geht es um einen Vergleich der Prinzipien der Wortschreibung im Englischen und Deutschen. Konkret werden Schreibdiphthonge und Doppelkonsonanten behandelt. Beide Phänomene eignen sich gut, um Prinzipien zu verstehen, nach denen die Wortschreibung funktioniert: So lassen sich Schreibdiphthonge nicht immer so aussprechen, wie es die einzelnen Vokalbuchstaben suggerieren, das heißt, sie sind nicht immer über die entsprechenden Graphem-Phonem-Korrespondenzen der einzelnen Segmente zu interpretieren, etwa <ei> für /ai/ im Deutschen und <ea> für /i/ im Englischen. Auf einer ,höheren‘ Ebene (der silbischen) zeigen sich aber systematische Züge, die in beiden Sprachen vergleichbar sind. Auch die Schreibungen der Doppelkonsonanten sind nicht einfach auf der Segmentebene zu verstehen, sondern sie ergeben sich aus einem Zusammenspiel der silbischen, der suprasegmentalen und der morphologischen Ebene. In beiden Sprachen wirken Prinzipien auf allen diesen Ebenen, aber zum Teil auf unterschiedliche Art und Weise.
Am Beispiel des an der Universität Oslo entwickelten Oslo Multilingual Corpus (OMC) wird illustriert, wie ein Parallelkorpus aus Originaltexten und deren Übersetzungen zur sprachvergleichenden Erforschung von Phänomenen der Satzverbindung und der Informationsverteilung auf Satz- und Textebene eingesetzt werden kann. Nach einer Skizze der OMC-Architektur wird eine Untersuchung von Satzverknüpfungen mit dem komitativen Konnektor „wobei“ und deren Entsprechungen in norwegischen Übersetzungen und Originaltexten vorgestellt, die dazu beiträgt, Bedeutungsfacetten dieses Konnektors aufzuzeigen, die in rein intralingualen Studien nicht so einfach zu erkennen sind, und dadurch einen besseren und systematischeren Einblick in die angewandten Übersetzungsstrategien gibt. Als zweites Einsatzbeispiel wird eine explorative Untersuchung zur Elaborierung von Ereignisbeschreibungen vorgestellt, die deutsche, norwegische, englische und französische Entsprechungen von „mit“-Konstruktionen (sog. „Sätzchen“) als Ausgangspunkt nimmt. Beide Studien illustrieren, dass ein Parallelkorpus auch ohne komplexe Annotierungen nicht nur für wort-basierte quantitative Untersuchungen verwertet werden, sondern auch im Zuge weniger zielgerichteter, eher qualitativ angelegter Studien als „Augenöffner“ für komplexe linguistische Phänomene dienen kann.
Die Aufbauprinzipien europäischer Possessionssysteme basieren viel öfter als gemeinhin angenommen auf gespaltener Possession. Dieses im Deutschen nicht prominente Phänomen wird anhand von Daten aus ausgewählten Beispielsprachen als in Europa durchaus etablierte Erscheinung vorgestellt. Die mit ihm verbundenen semantischen und morphosyntaktischen Aspekte werden anhand von qualitativen Korpusdaten diskutiert. Die Restriktionen, denen sie unterliegen, sind ebenfalls Gegenstand der Diskussion. In den Schlussfolgerungen wird dafür plädiert, künftig der Possession bei vergleichenden Studien zu europäischen Sprachen mehr Beachtung zu schenken.
Anhand einer Auswahl historischer Reden je dreier prominenter Deutscher und Polen wird eine signalphonetisch gestützte sprachvergleichende Analyse der glottalen Markierung vokalinitialer Wörter durchgeführt.
Generell erweist sich die glottale Markierung als variabel entlang eines Kontinuums zwischen einem echten glottalen Verschlusslaut (harter Stimmeinsatz) des Initialvokals über zeitlich nicht exakt koordinierte Glottalisierungen (Knarrstimme) und leichte Reflexe im Grundfrequenzverlauf bis hin zum völligen Fehlen einer Markierung.
Insgesamt zeigen sich im Polnischen gegenüber dem Deutschen seltener glottale Markierungen sowie eine sprachübergreifende schwache Abhängigkeit der Markierungshäufigkeit vom Sprechtempo (weniger bei Sprechtempoerhöhung).
Die Auftretenshäufigkeit glottaler Markierung wird sprachabhängig zudem durch unterschiedliche Faktoren beeinflusst: Für das Deutsche zeigen sich signifikante Einflüsse sowohl des Worttyps (Inhaltswörter mit häufigerer Markierung gegenüber Funktionswörtern) als auch der Betonung (betonte Silben mit häufigerer Markierung gegenüber unbetonten), während im Polnischen hier kein Einfluss sichtbar ist. Dafür zeigt das Polnische gegenüber dem Deutschen einen signifikanten Einfluss der Position innerhalb der Phrase (häufigere glottale Markierung in phraseninitialen im Gegensatz zu phrasenmedialen Wörtern). Diese sprachspezifischen Unterschiede können mit den prosodischen Charakteristika beider Sprachen Zusammenhängen. Im Unterschied zum Deutschen mit einem freien Wortakzent fällt dieser im Polnischen auf die Penultima, ist somit vorhersagbar und bedarf demzufolge keiner zusätzlichen glottalen Markierung im Sprachsignal.
Beide Sprachen hingegen zeigen übereinstimmend einen klar ausgeprägten Effekt der Vokalhöhe auf das Auftreten der glottalen Markierung (tiefe Vokale > mittlere Vokale > hohe Vokale).
A formal narrative representation is a procedure assigning a formal description to a natural language narrative. One of the goals of the computational models of narrative community is to understand this procedure better in order to automatize it. A formal framework fit for automatization should allow for objective and reproducible representations. In this paper, we present empirical work focussing on objectivity and reproducibility of the formal framework by Vladimir Propp (1928). The experiments consider Propp’s formalization of Russian fairy tales and formalizations done by test subjects in the same formal framework; the data show that some features of Propp’s system such as the assignment of the characters to the dramatis personae and some of the functions are not easy to reproduce.
This paper presents Release 2.0 of the SALSA corpus, a German resource for lexical semantics. The new corpus release provides new annotations for German nouns, complementing the existing annotations of German verbs in Release 1.0. The corpus now includes around 24,000 sentences with more than 36,000 annotated instances. It was designed with an eye towards NLP applications such as semantic role labeling but will also be a useful resource for linguistic studies in lexical semantics.
In multimodal scholarly presentations supported by presentation software, spoken and written language, various visualizations on the projected slides as well as the contributors’ gestures and facial expressions build a meaningful oneness. On the one hand, communication scientists as well as linguists have for a relatively long time neglected the presentation as a complex form of communication. On the other hand, since Tafte (2003 ), columnists of major German newspapers have been dealing with the question of the value, the quality and the place of PowerPoint in science, they have even tried to find the answer to the question whether PowerPoint is evil or not.
The presentation practice is perceived as fundamentally deficient of systematic empirical research on presentations. Also Grabowski called attention to this desideratum with two critical articles (Grabowski 2003, 2008). Various questions - still unanswered - have motivated the implementation of a number of experiments (in the summer of 2010) for analyzing the knowledge and learning effects and the communicational impact of scientific presentations. The general aim of these experiments was to conduct empirical research on selected presentations in order to find out what kind of presentation is successful. The main interest is to find out which model of scholarly presentation produces the best results regarding learning effect and communicative impact.
Vor dem Hintergrund einer neuen linguistischen Betrachtungsweise, die wissenschaftliche Präsentationen als eine eigenständige, komplexe, multimodale Textsorte auffasst, wird in diesem Beitrag zunächst der Aspekt der Multimodalität von Präsentationen fokussiert. Die analytische Beschäftigung mit wissenschaftlichen Präsentationen wird dann um erste Ergebnisse unserer Rezeptionsexperimente ergänzt, in denen unter anderem Erhebungen zur Wissensvermittlung unterschiedlicher wissenschaftlicher Präsentationen durchgeführt wurden.
Wissenschaftliche Kommunikation zeichnet sich durch ein besonders hohes Maß an Standardisierung und Organisation aus. Anforderungen der Objektivität, der Nachvollziehbarkeit und der Authentizität schlagen sich in der Struktur aller wissenschaftlichen Textsorten nieder. Die Kulturtechniken der Schrift sind auf diese Bedingungen ausgerichtet, weshalb das Lesen und Schreiben wissenschaftlicher Texte traditionell besonderen Bedingungen unterliegt, die üblicherweise im Studium vermittelt werden. In diesem Beitrag soll zunächst gezeigt werden, welches die wichtigsten wissenschaftlichen Textsorten sind, welche Eigenschaften sie besitzen und welche Ziele mit Ihnen kommunikativ verfolgt werden. Im zweiten Abschnitt geht es um die Digitalisierung von Texten: Welche Merkmale besitzen digitale Texte und welchen technischen Bedingungen unterliegen sie. Auch wird es hier um das Schreiben digitaler Texte überhaupt gehen. Im letzten Abschnitt dieses Beitrags sehen wir uns die Auswirkungen daraus auf die wissenschaftliche Kommunikation an. Digitale Texte weisen Eigenschaften auf, die die kommunizierten Inhalte zu verändern vermögen. Wie ändert sich das wissenschaftliche Schreiben dadurch?
We had found ourselves in the “Gutenberg-Galaxy” before the digitalization made its rise. The development of the book printing by Johannes Gutenberg and developments based on it as well as the following industrialization of printing are decisive for the expansion of the cultural revolution. It has meanwhile been transformed, upgraded and replaced by something which has been called “Turing Galaxy”. One of the most important changes is the automatic processing of data, the program-controlled production or manipulation of texts, images, sounds, formulas, tables and videos. The internet has led us to new distribution channels. The paper shows which trends of development concerning the cultural skills of writing and reading have been realized up to now as a result of the digitalization. Three aspects of development will be discussed: how the way of writing has changed to the present moment by the means of automation, multimodality and networking.
Die Veränderung der individuellen politischen Kommunikation ist ein wesentliches Element des Konzepts der Mediatisierung des Politischen. Immer mehr Politikerinnen und Politiker sowie Bürgerinnen und Bürger nutzen digitale Plattformen, um sich politisch auszutauschen und zu informieren. Dabei stellt sich die Frage, inwiefern Politiker/-innen selbst Austauschmöglichkeiten im Netz bieten und somit direkt Kommunikation fördern. Für die vorliegende Studie wurde die Nutzung des Microblogging-Dienstes Twitter durch Politiker/-innen während ausgewählter Landtagswahlkämpfe des Jahres 2011 auf partizipationsermöglichende Elemente hin untersucht. Diese Elemente wurden mithilfe des „Funktionalen Operatorenmodells“ systematisiert und kategorisiert. Die Ergebnisse verdeutlichen nicht nur eine individuell ausgeprägte Nutzungsfrequenz der einzelnen Politiker/-innen, sondern auch unterschiedliche Stile der Twitternutzung, die sich als „persönlich-interaktiv“ und „thematisch-informativ“ klassifizieren lassen. In Einblick auf deliberative Strukturen ist die Twitterkommunikation im Politiker-Bürger-Dialog hingegen noch ausbaufähig.
Mit rund 200 Millionen Nutzerinnen und Nutzern und stetig wachsenden Zahlen gewinnt das Web 2.0 Angebot Twitter mehr und mehr an Bedeutung. Doch was ist das Besondere an dieser neuen Form der Online-Medien? Jessica Einspänner, Mark Dang-Anh und Tobias Bürger sind Mitarbeitende an der Universität Bonn im Forschungsprojekt „Deliberation im Netz: Formen und Funktionen des digitalen Diskurses am Beispiel des Microbloggingsystems Twitter". Das Projekt ist Teil des DFG- Schwerpunktprogramms „Mediatisierte Welten", in dem insgesamt zwölf Projekte interdisziplinär miteinander zusammenarbeiten. Mit merz sprechen sie über Twitter als neue Form von Öffentlichkeit, die Userinnen und User, aber auch über die Möglichkeiten der Teilhabe und das Potenzial, das dieses Medium - gerade in der politischen Kommunikation - bietet.
Mehr Zivilgesellschaft durch Social Media? Medienethische Perspektiven auf Twitter als Diskursmedium
(2012)
Im Beitrag wird die Frage erörtert, inwiefern sich der Microblogging- Dienst Twitter als Diskursmedium der Zivilgesellschaft eignet. Die spezifischen Produktions-, Distributions- und Rezeptionsbedingungen von Social Media sowie die ihrem Netzwerkcharakter inhärenten neuartigen Konstitutionsoptionen für öffentliche Diskursräume erfordern eine Justierung der medienethischen Perspektive. Doch auch klassische ethische Theorien machen Microblogs greifbar: Die Prämissen der Diskursethik nach Habermas differenzieren sich auch im Handlungsbereich Twitter in prädiskursiven Geltungsansprüchen aus, die von Diskursteilnehmern implizit erhoben werden. Setzt man diese – und hier setzt die notwendige Modifikation des Blickwinkels ein – in Beziehung zu den spezifischen Funktionen des Mediums Twitter, treten komplexe kommunikative Optionen zu Tage. Prüft man die Geltungsansprüche der Wahrheit, Wahrhaftigkeit und Richtigkeit auf empirische Fallbeispiele in Twitter, lassen sich Brüche von medienethischer Relevanz feststellen, die nicht nur die zivilgesellschaftliche, sondern auch die journalistische Nutzung des Mediums in ein neues Licht rücken.
This paper presents the application of the <tiger2/> format to various linguistic scenarios with the aim of making it the standard serialisation for the ISO 24615 [1] (SynAF) standard. After outlining the main characteristics of both the SynAF metamodel and the <tiger2/> format, as extended from the initial Tiger XML format [2], we show through a range of different language families how <tiger2/> covers a variety of constituency and dependency based analyses.
Current work on sentiment analysis is characterized by approaches with a pragmatic focus, which use shallow techniques in the interest of robustness but often rely on ad-hoc creation of data sets and methods. We argue that progress towards deep analysis depends on a) enriching shallow representations with linguistically motivated, rich information, and b) focussing different branches of research and combining ressources to create synergies with related work in NLP. In the paper, we propose SentiFrameNet, an extension to FrameNet, as a novel representation for sentiment analysis that is tailored to these aims.
This paper presents an extension to the Stuttgart-Tübingen TagSet, the standard part-of-speech tag set for German, for the annotation of spoken language. The additional tags deal with hesitations, backchannel signals, interruptions, onomatopoeia and uninterpretable material. They allow one to capture phenomena specific to spoken language while, at the same time, preserving inter-operability with already existing corpora of written language.
We taught a humanoid robot a number of different actions involving a number of different objects (e.g., touching a green object, moving a red object etc.) alongside a number of simplified linguistic labels for these behaviours (e.g., ‘touch-green’, ‘move-red’ etc.). The robot managed to learn the associations between the behaviours and their linguistic labels, and it succeeded in recognising the compositional structure of the behaviours and their associated linguistic descriptions (ACTION/VERB+OBJECT/NOUN). Moreover, it was able to generalise the learned instructions to novel, previously untrained action+object-combinations (e.g., touch-red). This corresponds to the task of learning and decomposing so-called ‘holophrases’ in early child language acquisition.
Proceeding from the central ideas of the papers contained in this volume, the closing article sets out to achieve a unified theory of the syntax and semantics of verum focus, to be illustrated for the sentence and clause types of present day German. In German, verum focus is realized phonologically by means of pitch accents on morphosyntactic exponents of various classes: finite verb forms, complementizers and subordinators, interrogative and relative phrases, and modal particles. In the first half of the article, these constituents - most of which reside in the left periphery of the sentence or clause - are shown to share the gramma-tical function of distinguishing between sentence moods and other categories of clauses. This observation gives rise to the assumption that verum focus should be explicable as contrastive focus on semantically distinctive features or components of sentence mood and clause type. In the second half of the article this assumption is spelt out for the sentence and clause types of German. We propose a universal semantic structure of sentence meaning which makes it possible to reduce the most typical cases of verum focus and their diverse contextual interpretations to highlighting the connection between the sentence/clause and its textual or dis-course environment. This connection is syntactically implemented by an element occupying the head position of CP: either a finite verb form or a complementizer/subordinator. Realizations of verum focus on prefield constituents in wh- and relative clauses are explained as phonetic remedies deployed when a connecting element in C° is missing. Focusing of modal particles in the middle field and of verb forms in the right periphery of the clause are shown to differ semantically from verum focus stricto sensu, although they have similar pragmatic effects. The theory is built exclusively on assumptions needed for independent reasons and dispenses with the problematic verum operator assumed in most traditional accounts.
We report an ethnographic and field-experiment-based study of time intervals in Amondawa, a Tupi language and culture of Amazonia. We analyse two Amondawa time interval systems based on natural environmental events (seasons and days), as well as the Amondawa system for categorising lifespan time (“age”). Amondawa time intervals are exclusively event-based, as opposed to time-based (i.e. they are based on event-duration, rather than measured abstract time units). Amondawa has no lexicalised abstract concept of time and no practices of time reckoning, as conventionally understood in the anthropological literature. Our findings indicate that not only are time interval systems and categories linguistically and culturally specific, but that they do not depend upon a universal “concept of time”. We conclude that the abstract conceptual domain of time is not a human cognitive universal, but a cultural historical construction, semiotically mediated by symbolic and cultural-cognitive artefacts for time reckoning.
Opening/Eröffnung/Aperture
(2012)
I nationale og curopa’iskc sprogpolitiske undersogelser savner man orte et tilt'redsstiIlende cmpirisk grundlag. De tilgsngelige data om den aktuelle Situation for sprogene i de forskelligc lande er heterogene. ufuldstEndige og delvist foraddede og derfor vanskelige at sammenligne over tid. EKNIL’s curoptciskc sprogbarometer. KLM, er et forsog pä al afhjxlpe denne Situation. KLM er baseret pä et omfattende spor- geskema om en bred vifte al’sproglige forhold som er egnet til at danne et billede at'sprogenes Status og sprogpolitiske praksisser i hvert enkelt land. fx sprogencs juridiske Status, sprogenes Status i undervis- ning og forskning, Situationen for minoritetssprog, sprogene i kulturen og i erhvervslivet. KLM gennem- tores med fä ärs mellemrum. Naervjerende artikel beskriver baggrunden og resultateme af KLM 2 (2007- 2011) som omfatler 23 europa’iske lande
Other than linguistic laymen, most linguists avoid Statements concerning the general state of a language or its future. Despite some theoretical scruples, I shall, after some assessing comments on present German, make speculations on the further development of this language. Three scenarios of possible States of the German language at the end of this Century will be sketched and discussed in comparison. These speculations are but plausible considerations based on observations of the Contemporary language. In view of the looming partial loss of domains of German and other European Standard languages, I will then discuss how the further development of German can be positively influenccd within the context of multilingual Europe.
This article deals with three interrelated phenoma in the information structure of German sentences: the focusing of negative markers, of finite verb forms and of the particles ja, doch, wohl and schon. Focusing of the finite verb is the most important marker of verum focus, as described by Höhle (1988). Focusing of particles can be an alternative means for similar purposes, while focusing of negation seems to be the contradictory opposite of verum focus. It is shown that negation- independently of its information structural status - can be interpreted on three distinct levels of sentence meaning: as an indicator of the non-facticity of a state of affairs, the non-truth of a proposition, or the non-desirability of a speech act. Focusing of the negative marker puts contrastive emphasis on the negative value assigned to sentence meaning on one of these levels. Ve rum focus can be interpreted on the same three levels: as a marker of contrastive emphasis on a positive value of facticity, truth or desirability. The particles ja, doch, wohl and schon refer to sufficient epistemic or interactional conditions for the assignment of a positive or negative value. By focusing such a particle, the speaker indicates that (s)he believes the assigned value to be well justified and insists on establishing it as common ground for further interaction.
The instructions under which raters quantify syllable prominence perception need to be simple in order to maintain immediate reactions. This leads to noise in the rating data that can be dealt with by normalization, e.g. setting central tendency = 0 and dispersion = 1 (as in Z-score normalization). Questions arise such as: Which parameter is adequate here to capture central tendency? Which reference distribution should the normalization be based on? In this paper 16 different normalization methods are evaluated. In a perception experiment using German read speech (prose and poetry), syllable prominence ratings were collected. From the rating data 16 complete “mirror” data-sets were computed according to the 16 methods. Each mirror data-set was correlated with the same set of measures from the underlying acoustic data, focusing on raw syllable duration which is seen as a rather straightforward acoustic aspect of syllable prominence. Correlation coefficients could be raised considerably by selected methods.
The perception of syllable prominence depends to a limited extent on the acoustic properties of the speech signal in question. Psychoacoustic factors are involved as well. Thus, research often relies on two types of data: subjective prominence ratings collected in perception experiments and acoustic measures. A problem with the rating data is noise resulting from individual approaches to the rating task. This paper addresses the question of how this noise can be reduced by normalization, evaluating 12 normalization methods. In a perception experiment, prominence ratings concerning German read speech were collected. From the raw rating data 12 different ‘mirror’ data-sets were computed according to the 12 methods. Each mirror data-set was correlated with the same set of underlying acoustic data. The multiple regression setup included raw syllable duration as well as within-syllable maximum F0 and intensity. Adjusted r2-values could beraised considerably with selected methods.
A frequently replicated finding is that higher frequency words tend to be shorter and contain more strongly reduced vowels. However, little is known about potential differences in the articulatory gestures for high vs. low frequency words. The present study made use of electromagnetic articulography to investigate the production of two German vowels, [i] and [a], embedded in high and low frequency words. We found that word frequency differently affected the production of [i] and [a] at the temporal as well as the gestural level. Higher frequency of use predicted greater acoustic durations for long vowels; reduced durations for short vowels; articulatory trajectories with greater tongue height for [i] and more pronounced downward articulatory trajectories for [a]. These results show that the phonological contrast between short and long vowels is learned better with experience, and challenge both the Smooth Signal Redundancy Hypothesis and current theories of German phonology.
This paper presents an annotation scheme for English modal verbs together with sense-annotated data from the news domain. We describe our annotation scheme and discuss problematic cases for modality annotation based on the inter-annotator agreement during the annotation. Furthermore, we present experiments on automatic sense tagging, showing that our annotations do provide a valuable training resource for NLP systems.
Recht haben im Sprachunterricht. Wie besteht man bei Meinungsgegensätzen auf seinem Standpunkt?
(2012)
„Den eigenen Standpunkt begründen und verteidigen" gehört zu den Kann-Beschreibungen im Europäischen Referenzrahmen für Sprachen. Um seinen Standpunkt verteidigen zu können, muss man unter anderem in der Lage sein, darauf hinzuweisen, dass man selber Recht hat, wie auch, einem Kommunikationspartner zu widersprechen. Der folgende Aufsatz untersucht intonatorische Sprachmittel, die ein Sprecher des Deutschen hierzu einsetzen kann: Betonung des finiten Verbs, einer Partikel wie wohl oder doch oder eines Negationsausdrucks wie nicht oder kein. In der Linguistik spricht man von Verumfokus und Negationsfokus. Der Aufsatz erklärt, was unter Fokus zu verstehen ist, und gibt Beispiele dafür, wie er in gesprochener und geschriebener Sprache funktioniert. Er zeigt auf, welchen Stellenwert Intonation im Sprachunterricht haben kann und sollte, und schließt mit einigen praktischen Übungsvorschlägen.
Introduction
(2012)
Einleitung
(2012)
Der vorliegende Beitrag untersucht die grammatische Realisierung satzförmiger und satzwertiger Verbgruppen- und Satzadverbialia im Deutschen im Vergleich mit den romanischen Sprachen Italienisch und Portugiesisch (schwerpunktmäßig in der brasilianischen Varietät). Solche Adverbialia können formal recht unterschiedlich realisiert werden. Für das Deutsche sind finite, subjunktor-eingeleitete adverbiale Nebensätze typisch. Seltener sind uneingeleitete finite Nebensätze, Partizipialgruppen und durch eine Präposition eingeleitete Infinitivgruppen. In den romanischen Sprachen werden Gerundial-, Partizipial- und Infinitivgruppen deutlich häufiger als Adverbialia genutzt. Anders als im Deutschen können sie auch eigene Subjekte haben, wodurch sie finiten Nebensätzen ähnlicher werden.
In this paper, we provide an analysis of temporality in Hausa (Chadic, Afro-Asiatic). By testing the hypothesis of covert tense (Matthewson 2006) against empirical data, we show that Hausa is genuinely tenseless in the sense that the grammar does not restrict the relation between reference time and utterance time. Rather, temporal reference is pragmatically inferred from aspectual and contextual information. We also argue that future time reference in Hausa is realized as a combination of a modal operator and a prospective aspect, thus involving the modal meaning components of intention and prediction as well as event time shifting.
Wer eine korpusgestützte Untersuchung anstellt, ist zu Recht stolz auf hohe Belegzahlen und statistische Aussagekraft. Aber auch das Seltene und das Einzigartige hat einen Reiz, und darauf konzentrieren sich die folgenden Recherchen und Vorschläge. Selbst das Nichtvorhandene kann morgen schon belegbar sein - zum Beispiel Pluralformen zu Lemmata, die in Wörterbüchern Grammatikangaben wie „ohne Plural“ erhalten. Am Beispiel von Pluralformen besonders zu Feminina mit Derivationssuffix -heit/-(ig)keit werden unterschiedliche Möglichkeiten diskutiert, wie man mit dem Seltenen, mit dem Einzigartigen und mit dem Nichtvorhandenen oder Noch-nicht-Nachweisbaren in der Lexikografie und in sprachtechnologischen Anwendungen umgehen kann. Für Anregungen und Korrekturen danke ich herzlich Vilmos Ágel, Peter Eisenberg, Peter Gallmann, Klaus Mackowiak, Damaris Nübling, Werner Scholze-Stubenrecht, Anatol Stefanowitsch und Lutz Wind. Die Idee zu diesem Versuch gab mir die Mitarbeit an der 7. Auflage des Duden-Universalwörterbuchs, DDUW (2011), unter der Leitung von Werner Scholze-Stubenrecht, und am Vollformenprojekt meiner Kollegen aus der Duden-Sprachtechnologie.
The article discusses the possibilities and challenges of combining conversation analysis and ethnography in the study of everyday family life. We argue that such a combination requires the decision whether to prioritise interaction data or ethno-graphic (in particular, interview) data in the analysis. We present a conversation analytic case study of how household work is commonly brought up in the interactions of one couple and bring this to bear on a re-analysis of a possible conflict situation originally described in the ethnographic analysis by Klein, Izquierdo, and Bradbury (2007), published in this journal. While the findings of the two analyses converge, they inform us about different dimensions of couple interaction. The ethnographic analysis is focused on participants’ experiences, and the conversation analysis is focused on participants’ practices. We conclude that the methodological decision to prioritise interaction or interview data has consequences for the kind of questions we can ask.