Refine
Year of publication
- 2012 (272) (remove)
Document Type
- Part of a Book (120)
- Article (82)
- Conference Proceeding (35)
- Book (19)
- Part of Periodical (11)
- Doctoral Thesis (2)
- Other (2)
- Review (1)
Keywords
- Deutsch (118)
- Korpus <Linguistik> (28)
- Konversationsanalyse (19)
- Computerlinguistik (16)
- Englisch (11)
- Sprachgebrauch (11)
- Interaktion (10)
- Kontrastive Grammatik (10)
- Deutschland (9)
- Diskursanalyse (9)
Publicationstate
- Veröffentlichungsversion (102)
- Zweitveröffentlichung (23)
- Postprint (15)
Reviewstate
Publisher
- de Gruyter (37)
- Institut für Deutsche Sprache (31)
- Narr (17)
- European Language Resources Association (8)
- Lang (8)
- De Gruyter (7)
- European Language Resources Association (ELRA) (5)
- Verl. für Gesprächsforschung (5)
- Akademie Verlag (4)
- Springer (4)
Anhand einer Auswahl historischer Reden je dreier prominenter Deutscher und Polen wird eine signalphonetisch gestützte sprachvergleichende Analyse der glottalen Markierung vokalinitialer Wörter durchgeführt.
Generell erweist sich die glottale Markierung als variabel entlang eines Kontinuums zwischen einem echten glottalen Verschlusslaut (harter Stimmeinsatz) des Initialvokals über zeitlich nicht exakt koordinierte Glottalisierungen (Knarrstimme) und leichte Reflexe im Grundfrequenzverlauf bis hin zum völligen Fehlen einer Markierung.
Insgesamt zeigen sich im Polnischen gegenüber dem Deutschen seltener glottale Markierungen sowie eine sprachübergreifende schwache Abhängigkeit der Markierungshäufigkeit vom Sprechtempo (weniger bei Sprechtempoerhöhung).
Die Auftretenshäufigkeit glottaler Markierung wird sprachabhängig zudem durch unterschiedliche Faktoren beeinflusst: Für das Deutsche zeigen sich signifikante Einflüsse sowohl des Worttyps (Inhaltswörter mit häufigerer Markierung gegenüber Funktionswörtern) als auch der Betonung (betonte Silben mit häufigerer Markierung gegenüber unbetonten), während im Polnischen hier kein Einfluss sichtbar ist. Dafür zeigt das Polnische gegenüber dem Deutschen einen signifikanten Einfluss der Position innerhalb der Phrase (häufigere glottale Markierung in phraseninitialen im Gegensatz zu phrasenmedialen Wörtern). Diese sprachspezifischen Unterschiede können mit den prosodischen Charakteristika beider Sprachen Zusammenhängen. Im Unterschied zum Deutschen mit einem freien Wortakzent fällt dieser im Polnischen auf die Penultima, ist somit vorhersagbar und bedarf demzufolge keiner zusätzlichen glottalen Markierung im Sprachsignal.
Beide Sprachen hingegen zeigen übereinstimmend einen klar ausgeprägten Effekt der Vokalhöhe auf das Auftreten der glottalen Markierung (tiefe Vokale > mittlere Vokale > hohe Vokale).
The ISOcat registry reloaded
(2012)
The linguistics community is building a metadata-based infrastructure for the description of its research data and tools. At its core is the ISOcat registry, a collaborative platform to hold a (to be standardized) set of data categories (i.e., field descriptors). Descriptors have definitions in natural language and little explicit interrelations. With the registry growing to many hundred entries, authored by many, it is becoming increasingly apparent that the rather informal definitions and their glossary-like design make it hard for users to grasp, exploit and manage the registry’s content. In this paper, we take a large subset of the ISOcat term set and reconstruct from it a tree structure following the footsteps of schema.org. Our ontological re-engineering yields a representation that gives users a hierarchical view of linguistic, metadata-related terminology. The new representation adds to the precision of all definitions by making explicit information which is only implicitly given in the ISOcat registry. It also helps uncovering and addressing potential inconsistencies in term definitions as well as gaps and redundancies in the overall ISOcat term set. The new representation can serve as a complement to the existing ISOcat model, providing additional support for authors and users in browsing, (re-)using, maintaining, and further extending the community’s terminological metadata repertoire.
The article discusses the possibilities and challenges of combining conversation analysis and ethnography in the study of everyday family life. We argue that such a combination requires the decision whether to prioritise interaction data or ethno-graphic (in particular, interview) data in the analysis. We present a conversation analytic case study of how household work is commonly brought up in the interactions of one couple and bring this to bear on a re-analysis of a possible conflict situation originally described in the ethnographic analysis by Klein, Izquierdo, and Bradbury (2007), published in this journal. While the findings of the two analyses converge, they inform us about different dimensions of couple interaction. The ethnographic analysis is focused on participants’ experiences, and the conversation analysis is focused on participants’ practices. We conclude that the methodological decision to prioritise interaction or interview data has consequences for the kind of questions we can ask.
We taught a humanoid robot a number of different actions involving a number of different objects (e.g., touching a green object, moving a red object etc.) alongside a number of simplified linguistic labels for these behaviours (e.g., ‘touch-green’, ‘move-red’ etc.). The robot managed to learn the associations between the behaviours and their linguistic labels, and it succeeded in recognising the compositional structure of the behaviours and their associated linguistic descriptions (ACTION/VERB+OBJECT/NOUN). Moreover, it was able to generalise the learned instructions to novel, previously untrained action+object-combinations (e.g., touch-red). This corresponds to the task of learning and decomposing so-called ‘holophrases’ in early child language acquisition.
Für Muttersprachler des Polnischen und anderer artikelloser Sprachen gehört der Gebrauch des Artikels zu den schwierigsten Kapiteln der deutschen Grammatik. Sie haben große Mühe zu verstehen, wann im Deutschen der Definitartikel, wann der Indefinitartikel und wann kein Artikel verwendet wird.
Die vorliegende Arbeit setzt bei diesen Schwierigkeiten an. Sie versucht eine systematische Darstellung von Funktion und Gebrauch der Artikel, die den Vergleich mit dem Polnischen besonders berücksichtigt. Im Unterschied zum größten Teil der vorhandenen Literatur wird nicht nur der Artikelgebrauch in referentiellen Nominalphrasen, sondern auch der in prädikativen und anderen nicht-referentiellen Nominalphrasen ausführlich gewürdigt. Im Hinblick auf die Didaktisierung wird die Frage in den Mittelpunkt gestellt, welche Sprachmittel des Polnischen Funktionen erfüllen, die denen der deutschen Artikelwörter nahekommen.
Gerade weil das Thema der diesjährigen Arbeitstagung bereits seit einigen Jahrzehnten immer wieder Gegenstand verschiedener Forschungsrichtungen gewesen ist und heute gleichermaßen polymorph erforscht wird, sollten im Rahmen dieser Tagung aktuelle Projekte aus unterschiedlichen Disziplinen vorgestellt und interdisziplinär verhandelt werden. Das Ziel der Tagung war es, MedizinerInnen, PsychologInnen und GesprächsanalytikerInnen eine Plattform zu bieten, miteinander in Kontakt zu treten, die vorgestellten Ansätze, Erkenntnisinteressen und Methoden gemeinschaftlich zu diskutieren und dabei herauszustellen, in welchen Punkten sich diese von den eigenen unterscheiden.
Deklinationsklassen bilden einen Grundpfeiler des traditionellen Paradigmenmodells, das nach dem Vorbild der Grammatiken der klassischen Sprachen auch für die Beschreibung der deutschen Substantivflexion Verwendung gefunden hat. Im vorliegenden Beitrag soll die Rolle, die Deklinationsklassen in der deutschen Substantivdeklination spielen, überprüft werden. Beobachtungen zur Substantivflexion in verschiedenen europäischen Sprachen, darunter das Ungarische, das Polnische und das Italienische, die unterschiedliche Positionen innerhalb eines Spektrums besetzen, das vom hochflexivischen Lateinischen bis zu Sprachen ohne Deklinationsklassen (wie dem Englischen oder dem Türkischen) reicht, liefern Bausteine für eine Neuanalyse der deutschen Substantivflexion. Sichtbar wird, dass die deutsche Substantivflexion, bildlich gesprochen, auf dem Weg vom „Typus Latein“ zum „Typus Englisch“ schon sehr viel weiter fortgeschritten ist, als dies traditionelle Darstellungen nahe legen. An die Stelle der für kanonische Deklinationsklassen charakteristischen Sätze von klassentypischen Flexiven ist eine kleine Menge von Mustern der Stammformenbildung getreten.
We present a gold standard for semantic relation extraction in the food domain for German. The relation types that we address are motivated by scenarios for which IT applications present a commercial potential, such as virtual customer advice in which a virtual agent assists a customer in a supermarket in finding those products that satisfy their needs best. Moreover, we focus on those relation types that can be extracted from natural language text corpora, ideally content from the internet, such as web forums, that are easy to retrieve. A typical relation type that meets these requirements are pairs of food items that are usually consumed together. Such a relation type could be used by a virtual agent to suggest additional products available in a shop that would potentially complement the items a customer has already in their shopping cart. Our gold standard comprises structural data, i.e. relation tables, which encode relation instances. These tables are vital in order to evaluate natural language processing systems that extract those relations.
Knowledge Acquisition with Natural Language Processing in the Food Domain: Potential and Challenges
(2012)
In this paper, we present an outlook on the effectiveness of natural language processing (NLP) in extracting knowledge for the food domain. We identify potential scenarios that we think are particularly suitable for NLP techniques. As a source for extracting knowledge we will highlight the benefits of textual content from social media. Typical methods that we think would be suitable will be discussed. We will also address potential problems and limits that the application of NLP methods may yield.
In this paper, we examine methods to automatically extract domain-specific knowledge from the food domain from unlabeled natural language text. We employ different extraction methods ranging from surface patterns to co-occurrence measures applied on different parts of a document. We show that the effectiveness of a particular method depends very much on the relation type considered and that there is no single method that works equally well for every relation type. We also examine a combination of extraction methods and also consider relationships between different relation types. The extraction methods are applied both on a domain-specific corpus and the domain-independent factual knowledge base Wikipedia. Moreover, we examine an open-domain lexical ontology for suitability.
In this paper, we examine methods to extract different domain-specific relations from the food domain. We employ different extraction methods ranging from surface patterns to co-occurrence measures applied on different parts of a document. We show that the effectiveness of a particular method depends very much on the relation type considered and that there is no single method that works equally well for every relation type. As we need to process a large amount of unlabeled data our methods only require a low level of linguistic processing. This has also the advantage that these methods can provide responses in real time.
In this paper, we compare three different generalization methods for in-domain and cross-domain opinion holder extraction being simple unsupervised word clustering, an induction method inspired by distant supervision and the usage of lexical resources. The generalization methods are incorporated into diverse classifiers. We show that generalization causes significant improvements and that the impact of improvement depends on the type of classifier and on how much training and test data differ from each other. We also address the less common case of opinion holders being realized in patient position and suggest approaches including a novel (linguistically-informed) extraction method how to detect those opinion holders without labeled training data as standard datasets contain too few instances of this type.
Deutsch hat neben dem definiten Artikel und dem indefiniten Artikel noch zwei weitere indefinite Artikel, bzw. Gebrauchsweisen von Ausdrücken, die einem Artikelgebrauch sehr nahe kommen: (i) der indefinite Gebrauch des Demonstratives „dies“ und (ii) das aus „so“ und dem indefiniten Artikel verschmolzene „son“. In der vorliegenden Arbeit werden die referenziellen Eigenschaften dieser beiden indefiniten Demonstrativpronomen bezüglich ihrer Referentialität, Spezifizität und Diskursprominenz mit denen des indefiniten Artikels verglichen. Es kann gezeigt werden, dass indefinite Demonstrativpronomen deutlich stärkere referenzielle Eigenschaften in diesen Bereichen haben als der indefinite Artikel. Abschließend wird die Untersuchung auf Demonstrative weiterer Sprachen ausgedehnt, um so nach sprachübergreifenden Prinzipien dieser Ausdrücke und ihrer indefiniten Gebrauchsweisen zu suchen.
Am Anfang war die Lücke
(2012)
When we first started the project of looking at minority languages through a linguistic landscape lens, we felt that the visibility of minority languages in public space had been insufficiently dealt with in traditional minority language research. A linguistic landscape approach, as it had developed over the last years, would constitute a valuable path to explore, by looking at the ‘same old issues’ of language contact and language conflict from a specific angle. We were convinced that fresh linguistic landscape data would be able to provide innovative and useful insights into ‘patterns of language […] use, official language policies, prevalent language attitudes, [and] power relations between different linguistic groups’ (Backhaus 2007, p. 11). The linguistic landscape approach, as presented by the different authors in this volume, has clearly proven to be a heuristic appropriate and relevant for a wide range of minority language situations. More specifically, the ideas and analyses in the different chapters do contribute to a further understanding of minority languages and their speakers. They deepen our comprehension of language policies, power relations and ideologies in minority language settings.
The Component Metadata Infrastructure (CMDI) in a project on sustainable linguistic resources
(2012)
The sustainable archiving of research data for predefined time spans has become increasingly important to researchers and is stipulated by funding organizations with the obligatory task of being observed by researchers. An important aspect in view of such a sustainable archiving of language resources is the creation of metadata, which can be used for describing, finding and citing resources. In the present paper, these aspects are dealt with from the perspectives of two projects: the German project for Sustainability of Linguistic Data at the University of Tubingen (NaLiDa, cf. http://www.sfs.uni-tuebingen.de/nalida) and the Dutch-Flemish HLT Agency hosted at the Institute for Dutch Lexicology (TST-Centrale, cf.http://www.inl.nl/tst-centrale). Both projects unfold their approaches to the creation of components and profiles using the Component Metadata Infrastructure (CMDI) as underlying metadata schema for resource descriptions, highlighting their experiences as well as advantages and disadvantages in using CMDI.
This thesis deals with expressions consisting of two noun phrases connected by a comitative preposition, referred to as comitative constructions (CCs). It focuses on CCs in Polish, with some comparisons to other languages, and provides an analysis at the morphosyntax-semantics-pragmatics interface in the paradigm of Head-Driven Phrase Structure Grammar with the integrated model-theoretic semantic framework of Lexicalized Flexible Ty2. After postulating three different readings of Polish CCs: accompanitive, conjunctive and (open and closed) inclusive, a number of semantic phenomena are discussed which provide evidence for this classification. Further examination of the data shows that all CC types behave uniformly with regard to their syntactic properties but exhibit differences regarding agreement and person, number and gender resolution. These differences have previously been explained by syntactic stipulations. This thesis argues that a syntactic approach to CCs lacks real empirical motivation and it demonstrates that some of the existing analyses are problematic for a number of empirical and / or theoretical reasons. It further offers an alternative analysis based on the assumption that all CC types have a uniform, adjunctionbased syntactic structure, and that the crucial differences between them are semantic in nature, being triggered by the meaning of the comitative preposition. The core of the proposed semantic analysis are three different logical representations of the comitative preposition, whose truth conditions allow us to make the right predictions about the different behavior of the three CC types. All other lexical components of CCs, including plural pronouns, bear in each type of CC their customary forms and meanings. Implementing this idea in a constraint-based framework whose description language incorporates a formal semantic representation language, and modeling the morphosyntactic, semantic, pragmatic and referential properties of CCs within a single grammatical paradigm, we arrive at an analysis that accounts for these expressions in a very natural way.
Die Veränderung der individuellen politischen Kommunikation ist ein wesentliches Element des Konzepts der Mediatisierung des Politischen. Immer mehr Politikerinnen und Politiker sowie Bürgerinnen und Bürger nutzen digitale Plattformen, um sich politisch auszutauschen und zu informieren. Dabei stellt sich die Frage, inwiefern Politiker/-innen selbst Austauschmöglichkeiten im Netz bieten und somit direkt Kommunikation fördern. Für die vorliegende Studie wurde die Nutzung des Microblogging-Dienstes Twitter durch Politiker/-innen während ausgewählter Landtagswahlkämpfe des Jahres 2011 auf partizipationsermöglichende Elemente hin untersucht. Diese Elemente wurden mithilfe des „Funktionalen Operatorenmodells“ systematisiert und kategorisiert. Die Ergebnisse verdeutlichen nicht nur eine individuell ausgeprägte Nutzungsfrequenz der einzelnen Politiker/-innen, sondern auch unterschiedliche Stile der Twitternutzung, die sich als „persönlich-interaktiv“ und „thematisch-informativ“ klassifizieren lassen. In Einblick auf deliberative Strukturen ist die Twitterkommunikation im Politiker-Bürger-Dialog hingegen noch ausbaufähig.
Mehr Zivilgesellschaft durch Social Media? Medienethische Perspektiven auf Twitter als Diskursmedium
(2012)
Im Beitrag wird die Frage erörtert, inwiefern sich der Microblogging- Dienst Twitter als Diskursmedium der Zivilgesellschaft eignet. Die spezifischen Produktions-, Distributions- und Rezeptionsbedingungen von Social Media sowie die ihrem Netzwerkcharakter inhärenten neuartigen Konstitutionsoptionen für öffentliche Diskursräume erfordern eine Justierung der medienethischen Perspektive. Doch auch klassische ethische Theorien machen Microblogs greifbar: Die Prämissen der Diskursethik nach Habermas differenzieren sich auch im Handlungsbereich Twitter in prädiskursiven Geltungsansprüchen aus, die von Diskursteilnehmern implizit erhoben werden. Setzt man diese – und hier setzt die notwendige Modifikation des Blickwinkels ein – in Beziehung zu den spezifischen Funktionen des Mediums Twitter, treten komplexe kommunikative Optionen zu Tage. Prüft man die Geltungsansprüche der Wahrheit, Wahrhaftigkeit und Richtigkeit auf empirische Fallbeispiele in Twitter, lassen sich Brüche von medienethischer Relevanz feststellen, die nicht nur die zivilgesellschaftliche, sondern auch die journalistische Nutzung des Mediums in ein neues Licht rücken.
Terminology practice in companies and its methods evolved over the course of the years. This process can be seen as a broadening of methods rather than a paradigm change. Although this development led to an improvement in the practice, many crucial problems still remain unsolved. In this article I point out the open questions in the current methodology and argue why they are essential for the success of terminology projects. Also, I present how these questions can be addressed by embedding the terminology in a broader discourse of language management and social psychology.
Research today is often performed in collaborated projects composed of project partners with different backgrounds and from different institutions and countries. Standards can be a crucial tool to help harmonizing these differences and to create sustainable resources. However, choosing a standard depends on having enough information to evaluate and compare different annotation and metadata formats. In this paper we present ongoing work on an interactive, collaborative website that collects information on standards in the field of linguistics as a means to guide interested researchers.
The TEI has served for many years as a mature annotation format for corpora of different types, including linguistically annotated data. Although it is based on the consensus of a large community, it does not have the legal status of a standard. During the last decade, efforts have been undertaken to develop definitive de jure standards for linguistic data that not only act as a normative basis for the exchange of language corpora but also address recent advancements in technology, such as web-based standards, and the use of large and multiply annotated corpora.
In this article we will provide an overview of the process of international standardization and discuss some of the international standards currently being developed under the auspices of ISO/TC 37, a technical committee called “Terminology and other Language and Content Resources”. After that the relationship between the TEI Guidelines and these specifications, according to their formal model, notation format, and annotation model, will be discussed. The conclusion of the paper provides recommendations for dealing with language corpora.
In this paper, we address issues of inconsistencies of dictionary information and how different corpus methods and computer tools can assist in providing systematic cross-referencing. The question is raised how hyperlinking in an electronic reference work can be approached systematically in order to warrant consistent symmetrical links between synonyms or antonyms. Firstly, it is argued that working with a comprehensive corpus does not account for consistent cross-referencing. It is shown that a top-down corpus-driven linguistic analysis also does not guarantee the lexicographic documentation of binary lexico-semantic relations covered by corpus data, as proposed by Paradis/Willners (2006a, b). Secondly, with the help of dictionary examples taken from elexiko (an online dictionary of contemporary German) we demonstrate how a combination of both corpus-driven and corpus-based procedures enables lexicographers to systematically exploit corpus material in more depth than by using only one of these methods. It is also discussed where and why lexicographers are still prone to inconsistencies in the editing processes, irrespective of their underlying corpus methodologies. Finally, we introduce a cross-reference management tool that has been developed for elexiko and we explain its technological prerequisites and implications. This software supports lexicographers in detecting existing and missing references from and to a specific headword. It also offers options to automatically and comfortably correct discrepancies. Overall, we suggest a method that includes linguistic competence, complementary corpus approaches and additional software in order to ensure that links or references between synonymic and antonymic pairings are given in both directions.
Dieser Beitrag beleuchtet die Vor- und Nachteile korpusgestützter lexikografischer Methoden zur Ermittlung und Dokumentation sinnrelationaler Ausdrücke eines Stichwortes. Konkrete Beispiele aus der Praxis des elexiko-Wörterbuchs dienen der Veranschaulichung von Chancen als auch von konkreten Problemen, die die eingesetzten Methoden mit sich bringen. Für die Gewinnung potentieller Synonyme und Antonyme nutzt elexiko zwei unterschiedliche Verfahren, die mit verschiedenen Prämissen an ein Korpus als Datengrundlage herantreten (cf. Tognini-Bonelli 2001). Das korpusgesteuerte / korpusgeleitete Verfahren der Kollokationsanalyse und die zugrunde liegende Ermittlung von Ausdrücken mit verwandten Kollokationsprofi len (related profiles) (cf. Belica 2011) dienen der empirischen und statistischen Absicherung von sprachlichen Phänomenen. Sie erweisen sich aber als lückenhaft in Bezug auf einige Kontexte, in denen semantisch-konzeptuelle Beziehungen der Ähnlichkeit oder des Gegensatzes realisiert, aber nicht mit Korpustools erfasst werden. Mit der Anwendung der in elexiko komplementär genutzten korpusbasierten Vorgehensweise können diese Lücken teilweise gefüllt werden. Das Zusammenspiel beider Korpusansätze hat sich in der lexikografischen Praxis prinzipiell als vorteilhaft erwiesen, bringt jedoch auch Erkenntnisse zum Vorschein, die bisher weder linguistisch erfasst noch lexikografisch dokumentiert wurden und löst nicht, wie teilweise angenommen, das Problem inhaltlicher Inkonsistenzen (cf. Paradis/Willners 2007). Diese Aspekte werden anhand von konkreten Korpusbeispielen und Wörterbucheinträgen illustriert. Als Online-Wörterbuch profitiert elexiko von seinen schnellen Navigationsmöglichkeiten über Verlinkungen. Diese werden auch für sinnrelationale Partnerwörter wie Synonyme und Antonyme angelegt, um diverse Vernetzungsstrukturen nachvollziehbar zu machen. Die Arbeit mit einem Korpus kann bis zu einem gewissen Grad die Konsistenz der bidirektionalen Vernetzungen gewährleisten, sie aber nicht vollständig absichern. In diesem Beitrag wird auch die Frage beantwortet, inwieweit die erwähnten Korpusmethoden dazu beitragen, das gegenseitige Dokumentieren zwischen Synonym- oder Antonympaaren sicherzustellen. Anhand des für diese Zwecke entwickelten Tools vernetziko, einem Vernetzungsmanager, wird gezeigt, warum die Unterstützung zusätzlicher Software für eine konsistente Verlinkung zwischen paradigmatisch miteinander verbundenen Stichwörtern unerlässlich ist(Storjohann/Meyer 2012).
Die Aufbauprinzipien europäischer Possessionssysteme basieren viel öfter als gemeinhin angenommen auf gespaltener Possession. Dieses im Deutschen nicht prominente Phänomen wird anhand von Daten aus ausgewählten Beispielsprachen als in Europa durchaus etablierte Erscheinung vorgestellt. Die mit ihm verbundenen semantischen und morphosyntaktischen Aspekte werden anhand von qualitativen Korpusdaten diskutiert. Die Restriktionen, denen sie unterliegen, sind ebenfalls Gegenstand der Diskussion. In den Schlussfolgerungen wird dafür plädiert, künftig der Possession bei vergleichenden Studien zu europäischen Sprachen mehr Beachtung zu schenken.
During German colonialism in the Pacific, language contact between German and the local languages took place in different areas and in varying intensity. The numbers of native speakers of German were low, and in many cases German was not the means of communication, so that comparatively little language contact occurred naturally. Despite this situation, several native languages in the German colonial area integrated loanwords from German and preserved them up until today. Quantitative differences in borrowing between the affected languages are arguably due to extralinguistic factors influencing contact duration and intensity as well as local language attitudes. There is one area where the use of German was explicitly supported by the government: These are schools. The present paper investigates the numbers of students who came into contact with instruction of or in German. Many schools were mission-run, and in particular non-German missions had problems finding qualified teachers for their German instruction. Following an overview of population proportions regarding speakers of German and school attendance, this paper compares quantitative loanword data to contact opportunities with German in schools, drawing a tentative conclusion on whether instruction in German, as one extralinguistic factor influencing language contact, had a measurable effect on lexical borrowing from German.
I nationale og curopa’iskc sprogpolitiske undersogelser savner man orte et tilt'redsstiIlende cmpirisk grundlag. De tilgsngelige data om den aktuelle Situation for sprogene i de forskelligc lande er heterogene. ufuldstEndige og delvist foraddede og derfor vanskelige at sammenligne over tid. EKNIL’s curoptciskc sprogbarometer. KLM, er et forsog pä al afhjxlpe denne Situation. KLM er baseret pä et omfattende spor- geskema om en bred vifte al’sproglige forhold som er egnet til at danne et billede at'sprogenes Status og sprogpolitiske praksisser i hvert enkelt land. fx sprogencs juridiske Status, sprogenes Status i undervis- ning og forskning, Situationen for minoritetssprog, sprogene i kulturen og i erhvervslivet. KLM gennem- tores med fä ärs mellemrum. Naervjerende artikel beskriver baggrunden og resultateme af KLM 2 (2007- 2011) som omfatler 23 europa’iske lande
Opening/Eröffnung/Aperture
(2012)
Other than linguistic laymen, most linguists avoid Statements concerning the general state of a language or its future. Despite some theoretical scruples, I shall, after some assessing comments on present German, make speculations on the further development of this language. Three scenarios of possible States of the German language at the end of this Century will be sketched and discussed in comparison. These speculations are but plausible considerations based on observations of the Contemporary language. In view of the looming partial loss of domains of German and other European Standard languages, I will then discuss how the further development of German can be positively influenccd within the context of multilingual Europe.
This article focuses on the qualitative and quantitative analysis of patients’ responses to different types of doctors’ prediagnostic statements. Prediagnostic statements document the doctors’ process of understanding in the on going interactive event and simultaneously move it to an intersubjective level within the boundaries of communicability, for example, in the case of problematic symptom patterns. Four types of prediagnostic statements will be distinguished: the preliminary, unspecific diagnosis, the establishing of a (causal) link, information about the findings, and diagnoses of exclusion. On the basis of 29 doctor-patient-conversations, 150 patients’ responses to prediagnostic statements are analyzed in their contextual organization. Although many patients’ responses turn out to be affirmatively minimal, there are differences both in the elaborateness and regarding the reference type, depending on the statements’ degree of certainty, the patients’ self-diagnoses as well as on influences of the interaction type’s asymmetrical properties. Both patients and doctors work together on establishing interactive and epistemic territories and pay attention to the maintenance of their self-images and their interaction relationship.
Der nachfolgende Beitrag untersucht Form-Funktionsbeziehungen in einem spezifischen Bereich adverbialer Modifikation im Deutschen und Türkischen, nämlich bei den ereignisinternen Adjunkten. Abschnitt 1 entwickelt — mit übereinzelsprachlichem Gültigkeitsanspruch — die Begrifflichkeiten, anhand derer die Untersuchung vorgenommen wird. Abschnitt 2 wendet diese auf das Deutsche und das Türkische an. Abschnitt 3 formuliert ein kontrastives Zwischenergebnis, das in Abschnitt 4 mittels des Versuchs der Identifikation typologischer Korrelate der festgestellten Unterschiede zu einer typologischen Hypothese erweitert wird.
Der Beitrag ist dem holistischen sprachtypologischen Programm verpflichtet, das die Systematiken aufzeigen will, die den identifizierten sprachlichen Strukturen unterliegen und das diese Systematiken als Instanzen allgemeinerer Prinzipien der Variation und Übereinstimmung von sprachlichen Systemen darstellen will. Es wird beschreibend vorgegangen; aus der Beschreibung soll ein Verständnis des Gegenstands erzielt werden. Als deskriptives Werkzeug dienen die Begrifflichkeiten der funktionalen Typologie und der Semantik.
Die Auseinandersetzung mit dem Untersuchungsgegenstand „ereignisinterne Adjunkte“ geschieht in dem für typologische Untersuchungen höchst engen Rahmen der Untersuchung von nur zwei Sprachen. Dies hat Vorteile, die sich insbesondere auf die angelegte Breite und den primär semantischen Ausgangspunkt der Untersuchung beziehen. Es hat gleichzeitig Nachteile, die sich vor allem auf die Verallgemeinerbarkeit oder implikative Kraft der identifizierten Zusammenhänge beziehen. Die Vorteile gilt es zu nutzen, die Nachteile zu beachten.
Language attitudes may be differentiated into attitudes towards speakers and attitudes towards languages. However, to date, no systematic and differentiated instrument exists that measures attitudes towards language. Accordingly, we developed, validated, and applied the Attitudes Towards Languages (AToL) scale in four studies. In Study 1, we selected 15 items for the AToL scale, which represented the three dimensions of value, sound, and structure. The following studies replicated and validated the three-factor structure and differential mean profiles along the three dimensions for different languages (a) in a more diverse German sample (Study 2), (b) in different countries (Study 3), and (c) when participants based their evaluations on speech samples (Study 4). Moreover, we investigated the relation between the AToL dimensions and stereotypic speaker evaluations. Results confirm the reliability, validity, and generalizability of the AToL scale and its incremental value to mere speaker evaluations.
Was halten die Deutschen von ihrer Muttersprache? Wie denken sie über andere Sprachen und deutsche Dialekte (siehe auch Schoel / Stahlberg in diesem Band)? Wie nehmen sie Veränderungen ihrer Sprache wahr und was halten sie von fremdsprachlichen Einflüssen, wie z. B. der Verwendung von Anglizismen? Sind Deutsche, umgekehrt betrachtet, besonders kritisch, wenn andere Deutsche Englisch sprechen? Und wie bewerten sie andere Personen, die z.B. einen französischen oder russischen Akzent im Deutschen besitzen? Mit all diesen Fragen hat sich das vorliegende Teilprojekt im Rahmen dieses von der Volkswagenstiftung geförderten Forschungsprojekts beschäftigt. Ausgehend von sozialpsychologischen Theorien und Methoden, wurden Spracheinstellungen in Deutschland näher untersucht.
Current working practice of established German dictionaries incorporates large corpora as the basis of most analyses, descriptions and presentations. It is, however, individual lexicological and/or different corpus-methodological approaches that play a crucial role in the process of extracting and documenting lexicographic information in individual reference works. This paper addresses the question of how reliable information is in some electronic German dictionaries. Objects of our investigation are different types of corpus dictionaries, e.g. a digitized dictionary, a reference work that compiles its data fully automatically, a lexicographic system combining different electronic resources, and a corpus-assisted dictionary that examines and interprets its corpus data lexicographically. Critical examinations of such reference works inevitably come up with questions of authenticity and reliability of the given dictionary information. The advantages and disadvantages of various lexicographic or corpus-linguistic methods which are individually implemented will be outlined and critically analyzed with the help of examples. According to an extensive study (cf. Müller-Spitzer 2011) reliability of given information is one of the key criteria assigned to any reference work by users. We will elicit how different corpus methods expose different descriptions of natural discourse and how they answer questions of authenticity, typicality and reliability with regard to phenomena such as meaning spectrum, collocations, antonymy and hyperonymy. Overall, this paper is a critical account of the current German lexicographic developments. It will include discussions on meta-lexicographic demands and focus on whether there are suitable complementary corpus approaches providing authentic dictionary information to a satisfactory extent.
Linguistic query systems are special purpose IR applications. As text sizes, annotation layers, and metadata schemes of language corpora grow rapidly, performing complex searches becomes a highly computational expensive task. We evaluate several storage models and indexing variants in two multi-processor/multi-core environments, focusing on prototypical linguistic querying scenarios. Our aim is to reveal modeling and querying tendencies – rather than absolute benchmark results – when using a relational database management system (RDBMS) and MapReduce for natural language corpus retrieval. Based on these findings, we are going to improve our approach for the efficient exploitation of very large corpora, combining advantages of state-of-the-art database systems with decomposition/parallelization strategies. Our reference implementation uses the German DeReKo reference corpus with currently more than 4 billion word forms, various multi-layer linguistic annotations, and several types of text-specific metadata. The proposed strategy is language-independent and adaptable to large-scale multilingual corpora.
Germanistischer Frühling
(2012)
Der Aufsatz ist ein empirischer und theoretischer Beitrag zur Weiterentwicklung einer multimodalen, interaktionsanalytischen Methodologie. Auf der Grundlage eines minimalen Kontrasts wird im Detail analysiert, wie zwei Konfirmandinnen und zwei Konfirmanden ihren jeweils gleichzeitigen "Kerzengang" in der Vor-phase eines Gottesdienstes realisieren. Während die Konfirmandinnen ihren Gang in den Altarraum, das Anzünden ihrer Kerzen und den Rückweg zur Bank als "gemeinsam gehen" koordinieren, realisieren die beiden Konfirmanden ihren Gang als "hinter jemandem herlaufen". Die Analyse wird theoretisch gerahmt durch das Konzept "Gehen als situierte Praktik", das im Anschluss weiter geschärft wird.
Der Beitrag beschäftigt sich auf der Grundlage einer Einzelfallanalyse mit der Frage, wie Personen erkennbar machen, dass sie an einer Interaktion beteiligt sind. Die Frage, wer auf welche Weise und mit welchen Rechten und Pflichten an einer Interaktion teilnimmt/teilnehmen darf, und woran dies die Beteiligten und der Analytiker erkennen, gehört zu den etablierten Fragestellungen der Interaktionsanalyse. Im vorliegenden Beitrag wendet sich der Autor diesem Thema mit einem spezifischen Erkenntnisinteresse zu: Ihn interessiert, wie Personen, die über eine längere Phase keinen verbalen Beitrag zur Interaktion leisten, verdeutlichen, dass sie sich ungeachtet ihrer verbalen Abstinenz als Teil der laufenden Interaktion verstehen und verhalten. Oder, um es im Vorgriff auf spätere konzeptuelle Überlegungen zu formulieren: Dass sie Mitglieder/Beteiligte eines Interaktionsensembles sind, ohne sich verbal an dessen Konstitution zu beteiligen. Im Zentrum des Erkenntnisinteresses steht die Frage nach den Ressourcen, die von den verbal abstinenten Interaktionsbeteiligten eingesetzt werden, um zu verdeutlichen, dass sie an einer laufenden Interaktion teilnehmen und die Frage nach Gemeinsamkeiten und Unterschieden in den Beteiligungsformaten, die sie dabei produzieren.
Die Fallanalyse rekonstruiert aus multimodaler Perspektive eine Unterstützungsinteraktion im Unterricht. Die Unterstützung wird dabei als gemeinsame Herstellung des daran beteiligten Schülers und Lehrers konzeptualisiert. Es werden detailliert die vom Schüler produzierten Hinweise auf seine „Hilfsbedürftigkeit“ und die vom Lehrer eingesetzten Ressourcen bei seiner Hilfeleistung konstitutionsanalytisch rekonstruiert. In der falltranszendierenden Theoretisierung wird mit Bezug auf das gesprächsrhetorische Konzept „Unterstützen“ die Spezifik interaktiver Hilfeleistungen im Unterricht als konstitutive Anforderung an das professionelle Handeln von Lehrer/innen reflektiert.
This paper presents two toolsets for transcribing and annotating spoken language: the EXMARaLDA system, developed at the University of Hamburg, and the FOLK tools, developed at the Institute for the German Language in Mannheim. Both systems are targeted at users interested in the analysis of spontaneous, multi-party discourse. Their main user community is situated in conversation analysis, pragmatics, sociolinguistics and related fields. The paper gives an overview of the individual tools of the two systems – the Partitur-Editor, a tool for multi-level annotation of audio or video recordings, the Corpus Manager, a tool for creating and administering corpus metadata, EXAKT, a query and analysis tool for spoken language corpora, FOLKER, a transcription editor optimized for speed and efficiency of transcription, and OrthoNormal, a tool for orthographical normalization of transcription data. It concludes with some thoughts about the integration of these tools into the larger tool landscape.
Ein deutsch-griechisches diskursanalytisches Projekt der Leibniz Universität Hannover und der Aristoteles-Universität Thessaloniki1 widmet sich unter dem Arbeitstitel „Dynamik der Konstruktion von Differenz und Feindseligkeit“ der kritischen Analyse des Diskurses um die Schuldenkrise Griechenlands in deutschen und griechischen Medien. Ziel ist es, die Konstruktion und Etablierung von Differenzkategorien in deutschen und griechischen Medien zu untersuchen, um Erklärungsansätze für die massive Verschlechterung des deutsch-griechischen Verhältnisses zu finden. Ein interessanter Untersuchungsaspekt ist dabei die in Pressetexten verwendete Metaphorik, die etablierte Denkschemata aufzeigen kann.
The perception of syllable prominence depends to a limited extent on the acoustic properties of the speech signal in question. Psychoacoustic factors are involved as well. Thus, research often relies on two types of data: subjective prominence ratings collected in perception experiments and acoustic measures. A problem with the rating data is noise resulting from individual approaches to the rating task. This paper addresses the question of how this noise can be reduced by normalization, evaluating 12 normalization methods. In a perception experiment, prominence ratings concerning German read speech were collected. From the raw rating data 12 different ‘mirror’ data-sets were computed according to the 12 methods. Each mirror data-set was correlated with the same set of underlying acoustic data. The multiple regression setup included raw syllable duration as well as within-syllable maximum F0 and intensity. Adjusted r2-values could beraised considerably with selected methods.
The instructions under which raters quantify syllable prominence perception need to be simple in order to maintain immediate reactions. This leads to noise in the rating data that can be dealt with by normalization, e.g. setting central tendency = 0 and dispersion = 1 (as in Z-score normalization). Questions arise such as: Which parameter is adequate here to capture central tendency? Which reference distribution should the normalization be based on? In this paper 16 different normalization methods are evaluated. In a perception experiment using German read speech (prose and poetry), syllable prominence ratings were collected. From the rating data 16 complete “mirror” data-sets were computed according to the 16 methods. Each mirror data-set was correlated with the same set of measures from the underlying acoustic data, focusing on raw syllable duration which is seen as a rather straightforward acoustic aspect of syllable prominence. Correlation coefficients could be raised considerably by selected methods.
Over the past decades, problems related to linguistic minorities and their well-being, as well as to minority languages and their maintenance, have developed as an independent branch of minority studies. Studies of language in society and sociolinguistics, strategies of minority language survival and the empowerment of their speakers have produced a considerable output of case studies and theoretical writings.In this multifaceted field of investigation, language use, language practices, language policies and language politics represent interrelated aspects of social and linguistic relations that cannot be meaningfully addressed from a point of view of one scientific discipline only. This is specially the case when one wants to understand processes of language loss and maintenance, or the revitalization and empowerment of a language community. Such processes are linguistic expressions of complex social settings, and reflect group and individual identities that in turn express changing systems of collective values, human networks, fashions and social practices.
Current work on sentiment analysis is characterized by approaches with a pragmatic focus, which use shallow techniques in the interest of robustness but often rely on ad-hoc creation of data sets and methods. We argue that progress towards deep analysis depends on a) enriching shallow representations with linguistically motivated, rich information, and b) focussing different branches of research and combining ressources to create synergies with related work in NLP. In the paper, we propose SentiFrameNet, an extension to FrameNet, as a novel representation for sentiment analysis that is tailored to these aims.
This paper presents an annotation scheme for English modal verbs together with sense-annotated data from the news domain. We describe our annotation scheme and discuss problematic cases for modality annotation based on the inter-annotator agreement during the annotation. Furthermore, we present experiments on automatic sense tagging, showing that our annotations do provide a valuable training resource for NLP systems.
Our paper outlines a proposal for the consistent modeling of heterogeneous lexical structures in semasiological dictionaries, based on the element structures described in detail in chapter 9 (Dictionaries) of the TEI Guidelines. The core of our proposal describes a system of relatively autonomous lexical “crystals” that can, within the constraints of the relevant element’s definition, be combined to form complex structures for the description of morphological form, grammatical information, etymology, word-formation, and meaning for a lexical structure.
The encoding structures we suggest guarantee sustainability and support re-usability and interoperability of data. This paper presents case studies of encoding dictionary entries in order to illustrate our concepts and test their usability.
We comment on encoding issues involving <entry>, <form>, <etym>, and on refinements to the internal content of <sense>.
This paper presents an extension to the Stuttgart-Tübingen TagSet, the standard part-of-speech tag set for German, for the annotation of spoken language. The additional tags deal with hesitations, backchannel signals, interruptions, onomatopoeia and uninterpretable material. They allow one to capture phenomena specific to spoken language while, at the same time, preserving inter-operability with already existing corpora of written language.
This paper presents Release 2.0 of the SALSA corpus, a German resource for lexical semantics. The new corpus release provides new annotations for German nouns, complementing the existing annotations of German verbs in Release 1.0. The corpus now includes around 24,000 sentences with more than 36,000 annotated instances. It was designed with an eye towards NLP applications such as semantic role labeling but will also be a useful resource for linguistic studies in lexical semantics.
Corpora with high-quality linguistic annotations are an essential component in many NLP applications and a valuable resource for linguistic research. For obtaining these annotations, a large amount of manual effort is needed, making the creation of these resources time-consuming and costly. One attempt to speed up the annotation process is to use supervised machine-learning systems to automatically assign (possibly erroneous) labels to the data and ask human annotators to correct them where necessary. However, it is not clear to what extent these automatic pre-annotations are successful in reducing human annotation effort, and what impact they have on the quality of the resulting resource. In this article, we present the results of an experiment in which we assess the usefulness of partial semi-automatic annotation for frame labeling. We investigate the impact of automatic pre-annotation of differing quality on annotation time, consistency and accuracy. While we found no conclusive evidence that it can speed up human annotation, we found that automatic pre-annotation does increase its overall quality.
Die wortinitialen Segmente in Deutsch ja, jung sowie die Zweitkomponenten in den so genannten schließenden Diphthongen wie in Hai, Heu, Hau weisen im Vergleich zu hohen Vokalen in Kuh, Knie eine stark variierende Artikulation auf – zudem treten diese Laute in unterschiedlichen Kontexten auf. Die hier beobachtbaren Zusammenhänge zwischen Distribution und Aussprache lassen auf durch unterschiedliche silbische Positionen bedingte Allophonie schließen (Morciniec 1958; Shannon 1984; Hall 1992; für Englisch: Jakobson/Fant/Halle 1952, S. 20). Eine solche Analyse, die zudem eine erhebliche Reduktion des Phoneminventars beinhaltet, konnte sich bislang für das Deutsche nicht durchsetzen: Gewöhnlich sind sowohl die schließenden Diphthonge als auch [j] im deutschen Phoneminventar aufgeführt; letzteres Segment wird sogar meist als Frikativ klassifiziert. Der Sprachvergleich ergibt neue phonologische Generalisierungen, die eine durch Silbenstruktur bedingte allophonische Analyse stützen. Insbesondere lassen sich Abstufungen erkennen, die auf durch Sonorität bestimmte Silbifizierungsbedingungen schließen lassen.
Wortstellung und Satztypmarkierung im Deutschen und im Ungarischen. Parallelen und Diskrepanzen
(2012)
Das Deutsche und das Ungarische stellen für die kontrastive Grammatikforschung in der europäischen Linguistik insofern besonders interessante Vergleichssprachen dar, als sie einerseits genealogisch und typologisch große Unterschiede aufweisen, andererseits aber in den letzten Tausend Jahren durch das enge Zusammenleben im mitteleuropäischen Kulturraum auch auffällige Konvergenztendenzen zeigen, die mehrheitlich mit der unidirektionalen Wirkung des Deutschen auf das Ungarische zu erklären sind (vgl. Kiss 2003).
Im vorliegenden Beitrag werden nach einem überblicksartigen Vergleich relevanter Wortstellungstypen der beiden Sprachen besonders ausgewählte Interrogativsatztypen kontrastiert, die sowohl typologisch bedingte Diskrepanzen als auch bestimmte, auf einer abstrakten Ebene nachweisbare Parallelen aufweisen. Neben dem systematischen Vergleich werden exemplarisch auch mit Hilfe ausgewählter Korpusbelege veranschaulichte Performanzphänomene behandelt, um Konvergenzen im Sprachgebrauch zu zeigen.
Der Beitrag stellt ein Projekt vor, in dem am Institut für Deutsche Sprache (Mannheim) eine ethnographisch-gesprächsanalytische Studie zu interaktiven Professionalisierungsprozessen von Jugendlichen mit und ohne Migrationshintergrund im Kontext ihrer technischen Betriebsausbildung erarbeitet wird. Die Untersuchung ist als Teilprojekt in das Forschungsprojekt „Migrationslinguistik“ eingebettet und fokussiert primär Jugendliche mit russischsprachigem Migrationshintergrund im Verlauf ihrer Berufsausbildung in einem industriellen Produktionsbetrieb.
Das Deutsch der Migranten
(2012)
Die jährlich im Vorfeld der DGfS-Tagung veranstaltete Arbeitstagung Linguistische Pragmatik fand 2012 vor besonderem Hintergrund statt: Es war zugleich die erste Jahrestagung des neu gegründeten, seit 01.01.2012 bestehenden Vereins Arbeitskreis Linguistische Pragmatik. Zu diesem Anlass haben die Organisatoren (Constanze Spieß, Elke Diedrichsen und Jörg Bücker) ein Rahmenthema gewählt, das pragmatisch orientierte Linguistinnen und Linguisten der verschiedensten Forschungsrichtungen zusammenbringt: Sprachkritik und Sprachwandel.
Electronic dictionaries should support dictionary users by giving them guidance in text production and text reception, alongside a user-definable offer of lexicographic data for cognitive purposes. In this article, we sketch the principles of an interactive and dynamic electronic dictionary aimed at text production and text reception guiding users in innovative ways, especially with respect to difficult, complicated or confusing issues. The lexicographer has to do a very careful analysis of the nature of the possible problems to suggest an optimal solution for a specific problem. We are of the opinion that there are numerous complex situations where users need more detailed support than currently available in e-dictionaries, enabling them to make valid and correct choices. For highly complex situations, we suggest guidance through a decision tree-like device. We assume that the solutions proposed here are not specific to one language only but can, after careful analysis, be applied to e-dictionaries in different languages across the world.
Korpuslinguistik
(2012)
Inhaltlich unveränderte Neuauflage. Die Arbeit von Pamela Pachl entdeckt ein Feld künstlerischer Formen, die sich längst jenseits der anwendungsbezogenen Graphik als Sammlerobjekte in hochdifferenzierten Subkulturen etabliert haben. Thema dieser Arbeit sind Skatesticker. Skatesticker sind graphisch gestaltete Aufkleber, die im Besonderen in der Subkultur der Skater gesammelt, gehandelt und verehrt werden. Hergestellt werden die Sticker von Skatecompanys. Ursprünglich zu Werbezwecken produziert, wurden die Sticker zu einem autonomen Ausdruckszeichen des Skater-Lifestyles. Aufgrund der Qualität der graphischen und ästhetischen Gestaltung verlangt dieses Phänomen der Neuzeit geradezu nach einer wissenschaftlichen Untersuchung. Pamela Pachl hat hier ein neues, bisher nicht institutionell legitimiertes Feld entdeckt, seine Konturen und verschiedene Aspekte seiner internen Struktur beschrieben. Dieses Buch richtet sich sowohl an Wissenschaftler verschiedenster Fachrichtungen, wie Kunstwissenschaft, Germanistik und Soziologie als auch an Skater und an der Skateboardkultur Interessierte.
In this chapter, I will focus on the phenomenon of drop out, i.e., withdrawal from the turn due to overlapping talk, in order to reflect on the link between “unfinished” turns and participation framework. With the help of a sequential and multimodal analysis inspired by the conversation analytical approach, I will show that dropping out from a turn is strongly linked to the availability displayed by potential recipients of a turn-at-talk. Although conversation analysis has described in detail the systematics of overlapping talk, especially of its onset (Jefferson 1973, 1983, 1986) and its resolution (Scheg-loff 2000; Jefferson 2004), the phenomenon of withdrawal from a turn due to simultaneous talk has not been investigated in detail. While it seems to bedifficult to describe this interactional practice by referring exclusively to syntactic features (incompleteness of the turn), I suggest looking at turn withdrawal from a multimodal perspective (e.g. Goodwin 1980, 1981; Mondada2007a; Schmitt 2005), taking into account visible resources like gaze or gesture. The problem of continuing or stopping a turn-in-progress in overlapping talk can be closely linked to the participation framework (Goodwin and Goodwin 2004), as speakers do visibly take into account their recipient’s availability and coordinate their turn construction with the dynamic changes of the participation framework and the interactional space.
Wer eine korpusgestützte Untersuchung anstellt, ist zu Recht stolz auf hohe Belegzahlen und statistische Aussagekraft. Aber auch das Seltene und das Einzigartige hat einen Reiz, und darauf konzentrieren sich die folgenden Recherchen und Vorschläge. Selbst das Nichtvorhandene kann morgen schon belegbar sein - zum Beispiel Pluralformen zu Lemmata, die in Wörterbüchern Grammatikangaben wie „ohne Plural“ erhalten. Am Beispiel von Pluralformen besonders zu Feminina mit Derivationssuffix -heit/-(ig)keit werden unterschiedliche Möglichkeiten diskutiert, wie man mit dem Seltenen, mit dem Einzigartigen und mit dem Nichtvorhandenen oder Noch-nicht-Nachweisbaren in der Lexikografie und in sprachtechnologischen Anwendungen umgehen kann. Für Anregungen und Korrekturen danke ich herzlich Vilmos Ágel, Peter Eisenberg, Peter Gallmann, Klaus Mackowiak, Damaris Nübling, Werner Scholze-Stubenrecht, Anatol Stefanowitsch und Lutz Wind. Die Idee zu diesem Versuch gab mir die Mitarbeit an der 7. Auflage des Duden-Universalwörterbuchs, DDUW (2011), unter der Leitung von Werner Scholze-Stubenrecht, und am Vollformenprojekt meiner Kollegen aus der Duden-Sprachtechnologie.
Online dictionary use
(2012)
In this paper, we provide an analysis of temporality in Hausa (Chadic, Afro-Asiatic). By testing the hypothesis of covert tense (Matthewson 2006) against empirical data, we show that Hausa is genuinely tenseless in the sense that the grammar does not restrict the relation between reference time and utterance time. Rather, temporal reference is pragmatically inferred from aspectual and contextual information. We also argue that future time reference in Hausa is realized as a combination of a modal operator and a prospective aspect, thus involving the modal meaning components of intention and prediction as well as event time shifting.
In der linguistischen Forschung wird häufig auf die besondere informationsstrukturelle Funktion der Randpositionen des Satzes hingewiesen: Diese sind nicht nur für die Gewichtung des satzinternen Materials nach Hintergrund und Vordergrund relevant, sondern tragen auch zur Sicherung der Kohärenz im Diskurs bei. Dabei wird vor allem mit Hinweis auf kognitive und funktionale Prinzipien die universelle Gültigkeit der Topik-Fokus-Abfolge betont, mit der initialen (oder frühen) Platzierung des kontextuell verankerten Satzgegenstandes (des so genannten Topiks) und der späteren Erwähnung der Kernaussage (des Fokus).
In dem vorliegenden Artikel wird die Relevanz des linken Satzrandes für die Herstellung des Diskurszusammenhanges und die Universalität der Topik-Fokus-Ordnung überprüft. Zum einen scheint die Funktion des Satzanfangs komplex: Mit dem ersten Glied der Aussagesätze wird nämlich in vielen Sprachen nicht nur an etwas Gesagtes angeschlossen, sondern kann auch etwas Wichtiges hervorgehoben werden. Zum anderen sind die Unterschiede zwischen den Sprachen beträchtlich, was auf den Einfluss struktureller Gegebenheiten hindeutet.
Zur Lösung der Probleme wird ein neues informationsstrukturelles Prinzip vorgeschlagen, das auf der „C-Markiertheit“ (Kohärenzmarkiertheit) der Konstituenten aufbaut. Demnach sind nicht nur kontextuell gegebene, sondern auch kontrastive Elemente relevant für die Herstellung der Kohärenz (und somit C-markiert), da diese die Zuordnung zu ähnlichen oder identischen Mengen bzw. Skalen voraussetzen. Als universelle Strategie der pragmatischen Ordnung ist somit der so genannte „C-Constraint“ zu betrachten, der die initiale Platzierung der C-markierten Konstituenten vorschreibt, unabhängig von ihrem Topik- oder Fokusstatus.
Der typologischen Vielfalt bezüglich der Besetzung des linken Satzrandes wird durch die Beachtung relevanter struktureller Parameter in sieben genetisch und typologisch unterschiedlichen europäischen Sprachen (Deutsch, Englisch, Schwedisch, Französisch, Russisch, Finnisch, Ungarisch) — und durch die Aufstellung der so genannten „C-Hierarchie“ — Rechnung getragen. Deren drei Hauptkategorien weisen bezüglich der Zulassung von C-markierten kontrastiven Elementen und von unterschiedlichen Typen nicht C-markierter Fokusglieder am Satzanfang eine bedeutende Variation auf.