Refine
Year of publication
- 2007 (185) (remove)
Document Type
- Part of a Book (75)
- Article (63)
- Conference Proceeding (21)
- Book (16)
- Part of Periodical (6)
- Contribution to a Periodical (1)
- Master's Thesis (1)
- Preprint (1)
- Report (1)
Language
- German (146)
- English (37)
- Norwegian (1)
- Portuguese (1)
Keywords
- Deutsch (97)
- Korpus <Linguistik> (34)
- Konversationsanalyse (15)
- Gesprochene Sprache (11)
- Sprachgeschichte (9)
- Computerlinguistik (8)
- Grammatik (8)
- Semantik (8)
- Sprachpflege (7)
- Verb (7)
Publicationstate
- Veröffentlichungsversion (82)
- Zweitveröffentlichung (16)
- Postprint (11)
Reviewstate
Publisher
- de Gruyter (34)
- Narr (29)
- Institut für Deutsche Sprache (22)
- Equinox (4)
- Benjamins (3)
- Lang (3)
- Niemeyer (3)
- University of Birmingham (3)
- University of Illinois (3)
- Association for Computational Linguistics (2)
Der Beitrag zeigt, auf welch grundlegende Weise das Paradigma der Corpus-Driven-Linguistics (CDL) die linguistische Beschreibung sprachlichen Usus auf der Basis mathematisch-statistischer Clusteringverfahren bestimmt. Es soll deutlich werden, wie sich diese Prämissen im Forschungsschwerpunkt zur linguistischen Systematisierung und Interpretation von Kookkurrenzdaten manifestieren.
Arbeitet man als muttersprachlicher Sprecher des Deutschen mit Corpora gesprochener oder geschriebener deutscher Sprache, dann reflektiert man in aller Regel nur selten über die Vielzahl von kulturspezifischen Informationen, die in solchen Texten kodifiziert sind - vor allem, wenn es sich bei diesen Daten um Texte aus der Gegenwart handelt. In den meisten Fällen hat man nämlich keinerlei Probleme mit dem in den Daten präsupponierten und als allgemein bekannt erachteten Hintergrundswissen. Betrachtet man dagegen Daten in Corpora, die andere - vor allem nicht-indoeuropäische - Sprachen dokumentieren, dann wird einem schnell bewusst, wieviel an kulturspezifischem Wissen nötig ist, um diese Daten adäquat zu verstehen. In meinem Beitrag illustriere ich diese Beobachtung an einem Beispiel aus meinem Corpus des Kilivila, der austronesischen Sprache der Trobriand-Insulaner von Papua-Neuguinea. Anhand eines kurzen Ausschnitts einer insgesamt etwa 26 Minuten dauernden Dokumentation, worüber und wie sechs Trobriander miteinander tratschen und klatschen, zeige ich, was ein Hörer oder Leser eines solchen kurzen Daten-Ausschnitts wissen muss, um nicht nur dem Gespräch überhaupt folgen zu können, sondern auch um zu verstehen, was dabei abläuft und wieso ein auf den ersten Blick absolut alltägliches Gespräch plötzlich für einen Trobriander ungeheuer an Brisanz und Bedeutung gewinnt. Vor dem Hintergrund dieses Beispiels weise ich dann zum Schluss meines Beitrags darauf hin, wie unbedingt nötig und erforderlich es ist, in allen Corpora bei der Erschließung und Kommentierung von Datenmaterialien durch sogenannte Metadaten solche kulturspezifischen Informationen explizit zu machen.
Christian Cay Lorenz Hirschfeld (1742-1792) beschrieb in seiner "Theorie der Gartenkunst" die Stellung des Menschen in der Natur und spiegelte die gesellschaftlichen Zustände. Dabei stellte er eine Verbindung zwischen der Kunstform des Landschaftsgartens und der Verbesserung der Menschheit her. In diesem Band wird exemplarisch vorgeführt, mit welchem lexematischen Material er die Kombination aus differenzierter Beschreibung und beabsichtigter ästhetischer Erziehung in moralischer Absicht innerhalb des vom Sprachsystem lexikalisch vorgegebenen Rahmens umsetzte und welche sprachlichen Strategien aus diesen Intentionen resultierten.
The main objective of this article is to describe the current activities at the Mannheim Institute for German Language regarding the implementation of a domain-specific ontology for German grammar. We differentiate ontology bases from ontology management Systems, point out the benefits of database-driven Solutions, and go Step by Step through all phases of the ontology lifecycle. In Order to demonstrate the practical use of our approach, we outline the interface between our ontology and the grammis web Information System, and compare the ontology-based retrieval mechanism with traditional full text search.
Adjektiv (und Adkopula)
(2007)
Für die Analyse der gesprochenen Sprache wurden in den letzten Jahrzehnten computerisierte Sprachkorpora bereitgestellt, die qualitative und quantitative Untersuchungen erlauben. Die nächste „Herausforderung“ für die Korpuslinguistik stellt heute der Gebrauch des „World Wide Webs“ als unerschöpflicher Datenbank dar. Theoretischen Überlegungen über das Potenzial des WWWs folgt ein praktisches Beispiel: die Verwendung deutscher sprechsprachlicher Relativkonstruktionen in „Webforen“.
This paper aims to address these problems by dealing with theoretical and methodological questions concerning the national effects of the Bologna Process and the role national factors play in determining the impact of these effects. Altogether the purpose of the paper is to serve as a starting point for future research – both as a guide for systematic and comparative empirical work on higher education, but also for further theoretical and methodological reasoning concerning research on (higher) education policy. As higher education research so far particularly lacks an approach allowing for a competitive and systematic falsification of theoretical arguments by clearly indicating testable and specific hypothesis as well as variables behind the research design (Goedegebuure/Vught 1996) we propose to fall back on neighbouring disciplines, namely social science to improve and enhance the analysis (Slaughter 2001: 398; Altbach 2002: 154; Teichler 1996a: 433, 2005: 448). Several strands of research have to be considered – namely literature on Europeanization as well as insights and approaches of studies dealing with cross-national policy convergence. Taking into account the non-obligatory and mainly intergovernmental character of the Bologna Process the main focus of the paper is on factors related to the effects of transnational communication. The inherent goal is to extend the research agenda on higher education (McLendon 2003: 184ff) and to leave behind the restriction of to analyse only a few cases by striving for a research design that allows for systematic testing and sufficient explanations of cross-national policy convergence at the interface between the Bologna Process and domestic factors.
Zunehmend werden Videos und ihre Präsentation für die gesprächsanalytische Arbeitspraxis wichtig. Dieser Beitrag gibt praxisorientierte Hilfestellungen für die Einbettung von Audio- und Videodateien in Microsoft Powerpoint 2003 unter Windows XP, geht auf unterschiedliche Dateitypen ein und stellt Software zum Konvertieren und Editieren von Videodateien vor. Als besonders elaborierte Präsentationstechnik wird Screenrecording-Software beschrieben, mit der Bildschirmfilme von Abläufen z.B. in Transkriptionssoftware erstellt werden können, um so Video, Transkript und Analyse simultan in Powerpoint darzustellen.
Die Autoren untersuchen in ihrem Beitrag auf der Grundlage eines kurzen Videoausschnittes aus einer Schulstunde die manifesten Reaktionen und Verhaltensweisen, die ein Schüler angesichts der Kamera und der Aufnahmeaktivitäten produziert. Der Schüler ist zunächst auf das Unterrichtsgeschehen orientiert. Als er gewahr wird, dass die Kamera ihn erfasst, tritt für ihn diese Orientierung schlagartig in den Hintergrund, und die Kamera wird für ihn situativ relevant: Er blickt kurz in die Kamera, unterbricht dann aber den Sichtkontakt, indem er mit einer Hand, dann mit dem Hausaufgabenheft und schließlich wieder mit seitlich vor das Gesicht gehaltener Hand sein Gesicht bedeckt.
Die diesjährige Arbeitstagung, die zum vierten Mal vom Institut für Deutsche Sprache (IDS) in Mannheim veranstaltet wurde, hatte sich das Ziel gesetzt, eine Standortbestimmung der Gesprächsforschung vorzunehmen und Gelegenheit zur Reflektion ihrer "Aufgaben, Desiderate und Perspektiven" (so der Untertitel des Tagungsthemas "Gesprächsforschung") zu bieten. Bei den vielfältigen Forschungsinteressen am sprachlich-kommunikativen Handeln, bei den neuen technischen Möglichkeiten der Videoaufzeichnung und der computergestützten Verfügbarmachung von Gesprächsdaten und auch vor dem Hintergrund des Generationenwechsels, der sich derzeit in der Gesprächsforschung vollzieht, war das ein passendes wie auch dringlich erscheinendes Tagungsthema. Dies wurde durch die bisher höchste Teilnehmerzahl (120), einen relativ hohen Anteil von Gästen aus dem Ausland und durch eine größere Zahl jüngerer Teilnehmer und Vortragender bestätigt. Wie sich an der Liste der Referenten der 13. Arbeitstagung darüber hinaus zeigt, hat sich die in ihren Anfängen als Gelegenheit zur Diskussion von Forschungsproblemen und zur gemeinsamen Analyse von Daten gestaltete Arbeitstagung inzwischen zu dem zentralen Forum der Gesprächsforschungs-Community in Deutschland entwickelt.
We present a corpus-driven approach to the study of multi-word expressions, which constitute a significant part of. As a data basis, we use collocation profiles computed from DeReKo (Deutsches Referenzkorpus), the largest available collection of written German which has approximately two billion word tokens and is located at the Institute for the German Language (IDS). We employ a strongly usage-based approach to multi-word expressions, which we think of as conventionalised patterns in language use that manifest themselves in recurrent syntagmatic patterns of words. They are defined by their distinct function in language. To find multi-word expressions, we allow ourselves to be guided by corpus data and statistical evidence as much as possible, making interpretative steps carefully and in a monitored fashion. We develop a procedure of interpretation that leads us from the evidence of collocation profiles to a collection of recurrent word patterns and finally to multi-word expressions. When building up a collection of multi-word expressions in this fashion, it becomes clear that the expressions can be defined on different levels of generalisation and are interrelated in various ways. This will be reflected in the documentation and presentation of the findings. We are planning to add annotation in a way that allows grouping the multi-word expressions according to different features and to add links between them to reflect their relationships, thus constructing a network of multi-word expressions.
Das Deutsche gilt als prototypisches Beispiel für eine Sprache, die von einer plurizentrischen Sprachkultur getragen wird. Im Gegensatz zu monozentrischen Sprachen, bei denen ein zentraler Raum oder eine zentrale Institution das Muster bilden und bestimmen, was als sprachlicher Standard zu gelten hat, gilt es in plurizentrischen Sprachkulturen, einen Ausgleich zwischen den Ansprüchen verschiedener kultureller Zentren zu finden. Das Deutsche, so wie wir es kennen, geht als ganzes auf einen solchen Ausgleich zurück. Er sollte zunächst die Verständlichkeit von Druckwerken sichern. Und noch heute schlagen sich solche Differenzen in den Eigenheiten der verschiedenen deutschsprachigen Staaten nieder. Das hat zur Folge, dass jetzt auch diskutiert wird, wie viel von der sichtbaren Variation auf historisch-politische Unterteilungen zurückgeht („plurinational“), und wie viel das Erbe der traditionellen Dialekträume darstellt („polyareal“).
Das elexiko-Portal: Ein neuer Zugang zu lexikografischen Arbeiten am Institut für Deutsche Sprache
(2007)
Das elexiko-Portal soll verschiedene lexikografische Projekte des IDS in einem Verbund zusammenführen und - soweit das die Inhalte zulassen - gemeinsame Recherchemöglichkeiten über verschiedene lexikografische Produkte hinweg bieten. In diesem Aufsatz geht es v. a. darum zu zeigen, wie die XML-basierte Modellierung für das Portal aufgebaut ist, um zum einen die Basis für diese flexiblen Zugriffsstrukturen zu legen und zum anderen der Verschiedenheit der beteiligten Projekte Rechnung zu tragen. Gleichzeitig werden Perspektiven für eine flexiblere Darstellung der Daten und für die zukünftige Weiterentwicklung von Recherchemöglichkeiten aufgezeigt.
Wer sich mit grammatischen Phänomenen historischer Sprachstufen beschäftigt, kann seine empirischen Daten bekanntermaßen nicht auf der Grundlage von Sprecherurteilen gewinnen, sondern muss zunächst Korpusrecherchen betreiben. Die Größe des auszuwählenden Korpus ist sehr stark phänomenabhängig: So reicht es im Bereich der Syntax in der Regel nicht aus, kleinere Textausschnitte aus verschiedenen Textquellen zu einem Korpus zusammenzufügen, vielmehr müssen vollständige Texte nicht nur nach raum-zeitlichen Koordinaten, sondern auch textsortenabhängig ausgewählt werden, um ein repräsentatives Korpus für eine spezifische Sprachstufe zu erstellen. Da eine manuelle Sichtung dieser doch recht großen Korpora sich sehr zeitaufwändig gestaltet, bietet sich gerade im Bereich der historischen Syntax der Einsatz von syntaktisch annotierten, digitalen Korpora an. Im folgenden Beitrag wird der Aufbau einer solchen Baumbank für das Frühneuhochdeutsche einschließlich der verfügbaren Recherchemöglichkeiten vorgestellt.
Es gibt viele linguistische Forschungsfragen, für deren Beantwortung man Korpusdaten qualitativ und quantitativ auswerten möchte. Beide Auswertungsmethoden können sich auf den Korpustext, aber auch auf Annotationsebenen beziehen. Jede Art von Annotation, also Kategorisierung, stellt einen kontrollierten und notwendigen Informationsverlust dar. Das bedeutet, dass jede Art von Kategorisierung auch eine Interpretation der Daten ist. In den meisten großen Korpora wird zu jeder vorgesehenen Annotationsebene, wie z. B. Wortart-Ebene oder Lemma-Ebene, genau eine Interpretation angeboten. In den letzten Jahren haben sich neben den großen, ,,flach“ annotierten Korpora Korpusmodelle herausgebildet, mit denen man konfligierende Informationen kodieren kann, die so genannten Mehrebenen-Modelle (multilevel standoff corpora), in denen alle Annotationsebenen unabhängig vom Text gespeichert werden und nur auf bestimmte Textanker verweisen. Ich argumentiere anhand der Fehlerannotation in einem Lernerkorpus dafür, dass zumindest Korpora, in denen es stark variierende Annotationsbedürfnisse und umstrittene Analysen geben kann, davon profitieren, in Mehrebenen-Modellen kodiert zu werden.
Der Begriff und die Rolle von Daten in einer Wissenschaft hängen eng mit ihrem Selbstverständnis zusammen. Als erstes ist zu überlegen, inwiefern Linguistik eine empirische Wissenschaft ist und also von Daten abhängt.
Während in den Philologien ein Korpus die Grundlage einer Disziplin abgibt, die ohne es nicht bestünde, ist in der Linguistik ein Korpus nur ein Weg, an Daten zu kommen. Hier ist zu diskutieren, welche relativen Meriten die alternativen Wege im Hinblick auf die angestrebten Ziele haben.
Während manches auf uns gekommene Korpus seine Sprache sicher nicht angemessen repräsentiert, könnte eine heute von Linguisten erstellte Dokumentation diesen Anspruch im Prinzip einlösen. Hier stellt sich die Frage, ob das - angesichts des infiniten Charakters der Sprache - überhaupt möglich ist und in wieweit die Repräsentativität wieder von den angestrebten Zielen abhängt.
Dies sind alles Fragen linguistischer Methodologie. Eine Zeitlang hat man in der Linguistik geglaubt, ohne Methodologie zu Theorien gelangen zu können. Seit sich das als irrig herausgestellt hat, ist die Entwicklung von Methoden ein fühlbares Desiderat geworden. Wie man repräsentative Daten erhebt, wie man ein Korpus zusammenstellt und nutzt, wie man eine Sprache dokumentiert, sind alles Fragen, die eigentlich in die Alltagsroutine einer Wissenschaft fallen müssten. Dass sie noch weitgehend ungeklärt sind, ist ein Symptom dafür, dass die Linguistik noch keine erwachsene Wissenschaft ist.
Durch die Medienrevolution des Computerzeitalters hat auch die Lexikografie tiefgreifend verändert. Es stellen sich neue Fragen: Kann aus einer Datenbasis gleichzeitig ein gedrucktes und ein elektronisches Wörterbuch entwickelt werden? Welche innovativen Funktionalitäten können den Wörterbuchbenutzern im elektronischen Medium angeboten werden? Wie kann die Erarbeitung der Daten im lexikografischen Prozess bestmöglich unterstützt werden? Die Basis für die Möglichkeiten im Umgang mit den lexikografischen Daten bildet dabei die Datenmodellierung und -aufbereitung. Daher ist für die Erarbeitung eines Wörterbuchs eine Konzeption zur Modellierung und Aufbereitung der zugrunde liegenden Daten von entscheidender Bedeutung.
Die vorliegende Arbeit stellt nachdrücklich dar, wie eine wohlüberlegte, methodisch fundierte und vor allem anwendbare Datenmodellierung zu weitreichenden Verbesserungen der lexikografischen Praxis führt. Dazu wird ein Modell für den lexikografischen Prozess entwickelt, welches die Erarbeitung der Daten und die Recherchierbarkeit sowohl für Lexikografen als auch Wörterbuchbenutzer optimiert.
Der Wortschatzausschnitt der deutschen Kommunikationsverben – eine empirische Bestandsaufnahme
(2007)
In Deutschland gibt es Anzeichen für ein zunehmendes Interesse an der eigenen Sprache. Dennoch ergeben sich hier wie in anderen europäischen Ländern mit der kommunikativen Internationalisierung Probleme für die weitere Entwicklung der Hochsprachen, die für die kulturelle Vielfalt des Kontinents konstitutiv sind. Die steigende Tendenz, Englisch als einzige internationale Verkehrssprache und auch national als Fachsprache in mehreren Domänen zu verwenden, wird verstärkt durch einen Fremdsprachenunterricht, der in Deutschland wie in anderen Ländern Englisch zu Lasten anderer Sprachen bevorzugt. Dieser Entwicklung sucht die Europäische Union zu begegnen, indem sie das Ziel M + 2 Sprachen (Muttersprache plus zwei andere Sprachen) für alle Europäer propagiert. Dieses Programm wird auch von der Europäischen Föderation nationaler Sprachinstitutionen (EFNIL) unterstützt, das Netzwerke der zentralen Spracheinrichtungen der EU- Staaten, das sich für die Erhaltung und Weiterentwicklung der europäischen Sprachenvielfalt und die Mehrsprachigkeit der Europäer einsetzt. Für dieses Ziel sind aber Einsicht und Interesse bei vielen Deutschen noch zu wecken oder zu verstärken.
Deutscher Wortschatz im Internet: Das Informationssystem elexiko und sein Modulprojekt Neologismen
(2007)
Deutsches Fremdwörterbuch R-Z: Rückblick und Ausblick. Zum Gedenken an Gerhard Strauß (1941-2006)
(2007)
Dieser Beitrag gliedert sich in zwei Teile. Der erste ist ein Rückblick auf das Deutsche Fremdwörterbuch in seinem (wörterbuch-)geschichtlichen Kontext, auf seine Entstehung und seine Fertigstellung im Institut für Deutsche Sprache (IDS). Der zweite ist ein eher persönlich gefärbter Ausblick auf die Lexikologie und Lexikographie des Fremdworts im Deutschen, der auf meinen während der Fertigstellung des Fremdwörterbuchs gemachten Erfahrungen beruht. Er geht exemplarisch auf zwei Fragenkomplexe näher ein, die nach meiner Überzeugung bei fundierten und sachgemäßen historischen Untersuchungen zum deutschen Fremdwort mitberücksichtigt werden müssen.
Die Universität Bonn verfügt über ein elektronisches Korpus von Immanuel Kants gesammelten Schriften gemäß den Abteilungen 1–3 der Akademie-Ausgabe. Dieses Korpus bildet die Grundlage einer elektronischen Edition der Schriften Kants, auf die über die Webseite des ehemaligen Instituts für Kommunikationsforschung und Phonetik zugegriffen werden kann: http://www.ikp.uni-bonn.de/kant/. Im vorliegenden Artikel wird über den Umfang und den Zustand des Bonner Korpus und der elektronischen Edition berichtet.
Die Gründerjahre des IDS
(2007)
Cognitive linguists have long been interested in analogies people habitually use in thinking and speaking, but little is known about the nature of the relationship between verbal behaviour and such analogical schemas. This article proposes that discourse metaphors are an important link between the two. Discourse metaphors are verbal expressions containing a construction that evokes an analogy negotiated in the discourse community. Results of an analysis of metaphors in a corpus of newspaper texts support the prediction that regular analogies are form-specific, i.e., bound to particular lexical items. Implications of these results for assumptions about the generality of habitual analogies are discussed.
This paper presents a thorough examination of the validity of three evaluation measures on parser output. We assess parser performance of an unlexicalised probabilistic parser trained on two German treebanks with different annotation schemes and evaluate parsing results using the PARSEVAL metric, the Leaf-Ancestor metric and a dependency-based evaluation. We reject the claim that the TüBa-D/Z annotation scheme is more adequate then the TIGER scheme for PCFG parsing and show that PARSEVAL should not be used to compare parser performance for parsers trained on treebanks with different annotation schemes. An analysis of specific error types indicates that the dependency-based evaluation is most appropriate to reflect parse quality.
Evaluating phonological status: significance of paradigm uniformity vs. prosodic grouping effects
(2007)
A central concern of linguistic phonetics is to define criteria for determining the phonological status of sounds or sound properties observed in phonetic surface form. Based on acoustic measurements we show that the occurrence of syllabic sonorants vs. schwa-sonorant sequences in German is determined exclusively by segmental and prosodic structure, with no paradigm uniformity effects. We argue that these findings are consistent with a uniform representation of syllabic sonorants as schwa sonorant sequences in the lexicon. The stability of schwa in CVC-suffixes (e.g. the German diminutive suffix -chen), as opposed to its phonetic absence in a segmentally comparable underived context, is argued to be conditioned by the prosodic organisation of such suffixes external to the phonological word of the stem.
In der natürlichen Sprachverarbeitung haben Frage-Antwort-Systeme in der letzten Dekade stark an Bedeutung gewonnen. Vor allem durch robuste Werkzeuge wie statistische Syntax-Parser und Eigennamenerkenner ist es möglich geworden, linguistisch strukturierte Informationen aus unannotierten Textkorpora zu gewinnen. Zusätzlich werden durch die Text REtrieval Conference (TREC) jährlich Maßstäbe für allgemeine domänen-unabhängige Frage-Antwort-Szenarien definiert. In der Regel funktionieren Frage-Antwort-Systeme nur gut, wenn sie robuste Verfahren für die unterschiedlichen Fragetypen, die in einer Fragemenge vorkommen, implementieren. Ein charakteristischer Fragetyp sind die sogenannten Ereignisfragen. Obwohl Ereignisse schon seit Mitte des vorigen Jahrhunderts in der theoretischen Linguistik, vor allem in der Satzsemantik, Gegenstand intensive Forschung sind, so blieben sie bislang im Bezug auf Frage-Antwort-Systeme weitgehend unerforscht. Deshalb widmet sich diese Diplomarbeit diesem Problem. Ziel dieser Arbeit ist zum Einen eine Charakterisierung von Ereignisstruktur in Frage-Antwort Systemen, die unter Berücksichtigung der theoretischen Linguistik sowie einer Analyse der TREC 2005 Fragemenge entstehen soll. Zum Anderen soll ein Ereignis-basiertes Antwort-Extraktionsverfahren entworfen und implementiert werden, das sich auf den Ergebnissen dieser Analyse stützt. Informationen von diversen linguistischen Ebenen sollen daten-getrieben in einem uniformen Modell integriert werden. Spezielle linguistische Ressourcen, wie z.B. WordNet und Subkategorisierungslexika werden dabei eine zentrale Rolle einnehmen. Ferner soll eine Ereignisstruktur vorgestellt werden, die das Abpassen von Ereignissen unabhängig davon, ob sie von Vollverben oder Nominalisierungen evoziert werden, erlaubt. Mit der Implementierung eines Ereignis-basierten Antwort-Extraktionsmoduls soll letztendlich auch die Frage beantwortet werden, ob eine explizite Ereignismodellierung die Performanz eines Frage-Antwort-Systems verbessern kann.
In diesem Beitrag versuchen wir darzulegen, unter welchen Umständen introspektive Urteile objektive, quantifizierbare, und empirisch adäquate linguistische Daten sein können. Dazu skizzieren wir, wie die Resultate unserer experimentell erhobenen, relativen Urteilsstudien aussehen, und argumentieren, dass sie eine unverzichtbare Evidenzquelle für die Syntax bilden, weil sie Einsichten in die Architektur der Grammatik erlauben, die mit anderen Mitteln nicht möglich sind.
FnhdC/HTML und FnhdC/S
(2007)
Formen und Funktionen von Ethnolekten in multilingualen Lebenswelten - am Beispiel von Mannheim
(2007)
Sprechaktverben stehen, wie auch andere Einheiten des Lexikons, in unterschiedlichen Arten von Gegensatzbeziehungen zueinander. Das Spektrum der Gegensatzrelationen umfasst eine Vielfalt unterschiedlicher Phänomene wie Komplementarität, Kontrarität, direktionale Opposition, Sub- kontrarität, Konversivität, Reversivität und Dualität (vgl. Cruse 1986, Lang 1995, Cruse et al. 2002), die alle negationsinvolvierend, aber ftir den Wortschatzausschnitt der Sprechaktverben nicht alle gleichermaßen relevant sind. Gegensatzrelationen von Wörtern sind meist bei Adjektiven, seltener auch bei Adverbien, Nomen und Verben untersucht worden. Im Unterschied zu den klassischen Beispielen antonymischer Verben wie z. B. lieben-hassen, kommen-gehen und kaufen-verkaufen lassen sich Sprechaktverben nur schwer in das Spektrum der Gegensatzrelationen ein- ordnen. Im Folgenden werden die Kriterien, die zur Bestimmung unterschiedlicher Typen von Gegensatzrelationen angeführt worden sind, diskutiert und auf den Wortschatzbereich der Sprechaktverben angewendet.
The research project “German Today” aims to determine the amount of regional variation in (near-) standard German spoken by young and older educated adults, and to identify and locate the regional features. To this end, an extensive corpus of read and spontaneous speech is currently being compiled. German is a so-called pluricentric language. With our corpus we aim to determine whether national or regional standards really exist. Furthermore, the linguistic variation due to different contextual styles (read vs. spontaneous speech) shall be analysed. Finally, the corpus will enable us to investigate whether linguistic change has occurred in the domain of the German standard language. The main focus of all research questions is on phonetic variation (lexical variation is only of minor interest). Read and spontaneous speech of four secondary school students (aged seventeen to twenty) and two fifty- to sixt-year-olds is recorded in 160 cities throughout the German-speaking area of Europe. All participants read a number of short texts and word lists, name pictures, translate from English, and take part in a sociobiographic interview and a map task experiment. The resulting corpus will comprise over 1000 hours of orthographically and (in part) phonetically transcribed speech.
Bei diesem Beitrag handelt es sich um den Eröffnungsvortrag im Rahmen der 35. Jahrestagung Deutsch als Fremdsprache des Fachverbandes Deutsch als Fremdsprache (FaDaF) vom 31. Mai bis 2. Juni 2007 an der Freien Universität Berlin zum Rahmenthema »Auf neuen Wegen. Deutsch als Fremdsprache in Forschung und Praxis«.
Die in diesem Band zusammengestellten Beiträge behandeln die Zeitlichkeit, Prozessualität und Flüchtigkeit des Gesprächs auf unterschiedlichen Beschreibungsebenen. Von der Prosodie und Syntax (Couper- Kuhlen, Auer, Günthner) über die Gestik (Streeck) bis hin zur Ebene unterschiedlicher konversationeller Aufgaben im Sinne des Formulierens (Dausendschön-Gay/Gülich/Krafft), des Fokussierens (Hausendorf), des Turn-Taking (Mondada), des Erzählens/Erklärens (Quasthoff/Kern) und des Beendens (Selting) wird gezeigt, welche Perspektiven die Prozessualitätsannahme für die Beschreibung sprachlich-kommunikativer Phänomene eröffnet und welcher Art die Ergebnisse sind, die man auf dieser Grundlage erzielen kann. Zudem wird ebenenübergreifend ein besonders eng mit der Prozessualität des Gesprächs verbundenes Merkmal in seiner methodologischen Relevanz hervorgehoben: die Flüchtigkeit gesprochener Sprache (Bergmann).
This paper argues for the need of training doctors in order to improve their skills of listening to patients and of conducting the interaction with them. It argues for applied discourse analysis as an approach to medical discourse which provides for the soundest empirical basis for developing training schedules. The article shortly reviews the basic procedures and stocks of knowledge which are proper to applied discourse analysis. It then turns to the improvement of doctors' skills of active listening to the patient of and analyzing his/her communicative displays, e.g. regarding emotions, subjective theories of illness and identity concerns of his/her sufferings. Finally, aspects of the improvement for doctors' communicative skills are discussed, e.g. enhancing the comprehensibility of doctors' turns at talk, the management of the patients' participation in medical dialogue and the formulation of questions.
Gesprächsprotokolle auf Knopfdruck: Die automatische Zusammenfassung von gesprochenen Dialogen
(2007)
Dieser Beitrag beschreibt computerlinguistische Arbeiten zur automatischen Zusammenfassung gesprochener Dialoge. Der Beitrag geht sowohl auf die notwendige Vorverarbeitung als auch auf die eigentliche Zusammenfassung durch automatische Erkennung von Themengrenzen und Extraktion relevanter Äußerungen ein. Ein weiterer Schwerpunkt liegt in der Beschreibung von Arbeiten zur automatischen Anaphernresolution in gesprochener Sprache. Der Beitrag betont vor allem die Rolle und Bedeutung von annotierten Korpora für die computerlinguistische Forschung und Entwicklung.
Gesprächstraining
(2007)
Indefinitpronomina im weiteren Sinne sind eine Sammelklasse für alle Pronomina, die nicht auf bestimmte, eindeutig identifizierbare Gegenstände der Welt orientiert sind, also Interrogativa (wer, was), Indefinita im engeren Sinne (jemand, etwas, niemand, nichts) und Quantifikativa (alle, jeder, einige). Der interlinguale Vergleich zeigt hier Gemeinsamkeiten über die Klassen hinweg wie eine konzeptuelle Sortierung in "Person" und "Nicht-Personales", die Repräsentation der Individuativ Kontinuativ- Unterscheidung sowie die Berücksichtigung von Partitivität und Distributivität.
Gegenstand des Vortrags ist das Projekt "Grammatik des Deutschen im europäischen Vergleich" der Abteilung Grammatik des IDS. Mit dem Projekt wird eine innovative Form der vergleichenden Grammatikschreibung realisiert, die a) sprachtypologisch fundiert ist, b) statt eines bilateralen Vergleichs das Deutsche mit einem breiten Spektrum europäischer Sprachen (mit den Kernkontrastsprachen Englisch, Französisch, Polnisch und Ungarisch) kontrastiert und c) die grammatischen Strukturen des Deutschen auf diesem Hintergrund expliziter herausarbeitet. In dem Vortrag werde ich das Projekt mit seinen beiden gegenwärtigen Teilprojekten "Grammatik des Nominals" und "Wortphonologie" vorstellen.
Dieses Buch stellt die Gesprächsanalyse als Methodik zur Erforschung linguistischer Fragestellungen dar. Ihr Ziel ist die umfassende Analyse sprachlicher Phänomene in ihren formalen, funktionalen und kontextuellen Dimensionen. Grundlegende Eigenschaften der verbalen Interaktion werden zunächst auf ihre sprachtheoretischen Konsequenzen befragt. Sodann werden aus ihnen methodologische Prinzipien für die Erhebung und Analyse von Gesprächskorpora entwickelt. Das methodische Vorgehen wird an einer grammatischen und einer semantischen Fragestellung demonstriert. Untersucht werden freie Infinitivkonstruktionen im gesprochenen Deutsch und die Effekte von Kontrastierungsaktivitäten auf die Semantik von Ausdrücken im Gespräch. Theoretische Basis bildet hier die Integration der Gesprächsanalyse mit der construction grammar und der kognitiven Linguistik.
The project elexiko compiles an extensive, monolingual dictionary of Contemporary German. This contribution deals with the grammatical data in this dictionary; it is not only described how these are arranged content-wise depending on corpus data, but also how they were modelled.
Das Projekt elexiko erarbeitet ein umfangreiches, einsprachiges Wörterbuch des Gegenwartsdeutschen. In diesem Beitrag geht es um die grammatischen Angaben in diesem Wörterbuch; es wird nicht nur erläutert, wie diese inhaltlich in Abhängigkeit vom Prinzip der Korpusbasiertheit gestaltet sind, sondern auch, wie sie modelliert wurden.
Automatic summarization systems usually are trained and evaluated in a particular domain with fixed data sets. When such a system is to be applied to slightly different input, labor- and cost-intensive annotations have to be created to retrain the system. We deal with this problem by providing users with a GUI which allows them to correct automatically produced imperfect summaries. The corrected summary in turn is added to the pool of training data. The performance of the system is expected to improve as it adapts to the new domain.
Incompatibility (or co-hyponymy) is the most general type of semantic relation between lexical items, the meaning of which entails exclusion. Such items fall under a superordinate term or concept and denote sets which have no members in common (e.g. animal: dog-cat-mouse-lion-sheep; example from Cruse 2004). Traditionally, these have been of interest to lexical semanticists for the description of the structure of the lexicon. However, incompatibility is not just a relation that signifies a difference of meaning. This paper is a critical corpus-assisted re-evaluation of the phenomenon of incompatibility which argues that the relation in question sometimes also functions as a discourse marker. Incompatibles indicate recurrent intertextual patterns. This holds particularly true for socially or politically controversial lexical items such as Flexibilität (flexibility), Mobilität (mobility) or Globalisierung (globalisation). Corpus investigations of such words have revealed that among other semantically related terms, incompatibles have a crucial discourse focussing function. For the German lexical item Globalisierung, I will show how its lexical usage can be studied through a corpus-driven analysis of corresponding incompatibles. Incompatible terms are not contingent co-words but often occur in close contextual proximity and participate in regular syntagmatic structures (e.g. Globalisierung und Rationalisierung; Globalisierung und Modernisierung; Neoliberalismus, Globalisierung und Kapitalismus). Hence, these are easily extracted by conducting a computational collocation analysis. Such significant collocates provide a good insight into the discursive and thematic contexts of the search word. Following Teubert (2004), I will demonstrate how the meaning of such lexical items is constituted in discourse and how the examination of these particular collocates reveals their sense-constructing function and their pragmatic-discursive force. I will provide a brief discussion of the methodology used for such analyses, and I will explain why the complex semantic-pragmatic and thematic-communicative patterns implied in sets of incompatibles should be given a stronger emphasis in lexicography.
Intensitätspartikeln
(2007)
In this contribution we present some work of the R&D European project “LIRICS” and of the ISO/TC 37/SC 4 committee related to the topic of interoperability and re-use of language resources. We introduce some basic mechanisms of the standardization work in ISO and describe in more details the general approach on how to cope with the annotation of language data within ISO.
Jaw and Order
(2007)
It is well-accepted that the jaw plays an active role in influencing vowel height. The general aim of the current study is to further investigate the extent to which the jaw is active in producing consonantal distinctions, with specific focus on coronal consonants. Therefore, tongue tip and jaw positions are compared for the German coronal consonants Is, J, t, d, n, 1/, that is, consonants having the same active articulators (apical/laminal) but differing in manner of articulation. In order to test the stability of articulatory positions for each of these coronal consonants, a natural perturbation paradigm was introduced by recording two levels of vocal effort: comfortable, and loud without shouting. Tongue and jaw movements of five speakers of German were recorded by means of EMMA during /aCa/ sequences. By analyzing the tongue tip and jaw positions and their spatial variability we found that (1) the jaw's contribution to these consonants varies with manner of articulation, and (2) for all coronal consonants the positions are stable across loudness conditions except for those of the nasal. Results are discussed with respect to the tasks of the jaw, and the possible articulatory adjustments that may accompany louder speech.
Auf der Grandlage eines Drei-Generationen-Modells (Jugend, mittlere Generation, Alter) wird dargestellt, welche Anlässe es für alte Menschen zur Kommunikation mit Angehörigen der eigenen wie auch der anderen Generationen gibt. Dabei wird nach familiären, institutionellen und freien Kommunikationssituationen differenziert. Jede Konstellation wird in Hinblick auf Quantität und Qualität der Kommunikation sowie auf mögliche Erschwernisse und Probleme, insbesondere auch als Folge von körperlichen Gebrechen, charakterisiert. Auf diese Weise entsteht ein Bild des „kommunikativen Haushalts“ (Luckmann) der älteren Generation, das auf Schwachstellen hin überprüft wird. In einem letzten Schritt wird skizziert, welche Möglichkeiten zur Intensivierung der intra- wie der intergenerationellen Kommunikation bestehen.
Auf sprachvergleichende Untersuchungen wirken sich gerade bei den Konzessivverknüpfungen die teilweise sehr unterschiedlichen einzelsprachlichen Darstellungstraditionen unvorteilhaft aus, weil sie den Blick auf ein mögliches tertium comparationis verstellen. Dies betrifft auch den Vergleich zwischen dem Deutschen und dem Russischen. Der vorliegende Aufsatz gibt einen Überblick über die Konzessivkonnektoren dieser beiden Sprachen, wobei die semantischen, syntaktischen und morphologischen Ähnlichkeiten zwischen den betreffenden Sprachmitteln besonders hervorgehoben werden. Damit wird eine Vergleichsbasis erarbeitet, die für zukünftige Detail-Untersuchungen als Ausgangspunkt dienen kann.
In diesem Beitrag geht es einerseits um eine Definition dessen, was korpusgestützte Lexikographie ist, und andererseits um eine Bestandsaufnahme der gegenwärtigen Praxis korpusgestützter Lexikographie. Dabei wird ein Schwerpunkt gelegt auf allgemeinsprachige Wörterbücher der Gegenwartssprache, deren Inhalt die Beschreibung von Bedeutung und Verwendung von Lexemen ist. Außerdem liegt die Einschätzung zugrunde, dass die Auswertung elektronischer Korpora die Wörterbucharbeit weitgehend positiv beeinflusst und verändert, vorausgesetzt, dass zugrunde gelegte Korpus wurde für das geplante Wörterbuch so gut wie möglich in Umfang und Zusammensetzung eingerichtet.
In diesem Beitrag wird untersucht, wie mithilfe korpuslinguistischer Verfahren Erkenntnisse über den Aufbau von Bedeutungsparaphrasen in Wörterbüchern gewonnen werden können. Diese Erkenntnisse sollen dazu genutzt werden, den Aufbau von Bedeutungsparaphrasen in Wörterbüchern umfassend und systematisch zu beschreiben, z.B. im Hinblick auf eine Optimierung der Bedeutungsparaphrasen für so genannte elektronische Wörterbücher oder für die Extraktion lexikalisch-semantischer Information für NLP-Zwecke.
In this article, we discuss the meaning and use of positional verbs in the South-Caucasian language Laz. Positional verbs are defined as those verbs which — in combination with one of several locational verbal prefixes (preverbs) — may appear in the basic construction that functions as an answer to a “where” question, the so-called basic locative construction (BLC). Within this class of verbs, we pay particular attention to those positionals which are used regularly in our data to describe the configuration of inanimate movable objects. Laz is shown to be a multiverb language, i.e., a language that uses a comparatively large set of verbs in the BLC. The fourteen verbs in question are PRV-dgun ‘stand’, PRV-ren ‘stand’, PRV-zun ‘lie’, PRV-xen ‘sit, stay’, PRV-bɣun ‘be located as mass’, PRV-mpiy ‘be spread’, PRV-sun ‘be smeared’, PRV-tun ‘cover’, PRV-bun ‘hang’, PRV-nʒoy ‘stick, be stuck’, PRV-n un ‘be dipped’, PRV- abun ‘stick to, be sticky’, PRV- orun ‘be bound’, PRV-gzun ‘burn’. The semantics and the use of these verbs are described in some detail including nontypical configurations, which trigger variation among speakers due to alternative categorizations and prototype effects.
Mediale und modale Kommunikationsverben sind Verben, mit denen auf Situationen Bezug genommen wird, in denen ein Sprecher etwas äußert und sich dabei eines bestimmten Kommunikationsmediums bedient bzw. in denen ein Sprecher etwas in einer bestimmten Art und Weise sagt. Im Unterschied zu den Sprechaktverben im eigentlichen Sinn (Repräsentative, Direktive, Kommissive und Expressive) sind mit medialen und modalen Kommunikationsverben keine Sprechereinstellungen wie etwa eine bestimmte propositionale Einstellung oder eine bestimmte kommunikative Sprecherabsicht lexikalisiert; mit Ausnahme des mit ihnen lexikalisierten Kommunikationsmediums bzw. Äußernsmodus sind sie semantisch nicht spezifiziert.