Refine
Year of publication
- 2008 (235) (remove)
Document Type
- Part of a Book (114)
- Article (57)
- Conference Proceeding (34)
- Book (17)
- Part of Periodical (6)
- Doctoral Thesis (3)
- Working Paper (2)
- Master's Thesis (1)
- Review (1)
Keywords
- Deutsch (113)
- Wörterbuch (29)
- Korpus <Linguistik> (21)
- Internet (15)
- Mehrsprachigkeit (12)
- Gesprochene Sprache (10)
- Konversationsanalyse (9)
- Computerunterstützte Lexikographie (8)
- OWID (8)
- Sprachgeschichte (8)
Publicationstate
- Veröffentlichungsversion (103)
- Zweitveröffentlichung (19)
- Postprint (9)
- Preprint (2)
Reviewstate
- (Verlags)-Lektorat (90)
- Peer-Review (21)
- Verlags-Lektorat (4)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (3)
- (Verlag)-Lektorat (1)
- (Verlags-) Lektorat (1)
- (Verlags-)Lektorat (1)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (1)
- Peer-Revied (1)
- Peer-review (1)
Publisher
- Institut für Deutsche Sprache (29)
- de Gruyter (26)
- Narr (24)
- European Language Resources Association (ELRA) (7)
- iudicium (7)
- Lang (5)
- Stauffenburg (5)
- Dudenverlag (4)
- Olms (4)
- BBAW (3)
This paper presents three electronic collections of polarity items: (i) negative polarity items in Romanian, (ii) negative polarity items in German, and (iii) positive polarity items in German. The presented collections are a part of a linguistic resource on lexical units with highly idiosyncratic occurrence patterns. The motivation for collecting and documenting polarity items was to provide a solid empirical basis for linguistic investigations of these expressions. Our databe provides general information about the collected items, specifies their syntactic properties, and describes the environment that licenses a given item. For each licensing context, examples from various corpora and the Internet are introduced. Finally, the type of polarity (negative or positive) and the class (superstrong, strong, weak or open) associated with a given item is speci ed. Our database is encoded in XML and is available via the Internet, offering dynamic and exible access.
The authors present a multilingual electronic database of lexical items with idiosyncratic occurrence patterns. Currently, our database consists of: (1) a collection of 444 bound words in German; (2) a collection of 77 bound words in English; (3) a collection of 58 negative polarity items in Romanian; (4) a collection of 84 negative polarity items in German; and (5) a collection of 52 positive polarity items in German. The database is encoded in XML and is available via the Internet, offering dynamic and flexible access.
One of the most popular techniques used in HPSG-based studies to describe linguistic phenomena is the raising mechanism. Besides ordinary raising verbs or adjectives, this tool has been applied for handling verbal complexes and discontinuous constituents, among other phenomena. In this paper, a new application for raising within the HPSG paradigm will be discussed, thereby investigating data from the prepositional domain. We will analyze linguistic properties of word combinations in German consisting of a preposition, a noun, and another preposition (such as auf Grund von (‘by virtue of’)), thus arguing that raising is the most appropriate method for satisfactorily describing the crucial syntactic features which are typical for those expressions. The objective of this paper is thus to demonstrate the efficiency of the raising mechanism as used in HPSG, and therefore, to emphasize the importance of designing a satisfactory uniform theory of raising within this grammar framework.
We present SPLICR, the Web-based Sustainability Platform for Linguistic Corpora and Resources. The system is aimed at people who work in Linguistics or Computational Linguistics: a comprehensive database of metadata records can be explored in order to find language resources that could be appropriate for one’s spe cific research needs. SPLICR also provides a graphical interface that enables users to query and to visualise corpora. The project in which the system is developed aims at sustainably archiving the ca. 60 language resources that have been constructed in three collaborative research centres. Our project has two primary goals: (a) To process and to archive sustainably the resources so that they are still available to the research community in five, ten, or even 20 years time. (b) To enable researchers to query the resources both on the level of their metadata as well as on the level of linguistic annotations. In more general terms, our goal is to enable solutions that leverage the interoperability, reusability, and sustainability of heterogeneous collec- tions of language resources.
Der vorliegende Beitrag widmet sich einem etwas stiefmütterlich behandelten Aspekt im ansonsten durchaus lebhaft geführten Diskurs um die didaktische Grammatik: dem grammatischen Wissen der Lehrenden. Auf diesem Gebiet besteht m.E. eine Diskrepanz zwischen Anforderungen an die Lehrerrolle im Gefolge veränderter Forschungsparadigmen und konkreter Gegebenheiten einerseits und einer Realität andererseits, die durch quantitativ wie qualitativ sehr heterogene und teilweise defizitäre Wissensbestände gekennzeichnet ist. Diese Behauptung soll im ersten Teil des Beitrags argumentativ untermauert werden. Im zweiten Teil soll mit dem multimedialen grammatischen Informationssystem GRAMMIS eine mögliche Quelle für grammatisches Wissen vorgestellt werden, die den Bedürfnissen von DaF-Lehrenden entgegenkommt.
Altern wird in diesem Band untersucht als eine Aufgabe, die von allen Menschen - durchaus auf unterschiedliche Weise - zu bewältigen ist und an der sie aktiv teilhaben. Altern ist demnach nicht etwas, was einem nur passiert bzw. widerfährt, sondern erfolgt in einem sozialen Prozess, in dem sich die Beteiligten mit dem Altern auseinandersetzen und es interaktiv gestalten. Altern impliziert so als Aufgabe auch die Reflexion der lebensgeschichtlich eintretenden Veränderungen und ihre interaktive und kommunikati-ve Be- und Verarbeitung. In der kommunikativen Bewältigung dieser Veränderungen wird zugleich Identitätsarbeit geleistet und werden Aspekte von Altersidentität ausgebildet. Diese Wechselwirkungen zwischen Altern, Kommunikation und Identitätsarbeit werden anhand von Ausschnitten aus authentischen Gesprächen herausgearbeitet und mit gesprächsanalytischen Methoden untersucht. Im Anhang geben zwei lange Transkriptausschnitte Einblick in die Kommunikationsweisen älterer Menschen und stellen Material für weitere Analysen bereit.
This paper presents the results of a joint effort of a group of multimodality researchers and tool developers to improve the interoperability between several tools used for the annotation and analysis of multimodality. Each of the tools has specific strengths so that a variety of differ-ent tools, working on the same data, can be desirable for project work. However this usually re-quires tedious conversion between formats. We propose a common exchange format for multi-modal annotation, based on the annotation graph (AG) formalism, which is supported by import and export routines in the respective tools. In the current version of this format the common de-nominator information can be reliably exchanged between the tools, and additional information can be stored in a standardized way.
Lexical chaining has become an important part of many NLP tasks. However, the goodness of a chaining process and hence its annotation output depends on the quality of the chaining resource. Therefore, a framework for chaining is needed which integrates divergent resources in order to balance their deficits and to compare their strengths and weaknesses. In this paper we present an application that incorporates the framework of a meta model of lexical chaining exemplified on three resources and its generalized exchange format.
Anakoluthe dependenziell
(2008)
Although there is a growing interest of policy makers in higher education issues (especially on an international scale), there is still a lack of theoretically well-grounded comparative analyses of higher education policy. Even broadly discussed topics in higher education research like the potential convergence of European higher education systems in the course of the Bologna Process suffer from a thin empirical and comparative basis. This paper aims to deal with these problems by addressing theoretical questions concerning the domestic impact of the Bologna Process and the role national factors play in determining its effects on cross-national policy convergence. It develops a distinct theoretical approach for the systematic and comparative analysis of cross-national policy convergence. In doing so, it relies upon insights from related research areas — namely literature on Europeanization as well as studies dealing with cross-national policy convergence.
There has been a long tradition of discussing the advantages and disadvantages of using foreign words in the German language. In the first part of this paper, an historical example of this discussion will be presented. It shows that at the end of the 18th century a highly differentiated approach to this question had been developed. The type of functional reasoning applied there could also be useful for the present discussion about the influence of English on the German language. A functional interpretation of the use of indigenous and foreign words respectively in a language like German unavoidably leads to the conclusion that the use of elements of foreign origin is an integral part of what it means to be a modem European language. Of course languages differ in the wavs in which they technically deal with this fact. To document the fact that the integration of the European tradition o f mutual cultural and linguistic contact is a characteristic feature of European languages, and that different languages deal with this in technically different ways, the second part o f this article compares a German non-fictional text with its counterparts in seven other European languages.
Der vorliegende Band enthält die Beiträge eines Kolloquiums am Institut für Deutsche Sprache, Mannheim, in dem das komplexe und moderne Werk sowie das systematische Arbeiten Johann Christoph Adelungs gewürdigt wurde. Die Beiträger und Beiträgerinnen des Bandes stellen das kulturgeschichtliche Denken Adelungs, sein lexikographisches Werk, seine grammatischen, orthographischen und stilistischen Arbeiten unter spezifischen Fragestellungen dar: Adelungs durch Herder inspiriertes Verständnis von Kulturgeschichte bildet gleichsam das Prinzip seiner Arbeit. In Beispielen wird die Adelung-Rezeption beschrieben ebenso wie die Bedeutung seines Werks für heutige sprachhistorische Forschung. Dass Adelung mit seinen Arbeiten in Spannungsfelder einzuordnen ist, machen diejenigen Beiträge deutlich, die ihn als Traditionalisten und als Vertreter der beginnenden Moderne zeigen, als Sprachgelehrten mit präskriptiven und deskriptiven Anliegen, als konservativen Denker und Aufklärer zugleich. Insgesamt gibt dieser Band einen Überblick über die Komplexität von Adelungs Schaffen und über den Stand der Forschung.
Die Sprachfähigkeit als Gattungsmerkmal des homo sapiens erzeugt Zeichen, durch die linear akustische Signale mit begrifflich strukturierten Umwelterfahrungen verbunden werden. Diese Verbindung beruht weder (ikonisch) auf Ähnlichkeit noch (indexikalisch) auf direktem Situationsbezug, sondern ist (symbolisch) konventionell begründet. Sie ermöglicht durch freie Kombination die Bildung komplexer Zeichen. Damit sind entscheidende Eigenschaften der Sprache gegeben. Einerseits sind sprachliche Ausdrücke über alle Erfahrungsbereiche möglich, natürliche Sprachen sind unbegrenzt und vollständig, andererseits sind sie zwangsläufig abstrakt, sie können nur den klassifizierend begrifflichen Aspekt der Erfahrungswelt wiedergeben. Diese Begrenztheit liegt innerhalb der Sprache selbst. Zugleich ist durch die Möglichkeit, über alles, also auch über Sprache zu sprechen, die Basis für Reflexion und explizite Bewusstheit, also Selbstbewusstsein gegeben. - Das Ineinandergreifen der verschiedenen Aspekte wird abschließend an Brentanos Wiegenlied demonstriert.
Belemnons Curiöses Bauem-Lexicon (CBL) aus dem Jahr 1728 ist ein ungewöhnliches Wörterbuch schwieriger Ausdrücke und Syntagmen (fast ausschließlich aus dem Bereich der Fremdwörter), die von ungebildeten Sprechern des frühen 18. Jhs. ("Bauern") falsch verwendet wurden. Das CBL listet rund 800 dieser Fremdwörter alphabetisch auf, um ihnen nach knappen Angaben zur korrekten Aussprache, Bedeutung und Verwendung die jeweiligen Verballhornungen oder Fehlverwendungen, meist durch (oft komische) Verwendungsbeispiele illustriert, gegenüberzustellen. In diesem Beitrag werden einführend die äußere Gestalt, Überlieferung und Nachwirkung, Zielsetzung und Adressaten sowie Makro- und Mikrostruktur des Wörterbuchs beschrieben. Im Anschluss wird der Gesamtbestand der korrekten wie inkorrekten Wortformen gesichtet und auf zwei Arten sortiert: zuerst in der Anordnung des Wörterbuchs, um einen Überblick über seine Makrostruktur zu gewinnen, und dann unter Umkehrung der Benutzerperspektive in Form einer alphabetischen Auflistung der 2000 "Falschwörter" mit Zuordnung der jeweils zugrundeliegenden korrekten Form(en). Eine erste Durchsicht im Anschluss lässt verschiedene Typen von Fehl Verwendungen erkennen, abhängig vom sozio- und dialektalen Umfeld der Sprachbenutzer. Im Hintergrund steht die Frage, inwiefern das CBL eine sprachhistorische Quelle zur Alltagssprache des frühen 18. Jhs. darstellt: dient es in erster Linie der Erheiterung gebildeter Kreise auf Kosten der weniger Gebildeten, denen womöglich auch erfundene, besonders lächerliche sprachliche Fehlleistungen zugeschrieben werden, oder dokumentiert es tatsächlich den defizitären Fremdwortgebrauch von Sprachbenutzern aus der ländlichen Unterschicht seiner Entstehungszeit? Beigegeben wird eine fotografische Reproduktion des CBL in Gestalt einer pdf-Datei, die der Forschung bis zum Erscheinen einer hoffentlich bald verfügbaren kritischen Edition einen leichteren Zugriff auf diesen in mehrfacher Hinsicht interessanten Quellentext ermöglichen soll.
Bestandsaufnahme
(2008)
Die „Kontrastive Grammatik deutsch-rumänisch" war kein singuläres Ereignis. Sie ist ein zwar nicht zwangsläufiges, aber doch konsequentes Glied in einer Entwicklung, die um 1970 begann und heute einen erheblichen Teil der germanistischen Linguistik prägt. Es ist schon der Mühe wert, diese Entwicklung nachzuzeichnen. Dabei liegen drei Dimensionen nahe: Sprachtheorie, grammatische Beschreibungen und Wörterbücher.
Die Bibliografie des Projekts "Deutsch in Russland" enthält 359 Titel, von denen zwei Drittel auf Russisch sind. Die Inhalte der meisten russischsprachigen Veröffentlichungen werden im Text der Bibliografie kurz zusammengefasst. In der Einführung finden sich einige Anmerkungen zum Forschungsstand nach 1990 und eine Beschreibung der Titelinhalte.
Este artigo desenvolve sete teses acerca do conceito de coerência e de outros conceitos básicos da análise do discurso e da lingüística textual. Na primeira parte, inicia-se com algumas observações históricas acerca das noções de texto, discurso e comunicação. Na segunda parte, discute as relações entre coerência e coesão, intertextualidade e polifonia, bem como entre coerência e intertextualidade; define coesão como um tipo especial de coerência e polifonia como um tipo especial de intertextualidade e argumenta que as noções clássicas de coerência e intertextualidade representam perspectivas opostas dentro da lingüística textual. Na Terceira parte, busca uma redefinição de coerência que possa explicar esse conceito simultaneamente para o discurso, a cognição e o texto. Descarta as definições de coerência como resultado da constituição de sentido e como estado-alvo estável de um sistema e propõe sua definição como relativa uniformidade local de um sistema, segundo parâmetros considerados relevantes pelo observador. No último item, postula que coerência e incoerência são igualmente necessários dentro de qualquer sistema natural para garantir sua evolução histórica.
In this paper the authors briefly outline editing functions which use methods from computational linguistics and take the structures of natural languages into consideration. Such functions could reduce errors and better support writers in realizing their communicative goals. However, linguistic methods have limits, and there are various aspects software developers have to take into account to avoid creating a solution looking for a problem: Language-aware functions could be powerful tools for writers, but writers must not be forced to adapt to their tools.
In English and French relational adjectives occurring in construction with deverbal nominalizations can be thematically associated with subject as well as object arguments. By contrast, in German object-related readings of relational adjectives seem to be inadmissible. The greater flexibility of English and French in terms of the thematic interpretability of relational adjectives also shows up with respect to "circumstantial" thematic roles like directionals, locatives and instrumentals. It is arguably due to the common Latin heritage of English and French, since in Latin relational adjectives representing subject or object arguments of nominalizations are widely attested. However, even in English and French object-related readings are confined to result nominalizations, a restriction we suggest to account for in terms of the more "noun-like" character of result nominalizations in contrast to process nominalizations. Moreover, since argument-related interpretations of relational adjectives can always be overridden by appropriate agentive/ patientive phrases, relational adjectives cannot be analyzed as occupying an argument position, but rather as modifying the semantic role associated with it.
COSMAS II
(2008)
One problem of data-driven answer extraction in open-domain factoid question answering is that the class distribution of labeled training data is fairly imbalanced. In an ordinary training set, there are far more incorrect answers than correct answers. The class-imbalance is, thus, inherent to the classification task. It has a deteriorating effect on the performance of classifiers trained by standard machine learning algorithms. They usually have a heavy bias towards the majority class, i.e. the class which occurs most often in the training set. In this paper, we propose a method to tackle class imbalance by applying some form of cost-sensitive learning which is preferable to sampling. We present a simple but effective way of estimating the misclassification costs on the basis of class distribution. This approach offers three benefits. Firstly, it maintains the distribution of the classes of the labeled training data. Secondly, this form of meta-learning can be applied to a wide range of common learning algorithms. Thirdly, this approach can be easily implemented with the help of state-of-the-art machine learning software.
The authors describe two data sets submitted to the database of MWE evaluation resources: (1) cranberry expressions in English and (2) cranberry expressions in German. The first package contains a collection of 444 cranberry words in German (CWde.txt) and a collection of the corresponding cranberry expressions (CCde.txt). The second package consists of a collection of 77 cranberry words in English (CWen.txt) and a collection of the corresponding cranberry expressions (CCen.txt). The data included in these packages was extracted from the Collection of Distributionally Idiosyncratic Items (CoDII), an electronic linguistic resource of lexical items with idiosyncratic occurrence patterns. Each package contains a readme file, and can be downloaded from multiword.wiki.sourceforge.net/Resources.
ANW und elexiko repräsentieren eine neue Generation von wissenschaftlichen elektronischen (Online-)
Wörterbüchern: sie sind keine digitalisierten Klone von schon existierenden Printwörterbüchern, sondern werden inhaltlich neu und mit voller Berücksichtigung der Möglichkeiten des neuen Mediums realisiert. In diesem Beitrag werden zuerst pauschal einige wichtige Parallelen und Unterschiede zwischen dem ANW und elexiko beleuchtet. Anschließend wird der substanzielle Unterschied in den Suchoptionen eingehend behandelt. Elexiko hantiert mit dem Unterschied „einfache Suche“ neben „Expertensuche“ – ein bekanntes System. Das ANW hat ein eigenes, neues System mit den folgenden Suchmöglichkeiten entwickelt: Suche nach Information zu einem Wort, Suche nach einem Wort (von der Bedeutung aus), Suche nach Wörtern (auf Grund eines oder mehrerer gemeinschaftlicher Merkmale), Suche nach Beispielen mit gemeinsamen Merkmalen und Suche nach Information über das Wörterbuch selbst. In den onomasiologischen Suchformen, die vom Inhalt zum Wort führen, spielt das „Semagramm“, die Darstellung von Kenntnis, die mit einem Wort zu verbinden ist, in einem Rahmen mit „Slots“ und „Fillern“ eine substanzielle Rolle. Das Semagramm ist eine weitere Erneuerung des ANW.
Mit dieser Auswahl von 21 Beiträgen Manfred W. Hellmanns zum sprachlichen Ost-West-Problem wird der interessierten Öffentlichkeit ein umfassender und fundierter Überblick über einen spannenden Aspekt der deutschen Nachkriegsentwicklung gegeben. Sowohl die sprachlichen Differenzen im geteilten Deutschland als auch der Sprachgebrauch während und nach der Wende bis in die jüngste Zeit sind Gegenstand dieser methodisch wie thematisch maßstabsetzenden Untersuchungen aus 35 Jahren.
Das KLASSIKERWÖRTERBUCH ist ein in allen lexikographischen Arbeitsschritten digital erstelltes historisches Wörterbuch zur heute nicht mehr unmittelbar verständlichen Lexik in der „klassischen“ deutschen Dichtung des 18. und 19. Jahrhunderts. Als semantisches „Differenzwörterbuch“ behandelt es die lexikalischen Einheiten, die gegenüber dem heutigen Bedeutungswissen eine Änderung in der Semantik und/oder der Verwendung erfahren haben. Grundsätze der Korpusbestimmung, der Lemmaauswahl usw. wurden bereits an anderer Stelle ausführlich erläutert (Knoop/Brückner 2003). Auch eine Beschreibung von Mikrostrukturen im KLASSIKERWÖRTERBUCH liegt vor (Brückner 2004). Der vorliegende Beitrag ergänzt die bisherigen Veröffentlichungen durch eine typologische Einordnung des KLASSIKERWÖRTERBUCHs und seiner Konzeption in die deutsche Wörterbuchlandschaft. Dabei ist es nicht das Ziel, eine allgemeingültige Einteilung vorzunehmen oder jeden erwähnten Wörterbuchtyp in seinen eigenen Besonderheiten vollständig und angemessen darzustellen, sondern darum, durch den Vergleich mit anderen existierenden oder denkbaren Wörterbüchern das Konzept des KLASSIKERWÖRTERBUCHs deutlicher hervortreten zu lassen.
Der folgende Beitrag beschreibt das OWID-Modul zum Schulddiskurs 1945-1955, das aus einem von der DFG geförderten Projekt hervorgegangen ist und dessen Ergebnisse in Kämper (2005) ausführlich dargestellt sind. Das OWID-Modul „Diskurswörterbuch“ ist die Online-Version des Wörterbuchs zum Schulddiskurs (vgl. Kämper 2006. Erläutert wird der dem Wörterbuchtyp zugrunde gelegte Diskursbegriff und es wird dargestellt, inwiefern lexikalische Serialität Gegenstand des Wörterbuchs ist. Anschließend wird die besondere Struktur eines Diskurswortschatzes problematisiert, aus der als Aufgabe eines Diskurswörterbuchs die Darstellung begrifflich-
semantischer Bezugsrelationen des Wortbestands resultiert. Die Darstellung der äußeren Zugriffsstrukturen, der Artikelstrukturen, der Datendistribution und Verweise sowie Hinweise zur Benutzung werden dann exemplifiziert.
Data and transcription
(2008)
Im Teilprojekt CI “SemDok” der DFG-Forschergruppe Texttechnologische Informationsmodellierung wurde ein Textparser für Diskursstrukturen wissenschaftlicher Zeitschriftenartikel nach der Rhetorical Structure Theory entwickelt. Die wesentlichen konzeptuellen und technischen Merkmale des Chart-Parsers und die sich daraus ergebenden Parametrisierungsmöglichkeiten für Parsing-Experimente werden beschrieben. Zudem wird HPVtz., ein Tool für die Visualisierung von Parsing-Ergebnissen (RST-Bäume in einer XML-Anwendung) und die Navigation in ihnen, vorgestellt.
Im Deutschen und anderen europäischen Sprachen können Demonstrativa das Antezedens von Relativsätzen bilden oder als Determinator eines solchen Antezedens fungieren. Konstruktionen dieser Art weisen Besonderheiten in Bezug auf Form und Bedeutung auf: Einerseits finden sich Demonstrativa, die nicht oder nur marginal mit appositiven Relativsätzen kombiniert werden können, andererseits solche, die entweder keine restriktiven Relativsätze zulassen oder sich mit diesen nur in speziellen, nichtdeiktischen und nichtphorischen Bedeutungen kombinieren lassen. Zumindest einige dieser Besonderheiten scheinen auf allgemeinere, sprachübergreifende Beschränkungen hinzuweisen. So zeigt sich tendenziell, dass die Kombinierbarkeit von Demonstrativa mit restriktiven Relativsätzen mit der deiktischen Stärke des Demonstrativums korreliert: Distanzmarkierende und in diesem Sinn deiktisch starke Demonstrativa schließen restriktive Relativsätze tendenziell aus, während distanzneutrale oder nichtdeiktisch verwendbare Demonstrativa sie in der Regel zulassen. Beschränkungen dieser Art werden anhand des Deutschen, Französischen und Schwedischen aufgezeigt.
Im vorliegenden Beitrag soll der Aufbau einer maßgeschneiderten XML-Modellierung für ein Wörterbuchnetz erläutert werden. Diese Schriftfassung beruht auf einem gleichlautenden
Vortrag, der auf dem ersten Arbeitstreffen des DFG-Netzwerks „Internetlexikografie“ in
Mannheim im Mai 2011 gehalten wurde. Der Beitrag ist als Werkstattbericht zu verstehen,
d. h. als praktisch orientierter Blick sowohl darauf, wie wir unsere Modellierung für OWID
konzipiert haben, welche Konsequenzen dies für die lexikographische Arbeit sowie für die
Recherchemöglichkeiten der Nutzer hat, als auch darauf, welche Vor- und Nachteile wir bei
diesem Modellierungsansatz sehen. Der vorliegende Beitrag bietet damit keine umfassende
theoretische Auseinandersetzung mit verschiedenen Möglichkeiten der Modellierung. Lediglich
im folgenden Kapitel werden die Grundzüge des Modellierungsansatzes kurz erläutert
und es wird auf entsprechende weiterführende projektbezogene Literatur verwiesen.
Dass man den Wald vor lauter Bäumen nicht sehe, das ist eine der gängigsten Redewendungen um das Substantiv Wald, dessen heutigem Gebrauch in den folgenden Ausführungen nachgegangen werden soll. Aber nicht nur das: Auch sein Sinn scheint für unser Thema ganz einschlägig zu sein, es ist nicht leicht, dieses vielfältige Verwendungsbild rund um dieses Wort auf einen einfachen Nenner zu bringen. So manches läuft durcheinander in der Geschichte seines Gebrauchs und spiegelt sich in den heutigen Verwendungen.
Der, die oder das Nutella
(2008)
Der, die, das wird traditionell als Demonstrativpronomen eingestuft, obwohl es besonders in der gesprochenen Sprache zum Ausdruck der Referenz auf dritte Personen mit dem Personalpronomen er, sie, es in komplementärer Distribution auftritt. Im Beitrag wird das Verhältnis zwischen der und er zunächst auf dem Hintergrund anderer europäischer Sprachen kontrastiv untersucht. Anschließend wird die Frage der Didaktisierung aufgeworfen: an einem konkreten Beispiel wird gezeigt, wie man Deutschlernende auf den Gebrauch von der als Personalpronomen aufmerksam machen kann.
Sie ist schon ein erstaunliches Phänomen, die Sprache, bedenkt man, dass es auch ohne Einfluss einer steuernden Instanz so etwas wie Standarddeutsch gibt und die deutsche Sprache nicht in unzählige Variationen und Varietäten auseinanderdriftet. Die Verwunderung über den Zusammenhalt der Sprache ließ sich auch im Laufe der diesjährigen Jahrestagung des IDS immer wieder vernehmen, die unter dem Motto „Deutsche Grammatik. Regeln, Normen, Sprachgebrauch“ vom 11. bis 13. März 2008 im neugestalteten Rosengarten in Mannheim stattfand. Da man auf einer wissenschaftlichen Tagung beim Wundern nicht stehen bleibt, versuchten die versammelten Linguistinnen und Linguisten, der Natur von sprachlichen Regeln und Normen erklärend auf die Spur zu kommen. Wie entstehen sprachliche Normen? Welche Faktoren entscheiden, dass manche der neuen grammatischen Formen sich durchsetzen und zur Norm werden und andere nicht? Welche Bedeutung hat Sprachnormierung in verschiedenen gesellschaftlichen Bereichen wie Schule, Wirtschaft oder Recht? Und nicht zuletzt: Wie kann das grammatische Regelsystem erfasst werden?
Die "türkischen Powergirls". Lebenswelt und kommunikativer Stil einer Migrantinnengruppe in Mannheim
(2008)
Die ethnografisch-soziostilistische Fallstudie bietet einen umfassenden Einblick in die Lebenswelt, die sozialen Orientierungen und das Ausdrucksverhalten junger Migrantinnen in Mannheim, die sich "türkische Powergirls" nennen.
Die ethnografische Beschreibung des Migrantenstadtteils bildet den Rahmen für die Rekonstruktion des Entwicklungsprozesses von der ethnischen Jugendclique zu einer Gruppe sozial erfolgreicher junger Frauen. Dieser Prozess ist typisch für junge Migrantinnen in Deutschland, die in Auseinandersetzung mit relevanten Bezugswelten, der Welt der türkischen Gemeinschaft und der Welt der deutschen (Bildungs-)Institutionen, einen eigenständigen Weg zu finden versuchen. Das Selbstbild, das die Mädchen in diesem Prozess entwickeln, bildet die Bezugsgröße für ihren Kommunikationsstil.
Der zentrale Teil des Buches beschreibt diesen Stil, den derb-drastischen Umgangston, den schnellen Wechsel zwischen Deutsch und Türkisch und den virtuosen Gebrauch verschiedener Varietäten zum symbolischen Verweis auf soziale Kategorien, und zeigt, wie sich der Stil im Prozess des Erwachsenwerdens und in Reaktion auf neue Lebensumstände und (Bildungs-)Anforderungen allmählich verändert.
In der „Nacherstposition“ zwischen einer Vorfeldkonstituente und dem Finitum können im Deutschen bestimmte unflektierbare Einheiten (wie allerdings, wiederum, also, nun, nämlich, beispielsweise) auftreten, die sich anders als Fokuspartikeln verhalten. Es handelt sich um Adverbkonnektoren, die neben ihrer relationierenden Funktion in dieser - und nur in dieser - Position die informationsstrukturelle Aufgabe der Topikwechselmarkierung übernehmen. Nur eine kleine Klasse skalierender Einheiten - die typischen Stiefkinder der Fokuspartikelforschung {zumindest, höchstens, wenigstens u. a.) - kann hier alternativ Topik und Fokus markieren. Mit ihrer spezifischen Form-Funktions-Korrelation stellt die Nacherstposition von Adverbkonnektoren eine nicht zur Gänze kompositional erschließbare „Konstruktion“ im konstruktionsgrammatischen Sinne dar.
Das Institut für Deutsche Sprache ist eines der Gründungsmitglieder der „Europäischen Föderation nationaler Sprachinstitutionen", zu der die Sprachakademien und zentralen Sprachinstitute aus den Staaten der Europäischen Union gehören. Sie wird meist abkürzend E1N1I genannt mit dem Akronym ihres englischen Namens: „European Federation of National Institutions for Language“ (Näheres unter <www.efnil.org>). Auf ihrer Jahreskonferenz in Riga 2007 beschloss die Generalversammlung von EFNIL eine Resolution, die den sprachpolitisch zuständigen Stellen der EU und der Mitgliedsstaaten vorgelegt worden ist. Sie liegt inzwischen in allen 23 offiziellen Sprachen der Union vor. Der Beitrag gibt die deutsche Fassung wieder.
Digital Text Collections, Linguistic Research Data, and Mashups: Notes on the Legal Situation
(2008)
Comprehensive data repositories are an essential part of practically all research carried out in the digital humanities nowadays. For example, library science, literary studies, and computational and corpus linguistics strongly depend on online archives that are highly sustainable and that contain not only digitized texts but also audio and video data as well as additional information such as metadata and arbitrary annotations. Current Web technologies, especially those that are related to what is commonly referred to as the Web 2.0, provide a number of novel functions such as multiuser editing or the inclusion of third-party content and applications that are also highly attractive for research applications in the areas mentioned above. Hand in hand with this development goes a high degree of legal uncertainty. The special nature of the data entails that, in quite a few cases, there are multiple holders of personal rights (mostly copyright) to different layers of data that often have different origins. This article discusses the legal problems of multiple authorships in private, commercial, and research environments. We also introduce significant differences between European and U.S. law with regard to the handling of this kind of data for scientific purposes.
This work proposes opinion frames as a representation of discourse-level associations which arise from related opinion topics. We illustrate how opinion frames help gather more information and also assist disambiguation. Finally we present the results of our experiments to detect these associations.
This work proposes opinion frames as a representation of discourse-level associations that arise from related opinion targets and which are common in task-oriented meeting dialogs. We define the opinion frames and explain their interpretation. Additionally we present an annotation scheme that realizes the opinion frames and via human annotation studies, we show that these can be reliably identified.
Discourse metaphors
(2008)
The article introduces the notion of discourse metaphor, relatively stable metaphorical mappings that function as a key framing device within a particular discourse over a certain period of time. Discourse metaphors are illustrated by case studies from three lines of research: on the cultural imprint of metaphors, on the negotiation of metaphors and on cross-linguistic occurrence. The source concepts of discourse metaphors refer to phenomenologically salient real or fictitious objects that are part of interactional space (i.e., can be pointed at, like MACHINES or HOUSES) and/or occupy an important place in cultural imagination. Discourse metaphors change both over time and across the discourses where they are used. The implications of focussing on different types of source domains for our thinking about the embodiment and sociocultural situatedness of metaphor is discussed, with particular reference to recent developments in Conceptual Metaphor Theory. Research on discourse suggests that situatedness is a crucial factor in the functioning and dynamics of metaphor.
Diskurswörterbuch
(2008)
After a brief discussion on the term discourse, discourse will be related to the tasks o f a discourse dictionary. The paper goes on developing the subject of discourse lexicography, which is a lexicographic presentation of discourse vocabulary, of the net of its semantic relations, and of the societal and historical circumstances of the usage people have made of it. This background will be useful for the presentation of two types of discourse dictionaries. On the one hand, they are based on the same primary conception. On the other hand, they are adapted to the respective discourse constellations, The first example is the result of a project on the early post-war period and presents the already-existing discourse dictionary of this project. The content of this dictionary is the vocabulary of three different groups, which participate in one discourse and specifically represent its main item. Since this dictionary also exists in electronic version, this concept will be proved by examples taken out of this version. The second example refers to a project running on the 1967/68 protest period. The vocabulary of this discourse makes up a set of several single discourse items, while these items constitute the leading subject of the discourse of 1967/68: democracy. Thus, the task of the lexicographic description o f a complex discourse like this is not at least: to assign the discourse vocabulary to the single discourses and to describe the different usages relating to these single discourses. The paper ends with a draft o f a lexicographic program based on the type discourse dictionary
E-VALBU: Advanced SQL/XML processing of dictionary data using an object-relational XML database
(2008)
Contemporary practical lexicography uses a wide range of advanced technological aids,most prominently database systems for the administration of dictionary content. Since XML has become a de facto standard for the coding of lexicographic articles, integrated markup functionality – such as query, update, or transformation of instances – is of particular importance. Even the multi-channel distribution of dictionary data benefits from powerful XML database services. Exemplified by E-VALBU, the most comprehensive electronic dictionary on German verb valency, we outline an integrated approach for advanced XML storing and processing within an object-relational database, and for a public retrieval frontend using Web Services and AJAX technology.
Es wird ein Überblick gegeben über den sprachenpolitischen Hintergrund, die Vorgeschichte, die Gründung, die Ziele und Aktivitäten von EFNIL, der European Federation of National Institutions for Language, also der Europäischen Föderation Nationaler Sprachinstitutionen. Sie ist eine Netzwerkorganisation, zu der sich im Jahr 2003 Sprachakademien und zentrale Sprachinstitute aus den Ländern der Europäischen Union verbunden haben mit der Aufgabe, zur Erhaltung und Weiterentwicklung der sprachlichen Vielfalt in Europa beizutragen. Sie konzentriert dabei ihre Aufmerksamkeit und Aktivitäten auf die Hochsprachen in den Staaten der Europäischen Union.
Einleitung
(2008)
Einleitung
(2008)
Einleitung
(2008)
Ziel des folgenden Beitrags ist eine vergleichende Gegenüberstellung der elektronischen Wörterbücher
ELDIT („Elektronisches Lernerwörterbuch Deutsch-Italienisch“) und elexiko. Im Mittelpunkt der Darstellung stehen ein allgemeiner Überblick und die Beschreibungen der beiden Benutzerschnittstellen mit entsprechenden Hintergrundinformationen sowie ein technischer Vergleich der beiden Systeme in tabellarischer Form. Die Synopse zeigt, dass beide Wörterbücher einerseits eine Reihe von Gemeinsamkeiten aufweisen, die unter anderem in der modularen Struktur und im Zugang zu einzelnen Angabeklassen, aber auch in den eingesetzten Technologien und der Hypermedianutzung bestehen, andererseits unterscheiden sie sich wesentlich voneinander. Aus den möglichen Konstellationen verschiedener Parameter (Adressat, Fachgebiet, Zweck/Benutzungssituation, Medium) ergeben sich nämlich jeweils spezifische Anforderungen, die eine differenzierte Ausgestaltung nicht nur dieser, sondern ein- oder mehrsprachiger Benutzerschnittstellen im Allgemeinen auf mehreren Ebenen nötig machen.
In diesem Beitrag werden wichtige Neukonzeptionen und umfangreiche Nachbearbeitungen einzelner
Angabebereiche in elexiko erläutert. Die linguistische Konzeption dieser Angaben stellt eine Weiterentwicklung gegenüber der Konzeption dar, wie sie im Band „Grundfragen der elektronischen Lexikographie. elexiko – das Online-Informationssystem zum deutschen Wortschatz“ (2005) vorgelegt wurde. Betroffen sind z.B. die Angabebereiche der typischen Verwendungen, der sinn- und sachverwandten Wörter und der Besonderheiten des Gebrauchs.
elexiko ist ein Online-Wörterbuch zum Gegenwartsdeutschen, das korpusbasiert und modular erarbeitet wird. Ein Schwerpunkt liegt dabei auf der ausführlichen korpusbasierten Beschreibung der Bedeutung und Verwendung sprachlicher Ausdrücke sowie ihrer Vernetzung untereinander. Die Präsentation des Wörterbuchs soll insbesondere zeigen, wie Korpusdaten in den Wortartikeln aufbereitet werden und wie elexiko genutzt werden kann, um lexikalisches Wissen in verschiedenen Benutzungssituationen aus den Wortartikeln zu gewinnen.
Emotionale Kommunikation
(2008)
This article examines the interrelation between communicative behavior and emotion. First, it clarifies the notions of emotion as a concept (section 2) and the concept of communication (section 3). Then, it outlines the need to develop a model for emotions in communicative interaction (section 4). The interrelation between communicative behavior and emotion is interdependent — on the one hand, communicative behavior can influence a person’s own emotions and those of another person and, on the other hand, emotions can affect a person’s own and another person’s communicative behavior (section 5).
Electronic corpora play an ever growing role in lexicography. On the one hand, new access to linguistic usage is made possible through the use of text corpora and intelligent corpus-based query tools; however, the final results are still interpreted and described by lexicographers. In this case corpora are used for data acquisition. On the other hand, there are also projects that provide purely automatically acquired data in the form of "dictionaries". Lexicographers play only a minor role here. This latter type of corpus use creates a completely new kind of electronic dictionary. This article addresses the questions as to what extent these dictionaries differ from lexicographic tradition and whether they must be considered in metalexicography. Starting from previously compiled electronic dictionary typologies, we try to supplement the formulation of lexicographic data as a distinguishing feature. Finally, based on the findings of the project elexiko (Institute for the German Language - IDS), we demonstrate that the distinction between electronic versus man-made lexicographic data is also relevant to lexicographical practice.
EuroGr@mm
(2008)
Europäische Hochsprachen in der Klemme. Zwischen globalem Englisch, Dialekten und Regionalsprachen
(2008)
Starting from declarations of the EU, the value of European languages and their diversity according to their different territorial, social, and legal extensions are discussed. The Standard varieties of the various languages are emphasized as being especially important for national and European language policies and for individual language cultivation. They contributed and may continue to contribute more than other language varieties to the cultural wealth of Europe. On the other hand, their development is especially impaired by the increasing use of ‘global' English. The increasing tendency toward a diaglossia (English plus one other language) and the use of languages within the institutions of the EU are discussed. In conclusion, it is argued that although tolerance is necessary, it is not sufficient for a thriving further development of the European linguistic diversity.
As many popular text genres such as blogs or news contain opinions by multiple sources and about multiple targets, finding the sources and targets of subjective expressions becomes an important sub-task for automatic opinion analysis systems. We argue that while automatic semantic role labeling systems (ASRL) have an important contribution to make, they cannot solve the problem for all cases. Based on the experience of manually annotating opinions, sources, and targets in various genres, we present linguistic phenomena that require knowledge beyond that of ASRL systems. In particular, we address issues relating to the attribution of opinions to sources; sources and targets that are realized as zero-forms; and inferred opinions. We also discuss in some depth that for arguing attitudes we need to be able to recover propositions and not only argued-about entities. A recurrent theme of the discussion is that close attention to specific discourse contexts is needed to identify sources and targets correctly.
This paper is a project report of the lexicographic Internet portal OWID, an Online Vocabulary Information System of German which is being built at the Institute of German Language in Mannheim (IDS). Overall, the contents of the portal and its technical approaches will be presented. The lexical database is structured in a granular way which allows to extend possible search options for lexicographers. Against the background of current research on using electronic dictionaries, the project OWID is also working on first ideas of useradapted access and user-adapted views of the lexicographic data. Due to the fact that the portal OWID comprises dictionaries which are available online it is possible to change the design and functions of the website easily (in comparison to printed dictionaries). Ideas of implementing user-adapted views of the lexicographic data will be demonstrated by using an example taken from one of the dictionaries of the portal, namely elexiko.
In this paper, we present a suite of flexible UIMA-based components for information retrieval research which have been successfully used (and re-used) in several projects in different application domains. Implementing the whole system as UIMA components is beneficial for configuration management, component reuse, implementation costs, analysis and visualization.
The multiple gradations of German strong verbs are but manifestations of a rather uncomplicated system. There is a small number of ways to make up ablaut forms; these types of formation are identifiable in formal terms and, what is more, they have definite functions as morphological markers. Using classifications of stem forms according to quality, complexity and quantity of vowels, three types of operations involved in ablaut formation are identified. Ablaut always includes a change of quality type or a change of complexity type, and in addition it may include a change of quantity type. Ablaut forms are clearly distinguished as against bases (and against each other): their vocalism meets a defined standard of dissimilarity. On this basis, gradations are collected into inflectional classes that are defined in strictly synchronic terms. These classes continue the historical seven classes known from reference grammars. For the majority of strong verbs, membership in these classes (and thus ablaut) is predictable.
Nachschlagewerke sind aufgrund ihres primären Verwendungszweckes, Informationen schnell und gezielt
zu finden, auf vielfältige Art aufeinander bezogen und damit bereits in der gedruckten Fassung in
gewisser Weise sowohl explizit als auch implizit vernetzt angelegt. Im Falle elektronischer Nachschlagewerke lassen sich diese „Netzwerke“ zusätzlich ausweiten, indem auch Beziehungen zwischen Informationseinheiten etabliert werden können, die in der gedruckten Fassung, beispielsweise aufgrund der Entstehungsgeschichte der Einzelwerke, bisher gar nicht möglich waren. Diese Vernetzungen können weit über eine rein ausdrucksseitige Verknüpfung hinaus, indem sie philologische und informationswissenschaftliche Methoden verbinden. Im Folgenden werden die Wörterbuchverbünde OWID und Wörterbuchnetz vorgestellt und insbesondere auf das darin enthaltene Vernetzungspotential eingegangen. Neben den in beiden Ansätzen vorhandenen expliziten Verweise zwischen den Wortartikeln werden für das Trierer Wörterbuchnetz zusätzlich automatische Verfahren und Methoden aufgezeigt, mit deren Hilfe bisher nur implizit gegebene Beziehungen zwischen den Wortartikeln ermittelt und zur Überprüfung vorgeschlagen werden können.
The thesis describes a fully automatic system for the resolution of the pronouns 'it', 'this', and 'that' in English unrestricted multi-party dialog. Referential relations considered include both normal NP-antecedence as well as discourse-deictic pronouns. The thesis contains a theoretical part with a comprehensive empiricial study, and a practical part describing machine learning experiments.
In usage-based Construction Grammar, grammatical structure is assumed to ‘sedimenl’ from concrete linguistic experience as an automatic by-product o f repeated similar categorisation judgments (a process known as schematisation). At the same time, there is functional pressure on prospective inputs to such schematisations to retain or develop specialised properties that differentiate them from their near neighbours, i.e. other stored units in the constructicon (Goldberg: 1995). Moreover, Speakers are not assumed to necessarily extract all possible generalisations from their input. Using the example o f a group of German support verb constructions, the present study outlines a corpus-linguistic approach to identifying those Schemas that really seem to be formed by Speakers, and how they can be kept apart from mere potential generalisations.
The research project “German Today” aims to determine the amount of regional variation in (near-)standard German spoken by young and older educated adults and to identify and locate regional features. To this end, we compile an areally extensive corpus of read and spontaneous German speech. Secondary school students and 50-to-60-year-old locals are recorded in 160 cities throughout the German speaking area of Europe. All participants read a number of short texts and a word list, name pictures, translate words and sentences from English, answer questions in a sociobiographic interview, and take part in a map task experiment. The resulting corpus comprises over 1000 hours of speech, which is transcribed orthographically. Automatically derived broad phonetic transcriptions, selective manual narrow phonetic transcriptions, and variationalist annotations are added. Focussing on phonetic variation we aim to show to what extent national or regional standards exist in spoken German. Furthermore, the linguistic variation due to different contextual styles (read vs. spontaneous speech) shall be analysed. Finally, the corpus enables us to investigate whether linguistic change has occurred in spoken (near-)standard German.
In literalen Gesellschaften umfasst das Sprachvermögen sowohl das Sprechen wie auch das Schreiben. Dies gilt für die Muttersprache ebenso wie für Fremdsprachen. Sprechen und Schreiben sind dabei recht unterschiedliche Tätigkeiten, so dass zu erwarten wäre, dass sie im Fremdsprachen- wie auch im DaF-Unterricht zu gleichen Anteilen berücksichtigt werden. Die Unterrichtspraxis zeigt jedoch, dass die Schriftsprache dominant vertreten ist und die gesprochene Sprache ein Schattendasein führt. In diesem Beitrag benenne ich fünf Gründe, warum die gesprochene Sprache in dieser Weise im Hintergrund steht und ein sperriger, schwer zu handhabender Gegenstand ist (Abschnitt 2). Im Anschluss versuche ich zu verdeutlichen, wie weitreichend die Unterschiede zwischen gesprochener und geschriebener Sprache sind (Abschnitt 3). Abschließend formuliere ich einige Konsequenzen, die sich hieraus für den Fremdsprachen- und DaF-Unterricht ergeben, und plädiere dafür, sich die Schwierigkeiten, die mit einer Berücksichtigung der gesprochenen Sprache verbunden sind, bewusst zu machen und sich ihnen zu stellen, denn gesprochene Sprache ist m.E.ein unverzichtbarer Bestandteil des fremdsprachlichen Unterrichts.
Gespräche mit Patienten. Ein alltägliches und komplexes Arbeits- und Steuerungsinstrument für Ärzte
(2008)
Grenzgängereien
(2008)
Dieses Handbuch bietet ausführliche und aktuelle Informationen über die gegenwärtige Situation der deutschsprachigen Minderheiten in den Ländern Mittel- und Osteuropas. Dabei werden in einer Zusammenschau sowohl die Sprachinselminderheiten als auch die Minderheiten an den Rändern des geschlossenen deutschen Sprachgebiets in den Blick genommen. In sieben Länderartikeln wird jeweils ein Überblick über Demographie, Geschichte sowie politische und rechtliche Lage der Minderheiten gegeben. Auf der Basis neuer, eigener Erhebungen wird für jedes Land eine Dokumentation der Kompetenz- und Sprachgebrauchssituation, eine Beschreibung und Analyse der soziolinguistischen Situation mit ihren je spezifischen Standard-Substandard-Verteilungen und eine Untersuchung der Spracheinstellungen der Sprecher geboten.