Refine
Year of publication
Document Type
- Part of a Book (4500)
- Article (2966)
- Book (996)
- Conference Proceeding (688)
- Part of Periodical (308)
- Review (257)
- Other (151)
- Working Paper (83)
- Doctoral Thesis (68)
- Report (35)
Language
- German (8078)
- English (1765)
- Russian (145)
- French (38)
- Multiple languages (22)
- Spanish (16)
- Portuguese (14)
- Italian (9)
- Polish (7)
- Ukrainian (5)
Keywords
- Deutsch (5140)
- Korpus <Linguistik> (940)
- Wörterbuch (605)
- Konversationsanalyse (451)
- Rezension (423)
- Grammatik (405)
- Rechtschreibung (374)
- Gesprochene Sprache (361)
- Sprachgebrauch (356)
- Interaktion (339)
Publicationstate
- Veröffentlichungsversion (3883)
- Zweitveröffentlichung (1642)
- Postprint (395)
- Preprint (10)
- Erstveröffentlichung (8)
- Ahead of Print (7)
- (Verlags)-Lektorat (4)
- Hybrides Open Access (2)
- Verlags-Lektorat (1)
- Verlagsveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (3836)
- Peer-Review (1596)
- Verlags-Lektorat (94)
- Peer-review (56)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (44)
- Review-Status-unbekannt (14)
- Peer-Revied (12)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (10)
- (Verlags-)Lektorat (9)
- Verlagslektorat (5)
Publisher
- de Gruyter (1334)
- Institut für Deutsche Sprache (1091)
- Schwann (638)
- Narr (484)
- Leibniz-Institut für Deutsche Sprache (IDS) (263)
- De Gruyter (245)
- Niemeyer (200)
- Lang (184)
- Narr Francke Attempto (170)
- IDS-Verlag (144)
Zur Terminologie-Situation im Grammatikunterricht der Schulen im deutschsprachigen Teil der Schweiz
(1987)
Transformationen des paracelsischen Prima-Materia-Begriffs in der "Philosophia ad Athenienses"
(2009)
Rescuing Legacy Data
(2008)
This paper discusses issues that arise in the transformation of electronic language data from outdated to modern, sustainable formats. We first describe the problem and then present four different cases in which corpora of spoken language were converted from legacy formats to an XML-based representation. For each of the four cases, we describe the conversion workflow and discuss the difficulties that we had to overcome. Based on this experience, we formulate some more general observations about transforming legacy data and conclude with a set of best practice recommendations for a more sustainable handling of language corpora.
This paper presents the results of a joint effort of a group of multimodality researchers and tool developers to improve the interoperability between several tools used for the annotation and analysis of multimodality. Each of the tools has specific strengths so that a variety of differ-ent tools, working on the same data, can be desirable for project work. However this usually re-quires tedious conversion between formats. We propose a common exchange format for multi-modal annotation, based on the annotation graph (AG) formalism, which is supported by import and export routines in the respective tools. In the current version of this format the common de-nominator information can be reliably exchanged between the tools, and additional information can be stored in a standardized way.
Sprache, Schrift, Rechtschreibung : Abläufe beim Lesen und Schreiben - was ist hier wie wichtig?
(1987)
Sprachkultur und Literatur
(1985)
Das Konzept,Textgrammatik' wird einer kritischen Prüfung unterzogen. Die Hypothese, für die argumentiert wird, ist, dass eine strikte Auslegung im Sinne der Annahme, Texte hätten eine spezifische Grammatik, wie Sätze eine spezifische Grammatik haben, nicht aufrecht erhalten werden kann. Grundlegende Eigenschaften, nämlich die Existenz eines hierarchisch aufgebauten Regelsystems, eine spezifische Form von Gegliedertheit und Formbezogenheit, sind anders als auf Satzebene beim Text nicht gegeben. Exemplarisch werden die Phänomene Anaphorik sowie, ausführlicher, Erscheinungsformen der Ellipse bzw. aus dem elliptischen Formenkreis diskutiert. Das Fazit ist: ,Textgrammatik‘ sollte - wenn überhaupt gebraucht - nur als Verweis auf die Textsensibilität der Satzgrammatik dienen.
Bericht über eine Akademie
(1985)
Die Dudenredaktion
(1985)
Time-based data models and the Text Encoding Initiative’s guidelines for transcription of speech
(2005)
This paper describes a new research initiative addressing the issue of sustainability of linguistic resources. This initiative is a cooperation between three linguistic collaborative research centres in Germany, which comprise more than 40 individual research projects altogether. These projects are involved in creating manifold language resources, especially corpora, tailored to their particular needs. The aim of the project described here is to ensure an effective and sustainable access of these data by third-party researchers beyond the termination of these projects. This goal involves a number of measures, such as the definition of a common data format to completely capture the heterogeneous information encoded in the individual corpora, the development of user-friendly and sustainably usable tools for processing (e.g. querying) the data, and the specification of common inventories of metadata and terminology. Moreover, the project aims at formulating general rules of best practice for creating, accessing, and archiving linguistic resources.
This paper describes a new research initiative addressing the issue of sustainability of linguistic resources. The initiative is a cooperation between three collaborative research centres in Germany – the SFB 441 “Linguistic Data Structures” in Tübingen, the SFB 538 “Multilingualism” in Hamburg, and the SFB 632 “Information Structure” in Potsdam/Berlin. The aim of the project is to develop methods for sustainable archiving of the diverse bodies of linguistic data used at the three sites. In the first half of the paper, the data handling solutions developed so far at the three centres are briefly introduced. This is followed by an assessment of their commonalities and differences and of what these entail for the work of the new joint initiative. The second part then sketches seven areas of open questions with respect to sustainable data handling and gives a more detailed account of two of them – integration of linguistic terminologies and development of best practice guidelines.
This paper presents ongoing work on a multilingual (English, French, German) lexical resource of soccer language. The first part describes how lexicographic descriptions based on frame-semantic principles are derived from a partially aligned multilingual corpus of soccer match reports. The remainder of the paper then discusses how different types of ontological knowledge are linked to this resource in order to provide an access structure to the resulting dictionary. It is argued that linking lexical resources and ontologies in such a way provides novel ways to a dictionary user of navigating a domain vocabulary
In this paper, the authors describe a semi-automated approach to refine the dictionary-entry structure of the digital version of the Wörterbuch der deutschen Gegenwartssprache (WDG, en.: Dictionary of Present-day German), a dictionary compiled and published between 1952 and 1977 by the Deutsche Akademie der Wissenschaften that comprises six volumes with over 4,500 pages containing more than 120,000 headwords. We discuss the benefits of such a refinement in the context of the dictionary project Digitales Wörterbuch der deutschen Sprache (DWDS, en: Digital Dictionary of the German language). In the current phase of the DWDS project, we aim to integrate multiple dictionary and corpus resources in German language into a digital lexical system (DLS). In this context, we plan to expand the current DWDS interface with several special purpose components, which are adaptive in the sense that they offer specialized data views and search mechanisms for different dictionary functions-e.g. text comprehension, text production-and different user groups-e.g. journalists, translators, linguistic researchers, computational linguists. One prerequisite for generating such data views is the selective access to the lexical items in the article structure of the dictionaries which are the object of study. For this purpose, the representation of the eWDG has to be refined. The focus of this paper is on the semiautomated approach used to transform eWDG into a refined version in which the main structural units can be explicitly accessed. We will show how this refinement opens new and flexible ways of visualizing and querying the lexicographic content of the refined version in the context of the DLS project.
Kicktionary
(2009)
This paper presents EXMARaLDA, a system for the computer-assisted creation and analysis of spoken
language corpora. The first part contains some general observations about technological and methodological requirements for doing corpus-based pragmatics. The second part explains the systems architecture and gives an overview of its most important software components a transcription editor, a corpus management tool and a corpus query tool. The last part presents some corpora which have been or are currently being compiled with the help of EXMARaLDA.
Spoken language corpora— as used in conversation analytic research, language acquisition studies and dialectology— pose a number of challenges that are rarely addressed by corpus linguistic methodology and technology. This paper starts by giving an overview of the most important methodological issues distinguishing spoken language corpus workfrom the work with written data. It then shows what technological challenges these methodological issues entail and demonstrates how they are dealt with in the architecture and tools of the EXMARaLDA system.
Sprechhandlungen der Nicht-Verständigung : Bemerkungen zu Gestalt und Leistung dialogischer Texte
(1973)
Textsorten und Soziolekte : Funktion und Reziprozität in gesprochener und geschriebener Sprache
(1973)
Studien zur Texttheorie und zur deutschen Grammatik : Festgabe für Hans Glinz zum 60. Geburtstag
(1973)
This paper presents FOLKER, an annotation tool developed for the efficient transcription of natural, multi-party interaction in a conversation analysis framework. FOLKER is being developed at the Institute for German Language in and for the FOLK project, whose aim is the construction of a large corpus of spoken present-day German, to be used for research and teaching purposes. FOLKER builds on the experience gained with multi-purpose annotation tools like ELAN and EXMARaLDA, but attempts to improve transcription efficiency by restricting and optimizing both data model and tool functionality to a single, well-defined purpose. This paper starts with a description of the GAT transcription conventions and the data model underlying the tool. It then gives an overview of the tool functionality and compares this functionality to that of other widely used tools.
This contribution addresses the workshop topic of “standardising policies within eHumanities infrastructures”. It relates 10 years of experience with language resource standards, gained in the development of EXMARaLDA, a system for the construction and exploitation of spoken language corpora. Section 2 gives an overview of the EXMARaLDA system focussing on its relationship with existing and evolving standards for language resources. Section 3 presents the HIAT system as an example of an established community practice. Section 4 then addresses several issues that where encountered when trying to bring together HIAT, EXMARaLDA and the wider standard world.
We give an overview of the content and the technical background of a number of corpora which were developed in various projects of the Research Centre on Multilingualism (SFB 538) between 1999 and 2011 and which are now made available to the scientific community via the Hamburg Centre for Language Corpora.
We present some recent and planned future developments in EXMARaLDA, a system for creating, managing, analysing and publishing spoken language corpora. The new functionality concerns the areas of transcription and annotation, corpus management, query mechanisms, interoperability and corpus deployment. Future work is planned in the areas of automatic annotation, standardisation and workflow management.
High word frequency and neighborhood density contribute to the accuracy and speed of word production in English adults (e.g., Vitevitch & Sommers 2003), and characterize early words in child English (e.g., Storkel 2004). The present study investigated a speech corpus of child German (ages 2;00-3;00) to further the understanding of the influence of frequency and density on production. Results for four children suggest that, contrary to English, words produced early are not from denser neighborhoods in an adult lexicon than later words. As in English, frequent words are produced before less frequent words. Implications on theory and methodology are discussed.
This paper formulates a proposal for standardising spoken language transcription, as practised in conversation analysis, sociolinguistics, dialectology and related fields, with the help of the TEI guidelines. Two areas relevant to standardisation are identified and discussed: first, the macro structure of transcriptions, as embodied in the data models and file formats of transcription tools such as ELAN, Praat or EXMARaLDA; second, the micro structure of transcriptions as embodied in transcription conventions such as CA, HIAT or GAT. A two-step process is described in which first the macro structure is represented in a generic TEI format based on elements defined in the P5 version of the Guidelines. In the second step, character data in this representation is parsed according to the regularities of a transcription convention resulting in a more fine-grained TEI markup which is also based on P5. It is argued that this two step process can, on the one hand, map idiosyncratic differences in tool formats and transcription conventions onto a unified representation. On the other hand, differences motivated by different theoretical decisions can be retained in a manner which still allows a common processing of data from different sources. In order to make the standard usable in practice, a conversion tool—TEI Drop—is presented which uses XSL transformations to carry out the conversion between different tool formats (CHAT, ELAN, EXMARaLDA, FOLKER and Transcriber) and the TEI representation of transcription macro structure (and vice versa) and which also provides methods for parsing the micro structure of transcriptions according to two different transcription conventions (HIAT and cGAT). Using this tool, transcribers can continue to work with software they are familiar with while still producing TEI-conformant transcription files. The paper concludes with a discussion of the work needed in order to establish the proposed standard. It is argued that both tool formats and the TEI guidelines are in a sufficiently mature state to serve as a basis for standardisation. Most work consequently remains in analysing and standardising differences between different transcription conventions.
In diesem Aufsatz geht es um die Datenbank ‚Mehrsprachigkeit’ und das System EXMARaLDA, die am SFB 538 ‚Mehrsprachigkeit’ der Universität Hamburg entwickelt werden. Da deren konzeptuelle und technische Details bereits an anderer Stelle ausführlich dargestellt worden sind (z.B. Schmidt 2004), soll der Schwerpunkt hier einerseits auf solchen Aspekten liegen, die – gemäß dem Thema des Workshops – mit allgemeineren Fragen zum Umgang mit computerverwertbaren, heterogenen linguistischen Datenbeständen zu tun haben. Andererseits soll versucht werden, aus den praktischen Erfahrungen der nunmehr vierjährigen Projektarbeit einige Erkenntnisse abzuleiten, die über den konkreten Projektzusammenhang hinaus für die weitere Arbeit auf diesem Gebiet interessant sein könnten.
Von Buchscanner bis WorldCat : die Bibliothek des Instituts für Deutsche Sprache stellt sich vor
(2010)
Streit : eine linguistische Untersuchung verbaler Interaktionen in alltäglichen Zusammenhängen
(1995)
Streitgespräche im Alltag, ihr Entstehen und ihre für die Akteure meist nicht kontrollierbare Dynamik sind Gegenstand dieser Arbeit. Der Autorin geht es darum, mit konversationsanalytischem Instrumentarium Mechanismen und Muster von Streitgesprächen aufzuzeigen und nachvollziehbar darzustellen. Nach der Präsentation der Untersuchungsmethode werden zwei authentische informelle Alltagsgespräche, in denen sich jeweils eine Frau und ein Mann miteinander streiten, untersucht. Dabei wird die analytische Darstellungsweise der Komplexität verbaler Interaktion gerecht: Die Verstrickungen von Beziehungsebene, Sachverhaltsebene und der handlungsschematischen Ebene können so sukzessive aufgezeigt werden und deren Niederschlag in der Streitdynamik verfolgt und beschrieben werden. Im dritten Teil der Arbeit folgt auf der Basis der vorangegangenen Analysen die Systematisierung wesentlicher Streitaktivitäten: Neben emotionalen Beteiligungsmanifestationen und Interaktionsblockaden der Gesprächsbeteiligten werden auch einzelne Streitphasen wie Eskalations- und Entspannungsphasen im Zusammenhang mit den sie bestimmenden Modalitäten dargestellt.
Gegenstand des Berichts sind Verwendungen der deutschen Konjunktion wenn in als "konzessiv" bezeichneten Satzverknüpfungen. Der Schwerpunkt liegt dabei auf der Kombination von wenn mit voraufgehendem oder nachfolgendem auch. Die Arbeit setzt sich das Ziel, den Nachweis zu führen, daß - entgegen der Darstellung in manchen Wörterbüchern und Grammatiken - die Konzessivität dieser wenn-Konstruktionen nicht aus einer Mehrdeutigkeit oder Zweigliedrigkeit der Konjunktion resultiert, sondern sich aus dem Zusammenspiel der Bedeutungen der verknüpften Sätze, der Gebrauchsbedingungen von wenn als Konditionalkonjunktion, der Gebrauchsbedingungen der Partikel auch und allgemeinen Prinzipien ableiten läßt. Nach einer Illustration konzessiver Interpretationen wird in einem theoretisch ausgerichteten Abschnitt der Begriff der Konzessivität auf der Grundlage aussagenlogischer Wahrheitsfunktionen bestimmt. Dabei wird das für ihn konstitutive Begriffspaar der (Diskurs-) Präsuppositionen und der Wahrheitsbedingungen - Bedeutung - erläutert. Anschließend wird auf den Begriff der Konditionalität als der angenommenen Invariante aller wenn-Konstruktionen eingegangen. Danach werden auch wenn- und wenn auch-Konstruktionen in ihren syntaktischen Varianten und Interpretationsmöglichkeiten beschrieben. Ein spezieller Abschnitt ist der Frage der Konzessivität von wenn schon-Konstruktionen gewidmet. Den Abschluß bilden Hypothesen über die Legitimierung einer konzessiven Interpretation von wenn-Konstruktionen.
Das in drei Teilen erschienene Wörterbuch enthält 602 Stichwörter unterschiedlichster Art, ausgewählt aus repräsentativen Jahrgangsquerschnitten der Welt und des Neuen Deutschland in der Zeit von 1949 bis 1974. Jedes Stichwort ist mit ausführlichen Sach- und Sinnerläuterungen und einer präzisen Analyse des Wortgebrauchs versehen, der durch eine Fülle von Verwendungsbeispielen belegt wird. Darüber hinaus werden in gesonderten Tabellen alle belegten Wortformen, Komposita und sonstigen Wortbildungen, auch Bedeutungen und Kollokationstypen in ihrer Häufigkeit nachgewiesen. So wird nicht nur die Entwicklung des öffentlichen Sprachgebrauchs in Ost und West exemplarisch sichtbar gemacht, auch die sprachlichen Eigenheiten zweier typischer Zeitungen aus den beiden deutschen Staaten sind damit dokumentiert. Eine wichtige Epoche der jüngsten deutschen Sprachgeschichte wird damit lexikographisch dokumentiert.
Das in drei Teilen erschienene Wörterbuch enthält 602 Stichwörter unterschiedlichster Art, ausgewählt aus repräsentativen Jahrgangsquerschnitten der Welt und des Neuen Deutschland in der Zeit von 1949 bis 1974. Jedes Stichwort ist mit ausführlichen Sach- und Sinnerläuterungen und einer präzisen Analyse des Wortgebrauchs versehen, der durch eine Fülle von Verwendungsbeispielen belegt wird. Darüber hinaus werden in gesonderten Tabellen alle belegten Wortformen, Komposita und sonstigen Wortbildungen, auch Bedeutungen und Kollokationstypen in ihrer Häufigkeit nachgewiesen. So wird nicht nur die Entwicklung des öffentlichen Sprachgebrauchs in Ost und West exemplarisch sichtbar gemacht, auch die sprachlichen Eigenheiten zweier typischer Zeitungen aus den beiden deutschen Staaten sind damit dokumentiert. Eine wichtige Epoche der jüngsten deutschen Sprachgeschichte wird damit lexikographisch dokumentiert.
Das in drei Teilen erschienene Wörterbuch enthält 602 Stichwörter unterschiedlichster Art, ausgewählt aus repräsentativen Jahrgangsquerschnitten der Welt und des Neuen Deutschland in der Zeit von 1949 bis 1974. Jedes Stichwort ist mit ausführlichen Sach- und Sinnerläuterungen und einer präzisen Analyse des Wortgebrauchs versehen, der durch eine Fülle von Verwendungsbeispielen belegt wird. Darüber hinaus werden in gesonderten Tabellen alle belegten Wortformen, Komposita und sonstigen Wortbildungen, auch Bedeutungen und Kollokationstypen in ihrer Häufigkeit nachgewiesen. So wird nicht nur die Entwicklung des öffentlichen Sprachgebrauchs in Ost und West exemplarisch sichtbar gemacht, auch die sprachlichen Eigenheiten zweier typischer Zeitungen aus den beiden deutschen Staaten sind damit dokumentiert. Eine wichtige Epoche der jüngsten deutschen Sprachgeschichte wird damit lexikographisch dokumentiert.