Refine
Year of publication
- 2002 (17) (remove)
Document Type
- Conference Proceeding (8)
- Article (6)
- Report (2)
- Review (1)
Has Fulltext
- yes (17)
Is part of the Bibliography
- no (17)
Keywords
- Korpus <Linguistik> (4)
- XML (4)
- Deutsch (3)
- Hypertext (3)
- Fachsprache (2)
- Hyperlink (2)
- Tagungsbericht (2)
- Terminologie (2)
- Wissenserwerb (2)
- API (1)
Publicationstate
- Veröffentlichungsversion (6)
- Zweitveröffentlichung (5)
- Postprint (4)
- Preprint (1)
Reviewstate
- Peer-Review (17) (remove)
Publisher
In this paper, we investigate the practical applicability of Co-Training for the task of building a classifier for reference resolution. We are concerned with the question if Co-Training can significantly reduce the amount of manual labeling work and still produce a classifier with an acceptable performance.
We describe a simple and efficient Java object model and application programming interface (API) for (possibly multi-modal) annotated natural language corpora. Corpora are represented as elements like Sentences, Turns, Utterances, Words, Gestures and Markables. The API allows linguists to access corpora in terms of these discourse-level elements, i.e. at a conceptual level they are familiar with, with the flexibility offered by a general purpose programming language. It is also a contribution to corpus standardization efforts because it is based on a straightforward and easily extensible data model which can serve as a target for conversion of different corpus formats.
Der Artikel beschreibt die Entwicklung eines sprachlichen Mythos, einer in Sprache entwickelten und gefassten, zu Propagandazwecken (miss)gebrauchten Konstruktion von Wirklichkeit, die nicht nur das Wirklichkeitsbild einer Epoche prägte, sondern in starkem Maße auch in die Wirklichkeit der davon betroffenen Menschen eingriff und diese veränderte. Die Legende vom Dolchstoß, vom hinterrücks verübten Mord am deutschen Frontsoldaten, vom Verrat aus den eigenen Reihen, wird von seinen Vertretern dazu benutzt, die eigene Verantwortung für die Niederlage der Deutschen im 1. Weltkrieg auf den politischen Gegner abzuwälzen, um diesen nicht nur politisch, sondern auch gesellschaftlich zu diffamieren. Doch war diese Legende kein spontanes Produkt einer von Chaos geprägten Nachkriegszeit, sondern sie gehörte bereits zum politischen Strategiespiel einer in der Bismarckzeit eingeführten Propagandaschlacht. In ihr wurde bereits die Erwartungshaltung geschürt, dass in der Stunde der Not Sozialdemokraten, Juden, Katholiken und Freimaurer das Vaterland nicht nur im Stich lassen, sondern es aus fehlender nationaler Gesinnung verraten würden. Die Sprachlichkeit dieser Vorgänge hervorzuheben, ist das besondere methodische und theoretische Anliegen des Artikels.
Der Kurzbeitrag berichtet über ein Projekt ”Hypertextualisierung auf textgrammatischer Grundlage“ (HyTex), in dem erforscht wird, wie sich linear organisierte Dokumente mit semiautomatischen Methoden auf der Grundlage von textgrammatischem Markup und der linguistisch motivierten Modellierung terminologischen Wissens in delinearisierte Hyperdokumente überführen lassen. Ziel ist es, eine Sammlung von Fachtexten so in einen Hypertext zu überführen, dass terminologiebedingte Verständnisschwierigkeiten beim Lesen durch entsprechende Linkangebote aufgelöst werden, so dass die Fachtexte auch von Semi-Experten der Domäne selektiv gelesen werden können. Der Schwerpunkt des Beitrags liegt auf der Modellierung terminologischen Wissens mit XML Topic Maps und dessen Stellenwert für die automatische Erzeugung von Hyperlinks.
Online Access Tools for Spoken German: The Resources of the Deutsches Spracharchiv in a Database
(2002)
This paper shows some details of the modernization of the Deutsches Spracharchiv (DSAv). It explores some future possibilities of linguistical documentation and analysis using the Web. The Institut für Deutsche Sprache (IDS) in Mannheim is the central institution for linguistic research in Germany. The DSAv in the IDS is the center for documentation and research of spoken German. These archives include the largest collection of sound recordings of spoken German (dialects and colloquial speech, including e.g. lots of extinct dialects of former German territories in Eastern Europe) - altogether more than 15,000 sound recordings. The lacking clarification and accessibility of this data material has been felt as an essential deficit. The opportunity to edit the sound signal digitally offers a much easier access to spoken language. Through the integration of the already existing information about the corpora and the transcribed texts in an information- and full text databank, as well as the linking of the data with the acoustic signal (alignment), arises a data-pool with considerably better documentation of the materials and a fast direct grasp of the recorded sounds. Thus, the DSAv initiates totally new research questions for the work at the IDS, as well as for linguistics altogether.
The concept of text coherence was developed for linear text, i.e. text of sequentially organized content. The present article addresses to what extent this concept can be applied to hypertext. Following the introduction (section 1), I will define different aspects of text coherence (section 2). I will then explain the importance of the sequential order of text constituents for coherence-building, as explored by empirical studies on text comprehension (section 3). Section 4 discusses how hypertext-specific forms of reading affect the processes of coherence-building and coherence-design. Section 5 explores how the new challenges of hypertext comprehension may be met by hypertext-specific coherence cues. A summary and outlook is included (section 6).