Refine
Year of publication
Document Type
- Article (34)
- Part of a Book (11)
- Conference Proceeding (9)
- Other (1)
- Part of Periodical (1)
Has Fulltext
- yes (56)
Keywords
- Deutsch (25)
- Korpus <Linguistik> (12)
- Konversationsanalyse (5)
- Rumänisch (5)
- Computerlinguistik (4)
- Englisch (4)
- Rezension (4)
- Annotation (3)
- Französisch (3)
- Historische Phonetik (3)
Publicationstate
- Veröffentlichungsversion (37)
- Postprint (10)
- Zweitveröffentlichung (1)
Reviewstate
- Peer-review (56) (remove)
Publisher
- De Gruyter (7)
- TUDpress (3)
- Elsevier (2)
- Oxford University Press (2)
- de Gruyter (2)
- iudicium (2)
- Association for Computational Linguistics (1)
- Brill (1)
- Budrich (1)
- EACL (1)
Cybermobbing ist der gezielte Versuch, online das Face einer anderen Person zu dekonstruieren. Etwa ein Drittel aller Jugendlichen ist schon mindestens einmal mit diesem Problem konfrontiert worden. Seinen temporären Höhepunkt erreichte es mit dem Erscheinen der Internetseite Isharegossip.com (ISG). Diese entwickelte sich sehr schnell zu einer regelrechten Mobbing-Plattform. Täter fanden hier ganz besonders drastische verbale Mittel, um ihre Opfer zu kompromittieren. Bislang wurde noch nicht qualitativ analysiert, inwieweit Opfer und sogenannte virtuelle Zaungäste auf diese Verbalattacken reagieren. Ziel des Aufsatzes ist es, anhand eines typischen Diskurses sechs Verteidigungsstrategien aufzuzeigen, die von Opfern aber auch von sogenannten virtuellen Zaungästen angewandt werden, um das Face des Opfers zu rekonstruieren und zu stabilisieren.
This paper presents a short insight into a new project at the "Institute for the German Language” (IDS) (Mannheim). It gives an insight into some basic ideas for a corpus-based dictionary of spoken German, which will be developed and compiled by the new project "The Lexicon of spoken German” (Lexik des gesprochenen Deutsch, LeGeDe). The work is based on the "Research and Teaching Corpus of Spoken German” (Forschungs- und Lehrkorpus Gesprochenes Deutsch, FOLK), which is implemented in the "Database for Spoken German” (Datenbank für Gesprochenes Deutsch, DGD). Both resources, the database and the corpus, have been developed at the IDS.
Feedback utterances are among the most frequent in dialogue. Feedback is also a crucial aspect of linguistic theories that take social interaction, involving language, into account. This paper introduces the corpora and datasets of a project scrutinizing this kind of feedback utterances in French. We present the genesis of the corpora (for a total of about 16 hours of transcribed and phone force-aligned speech) involved in the project. We introduce the resulting datasets and discuss how they are being used in on-going work with focus on the form-function relationship of conversational feedback. All the corpora created and the datasets produced in the framework of this project will be made available for research purposes.
As a consequence of a recent curation project, the Dortmund Chat Corpus is available in CLARIN-D research infrastructures for download and querying. In a legal expertise it had been recommended that standard measures of anonymisation be applied to the corpus before its republication. This paper reports about the anonymisation campaign that was conducted for the corpus. Anonymisation has been realised as categorisation, and the taxonomy of anonymisation categories applied is introduced and the method of applying it to the TEI files is demonstrated. The results of the anonymisation campaign as well as issues of quality assessment are discussed. Finally, pseudonymisation as an alternative to categorisation as a method of the anonymisation of CMC data is discussed, as well as possibilities of an automatisation of the process.
Nach Bemerkungen zur Abgrenzung des Gegenstandes und einem kurzen Forschungsbericht zur Entwicklung der gesprächsanalytischen Forschung zu Beratung und verwandten Flandlungssituationen wird die gesprächsanalytische Vorgehensweise an einem einfachen Fallbeispiel demonstriert (Kap. 2) mit dem Ziel, das Erkenntnispotential bei der Aufdeckung von Handlungsstrukturen im Gespräch und damit verknüpfter inhärenter Probleme der Gesprächsführung zu verdeutlichen. Vor dem Hintergrund der ersten Verlaufsanalyse werden dann Kernstrukturen des Beratens systematisch dargestellt, insbesondere das Handlungsschema Beraten und die strukturellen Vorgaben für die sequenzielle Durchführung (Kap. 3). Schließlich werden ausgewählte Strategien des Gesprächshandelns von Ratsuchenden und Ratgebern dargestellt, mit denen diese versuchen, ihre Perspektive zur Geltung zu bringen, und die mit den Zielsetzungen und dem Rollenverständnis der Akteure, ihrem Selbstverständnis als Handelnde und ihrem Umgang mit spezifischen inhärenten Problemen des Beratungshandeln Zusammenhängen (Kap. 4). Als Materialgrundlage wird ein gemischtes Korpus von Beratungsgesprächen aus privaten und unterschiedlichen institutioneilen Kontexten benutzt (u.a. Studienberatung, ärztliche Beratung, kommunale Mieterberatung).
This paper provides a unified semantic and discourse pragmatic analysis of the German particle nämlich, traditionally described as having a specificational and an explanative reading. Our claim is that nämlich is a discourse marker which signals that the expression it is attached to is a short (elliptic) answer to a salient implicit question about the previous utterance. We show how both the explanative and the specificational reading can be derived from this more general semantic contribution. In addition we discuss some cross linguistic consequences of our analysis.
Catching the common cause: extraction and annotation of causal relations and their participants
(2017)
In this paper, we present a simple, yet effective method for the automatic identification and extraction of causal relations from text, based on a large English-German parallel corpus. The goal of this effort is to create a lexical resource for German causal relations. The resource will consist of a lexicon that describes constructions that trigger causality as well as the participants of the causal event, and will be augmented by a corpus with annotated instances for each entry, that can be used as training data to develop a system for automatic classification of causal relations. Focusing on verbs, our method harvested a set of 100 different lexical triggers of causality, including support verb constructions. At the moment, our corpus includes over 1,000 annotated instances. The lexicon and the annotated data will be made available to the research community.
The paper presents best practices and results from projects dedicated to the creation of corpora of computer-mediated communication and social media interactions (CMC) from four different countries. Even though there are still many open issues related to building and annotating corpora of this type, there already exists a range of tested solutions which may serve as a starting point for a comprehensive discussion on how future standards for CMC corpora could (and should) be shaped like.