410 Linguistik
Refine
Document Type
- Working Paper (14) (remove)
Keywords
- Korpus <Linguistik> (4)
- Deutsch (3)
- Konversationsanalyse (3)
- Gesprochene Sprache (2)
- Gesprächsanalyse (2)
- Interaktion (2)
- Programmiersprache (2)
- Argumentation (1)
- BNC (1)
- COHA (1)
Publicationstate
- Veröffentlichungsversion (8)
- Preprint (1)
Reviewstate
Deutschlandtürkisch?
(2004)
Migration führt zu Zwei- und Mehrsprachigkeit. Ein Ausdruck dieser Sprachkontaktsituation sind Phänomene wie Codeswitching oder Codemixing, die weltweit, wie auch im kommunikativen Haushalt der türkischen Migranten in Europa, zu beobachten sind.1 Eine andere Folge dieses Prozesses sind Auffälligkeiten, die sich im Laufe der Zeit auf verschiedenen Ebenen der Diasporasprachen zeigen. Im vorliegenden Beitrag beschäftigen wir uns mit der Frage nach solchen Besonderheiten und ihren Ursachen im Türkischen der Migranten in Deutschland. Hierzu analysieren wir mündliche Alltagskonversationen von zwei Gruppen. Unsere Analyse von gesprochener Sprache wirft in diesem Zusammenhang einige zentrale methodologische Fragen bezüglich der untersuchten Daten und der Analyseperspektive auf, die wir zunächst in Auseinandersetzung mit der Forschungsliteratur erörtern.
New KARL (Knowledge Acquisition and Representation Language) allows to specify all parts of a problem-solving method (PSM). It is a formal language with a well-defined semantics and thus allows to represent PSMs precisely and unambiguously yet abstracting from implementation detail. In this paper it is shown how the language KARL has been modified and extended to New KARL to better meet the needs for the representation of PSMs. Based on a conceptual structure of PSMs new language primitives are introduced for KARL to specify such a conceptual structure and to support the configuration of methods. An important goal for this extension was to preserve three important properties of KARL: to be (i) a conceptual, (ii) a formal, and (iii) an executable language.
A topic in the field of knowledge acquisition is the reuse of components that are described at the knowledge level. Problems concern the description, indexing and retrieval of components. In our case there is the additional feature of integrating so called automated building blocks in a knowledge level description. This paper describes what knowledge level descriptions of components for reuse should look like, and proposes a way to describe assumptions and requirements that are to be made explicit. In the paper an extension of the “normal” knowledge acquisition setting is made in the direction of machine learning components.
This introductory tutorial describes a strictly corpus-driven approach for uncovering indications for aspects of use of lexical items. These aspects include ‘(lexical) meaning’ in a very broad sense and involve different dimensions, they are established in and emerge from respective discourses. Using data-driven mathematical-statistical methods with minimal (linguistic) premises, a word’s usage spectrum is summarized as a collocation profile. Self-organizing methods are applied to visualize the complex similarity structure spanned by these profiles. These visualizations point to the typical aspects of a word’s use, and to the common and distinctive aspects of any two words.
Der Beitrag untersucht die deutsche Wiedervereinigung als einen Fall von Kontakt zwischen verschiedenen Kulturen. Auf dem Hintergrund der von Bateson (1985) unterschiedenen Verlaufsformen von Kulturberührung wird diskutiert, wie die Entwicklung des Kontakts zwischen der westdeutschen und der ostdeutschen Kultur seit der Wende zu charakterisieren ist. Im deutsch-deutschen Diskurs stellt sich für die Beteiligten zunächst die Aufgabe der Bildung und Ausarbeitung wechselseitiger Kategorien ('Wessis' und 'Ossis'). Dabei werden gleichzeitig Modellvorstellungen über mögliche Relationen zwischen den Kulturen entwickelt und etabliert. Anhand von Publikums-sendungen des Fernsehens wird gezeigt, daß bisher drei Modelle sich einander abgelöst haben: 1. Experten und Laien im Lehr-Lern-Diskurs, 2. Gleich und Gleich und 3. Unterschiedliche Identiäten. Sowohl die Kategorien wie die Beziehungsmodelle sind dabei nicht vorgegeben und statisch, sondern werden im Kosmos der Interaktionen, die die Kulturberührung ausmachen, konstituiert und modifiziert und bilden dann die Grundlage für weitere Interaktionen. Anhand von Ausschnitten der Sendung 'Richtung Deutschland. Was wird mit der sozialen Sicherheit? (27.2.1990, ZDF)' wird exemplarisch untersucht, wie das Experten-/Laienmodell interaktiv inszeniert und konstituiert wird und wie in seinem Rahmen die ostdeutschen Teilnehmerinnen marginalisiert werden.
KoralQuery 0.3
(2015)
KoralQuery is a general corpus query protocol (i.e. independent of research tasks and corpus formats), serialized in JSON-LD [1]. KoralQuery focuses on simplicity of implementation rather than human readibility and writability. Support for a growing number of query languages is granted by the Koral serialization processor.
In this paper, a method for measuring synchronic corpus (dis-)similarity put forward by Kilgarriff (2001) is adapted and extended to identify trends and correlated changes in diachronic text data, using the Corpus of Historical American English (Davies 2010a) and the Google Ngram Corpora (Michel et al. 2010a). This paper shows that this fully data-driven method, which extracts word types that have undergone the most pronounced change in frequency in a given period of time, is computationally very cheap and that it allows interpretations of diachronic trends that are both intuitively plausible and motivated from the perspective of information theory. Furthermore, it demonstrates that the method is able to identify correlated linguistic changes and diachronic shifts that can be linked to historical events. Finally, it can help to improve diachronic POS tagging and complement existing NLP approaches. This indicates that the approach can facilitate an improved understanding of diachronic processes in language change.
Freiraum schaffen im Klassenzimmer: Fallbasierte methodologische Überlegungen zur Raumanalyse
(2015)
Dieser Beitrag versucht, statistische Regelmäßigkeiten in der Abfolge von Sprecheinheiten Innerhalb von Gesprächen zu ermitteln. Das Augenmerk richtet sich auf die Unterscheidung und Erfassung von argumentativen Kategorien in Konfliktgesprächen zwischen Müttern und ihren jugendlichen Töchtern. Als konfliktäres Argument wird die Begründung einer Person in einer Konfliktsituation bezeichnet, mit der ein Ziel oder ein anderes Argument gestützt oder geschwächt werden soll. Wir betrachten Fakten, Bewertungen, Konnexe, Normen und Präferenzen als Elemente einer Kognition "konfliktäres Argument". Ein Argument kann bezogen auf ein Ziel oder ein anderes Argument stärkenden (stützenden, zusätzlich stützenden), modifizierenden (relativierenden) oder schwächenden (einwendenden, gegenbehauptenden) Charakter tragen. Neben argumentativen Elementen im engeren Sinne werden auch gesprächssteuernde Kategorien betrachtet: Initiativen (Aufforderungen, Fragen) sowie Reaktiven (positive, negative Reaktionen auf Argumente oder Initiativen). Die Art und Qualität der aktivierten und vorgebrachten Argumente wird als abhängig betrachtet von den Motiven der beteiligten Partner. Bei Müttern werden Kontrollmotive, bei Töchtern vor allem Individuierungsmotive an-genommen. Es wird erwartet, daß sich diese Tendenzen in den Mikrosequenzen niederschlagen. Datenbasis sind 60 Gespräche zwischen 30 Müttern und Töchtern im Alter von 12 bis 24 Jahren. Jede Dyade diskutierte zwei aktuelle Konflikte nach freier Wahl. Die transkribierten Gespräche wurden nach dem Mannheimer Argumentations-Kategorien-System, das sich an den o.a. theoretischen Konstrukten orientiert, in Einheiten zerlegt und klassifiziert. Die Kategorien erwiesen sich als ausreichend objektiv und rellabel. Die Auswertungen erfolgten über log-lineare und lag-sequentielle Analysen. Bei den Ergebnissen konnten wir die Phänomene der Zustimmungs-Relativierungs-Sequenz und der Argument-Reihung als In-turn-Sequenzen Identifizieren. Als turn- übergreifende Muster fielen besonders deutlich auf der negative Reaktionszyklus: eine über drei bis vier lags andauernde Folge von negativen Reaktionen auf Argumente. Weiter bezeichneten wir mit Argumentkonfrontation die Tendenz, daß Gegenargumente überzufällig häufig mit Gegenargumenten gekontert wurden. Besonders bei Müttern waren weiter repetitive Phänomene erkennbar. Sie bestanden darin, daß Initiativen, Insbesondere Aufforderungen und Klärungsfragen nach einer Reaktion wiederholt wurden. Wir nennen das "Insistieren" bzw. "Nachhaken". Mit Bezug auf die Dimension der Argumentelemente konnten deutliche Sequenzen von Abfolgen nicht ermittelt werden. Die Partnerinnen neigten dazu, ihre Argumente jeweils auf der gleichen Ebene (Fakten, Bewertungen, Konnexen und Präferenzen) anzusiedeln, was als Hinweis auf kohärent elementbezogenes Argumentieren aufzufassen Ist. Die Ergebnisse bestätigen in großen Teilen die Erwartungen. Die verschiedenen Mikro-Gesetzmäßigkeiten werden unter Bezug auf die von Jones und Gérard (1967) nach der Kontingenz unterschiedenen Typen von Interaktionen interpretiert.
Transkriptionsaufwand
(2015)
Während die Erhebung von Gesprächsdaten zwar zeitaufwändig, aber doch noch relativ zügig zu bewältigen ist, handelt es sich bei der Transkription um eine langwierige Aufgabe, die oft unterschätzt wird. Damit Studierende, Promovierende sowie WissenschaftlerInnen, die Exposés, Arbeitspläne usw. aufstellen oder Zuschüsse für Projekte beantragen müssen, zukünftig über fundiertere Werte verfügen und damit realistischere Aussagen über den benötigten Aufwand (zeitliche wie personelle Ressourcen) treffen können, stellt der Beitrag die Ergebnisse einer Erhebung des Transkriptionsaufwandes im FOLK-Projekt vor.
Maskierung
(2015)
Aus forschungsethischen Gründen müssen die Daten aus Gesprächsaufzeichnungen, die Metadaten sowie die Transkripte maskiert werden. Der Beitrag stellt Arbeitsschritte der Maskierung vor, die auf den Erfahrungen bei der Datenaufbereitung der Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für die Veröffentlichung in der Datenbank für Gesprochenes Deutsch (DGD) basieren.