410 Linguistik
Refine
Document Type
- Working Paper (14) (remove)
Keywords
- Korpus <Linguistik> (4)
- Deutsch (3)
- Konversationsanalyse (3)
- Gesprochene Sprache (2)
- Gesprächsanalyse (2)
- Interaktion (2)
- Programmiersprache (2)
- Argumentation (1)
- BNC (1)
- COHA (1)
Publicationstate
- Veröffentlichungsversion (8)
- Preprint (1)
Reviewstate
Deutschlandtürkisch?
(2004)
Migration führt zu Zwei- und Mehrsprachigkeit. Ein Ausdruck dieser Sprachkontaktsituation sind Phänomene wie Codeswitching oder Codemixing, die weltweit, wie auch im kommunikativen Haushalt der türkischen Migranten in Europa, zu beobachten sind.1 Eine andere Folge dieses Prozesses sind Auffälligkeiten, die sich im Laufe der Zeit auf verschiedenen Ebenen der Diasporasprachen zeigen. Im vorliegenden Beitrag beschäftigen wir uns mit der Frage nach solchen Besonderheiten und ihren Ursachen im Türkischen der Migranten in Deutschland. Hierzu analysieren wir mündliche Alltagskonversationen von zwei Gruppen. Unsere Analyse von gesprochener Sprache wirft in diesem Zusammenhang einige zentrale methodologische Fragen bezüglich der untersuchten Daten und der Analyseperspektive auf, die wir zunächst in Auseinandersetzung mit der Forschungsliteratur erörtern.
New KARL (Knowledge Acquisition and Representation Language) allows to specify all parts of a problem-solving method (PSM). It is a formal language with a well-defined semantics and thus allows to represent PSMs precisely and unambiguously yet abstracting from implementation detail. In this paper it is shown how the language KARL has been modified and extended to New KARL to better meet the needs for the representation of PSMs. Based on a conceptual structure of PSMs new language primitives are introduced for KARL to specify such a conceptual structure and to support the configuration of methods. An important goal for this extension was to preserve three important properties of KARL: to be (i) a conceptual, (ii) a formal, and (iii) an executable language.
A topic in the field of knowledge acquisition is the reuse of components that are described at the knowledge level. Problems concern the description, indexing and retrieval of components. In our case there is the additional feature of integrating so called automated building blocks in a knowledge level description. This paper describes what knowledge level descriptions of components for reuse should look like, and proposes a way to describe assumptions and requirements that are to be made explicit. In the paper an extension of the “normal” knowledge acquisition setting is made in the direction of machine learning components.
This introductory tutorial describes a strictly corpus-driven approach for uncovering indications for aspects of use of lexical items. These aspects include ‘(lexical) meaning’ in a very broad sense and involve different dimensions, they are established in and emerge from respective discourses. Using data-driven mathematical-statistical methods with minimal (linguistic) premises, a word’s usage spectrum is summarized as a collocation profile. Self-organizing methods are applied to visualize the complex similarity structure spanned by these profiles. These visualizations point to the typical aspects of a word’s use, and to the common and distinctive aspects of any two words.
Der Beitrag untersucht die deutsche Wiedervereinigung als einen Fall von Kontakt zwischen verschiedenen Kulturen. Auf dem Hintergrund der von Bateson (1985) unterschiedenen Verlaufsformen von Kulturberührung wird diskutiert, wie die Entwicklung des Kontakts zwischen der westdeutschen und der ostdeutschen Kultur seit der Wende zu charakterisieren ist. Im deutsch-deutschen Diskurs stellt sich für die Beteiligten zunächst die Aufgabe der Bildung und Ausarbeitung wechselseitiger Kategorien ('Wessis' und 'Ossis'). Dabei werden gleichzeitig Modellvorstellungen über mögliche Relationen zwischen den Kulturen entwickelt und etabliert. Anhand von Publikums-sendungen des Fernsehens wird gezeigt, daß bisher drei Modelle sich einander abgelöst haben: 1. Experten und Laien im Lehr-Lern-Diskurs, 2. Gleich und Gleich und 3. Unterschiedliche Identiäten. Sowohl die Kategorien wie die Beziehungsmodelle sind dabei nicht vorgegeben und statisch, sondern werden im Kosmos der Interaktionen, die die Kulturberührung ausmachen, konstituiert und modifiziert und bilden dann die Grundlage für weitere Interaktionen. Anhand von Ausschnitten der Sendung 'Richtung Deutschland. Was wird mit der sozialen Sicherheit? (27.2.1990, ZDF)' wird exemplarisch untersucht, wie das Experten-/Laienmodell interaktiv inszeniert und konstituiert wird und wie in seinem Rahmen die ostdeutschen Teilnehmerinnen marginalisiert werden.
KoralQuery 0.3
(2015)
KoralQuery is a general corpus query protocol (i.e. independent of research tasks and corpus formats), serialized in JSON-LD [1]. KoralQuery focuses on simplicity of implementation rather than human readibility and writability. Support for a growing number of query languages is granted by the Koral serialization processor.
In this paper, a method for measuring synchronic corpus (dis-)similarity put forward by Kilgarriff (2001) is adapted and extended to identify trends and correlated changes in diachronic text data, using the Corpus of Historical American English (Davies 2010a) and the Google Ngram Corpora (Michel et al. 2010a). This paper shows that this fully data-driven method, which extracts word types that have undergone the most pronounced change in frequency in a given period of time, is computationally very cheap and that it allows interpretations of diachronic trends that are both intuitively plausible and motivated from the perspective of information theory. Furthermore, it demonstrates that the method is able to identify correlated linguistic changes and diachronic shifts that can be linked to historical events. Finally, it can help to improve diachronic POS tagging and complement existing NLP approaches. This indicates that the approach can facilitate an improved understanding of diachronic processes in language change.