Refine
Year of publication
Document Type
- Working Paper (48) (remove)
Keywords
- Korpus <Linguistik> (14)
- Gesprochene Sprache (12)
- Deutsch (10)
- Konversationsanalyse (7)
- Forschungsdaten (5)
- Infrastruktur (5)
- Transkription (5)
- Interaktionsanalyse (4)
- Niederdeutsch (4)
- Sprachgebrauch (4)
Publicationstate
- Veröffentlichungsversion (48) (remove)
Reviewstate
- (Verlags)-Lektorat (23)
- Peer-Review (5)
- Review-Status-unbekannt (3)
- Review-Status unbekannt (1)
Publisher
- Institut für Deutsche Sprache (11)
- Leibniz-Institut für Deutsche Sprache (IDS) (4)
- Zenodo (4)
- Leibniz-Institut für Deutsche Sprache (3)
- Universität Zürich (3)
- CLARIN Legal and Ethical Issues Committee (CLIC) (2)
- DYLAN Project (2)
- Universität Bielefeld (2)
- AIFB (1)
- Bergische Universität-GHS Wuppertal, Fachbereich 4 (1)
This introductory tutorial describes a strictly corpus-driven approach for uncovering indications for aspects of use of lexical items. These aspects include ‘(lexical) meaning’ in a very broad sense and involve different dimensions, they are established in and emerge from respective discourses. Using data-driven mathematical-statistical methods with minimal (linguistic) premises, a word’s usage spectrum is summarized as a collocation profile. Self-organizing methods are applied to visualize the complex similarity structure spanned by these profiles. These visualizations point to the typical aspects of a word’s use, and to the common and distinctive aspects of any two words.
Dieser Beitrag versucht, statistische Regelmäßigkeiten in der Abfolge von Sprecheinheiten Innerhalb von Gesprächen zu ermitteln. Das Augenmerk richtet sich auf die Unterscheidung und Erfassung von argumentativen Kategorien in Konfliktgesprächen zwischen Müttern und ihren jugendlichen Töchtern. Als konfliktäres Argument wird die Begründung einer Person in einer Konfliktsituation bezeichnet, mit der ein Ziel oder ein anderes Argument gestützt oder geschwächt werden soll. Wir betrachten Fakten, Bewertungen, Konnexe, Normen und Präferenzen als Elemente einer Kognition "konfliktäres Argument". Ein Argument kann bezogen auf ein Ziel oder ein anderes Argument stärkenden (stützenden, zusätzlich stützenden), modifizierenden (relativierenden) oder schwächenden (einwendenden, gegenbehauptenden) Charakter tragen. Neben argumentativen Elementen im engeren Sinne werden auch gesprächssteuernde Kategorien betrachtet: Initiativen (Aufforderungen, Fragen) sowie Reaktiven (positive, negative Reaktionen auf Argumente oder Initiativen). Die Art und Qualität der aktivierten und vorgebrachten Argumente wird als abhängig betrachtet von den Motiven der beteiligten Partner. Bei Müttern werden Kontrollmotive, bei Töchtern vor allem Individuierungsmotive an-genommen. Es wird erwartet, daß sich diese Tendenzen in den Mikrosequenzen niederschlagen. Datenbasis sind 60 Gespräche zwischen 30 Müttern und Töchtern im Alter von 12 bis 24 Jahren. Jede Dyade diskutierte zwei aktuelle Konflikte nach freier Wahl. Die transkribierten Gespräche wurden nach dem Mannheimer Argumentations-Kategorien-System, das sich an den o.a. theoretischen Konstrukten orientiert, in Einheiten zerlegt und klassifiziert. Die Kategorien erwiesen sich als ausreichend objektiv und rellabel. Die Auswertungen erfolgten über log-lineare und lag-sequentielle Analysen. Bei den Ergebnissen konnten wir die Phänomene der Zustimmungs-Relativierungs-Sequenz und der Argument-Reihung als In-turn-Sequenzen Identifizieren. Als turn- übergreifende Muster fielen besonders deutlich auf der negative Reaktionszyklus: eine über drei bis vier lags andauernde Folge von negativen Reaktionen auf Argumente. Weiter bezeichneten wir mit Argumentkonfrontation die Tendenz, daß Gegenargumente überzufällig häufig mit Gegenargumenten gekontert wurden. Besonders bei Müttern waren weiter repetitive Phänomene erkennbar. Sie bestanden darin, daß Initiativen, Insbesondere Aufforderungen und Klärungsfragen nach einer Reaktion wiederholt wurden. Wir nennen das "Insistieren" bzw. "Nachhaken". Mit Bezug auf die Dimension der Argumentelemente konnten deutliche Sequenzen von Abfolgen nicht ermittelt werden. Die Partnerinnen neigten dazu, ihre Argumente jeweils auf der gleichen Ebene (Fakten, Bewertungen, Konnexen und Präferenzen) anzusiedeln, was als Hinweis auf kohärent elementbezogenes Argumentieren aufzufassen Ist. Die Ergebnisse bestätigen in großen Teilen die Erwartungen. Die verschiedenen Mikro-Gesetzmäßigkeiten werden unter Bezug auf die von Jones und Gérard (1967) nach der Kontingenz unterschiedenen Typen von Interaktionen interpretiert.
Mit dem cGAT-Handbuch stellt das FOLK-Projekt eine Richtlinie für das computergestützte Transkribieren nach GAT 2 zur Verfügung. Das Handbuch wurde anhand der Transkriptionspraxis in FOLK entwickelt und enthält eine Vielzahl von authentischen Beispielen, die mit dem zugehörigen Audio auch über die Datenbank für Gesprochenes Deutsch (DGD) abgerufen werden können.
CLARIAH-DE cross-service search - prospects and benefits of merging subject-specific services
(2021)
CLARIAH-DE combines services and offerings of CLARIN-D and DARIAH-DE. This includes various search applications which are made directly available to researchers. These search applications are presented in this working paper based on their main characteristics and compared with a focus on possible harmonizations. Opportunities and risks of different forms of technical integration are highlighted. Identified challenges can be explained in particular considering the background of different organizational and technical frameworks as well as highly specific and discipline-dependent requirements. The integration work that has already been carried out and the experiences gained with regard to future work and possible integration of further applications are also discussed. The experiences made in CLARIAH-DE can especially be of interest for other projects in the field of digital research infrastructures.
Collaborative work in NFDI
(2023)
The non-profit association National Research Data Infrastructure (NFDI) promotes science and research through a National Research Data Infrastructure. Its aim is to develop and establish an overarching research data management (RDM) for Germany and to increase the efficiency of the entire German science system. After a two-and-a-half year build up phase, the process of adding new consortia, each representing a different data domain, has ended in March 2023. NFDI now has 26 disciplinary consortia (and one additional basic service collaboration). Now the full extent of cross-consortial interaction is beginning to show.
The paper deals with the process of computer-aided transcription regarding Arabic-German data material for interaction-based studies. First of all, it sheds light upon some major methodological challenges posed by the conversation-analytic approaches: due to current corpus technology, the reciprocity, linearity, and simultaneity of linguistic activities cannot be reconstructed in an analytically proper way when using the Arabic characters in multilingual and bidirectional transcripts. The difficulty of transcribing Arabic encounters is also compounded by the fact that Spoken Arabic as well as its varieties and phenomena have not been standardised enough (for conversation-analytic purposes). Therefore, the second part of this paper is dedicated to preliminary, self-developed solutions, namely a systematic method for transcribing Spoken Arabic.
A topic in the field of knowledge acquisition is the reuse of components that are described at the knowledge level. Problems concern the description, indexing and retrieval of components. In our case there is the additional feature of integrating so called automated building blocks in a knowledge level description. This paper describes what knowledge level descriptions of components for reuse should look like, and proposes a way to describe assumptions and requirements that are to be made explicit. In the paper an extension of the “normal” knowledge acquisition setting is made in the direction of machine learning components.
Deutschlandtürkisch?
(2004)
Migration führt zu Zwei- und Mehrsprachigkeit. Ein Ausdruck dieser Sprachkontaktsituation sind Phänomene wie Codeswitching oder Codemixing, die weltweit, wie auch im kommunikativen Haushalt der türkischen Migranten in Europa, zu beobachten sind.1 Eine andere Folge dieses Prozesses sind Auffälligkeiten, die sich im Laufe der Zeit auf verschiedenen Ebenen der Diasporasprachen zeigen. Im vorliegenden Beitrag beschäftigen wir uns mit der Frage nach solchen Besonderheiten und ihren Ursachen im Türkischen der Migranten in Deutschland. Hierzu analysieren wir mündliche Alltagskonversationen von zwei Gruppen. Unsere Analyse von gesprochener Sprache wirft in diesem Zusammenhang einige zentrale methodologische Fragen bezüglich der untersuchten Daten und der Analyseperspektive auf, die wir zunächst in Auseinandersetzung mit der Forschungsliteratur erörtern.
2017 gibt es im deutschen Mikrozensus zum ersten Mal seit etwa achtzig Jahren eine Frage zur Sprache der Bevölkerung in Deutschland. Diese Frage wird dann offenbar im entsprechenden Rhythmus des Mikrozensus jährlich wiederholt werden. Der Mikrozensus ist eine seit 1957 durchgeführte, repräsentative Befragung, bei der ungefähr 830.000 Menschen (das sind ca. 1 % der Bevölkerung) in rund 370.000 Haushalten befragt werden.1 Darin werden etwa Angaben zu den soziodemographischen Daten erfragt, zur familiären Situation, zur Wohnsituation, zur Aus- und Fortbildung und zur Arbeitssituation. Für die befragten Personen besteht Auskunftspflicht. Das Stellen einer Sprachfrage sieht, aus sprachwissenschaftlicher Sicht, zunächst nach einem sinnvollen und wünschenswerten Schritt aus. Nach näherer Betrachtung der gestellten Frage zeigen sich jedoch viele Unzulänglichkeiten und das, obwohl die Antworten und statistischen Auswertungen zu dieser Frage überhaupt noch ausstehen. Die Ergebnisse werden üblicherweise in der zweiten Hälfte des Folgejahres durch das statistische Bundesamt veröffentlicht.
Analog zu dem verbalen Bereich weist auch die nominale Domäne eine Reihe semantisch-syntaktischer Regularitäten und Restriktionen bezüglich ihrer internen Struktur auf. Als signifikante Parallelen zwischen Nominalstrukturen und Sätzen gelten Kontroll-, Bindungs- als auch Passivisierungsverhalten. Der Schwerpunkt des in der letzten Phase des Projekts B8 des SFB 340 entwickelten Nominalphrasenfragments liegt auf der Ausarbeitung einer Analyse für komplexe Nominalstrukturen, der eine bestimmte Menge empirisch basierter Generalisierungen zugrunde liegen. Neben der Behandlung der Kongruenzphänomene innerhalb der Nominalphrase, steht die Beschreibung der Argumentstruktur deutscher Nomina im Mittelpunkt. Das Ziel ist, eine solche Analyse zu entwickeln, die ohne leere Elemente und Spuren innerhalb der NP auskommt und eine gute Basis für Erweiterungsmöglichkeiten darstellen kann. Das Papier soll einen Überblick über die empirischen und theoretischen Annahmen geben, die der hier vorgestellten Analyse zugrunde liegen und einige ausgewählte Phänomene aus dem Nominalphrasenbereich im HPSG-Formalismus zu skizzieren. Im ersten Abschnitt wird eine Taxonomie der deutschen Nomina hinsichtlich ihrer Valenzeigenschaften vorgestellt. Im Mittelpunkt des Interesses stehen dabei Nomina mit einer Argumentstruktur. Weiterhin werden die Genitiv-NPn behandelt. Diskutiert werden insbesondere der kategoriale Status und die syntaktische Funktion der pränominalen Genitive. In Kapitel Analyse wird eine HPSG-Analyse deutscher NPn vorgeschlagen, die der Implementierung der Nominalsyntax im Projekt B8 zugrunde liegt.
Das vorliegende Papier fasst den bisherigen Diskussionsstand zur Konzeption eines Organisationsmodells für die institutionelle Verstetigung des Verbundforschungsprojektes TextGrid zusammen und bündelt die bisherigen Arbeitsergebnisse im Arbeitspaket 3 – Strukturelle und organisatorische Nachhaltigkeit. Das hier skizzierte Organisationsmodell basiert auf den in D-Grid und WissGrid erarbeiteten Nachhaltigkeitskonzepten und adaptiert das Konzept der Virtuellen Organisation (VO) für TextGrid. Insgesamt strebt TextGrid eine institutionelle Verstetigung seiner Aktivitäten nach Ende der Projektlaufzeit an und beabsichtigt gemeinsam mit Virtuellen Forschungsumgebungen aus anderen Wissenschaftsdisziplinen Wege und Prozesse etablieren zu können. Am 24./25. Februar 2011 hat TextGrid einen Strategie-Workshop in Berlin ausgerichtet, zu dem sich eine Expertenrunde zur „Nachhaltigkeit von Virtuellen Forschungsumgebungen“ eingefunden hat. Diskutiert werden wird, wie Virtuelle Forschungsumgebungen basierend auf heutigen finanziellen und organisatorischen Strukturen nachhaltig sein können und welche Empfehlungen sich daraus für TextGrid ableiten. Die Diskussionsergebnisse der Expertenrunde werden zusammen mit den Überlegungen in diesem Papier in die Konzeption eines umfassenderen Organisationsmodells einfließen, das die Grundlage für eine Verstetigung von TextGrid bilden wird.
Diese Handreichung stellt die Datenbank für Gesprochenes Deutsch (DGD) und speziell das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) als Instrumente gesprächsanalytischer Arbeit vor. Nach einem kurzen einführenden Überblick werden anhand des Beispiels "sprich" als Diskursmarker bzw. Reformulierungsindikator Schritt für Schritt die Ressourcen und Tools für systematische korpus- und datenbankgesteuerte Recherchen und Analysen vorgestellt und illustriert.
Diese Handreichung stellt die Datenbank für Gesprochenes Deutsch (DGD) und speziell das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) als Instrumente gesprächsanalytischer Arbeit vor. Nach einem kurzen einführenden Überblick werden anhand vier verschiedener Beispiele Schritt für Schritt die Ressourcen und Tools für systematische korpus- und datenbankgesteuerte Recherchen und Analysen vorgestellt und illustriert.
Diese Handreichung stellt die Datenbank für Gesprochenes Deutsch (DGD) und speziell das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) als Instrumente gesprächsanalytischer Arbeit vor. Nach einem kurzen einführenden Überblick werden anhand des Beispiels metapragmatischer Modalisierungen mit den Adverbien "sozusagen" und "gewissermaßen" und mit der Formel "in Anführungszeichen/-strichen" Schritt für Schritt die Ressourcen und Tools für systematische korpus- und datenbankgesteuerte Recherchen und Analysen vorgestellt und illustriert.
Im Beitrag werden die Ergebnisse einer im Jahr 2015 durchgeführten Online-Umfrage vorgestellt, in der die Angemessenheit von Aussprachevarianten des Deutschen in formellen Sprechsituationen bewertet werden sollte. Zu diesem Zweck wurden den 1.964 Teilnehmer/-innen Aussprachevarianten von insgesamt 207 Lexemen vorgelegt, vor allem aus den Bereichen Wortakzent, Vokalquantität und Fremdwortrealisierung. Die Umfrageergebnisse werden tabellarisch aufgeführt und damit weiterer Forschung zur Verfügung gestellt.
The landscape of digital lexical resources is often characterized by dedicated local portals and proprietary interfaces as primary access points for scholars and the interested public. In addition, legal and technical restrictions are potential issues that can make it difficult to efficiently query and use these valuable resources. As part of the research data consortium Text+, solutions for the storage and provision of digital language resources are being developed and provided in the context of the unified cross-domain German research data infrastructure NFDI. The specific topic of accessing lexical resources in a diverse and heterogenous landscape with a variety of participating institutions and established technical solutions is met with the development of the federated search and query framework LexFCS. The LexFCS extends the established CLARIN Federated Content Search that already allows accessing spatially distributed text corpora using a common specification of technical interfaces, data formats, and query languages. This paper describes the current state of development of the LexFCS, gives an insight into its technical details, and provides an outlook on its future development.