Refine
Year of publication
Document Type
- Part of a Book (4500)
- Article (2966)
- Book (996)
- Conference Proceeding (688)
- Part of Periodical (308)
- Review (257)
- Other (151)
- Working Paper (83)
- Doctoral Thesis (68)
- Report (35)
Language
- German (8078)
- English (1765)
- Russian (145)
- French (38)
- Multiple languages (22)
- Spanish (16)
- Portuguese (14)
- Italian (9)
- Polish (7)
- Ukrainian (5)
Keywords
- Deutsch (5140)
- Korpus <Linguistik> (940)
- Wörterbuch (605)
- Konversationsanalyse (451)
- Rezension (423)
- Grammatik (405)
- Rechtschreibung (374)
- Gesprochene Sprache (361)
- Sprachgebrauch (356)
- Interaktion (339)
Publicationstate
- Veröffentlichungsversion (3883)
- Zweitveröffentlichung (1642)
- Postprint (395)
- Preprint (10)
- Erstveröffentlichung (8)
- Ahead of Print (7)
- (Verlags)-Lektorat (4)
- Hybrides Open Access (2)
- Verlags-Lektorat (1)
- Verlagsveröffentlichung (1)
Reviewstate
- (Verlags)-Lektorat (3836)
- Peer-Review (1596)
- Verlags-Lektorat (94)
- Peer-review (56)
- Qualifikationsarbeit (Dissertation, Habilitationsschrift) (44)
- Review-Status-unbekannt (14)
- Peer-Revied (12)
- Abschlussarbeit (Bachelor, Master, Diplom, Magister) (Bachelor, Master, Diss.) (10)
- (Verlags-)Lektorat (9)
- Verlagslektorat (5)
Publisher
- de Gruyter (1334)
- Institut für Deutsche Sprache (1091)
- Schwann (638)
- Narr (484)
- Leibniz-Institut für Deutsche Sprache (IDS) (263)
- De Gruyter (245)
- Niemeyer (200)
- Lang (184)
- Narr Francke Attempto (170)
- IDS-Verlag (144)
This paper describes general requirements for evaluating and documenting NLP tools with a focus on morphological analysers and the design of a Gold Standard. It is argued that any evaluation must be measurable and documentation thereof must be made accessible for any user of the tool. The documentation must be of a kind that it enables the user to compare different tools offering the same service, hence the descriptions must contain measurable values. A Gold Standard presents a vital part of any measurable evaluation process, therefore, the corpus-based design of a Gold Standard, its creation and problems that occur are reported upon here. Our project concentrates on SMOR, a morphological analyser for German that is to be offered as a web-service. We not only utilize this analyser for designing the Gold Standard, but also evaluate the tool itself at the same time. Note that the project is ongoing, therefore, we cannot present final results.
Dieser Band fasst die Vorträge des 9. Hildesheimer Evaluierungs- und Retrieval-Workshops (HIER) zusammen, der am 9. und 10. Juli 2015 an der Universität Hildesheim stattfand. Die HIER Workshop-Reihe begann im Jahr 2001 mit dem Ziel, die Forschungsergebnisse der Hildesheimer Informationswissenschaft zu präsentieren und zu diskutieren. Mittlerweile nehmen immer wieder Kooperationspartner von anderen Institutionen teil, was wir sehr begrüßen. HIER schafft auch ein Forum für Systemvorstellungen und praxisorientierte Beiträge.
Open Science and language data: Expectations vs. reality. The role of research data infrastructures
(2023)
Language data are essential for any scientific endeavor. However, unlike numerical data, language data are often protected by copyright, as they easily meet the threshold of originality. The role of research infrastructures (such CLARIN, DARIAH, and Text+) is to bridge the gap between uses allowed by statutory exceptions and the requirements of Open Science. This is achieved on the one hand by sharing language data produced by research organisations with the widest possible circle of persons, and on the other by mutualizing efforts towards copyright clearance and appropriate licensing of datasets.
Seit der Migrationswelle 2015 steht Deutschland der gesellschaftspolitischen Herausforderung gegenüber, hunderttausende Flüchtlinge in den Arbeitsmarkt zu integrieren. Erfolgreiche Kommunikation am Arbeitsplatz stellt dabei eine Barriere dar, die es durch Verständnissicherung und Interaktionskompetenz zu überwinden gilt.
Diese empirische interaktionslinguistische Arbeit untersucht mittels der multimodalen Gesprächsanalyse die Verständnissicherung in Interaktionen am Arbeitsplatz. Anhand von Reparatursequenzen werden im ersten Analyseteil der Arbeit Praktiken der Integration von Geflüchteten im Prozess der Verständnissicherung untersucht und Unterschiede zwischen l1- und l2-Sprechern herausgestellt. Im zweiten Teil erfolgt eine longitudinale Studie, welche die Entwicklung der Reparatursequenzen der l2-Sprecher fokussiert, um aufzuzeigen, wie sich ihre Interaktionskompetenz und somit auch ihre Partizipation und Integration während ihres Beschäftigungsverhältnisses entwickelt.
Corpus-based identification and disambiguation of reading indicators for German nominalizations
(2010)
Corpus data is often structurally and lexically ambiguous; corpus extraction methodologies thus must be made aware of ambiguities. Therefore, given an extraction task, all relevant ambiguities must be identified. To resolve these ambiguities, contextual data responsible for one or another reading is to be considered. In the context of our present work, German -ung-nominalizations and their sortal readings are under examination. A number of these nominalizations may be read as an event or a result, depending on the semantic group they belong to. Here, we concentrate on nominalizations of verbs of saying (henceforth: "verba dicendi"), identify their context partners and their influence on the sortal reading of the nominalizations in question. We present a tool which calculates the sortal reading of such nominalizations and thus may improve not only corpus extraction, but also e.g. machine translation. Lastly, we describe successful attempts to identify the correct sortal reading, conclusions and future work.
Präpositionale Wortverbindungen (PWVs) und präpositionale lexikalisch geprägte Muster - speziell der Typ der binären Konstruktionen - sind ein in der (kontrastiven) Mehrwortforschung bislang kaum beachteter Typ, wie bereits mehrfach betont. Wenn in den deutschen PWVs die interne Stelle zwischen der Präposition und dem Nomen überproportional häufig nicht mit einem Artikel besetzt ist, ist bei solchen Kombinationen mit einem potenziell hohen Lexikalisierungsgrad zu rechnen. Solche PWVs kann man als autonome Einheiten auffassen, und dementsprechend soll man sie auch als feste Wortverbindungen untersuchen. Die formale und inhaltliche Grundlage für das kontrastive Modell bildet das UWV-Modell (vgl. Steyer 2000, 2013) und das Konzept lexikalisch geprägter Muster (siehe Steyer in diesem Band). Im Folgenden wird diese Herangehensweise auf die Äquivalenzfindung im Sprachenpaar Deutsch (DE) - Slowakisch (SK) angewendet. Einen zentralen Stellenwert nimmt die Kontrastierung von Kollokationsfeldern, von rekurrenten lexikalischen Erweiterungsmustern und komplexeren Wortverbindungsmuster ein. Es handelt sich um ein monodirektional angelegtes Modell Deutsch -> Fremdsprache, die korpusbasierte kontrastive Aufbereitung und Beschreibung schließt jedoch eine Bi- oder auch Multidirektionalität nicht aus. Die komplexe Äquivalenzproblematik und die entsprechenden Konvergenzen und Divergenzen werden in diesem Beitrag anhand folgender ausgewählter Kontrastbereiche im Vergleich Deutsch -> Zielsprache Slowakisch diskutiert: a) Verhältnis des deutschen Lemmas zu seinem prototypischen Äquivalent bzw. den prototypischen Äquivalenten, b) Bedeutung(en) und Gebrauchsspezifika der PWVs, c) interne und externe Variabilität der zugrundeliegenden Muster der PWVs und ihrer äquivalenten PWV-Muster; d) typische Einbettungen der äquivalenten PWVs in Satzkonstruktionen und semantische Merkmale verbaler Satelliten.
This article targets a distinctive kind of root structures in German formed by minimally two phrases but lacking an overt verbal predicate like i.a. die Guten ins Tröpfchen, die Schlechten ins Kröpfchen, jedem ein Bier or in den Müll mit dem Dreck. Certain instantiations of these patterns have been dubbed verblose Direktiva by Jacobs (2008) who provides an account in terms of construction grammar. Müller (2011), on the other hand, proposes an anti-passive analysis of the phenomenon. However, these apparent verbless root structures show conspicuous parallels in form and interpretation to another type of non-finite root structures in German, namely root infinitives. Both exclude an overt subject expression and both have a modal interpretation. Referring to these parallels, an analysis is elaborated which employs a empty verbal category. The overt consituents, then, are hosted by the (possibly extended) projection of the empty verb. Furthermore, this analysis captures a broader range of data, in particular instances formed by concatenated NPDAT-NPAKK or NPAKK-PP.
Eine Wörterbuchforschung für das Sprachenpaar Deutsch-Spanisch an der Schnittstelle zwischen Phraseologie und Konstruktionsgrammatik existiert bislang praktisch nicht. Ziel der vorliegenden Arbeit ist es daher, einen Beitrag zur Schließung dieser Lücke zu leisten, und zwar am Beispiel der „Idiomatik Deutsch-Spanisch" (IDSP) (Schemann et al. 2013). Die Phraseologieforschung befasst sich zwar schon lange mit nicht-kompositionalen Konstruktionen (die heterogen benannt werden z.B. Satzmuster, Phraseoschablonen, Phrasem- Konstruktionen, Schemata), die empirische Fundierung ist aber eher noch unsystematisch und bezogen auf die Lexikografie eher noch im Anfang begriffen. Es wird zum einen gezeigt, welchen großen Stellenwert solchen Mustern in der „Idiomatik Deutsch-Spanisch" (ebd.) zukommt. Zum anderen wird ein Vorschlag unterbreitet, mit dem die im Wörterbuch verzeichneten Phraseme und Muster unter einer dem Aspekt verfestigter Muster und Schemata klassifiziert und gruppiert werden können.
The paper is concerned with the filling of the right edge of a German clause with different constituents: subconstituents of the clause, arguments and modifiers of the NP, appositions and right-dislocated elements. It is argued that these different ways of filling the right edge come about in quite different ways. Subconstituents of the clause are base generated at the right edge in syntax. Constituents of the NP and appositions get to the right edge postsyntactically, i.e., they are linearised there only in the phonological component. Finally, the appearance of right-dislocated constituents is the result of two well-established deletion processes operating on two adjacent clauses.
The different mechanisms allow us to understand differences these elements show regarding positioning inside the right edge, binding and intonation. An important empirical generalisation put forward in the IDS-grammar can be captured. The grammar's controversial assumption that the right edge comprises a part which is disintegrated in between two syntactically integrated parts can be shown to be superfluous.
In current corpuslinguistic investigations, especially the collection of linguistic data and the frequency of linguistic phenomena (i.e. in the "linguistic matter") is in the center of interest of morphological discussions. This paper argues in favor of taking also morphological "antimatter" in account, i.e. surveying the structure of words containing morphological restrictions which cannot be proven systematically. With recourse to Popper's falsificationism and starting with prominent restrictions in the morphology of German, the article discusses theoretical consequences and chances for morphological theory with special emphasis on morphological change, i.e. when antimatter becomes matter and vice versa.
Constructionist approaches to grammar do not draw a clear distinction between lexicon and grammar, as generative "words and rules" accounts do. Rather, they conceptualize grammar and lexicon as a continuum of constructions of greater or lesser complexity and abstraction. In this paper, i explore the implications of this paradigm shift for the applied discipline of grammaticography. If we abandon the distinction between grammar and lexicon, should we also abandon the distinction between grammar, books and dictionaries? Drawing on a case study on the treatment of verbless constructions in the "IDS-Grammatik", it is argued that constructions should play a greater role in grammar books, but that grammar books still need to provide access to general principles of grammar.
This White Paper sets out commonly agreed definitions on activities of consortia within NFDI. It aims to provide a common basis for reporting and reference regarding selected questions of cross-consortial relevance in DFG’s template for the Interim Reports. The questions were prioritised by an NFDI Task Force on Evaluation and Reporting (formerly Task Force Monitoring) as a result of discussing possible answers to the DFG template. In this process the need to agree on a generalizable meaning of terms commonly used in the context of NFDI, and reporting in particular, were identified from cross-consortial perspectives. Questions that showed the highest requirement on clarification are discussed in this White Paper. As NFDI evolves, the Task Force will likely propose further joint approaches for reporting in information infrastructures.
While each of broad relevance, the questions addressed relate to substantially different aspects of consortia’s work. They are thus also structured slightly different.
Sprachanfragen als authentische Primärdaten bergen Erkenntnispotenziale für eine große Bandbreite linguistischer und transferwissenschaftlicher Forschungsfragen und Methoden. Der Beitrag skizziert diese Potenziale und legt dabei den Fokus auf wissenschaftskommunikative Prozesse im Austausch linguistischer Laien und Experten. Anhand erster Ergebnisse einer empirischen korpusgestützten Untersuchung von ca. 50.000 Sprachanfragen wird skizziert, welche Erkenntnisse aus diesen Daten für die Vermittlung von Sprachwissen in einer zunehmend digitalisierten und vernetzten Gesellschaft gewonnen werden können.
Metadaten zu Gesprächen und den beteiligten Sprecher/-innen enthalten Informationen, die für die Beschreibung, Erschließung und Analyse von Korpora wichtig sind. Bisher werden sie jedoch in der Konversationsanalyse und der Interaktionalen Linguistik so gut wie nicht genutzt. Dieser Beitrag zeigt exemplarisch, wie Metadaten des Gesprächskorpus „Forschungs- und Lehrkorpus Gesprochenes Deutsch“ (FOLK) im Rahmen einer interaktionslinguistischen Untersuchung verwendet werden können, um Regularitäten der Verwendung einer untersuchten Gesprächspraktik zu identifizieren und ihren Zusammenhang mit den Eigenschaften von Aktivitäten und Sprecherrollen zu klären. In allgemeinerer Perspektive diskutiert der Beitrag, wie und an welchen Stellen einer interaktionslinguistischen Untersuchung Metadaten von Nutzen sein können und wie ihr Stellenwert im Rahmen dieser Methodologie kritisch reflektiert werden muss.
Filtern, Explorieren, Vergleichen: neue Zugriffsstrukturen und instruktive Potenziale von OWIDplus
(2023)
OWIDplus, das Zusatzangebot zur Wörterbuchplattform OWID, vereint verschiedenste lexikalische Datenbanken, Korpustools und visuell aufbereitete Analysen, die mithilfe von Textsuche und Kategorienfiltern so sortiert werden können, dass Benutzer*innen leicht die für sie interessanten Projekte entdecken können. Eine tiefergehende Beschäftigung mit den Einzelprojekten zeigt, wie bei aller oberflächlicher Ähnlichkeit oder gemeinsamen Themenbereichen ganz unterschiedliche methodische Zugänge zu sprachlichen Daten gewählt worden sind und wie Methodik und Forschungsfrage stets aufeinander abgestimmt werden müssen. Die Vielzahl potenzieller Forschungsfragen führt so unweigerlich zu einer Diversität von Projekten und somit einer Heterogenität, die, so hoffen die Autor*innen, in OWIDplus greifbar wird.
Die sprachlichen Auffälligkeiten, die in Gedichten zu beobachten sind, haben immer wieder Anlass zu verschiedenen Versionen der Abweichungstheorie gegeben, derzufolge die in Gedichten verwendete Sprache von nicht-lyrischer Sprache abweicht. Expressionistische Lyrik ist insbesondere für ihre argumentstrukturellen Innovationen bekannt. Auf der Basis eines Korpus expressionistischer Gedichte wird eine Übersicht über diese Auffälligkeiten gegeben, die die Grundlage für weitere Studien darstellen soll, in denen zu zeigen sein wird, inwieweit unter bestimmten grammatiktheoretischen Annahmen die Abweichungstheorie zurückgewiesen werden kann.
This paper presents the IVK-Ler corpus, a longitudinal, annotated learner corpus of weekly writings produced by a group of 18 adolescents in a preparatory class. The corpus consists of 117 student texts collected between 2020 and 2021 and has a structure layered by student and text number. It includes metadata that enables researchers to analyze and track individual student progress in terms of syntactic competence and literacy. The annotation schema, manual and automatic annotation processes, and corpus representation are described in detail. The corpus currently includes target hypotheses and gold standard part-of-speech tags. Future work could include additional annotation layers for topological fields and dependency relations, as well as semantic and discourse annotations to make the corpus usable for tasks beyond syntactic evaluations.
Der vorliegende Beitrag beschreibt, wie die Verfügbarkeit digitaler Textkorpora den Wandel von einer systemorientierten hin zu einer gebrauchsorientierten Sprachforschung ermöglicht hat. Doch die korpusbasierte Beschreibung des Sprachgebrauchs kann nur so realistisch sein wie die Korpora, mit denen sie arbeitet. Deshalb ist es von großer Bedeutung, auch besondere Textsorten zu berücksichtigen und Herangehensweisen zu entwickeln, das dafür nötige Vertrauen bei den Datenspendern zu erzeugen. Im Zentrum des Beitrags steht deshalb die Diskussion von einigen derartigen Textsorten und den Herausforderungen, die sich mit ihnen in Hinsicht auf den Korpusaufbau verbinden. Der Beitrag endet mit einem Ausblick auf das Forum Deutsche Sprache, das einen solchen Ort des Vertrauens für Spracherhebungen bieten möchte.
Einleitung
(2023)
Der Beitrag betrachtet das Deutsche Referenzkorpus DeReKo in Bezug auf Strategien für seinen Ausbau, den Zugriff über die Korpusanalyseplattform KorAP und seine Einbettung in Forschungsinfrastrukturen und in die deutschsprachige und europäische Korpuslandschaft. Ausgehend von dieser Bestandsaufnahme werden Perspektiven zu seiner Weiterentwicklung aufgezeigt. Zu den Zukunftsvisionen gehören die Verteilung von Korpussressourcen und die Konstruktion multilingualer vergleichbarer Korpora anhand der Bestände der National- und Referenzkorpora, eine Plattform zur Abgabe und Aufbereitung von Sprachspenden als eine Anwendung von Citizen Science sowie eine Komponente zur automatischen Identifikation von übersetzten bzw. maschinenverfassten Texten.
In unserem Beitrag widmen wir uns dem Einsatz von Sprachkorpora für den Kontext
Deutsch als Fremdsprache (DaF), wobei wir unterschiedliche Ressourcen und Anwendungsbereiche beleuchten. Ziel des Beitrags ist es, exemplarisch Korpora für den DaF-Kontext vorzustellen, sowie deren Potenziale beispielhaft herauszustellen. Zu den vorgestellten Ressourcen zählen Lernerkorpora für Deutsch als Zielsprache, Spezial- und Fachkorpora, Vergleichskorpora sowie Korpora der gesprochenen Sprache und Wörterbuchressourcen. Mit Blick auf die unterschiedlichen Korpora und deren Spezifika loten wir lohnende Perspektiven und Anknüpfungspunkte für Forschung und Didaktik aus und geben Hinweise zur vertiefenden Auseinandersetzung.
This paper analyses intensification in German digitally-mediated communication (DMC) using a corpus of YouTube comments written by young people (the NottDeuYTSch corpus). Research on intensification in written language has traditionally focused on two grammatical aspects: syntactic intensification, i.e. the use of particles and other lexical items and morphological intensification, i.e. the use of compounding. Using a wide variety og examples from the corpus, the paper identifies novel ways that have been used for intensification in DMC, and suggests a new taxonomy of classification for future analysis of intensification.
In diesem sprachwissenschaftlichen Projekt wurden Verfahren des Sprecherwechsels und der Bedeutungsaushandlung in authentischen, telefonisch gedolmetschten Beratungsgesprächen untersucht. Die Daten liegen als PDF (nach dem HIAT-Verfahren) und als bearbeitbare Rohdaten in einer .exb-Datei vor. Die Transkripte dokumentieren Beratungsgespräche zwischen arabischsprechenden Klienten und einer Migrations- und Sozialberaterin, zu denen verschiedene Dolmetscher via Telefon herangezogen werden. Die Dolmetscher befinden sich jeweils in einem anderen Raum als die Beraterin und die Klienten. Die Gespräche erfolgten nach vorheriger Anmeldung. Die Beraterin ruft den Dolmetscher jeweils zum vereinbarten Termin an. Die Klienten sind subsidiär geschützte syrische Geflüchtete mit sehr geringen Deutschkenntnissen, die Hilfe beim Familiennachzug, Spracherwerb oder anderen authentischen Anliegen benötigen. Die Dolmetscher sprechen verschiedene regionale Varietäten des Arabischen. Daten, die auf die beteiligten Personen sowie auf die Beratungsstelle schließen lassen, wurden anonymisiert. Technisch bedingte Übertönungen und andere Handlungen der Beteiligten, die wegen der mangelnden Kopräsenz nicht für alle Beteiligten in den beiden Interaktionsräumen hörbar oder in einem Interaktionsraum nur visuell wahrnehmbar sind, wurden in den jeweiligen Annotationsspuren durchgehend annotiert. Dagegen wurden non- und paraverbale Phänomene wie etwa die Atmung ausschließlich im Hinblick auf ihre kommunikative Bedeutung sowie Relevanz für den Sprecherwechsel transkribiert und bei eingeschränkter akustischen Wahrnehmung kenntlich gemacht. Natürliche Phänomene menschlichen Sprechens, wie das Einatmen, Schlucken und Schmatzen, mit denen keine turnbezogene Handlungen einhergehen, blieben unberücksichtigt. Die nonverbalen Handlungen der Aktanten und deren Prosodie werden nur ansatzweise und im Hinblick auf die Untersuchungsfrage angedeutet.
Es werden in Veröffentlichungen ein englisches oder ein deutsches Kürzel als Bezeichnung für das Korpus verwendet (TIGA und TeDo). Die Nummerierung der Dateien ist jedoch immer die selbe.
Weitere Sprachen in dieser Datensammlung sind verschiedene Varietäten des gesprochenen Arabisch. Die Datensammlung stammt aus dem DFG-Projekt ME 3439/3 "Turn-taking und Verständnissicherung beim Telefondolmetschen Deutsch-Arabisch".
This paper shows how experimental methods can advance syntactic description and syntactic theory. The empirical domain is the order of verbs in German verb clusters containing a modal verb in the perfect. Such clusters are special insofar as prescriptive grammar requires the finite verb to appear in cluster-initial instead of cluster-final position (e.g., hat lesen müssen 'has read must' instead of lesen müssen hat 'read must has'). Contrary to this requirement, experiments show that native speakers accept the auxiliary also in later positions as long as it precedes the modal verb. The acceptability data are corroborated by corpus data and experimental data from language production. The relevance of the experimental data for syntactic theory are discussed.
The linear analysis of sentences is part of every grammatical description of German, often based on the theory of 'Topologische Felder' ('topological fields'). According to this theory, German sentences are composed of so-called 'Felder' ('fields') that can be filled by differents kinds of syntactic expressions. One widespread assumption is that some of the fields can be left empty, depending on the kind of sentence, another widespread assumption is that some of the fields are only optional. We will show that not all kinds of empty positions or fields which are adopted in different versions of topological theories are motivated. But this seems to be essential if we take the theory of topological fields serious. The following is an attempt of clarification.
The paper provides a survey about grammatical variation in German and discusses the consequences for grammar books: How can they describe systematic differences between several varieties as well as the core system of German as an individual language? Proceeding from the differentiation between extra- and intralinguistic explanations for grammatical variation and from theoretic considerations on the notion of 'system' the paper discusses different possibilities of modeling the relationship between system and variation. It argues for a modular concept with a core system that provides the option of internal variation and modular systems that contain grammatical phenomena which are specific for certain varieties.
The paper attempts to bridge the gap between semantics and the conceptualization and teaching of grammar at secondary school exemplarily concerning German demonstratives dies- and jen-. I show that existing accounts of these demonstratives in reference grammars and school books are far from being satisfactory, whilst at least for dies-, if not for jen-, there exist comprehensive linguistic analyses. I adapt these to offer a semantic analysis for jen- using corpus data from modern German with pronominal and adnominal jen-, and propose a didactically applicable category of 'shared mental space' of the speaker and the hearer for the demonstratives: I argue that speakers use demonstrative reference to anchor the referent inside resp. outside their and the hearers' shared mental space.
Die Arbeit mit digitalen Daten und empirischen Methoden hat die Möglichkeiten intersubjektiv nachprüfbarer Forschung und Theoriebildung in der Linguistik wie in kaum einer anderen geisteswissenschaftlichen Disziplin verändert. Der Linguistik steht heute eine beeindruckende Anzahl hochwertiger Korpusressourcen zur Verfügung, um Fragestellungen ausgehend vom tatsächlichen Sprachgebrauch in gesprochener und geschriebener Sprache zu bearbeiten und Hypothesen datengestützt zu überprüfen.
Dieser Band bietet Einblicke in Grundlagenfragen, aktuelle Forschungsarbeiten und Entwicklungen im Bereich der korpusgestützten Sprachanalyse – von den theoretischen Grundlagen über die Beschreibung einzelner Korpora und Werkzeuge bis hin zu korpusgestützten Fallstudien und zum Einsatz von Korpora in Lehre und Unterricht. Die 25 Beiträge reflektieren den Stand der gegenwärtigen Forschung und sind nicht nur für Expertinnen und Experten, sondern auch für fortgeschrittene Studierende der Linguistik mit einschlägigem fachlichen Interesse verständlich.
Strategische Kommunikation wird in verschiedenen Bereichen der menschlichen Interaktion verwendet, um eine bestimmte Zielgruppe zu beeinflussen. Sie befindet sich an der Schnittstelle mannigfaltiger Disziplinen, wie z.B. Kommunikations- und Politikwissenschaft, Psychologie, Management und Marketing. Strategische Kommunikation bezieht sich sowohl auf öffentliche und private Kommunikation, professionelle und unprofessionelle Kommunikantinnen und Kommunikanten als auch auf unterschiedliche Kommunikationskanäle.
Oralität ist gegenüber Literalität historisch primär, und der Übergang hin zur Literalität ist sprach- wie kulturwissenschaftlich einschneidend. Unserdeutsch (Rabaul Creole German), eine erst knapp über 100 Jahre junge, originär ausschließlich mündlich verwendete Kreolsprache, befindet sich gegenwärtig an der Schwelle hin zur Verschriftung. Eine Sammlung von rund 180 spontan schriftlich produzierten Äußerungen dieser noch auf allen Ebenen unnormierten Sprache zeigt von den Unserdeutsch-SchreiberInnen intuitiv zugrunde gelegte Graphem-Phonem-Korrespondenzen. Die Schriftbelege lassen dabei Rückschlüsse zu auf graphematische Kontakteinflüsse sowie auf die mentale Repräsentation von Wörtern bei den SprecherInnen. Diese Erkenntnisse sind, neben ihrer sprachtheoretischen Relevanz, vor allem auch für die noch ausstehende Erarbeitung einer Orthographie von Unserdeutsch von Bedeutung.
Kommunikative Misserfolge im Deutschen für ukrainische Deutschlerner aus interkultureller Sicht
(2020)
Begriffe, die meist als nulläquivalente Lexik (Lakunen) für ukrainische Deutschlerner gelten und somit Schwierigkeiten bereiten sowie im Allgemeinen zu Misserfolgen zwischen Kommunizierenden führen können, stehen im Mittelpunkt der folgenden Ausführungen. Um sie zu vermeiden, werden einige Themen und Aufgaben zur Erweiterung der sozial-kommunikativen und interkulturellen Kompetenzen vorgeschlagen.
Der Beitrag beschreibt einen spezifisch diskurslinguistischen Zugang zu der sprachgeschichtlichen Frage nach durch gesellschaftlich-politische Faktoren hervorgerufenen Umbrüchen. Orientiert an den Foucaultschen Kategorien der Serialität und der Diskontinuität werden diese methodischen Implikaturen auf die Umbrüche 1918/19 und 1945ff bezogen. Das Methodenmodell besteht im Wesentlichen aus zwei Aspekten: Als Faktor von hoher Umbruchrelevanz wird zum einen der soziopragmatische Bezug zu Diskursakteuren hergestellt. Exemplarisch werden zum andern diese Epochen kennzeichnende demokratiegeschichtliche Institutionalisierungsakte im Sinne Searles beschrieben. Damit wird ein Beitrag zur diskurslinguistischen Methodenreflexion geleistet.
Der vorliegende Aufsatz widmet sich zwei Kategorien der traditionellen (deutschen) Grammatik: dem Aufforderungssatz, einer der fünf klassischen Satzarten, und dem Imperativ, einer Verbform, die als typisch für Aufforderungssätze gilt. Er greift Beobachtungen aus der jüngeren Fachliteratur auf, die ein zunehmendes Unbehagen mit beiden Kategorien erkennen lassen. In morphologischer Hinsicht zeigt sich, dass nur wenige deutsche Verben eine eindeutige Imperativform besitzen. Manche Verben besitzen keine Imperativform. Bei der Mehrzahl der Verben besteht Homonymie zwischen Imperativformen und Konjunktivformen der 3. Person Singular. Imperativformen werden durch Konjunktivformen verdrängt. In syntaktischer Hinsicht wird argumentiert, dass Imperativsyntagmen keine Satzform haben. Satzförmige Ausdrücke mit Konjunktivformen, die für auffordernde Handlungen stehen, können als Wunschsätze kategorisiert werden. Als Aufforderungssätze bleiben zwei Klassen von Syntagmen im Grenzbereich zwischen nicht-satzförmigen und satzförmigen Ausdrücken übrig, die besondere Eigenschaften hinsichtlich Subjektbesetzung und Subjekt-Verb-Kongruenz zeigen.
Orthographie ist ein Thema, das spätestens seit der Rechtschreibreform 1996 nicht nur die wissenschaftliche Forschung, sondern auch den öffentlichen Diskurs entscheidend geprägt hat. Aus Anlass von „20 Jahren Rat für deutsche Rechtschreibung“ war dieses Thema auch Gegenstand der 59. Jahrestagung des Leibniz-Instituts für Deutsche Sprache.
Als Teil der NFDI vernetzt Text+ ortsverteilt verschiedenste Daten und Dienste für die geisteswissenschaftliche Forschung und stellt sie der wissenschaftlichen Gemeinschaft FAIR zur Verfügung. In diesem Beitrag beschreiben wir die Umsetzung beispielhaft im Bereich der Text+ Datendomäne Sammlungen anhand von Korpora, die in verschiedenen Disziplinen Verwendung finden. Die Infrastruktur ist auf Erweiterbarkeit ausgelegt, so dass auch weitere Ressourcen über Text+ verfügbar gemacht werden können. Enthalten ist auch ein Ausblick auf weitere zu erwartende Entwicklungen. Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.
IDS aktuell. Neues aus dem Leibniz-Institut für Deutsche Sprache in Mannheim. Jg. 2023, Heft 3
(2023)
Hintergrund: Die digitale Transformation prägt gesellschaftliche Systeme weltweit. Digital Health umfasst verschiedene Bereiche, wie z. B. die Verfügbarkeit und Auswertung von Daten, die Möglichkeit der Vernetzung innerhalb der eigenen Berufs- oder Betroffenengruppe und die Art, wie Patient*innen, Angehörige und Behandler*innen miteinander kommunizieren.
Ziel der Arbeit: Digital Health wird mit ihren Auswirkungen auf die Beziehung und die Kommunikation zwischen Patient*innen, Angehörigen und Behandler*innen beleuchtet. Veränderungen, die bereits erkennbar sind, werden beschrieben und Perspektiven aufgezeigt.
Methoden: Das Thema wird aus sozialphilosophischer, sprachwissenschaftlicher und ärztlicher Perspektive in folgenden Bereichen exploriert: digitale vs. analoge Kommunikation, Narration vs. Datensammeln, Internet und soziale Medien als Informationsquelle, Raum für Identitätsbildung und Veränderung der Interaktion von Patient*innen, Angehörigen und Behandler*innen.
Ergebnisse: Die Erweiterung der Interaktion zwischen Patient*innen und Ärzt*innen auf digitale und Präsenzformate sowie die asynchrone und synchrone Kommunikation erhöhen die Komplexität, aber auch die Flexibilität. Die Fokussierung auf „objektive“ Daten kann den Blick auf die Person mit ihrer individuellen Biografie beeinträchtigen, während digitale Räume die Möglichkeiten zur Identitätsbildung aufseiten der Patient*innen und für die Interaktion deutlich erweitern.
Diskussion: Bereits jetzt zeigen sich Vorteile der Digitalisierung (z. B. besseres Selbstmanagement) und Nachteile (Fokussierung auf Daten statt auf die Person). Für den kinder- und jugendärztlichen Bereich bestehen die Notwendigkeiten, professionelle kommunikative Kompetenzen und professionelle Gesundheitskompetenz zu erweitern sowie die Organisation seiner Versorgungseinrichtungen weiterzuentwickeln.
National Socialism, one could argue, was all about belonging: belonging to the ‘Volk’ or the ‘Volksgemeinschaft’, belonging to the ‘Aryan’ or ‘Non-Aryan race’, belonging to the National Socialist ‘movement’, and so on. These categories of belonging worked both inclusionary and exclusionary and they were constituted, proclaimed and enacted to a great part through language. What is more, they had to be performed through communicative acts. For the normative side of National Socialist propaganda and legislation, this seems rather obvious and one-directional. On the side of the general population, however, this entailed a mixture of communicative need to position oneself vis-à-vis National Socialism (mostly in affirmative ways), but also the urge to do so willingly. When we look at the language use of ‘ordinary people’ in different communicative situations and texts during National Socialism, we have to focus on these dimensions of discursive collusion, co-constitution and appropriation. People during National Socialism, such is our hypothesis, navigated through discourses of belonging and by that made them real and effective. Besides diaries, war letters and autobiographical writings, one way to grasp this phenomenon is to analyse petitions, i.e., letters of complaint and request sent in large numbers by ‘ordinary people’ to public authorities of the party and the state. As I will show by some examples, letter-writers tried to inscribe themselves within (what they took for) National Socialist discourses of belonging in order to legitimate their claims. By doing so, they co-constituted and co-created the discursive realm of National Socialism.
One of the fundamental questions about human language is whether all languages are equally complex. Here, we approach this question from an information-theoretic perspective. We present a large scale quantitative cross-linguistic analysis of written language by training a language model on more than 6500 different documents as represented in 41 multilingual text collections consisting of ~ 3.5 billion words or ~ 9.0 billion characters and covering 2069 different languages that are spoken as a native language by more than 90% of the world population. We statistically infer the entropy of each language model as an index of what we call average prediction complexity. We compare complexity rankings across corpora and show that a language that tends to be more complex than another language in one corpus also tends to be more complex in another corpus. In addition, we show that speaker population size predicts entropy. We argue that both results constitute evidence against the equi-complexity hypothesis from an information-theoretic perspective.
In the context of a Nordic Conference on Bilingualism, it can be a rewarding task to look at issues such as language planning, policy and legislation from a perspective of the southern neighbours of the Nordic world. This paper therefore intends to point attention towards a case of societal multilingualism at the periphery of the Nordic world by dealing with recent developments in language policy and legislation with regard to the North Frisian speech community in the German Land of Schleswig-Holstein. As I will show, it is striking to what degree there are considerable differences in the discourse on minority protection and language legislation between the Nordic countries and a cultural area which may arguably be considered to be part of the Nordic fringe - and which itself occasionally takes Scandinavia as a reference point, e.g. in the recent adoption of a pan-Frisian flag modelled on the Nordic cross (Falkena 2006).
The main focus of the paper will be on the Frisian Act which was passed in the Parliament of Schleswig-Holstein in late 2004. It provides a certain legal basis for some political activities with regard to Frisian, but falls short of creating a true spirit of minority language protection and/or revitalisation. In contrast to the traditions of the German and Danish minorities along the German-Danish border and to minority protection in Northern Scandinavia (in particular to Sámi language rights), the approach chosen in the Frisian Act is extremely weak and has no connotation of long-term oriented language-planning, let alone a rights-based perspective.
The paper will then look at policy developments in the time since the Act was passed, e.g. in the Schleswig-Holstein election campaign in 2005, and on latest perceptions of the Frisian language situation in the discourse on North Frisian Policy in Schleswig-Holstein majority society. In the final part of the paper, I will discuss reasons for the differences in minority language policy discourse between Germany and the Nordic countries, and try to provide an outlook on how Frisian could benefit from its geographic proximity to the Nordic world.
Tollpatschig interviewen oder interviewt werden – Kurzvideos im ukrainischen und deutschen Fernsehen
(2016)
Kurzinterviews im Fernsehen stellen nicht nur für die kontrastive Medienlinguistik, sondern auch für die Gesprächsanalyse, Textsortenlinguistik und Pragmatik einen aufschlussreichen Gegenstand dar, besonders wenn es sich um kommunikative Abweichungen handelt. Der Beitrag stellt die Klassifizierung der Abweichungen bzw. der Deviationen in den Fernsehinterviews in Bezug auf die Kommunikation und die Sprache vor. Dabei werden die Kommunikationsdeviationen vom Standpunkt des Adressanten, des Kommunikationsprozesses, des gegenseitigen Verständnisses und des Adressaten sowie sprachliche Abweichungen betrachtet. Im Beitrag werden gemeinsame und unterschiedliche Merkmale der Deviationen in ukrainischen und deutschen Kurzinterviews im Fernsehen festgestellt, was zur Erarbeitung eines Modells der Deviationen und zu einer tieferen kontrastiven Untersuchung beider Sprachen verhilft.
What is the subject of German linguistics? This seemingly simple question has no obvious answer. In the ZGL’s first issue, the editors required contributions to cover the whole of the German language and to be theoretically sound but application-orientated, whereas the current ZGL-homepage defines the German language of present and history in all its differentiations as its subject matter.
Looking through the fifty volumes of ZGL, three relationships can be identified as presumably enlightening the role of language, in particular the German language: language and mind; language and language use; language and culture. Though of a different systematic type, language and data should be added as an increasingly important pairing for conceptualizing language. On this basis, I also discuss the position of linguistic studies of the German language, mirrored in the ZGL-volumes, between social, cultural and natural sciences, as well as the corresponding epistemic approaches – like explaining vs. understanding.
This replication study aims to investigate a potential bias toward addition in the German language, building upon previous findings of Winter and colleagues who identified a similar bias in English. Our results confirm a bias in word frequencies and binomial expressions, aligning with these previous findings. However, the analysis of distributional semantics based on word vectors did not yield consistent results for German. Furthermore, our study emphasizes the crucial role of selecting appropriate translational equivalents, highlighting the significance of considering language-specific factors when testing for such biases for languages other than English.
Die Tagung Kommunikative Praktiken im Nationalsozialismus im virtuellen Paderborn hatte zum Ziel, die unterschiedlichen Perspektiven der geschichts- und sprachwissenschaftlichen NS-Forschung unter dem Dach der Praxeologie zusammenzubringen und so zu koordinieren, dass möglichst viele Anknüpfungspunkte für ein gemeinsames Verständnis der Hervorbringung von ns-spezifischen Deutungsrahmen entstehen (vgl. allgemein als Forschungsüberblick dazu Scholl 2019). Dabei haben sich Unterschiede in der Definition und Reichweite von kommunikativen Praktiken gezeigt, mehr noch aber wurden konvergierende Verständnisse freigelegt. Diese richten sich vor allem auf die kommunikative Bearbeitung zentraler Diskursgegenstände wie Gemeinschaft, Arbeit oder Freiheit durch sprachliche o. a. Verfahren, die situiert und unter konkreten historischen Bedingungen aus einem bestimmten Akteurskreis heraus entstehen.
Der Beitrag untersucht Bedeutungszuschreibungen an den 30. Januar 1933 während des Nationalsozialismus. Ausgehend von der Beobachtung des hohen historisch-symbolischen Gehalts, der diesem Datum auch heute noch anhaftet, wird anhand von charakteristischen Belegstellen gezeigt, mit welchen Aufladungen die Ereignisse dieses Tages während der NS-Zeit versehen wurden, sowohl von Seiten wichtiger Instanzen des NS-Regimes, aber auch durch die Ko-Konstitution und teils strategisch-funktionale Aneignung dieser Deutungsmuster durch einzelne Mitglieder der integrierten Gesellschaft. Im Zentrum steht nicht so sehr eine spezifische kommunikative Praktik, sondern die Beobachtung, dass ein zentrales Referenzdatum des Nationalsozialismus, der 30. Januar 1933 als ›Tag der Machtergreifung‹, in unterschiedlichen kommunikativen Praktiken zur Anwendung kam bzw. dass die ›historische‹ Bedeutung dieses Datums in unterschiedlichen kommunikativen Praktiken konstituiert wurde.
Die nationalsozialistische Gesellschaft war geprägt von vielgestaltigen kommunikativen Praktiken des sozialen und auch gewaltvollen Ein- und Ausschlusses. Gleichzeitig bildeten sich durch Widerstandshandlungen vielfältige Gegendiskurse heraus. Der Sammelband nimmt konkrete Beispiele kommunikativer Praktiken während des Nationalsozialismus in den Blick und fragt speziell danach, inwiefern diese themen-, textsorten- und akteursspezifisch gebunden waren.
„Unserdeutsch”, a creole spoken in a former German South Pacific colony, and what is now Papua New Guinea, is being extensively documented and studied by linguists for the first time. There is no time to lose, because after a chequered history the world's only German-based creole – long ignored – is facing extinction.
In this paper, we discuss to what extent the German-based contact language Unserdeutsch (Rabaul Creole German, cf. Volker 1982) matches the category‘creole language’ from both a socio-historical and structural perspective. As a point of reference, we will use typological criteria that are widely supposed to be typical for creole languages. It is shown that Unserdeutsch fits fairly well into the pattern of an ‘average creole’, as has been suggested by data in the Atlas of Pidgin and Creole Language Structures (Michaelis et al. 2013). This is despite a series of atypical conditions in its development that might lead us to expect a close structural proximity to the lexifier language, i.e. a relatively acrolectal creole. A possible explanation for this striking discrepancy can be found in the primary function of Unserdeutsch as a marker of identity as well as in the linguistic structure of its substrate language Tok Pisin.