Refine
Year of publication
Document Type
- Article (22) (remove)
Has Fulltext
- yes (22)
Keywords
- Deutsch (11)
- Korpus <Linguistik> (4)
- Rechtschreibung (4)
- Kommunikation (3)
- Sprachgebrauch (3)
- Sprachwandel (3)
- Automatische Sprachanalyse (2)
- COVID-19 (2)
- Computerlinguistik (2)
- Daten (2)
Publicationstate
- Postprint (22) (remove)
Reviewstate
- (Verlags)-Lektorat (22) (remove)
Publisher
- Oxford University Press (4)
- Buske (3)
- V&R Unipress (3)
- Friedrich (2)
- StudienVerlag (2)
- Deutsche Hochschulverband (DHV) (1)
- Lang (1)
- Lemmens (1)
- Linguistic Analysis (1)
- Metropol (1)
Die Coronapandemie hat die Welt seit Anfang 2020 in vielfältiger Weise geprägt. Der Alltag hat sich gewandelt: Schule, Beruf, das tagtägliche Bewegen in der Öffentlichkeit oder in Verkehrsmitteln ist Regeln unterstellt, die es in dieser flächendeckenden und umfassenden Art so noch nicht gegeben hat. In diesem Wandel in der Welt ist auch die Sprache einer stetigen Entwicklung unterworfen. Neue Dinge in der Welt wollen erzählt und ausgetauscht werden. Und so kommt es in der Zeit der Coronapandemie zu zahlreichen Wortneuschöpfungen, Entlehnungen oder Bedeutungserweiterungen von bereits existierenden Wörtern. Das Leibniz-Institut für Deutsche Sprache in Mannheim (IDS) beobachtet diese Entwicklungen und arbeitet u. a. im Projekt »Neuer Wortschatz« an der Dokumentation dieser lexikalischen Spuren, die die Coronapandemie im Wortschatz hinterlässt. Der Beitrag begibt sich auf Spurensuche nach Neuem, nach neu Ausgehandeltem und nach der Frage, wie die (Wort-)Geschichte wohl weitergehen wird.
An approach to the unification of XML (Extensible Markup Language) documents with identical textual content and concurrent markup in the framework of XML-based multi-layer annotation is introduced. A Prolog program allows the possible relationships between element instances on two annotation layers that share PCDATA to be explored and also the computing of a target node hierarchy for a well-formed, merged XML document. Special attention is paid to identity conflicts between element instances, for which a default solution that takes into account metarelations that hold between element types on the different annotation layers is provided. In addition, rules can be specified by a user to prescribe how identity conflicts should be solved for certain element types.
This article shows that the TEI tag set for feature structures can be adopted to represent a heterogeneous set of linguistic corpora. The majority of corpora is annotated using markup languages that are based on the Annotation Graph framework, the upcoming Linguistic Annotation Format ISO standard, or according to tag sets defined by or based upon the TEI guidelines. A unified representation comprises the separation of conceptually different annotation layers contained in the original corpus data (e.g. syntax, phonology, and semantics) into multiple XML files. These annotation layers are linked to each other implicitly by the identical textual content of all files. A suitable data structure for the representation of these annotations is a multi-rooted tree that again can be represented by the TEI and ISO tag set for feature structures. The mapping process and representational issues are discussed as well as the advantages and drawbacks associated with the use of the TEI tag set for feature structures as a storage and exchange format for linguistically annotated data.
We report on finished work in a project that is concerned with providing methods, tools, best practice guidelines, and solutions for sustainable linguistic resources. The article discusses several general aspects of sustainability and introduces an approach to normalizing corpus data and metadata records. Moreover, the architecture of the sustainability platform implemented by the authors is described.
This article introduces the topic of ‘‘Multilingual language resources and interoperability’’. We start with a taxonomy and parameters for classifying language resources. Later we provide examples and issues of interoperatability, and resource architectures to solve such issues. Finally we discuss aspects of linguistic formalisms and interoperability.
Mehrsprachigkeit gehört zu den Themen, zu denen wohl viele Menschen eine Meinung haben. Der Wert traditioneller schulischer Fremdsprachen wird dabei häufig hervorgehoben, während Wert und Erhalt von Herkunftssprachen Zugewanderter hinterfragt werden. Einstellungen gegenüber Sprachen sind demnach abhängig vom Prestige der jeweiligen Sprachen und ihrer Sprecher:innen. Dies geschieht vor dem Hintergrund, dass Deutschland überwiegend als ein einsprachiges Land mit einer einsprachigen Gesellschaft angesehen wird. Ähnliches gilt im Übrigen auch für Österreich. So schreibt beispielsweise der Sprachwissenschaftler Heiko Marten, „dass in der Wahrnehmung großer Teile der österreichischen Gesellschaft Monolingualismus nach wie vor die Norm ist“ (Marten 2016, S. 165). Diese Annahme gilt auch für den schulischen Kontext, wie die Erziehungswissenschaftlerin Ingrid Gogolin mit dem Begriff des „monolingualen Habitus“ herausgearbeitet hat (vgl. Gogolin 2008). Gründe für einen monolingualen Habitus könnten darin liegen, dass „von Teilen der Allgemeinheit oft übersehen [wird], dass in Deutschland auch zahlreiche weitere Sprachen gesprochen werden“ (Marten 2016, S. 148). Doch was passiert nun, wenn eine Sprache einen Statuswechsel von Landessprache zu Herkunftssprache durchläuft? Was lässt sich beobachten, wenn beispielsweise das Deutsche zu einer Minderheitensprache wird?