Refine
Year of publication
- 2020 (128) (remove)
Document Type
- Part of a Book (56)
- Article (36)
- Review (12)
- Part of Periodical (8)
- Conference Proceeding (6)
- Book (5)
- Doctoral Thesis (2)
- Other (2)
- Master's Thesis (1)
Language
- German (105)
- English (21)
- Multiple languages (2)
Has Fulltext
- yes (128)
Is part of the Bibliography
- no (128) (remove)
Keywords
- Deutsch (35)
- Mundart (17)
- Dialektologie (15)
- Korpus <Linguistik> (14)
- Sprachgebrauch (13)
- Grammatik (11)
- Social Media (11)
- COVID-19 (10)
- Computerunterstützte Kommunikation (10)
- Linguistik (9)
Publicationstate
- Zweitveröffentlichung (56)
- Veröffentlichungsversion (55)
- Postprint (5)
- Ahead of Print (1)
Reviewstate
Publisher
Zum (Fremdsprachen-)Lernen mit Sozialen Medien existieren verschiedene Hypothesen, von denen ein paar eine große Stoßkraft entwickelt haben, obwohl sie sich empirisch nicht belegen lassen. In diesem Artikel werden einige von ihnen dekonstruiert, gleichzeitig wird aber auch gezeigt, warum und mit welchen Zielen ein Einsatz Sozialer Medien im Deutsch-als-Fremdsprache-Unterricht sinnvoll ist. Möglichkeiten des Einsatzes werden beispielhaft für die Förderbereiche des kooperativen Schreibens sowie für eine Verbindung von informellem und formalem Lernen thematisiert. Dabei wird ein besonderer Schwerpunkt auf die Betrachtung sozialer Netzwerke gelegt. Abschließend wird auf Herausforderungen eingegangen, die sich im Zusammenhang mit dem Einsatz Sozialer Medien im Deutsch-als-Fremdsprache-Unterricht stellen.
Dieser Beitrag beschäftigt sich mit dem Einsatz von dialektalen Merkmalen in Werbespots für den deutschen und österreichischen Markt sowie mit seinen Funktionen am Beispiel von Iglo (Lebensmittelbranche, Tiefkühlkost). Im Zentrum stehen dabei folgende Fragen: Welche dialektalen Merkmale welcher sprachlichen Beschreibungsebenen (Phonetik/Phonologie, Morphologie, Lexik) werden in welchen Textteilen der Spots verwendet? Wird dabei auch multimodal und multisensorisch auf die betreffende Region Bezug genommen? Die Analysen zeigen auch, inwiefern sich der Gebrauch dieser Merkmale in den deutschen und österreichischen Spots unterscheidet, und ob der Dialektgebrauch in den Werbespots (Auswahl der Merkmale, Kontexte/Gesprächssituationen) mit den Ergebnissen von Studien zum Gebrauch und zur Wahrnehmung von Dialekten im Allgemeinen übereinstimmt.
Repeating the movements associated with activities such as drawing or sports typically leads to improvements in kinematic behavior: these movements become faster, smoother, and exhibit less variation. Likewise, practice has also been shown to lead to faster and smoother movement trajectories in speech articulation. However, little is known about its effect on articulatory variability. To address this, we investigate the extent to which repetition and predictability influence the articulation of the frequent German word “sie” [zi] (they). We find that articulatory variability is proportional to speaking rate and the duration of [zi], and that overall variability decreases as [zi] is repeated during the experiment. Lower variability is also observed as the conditional probability of [zi] increases, and the greatest reduction in variability occurs during the execution of the vocalic target of [i]. These results indicate that practice can produce observable differences in the articulation of even the most common gestures used in speech.
Ancient Chinese poetry is constituted by structured language that deviates from ordinary language usage; its poetic genres impose unique combinatory constraints on linguistic elements. How does the constrained poetic structure facilitate speech segmentation when common linguistic and statistical cues are unreliable to listeners in poems? We generated artificial Jueju, which arguably has the most constrained structure in ancient Chinese poetry, and presented each poem twice as an isochronous sequence of syllables to native Mandarin speakers while conducting magnetoencephalography (MEG) recording. We found that listeners deployed their prior knowledge of Jueju to build the line structure and to establish the conceptual flow of Jueju. Unprecedentedly, we found a phase precession phenomenon indicating predictive processes of speech segmentation—the neural phase advanced faster after listeners acquired knowledge of incoming speech. The statistical co-occurrence of monosyllabic words in Jueju negatively correlated with speech segmentation, which provides an alternative perspective on how statistical cues facilitate speech segmentation. Our findings suggest that constrained poetic structures serve as a temporal map for listeners to group speech contents and to predict incoming speech signals. Listeners can parse speech streams by using not only grammatical and statistical cues but also their prior knowledge of the form of language.
Der Artikel hinterfragt die Annahme, dass Wortarten sich gemäß ihrer Definition dazu eignen, als (schul-)grammatische Kategorien zu fungieren: Betrachtet man die tatsächlich in Sprachen (hier: dem Deutschen) vorliegende lexikalische Elemente, so stellt man fest, dass systematische Zwischen- und Zweifelsfälle der Kategorisierung binäre Kategorisierungen (wie Substantiv – kein Substantiv, Verb – kein Verb, etc.) oft empirisch nicht zulassen. Alternative (graduellere/mehrdimensionale) Kategorisierungen, die den empirischen Fakten Rechnung tragen, eignen sich umgekehrt aber nicht für die ihnen zugedachten binären Vorhersagen (Großschreibung – keine Großschreibung, Subjektkongruenz – keine Subjektkongruenz, etc.). Eine Lösung dieses Dilemmas scheint momentan nicht leicht verfügbar.
Der Beitrag beschreibt einen Ansatz zur Qualitätsbewertung multimodaler Hypertexte und internetbasierter Interaktion. Das Modell fußt auf Ansätzen zur Bewertung von Textqualität in linear organisierten Schrifttexten, insbesondere dem Zürcher Textqualitätenraster, das bereits im prädigitalen Zeitalter für eine große empirische Untersuchung zum Schreibgebrauch in Aufsatztexten genutzt wurde. Der Beitrag beschreibt und begründet, welche Erweiterungen für multimodale Hypertexte und internetbasierte Interaktion erforderlich sind. Vertiefend wird dabei das Konzept der Kohärenz behandelt, das für lineare Texte und für Hypertexte gleichermaßen relevant ist. An Beispielen wird gezeigt, wie Hyperlinks als digitale Kohärenzbildungshilfen bei der Hypertextproduktion und beim interaktionsorientierten Schreiben eingesetzt werden. Die Kohärenzanalyse wird erweitert um zwei neue Aspekte: 1) die interaktionale Kohärenz zwischen Beiträgen verschiedener Personen in der digitalen Interaktion (z. B. beim Chatten oder in Online-Diskussionen) und 2) die multimodale Kohärenz zwischen Text-, Bild-, Audio- und Videoelementen.
Was macht eigentlich die Netzwerkforschung im Zusammenhang mit Beziehungen und deren Struktur in der digitalen Welt? Wie hängt Struktur und die Herausbildung von Kultur und Sprache zusammen? Obwohl Kultur noch mehr als Sprache umfasst, sind die Aushandlung von Kultur und die Anwendung von Kulturelementen kaum ohne Sprache vorstellbar. Sprache ist also integrativer Teil von Kultur - ohne Sprache keine Kultur. Die Herausbildung von Sprachkulturen ist wesentlicher Teil dieser Entwicklungen. Wenn wir nun auf den Zusammenhang von Netzwerken und Kultur schauen, so können wir feststellen, dass hier kaum eine Kausalität behauptet werden kann, sondern beides ist miteinander tief verwoben. Zunächst werden einige wichtige Aspekte der Netzwerkforschung exemplarisch angesprochen und mit eigener Forschung illustriert. Danach gehe ich auf einen Shitstorm ein, an dem ich einige Aspekte aus dem Anfangsteil noch einmal aufnehme.
In internetgestützten Medien ist eine Reihe von medienspezifischen Kommunikationspraktiken entstanden - vom Flaming und Trolling aus der Frühzeit des Internet bis zum für die Sozialen Medien charakteristischen Shitstorm. In diesem Beitrag befasse ich mich anhand einer Fallstudie eines von mir als „personalisiert“ bezeichneten Shitstorms gegen die Sprachwissenschaftlerin Luise Pusch mit der Frage, inwiefern diese Form des Shitstorms mit den medialen Eigenschaften sozialer Netze - speziell, des Netzwerks Twitter - zusammenhängt und welche gesellschaftlichen Rahmenbedingungen er benötigt.
Als die Olympischen Sommerspiele 1968 im Oktober 1963 nach Mexico City vergeben wurden, machten sorgenvolle Befürchtungen aufgrund der Höhe des Austragungsorts und die dadurch auftretenden Belastungen der Athlet*innenkörper in den Medien die Runde. Sehr schnell gingen fast alle teilnehmenden Sportverbände zur höhenphysiologischen Vorbereitung unter Einbeziehung sportmedizinischer Expertise über. Auf der Basis von Archivbeständen des Deutschen Olympischen Sportbundes sowie zeitgenössischen sportmedizinischen Beiträgen beleuchtet der Aufsatz die Rolle der Sportmedizin in der Vorbereitungsphase auf die Olympischen Sommerspiele 1968. Im Zentrum steht die Frage, auf welche Weise der Leistungskörper der Athlet*innen ins biopolitische, sportmedizinische Blickfeld rückte, welche Tests und Untersuchungen mit ihm durchgeführt wurden und welche Bedeutung dies für das Zusammenspiel von Leistungssport und Sportmedizin hatte.
In dem einleitenden Beitrag wird in groben Zügen 1. ein Überblick über die digitale Entwicklung und die Entwicklung der Internetlinguistik gegeben und 2. auf Probleme und Desiderata hinsichtlich theoretischer und empirisch-methodischer Aspekte in der Forschung eingegangen, wobei 3. perspektivisch auf Vernetzung und Netzwerkanalysen fokussiert wird. Dies wird schlaglichtartig reflektiert vor dem Hintergrund der Entwicklung eines maschinenbasierten Digitalkapitalismus.
Wenn hinten besser ist als vorne. Laienlinguistisches Wissen unter diskursanalytischer Perspektive
(2020)
Wahrnehmungsdialektologische Studien haben den wichtigen Nachweis erbracht, dass sich Laien bei der mentalen Strukturierung ihrer sprachlichen Umgebung an sozial relevanten, z. B. an politischen, Räumen orientieren. Methodisch ermittelt wurde dieser Nachweis über Draw-a-map-Aufgaben, die Laien zur kartografischen Visualisierung ihrer sprachräumlichen Vorstellungen bewegen. Vorliegender Artikel wählt einen methodisch anderen Weg: Laienlinguistische Strukturierungen werden nämlich nicht ausgehend von handgezeichneten Karten, sondern von Gesprächen über diese Karten untersucht. Dabei zeigt sich, dass es mentale Strukturierungen gibt, die jenseits von kartografisch abbildbaren Räumen liegen: Ein flexibel einsetzbares Hinten und Vorne im Sprachraum etwa oder ein Oben und Unten, die beide mit gewichtigen gesellschaftlichen Wertungen versehen und deshalb für Laien im Alltag relevant sind.
Die Wörterbücher zur Sprach- und Kommunikationswissenschaft sind eine Fachwörterbuchreihe, die für 25 Bände geplant ist und in der aktuell ca. 12.000 Artikel online stehen. WSK-1 wird in zwei Teilbänden (Formenlehre, Syntax) von Stefan J. Schierholz und Pál Uzonyi herausgegeben. Es handelt sich um ein alphabetisches und teilbilingualisiertes terminologisches Fachwörterbuch, das als Adressaten in erster Linie Studierende sieht und bei der Textrezeption und fachbezogenen Informationen behilflich sein soll. Von insgesamt ca. geplanten 4500 Artikeln sind über 4000 Artikel bereits online erschienen.
Im Folgenden werden die konzeptuelle Ordnung der Termini, die unterschiedlichen Artikeltypen (Synopse-, Einzel-, Verweisartikel), die Verweisstrukturen (uni-, bidirektional; Synonyme, Antonyme, inhaltlich-thematische Verweisungen, Mehrworttermini), die Abbildung der kognitiven Strukturen des Fachwissens, die Lernkomponenet des Bandes sowie der Artikelaufbau vorgestellt.
Bisherige Studien zur gegenwärtigen Sprachsituation im ehemaligen innerdeutschen Grenzgebiet haben vor allem den Basisdialekt im bayrisch-thüringischen Grenzgebiet fokussiert. Die Regionalsprache, die laienlinguistische Wahrnehmung sowie die nördlich gelegenen Grenzgebiete wurden eher stiefmütterlich behandelt. In diesem Beitrag steht eine Untersuchung im Mittelpunkt der Betrachtung, die im Rahmen meines laufenden Promotionsprojekts durchgeführt wurde und sich dem genannten Desiderat annimmt. Der Fokus des Beitrags richtet sich auf ausgewählte Ergebnisse der Draw-a-Map-Task, die aufzeigen, wie die dort lebenden Personen den ehemaligen deutsch-deutschen Grenzraum strukturieren und wahrnehmen (bspw. welche Dialekträume werden im Grenzgebiet unterschieden und welchen Konzepten unterliegen sie). Hierbei steht insbesondere die Veränderlichkeit des Konzepts der „Mauer in den Köpfen“ im Vordergrund.
In der vorliegenden Studie steht die itzgründische Dialektlandschaft innerhalb der ehemaligen Grenzgebiete in Thüringen und Bayern im Fokus. Auf Basis des „integrierenden Ansatzes“ werden Real-Time-Daten und Apparent-Time-Daten miteinander kombiniert und die Frage geklärt, ob an der ehemaligen deutsch-deutschen Grenze eine neue Dialektgrenze entstanden ist. In diesem Zusammenhang wird sowohl die Wahrnehmung als auch die Kompetenz der Grenzbewohner untersucht. So ist es möglich, die objektive, dialektgeografische Struktur (mittels Variablenanalyse) und die subjektive, wahrnehmungsdialektologische Struktur (mittels Hörerurteilstests) darzustellen.
Sprachliche Zeichen im öffentlichen Raum (Linguistic Landscape - LL) tragen neben ihrer primären Bedeutung und Funktion wie Auskunft und Werbung auch sekundäre Informationen zur Sprachenhierarchie, zur Repräsentation von Minderheitensprachen, zur sprachlichen Toleranz gegenüber der Mehrsprachigkeit in diesem Raum, etc. Diese Vielschichtigkeit macht die sprachlichen Zeichen im öffentlichen Raum zu wertvollen Lernobjekten, an denen die im Berufsleben so bedeutende diskursive Lesefähigkeit der Studierenden trainiert werden kann. Der Beitrag öffnet Perspektiven auf die Möglichkeiten der Verknüpfung der LL-Analyse mit den Inhalten der traditionellen germanistischen Curricula wie auch benachbarter Fachbereiche und verweist auf bisherige Studien in diesem Bereich.
Nonnative-accented speakers face prevalent discrimination. The assumption that people freely express negative sentiments toward nonnative speakers has also guided common research methods. However, recent studies did not consistently find downgrading, so that prejudice against nonnative accents might even be questioned at first sight. The present theoretical article will bridge these contradictory findings in three ways: (a) We illustrate that nonnative speakers with foreign accents frequently may not be downgraded in commonly used first-impression and employment scenario paradigms. It appears that relatively controlled responding may be influenced by norms and motivations to respond without prejudice, whereas negative biases emerge in spontaneous responding. (b) We present an integrative view based on knowledge on modern forms of prejudice to develop modern notions of accent-ism, which allow for predictions when accent biases are (not) likely to surface. (c) We conclude with implications for interventions and a tailored research agenda.
Vitaminhaltig ist gut, vitaminreich noch besser. Eine arbeitsfreie Zeit mag entspannen, eine arbeitslose kaum. Wirken solche Aussagen sinnvoll oder doch eher sinnarm?
Die Wortbildungsproduktivität von komplexen possessiven und privativen Adjektiven erscheint praktisch grenzenlos – in der Theorie werden ihr dagegen sehr wohl Grenzen gesetzt, jedoch ohne Berücksichtigung gebrauchsbasierter, empirischer Analysen. Diesem Desiderat widmet sich dieser Band, in welchem anhand konkreter Sprachdaten Forschungslücken und Widersprüche aufgedeckt und offene Fragestellungen beantwortet werden. Zudem zeigen sich neue Bedeutungsaspekte, die den Wortbildungsprodukten bislang nicht zugeschrieben wurden. In Gänze erbringen die Analysen den nötigen Beweis, dass die korpuslinguistischen Untersuchungen bisherige morphologische Beschreibungen sowohl erweitern als auch korrigieren können und sich darüber hinaus zum Entwickeln neuer Modelle mit neuen Kategorien eignen. Die eigens für diese Zwecke korpusgestützt generierte Stichwortliste findet sich samt Anzahl an Belegtreffern im Anhang wieder.
Der Text etabliert eine neue analytische Hinsicht auf soziolinguistische Fragestellungen unter dem Titel soziale Präsenz, ausgehend von bestehenden theoretischen Annäherungen an das Verhältnis von Sprechen und Sozialität. Ziel des Ansatzes ist eine umfassende Analyse menschlichen (Sprach)Handelns in der Lebenswelt, die unterschiedliche Formen von symbolischer und praktischer Selbstbehauptung und darauf bezogener Formen gesellschaftlicher Anerkennung in ihrer jeweiligen Bedeutung für die praktische Aushandlung sozialer Regime der Sichtbarkeit in den Blick nimmt. Die theoretischen Setzungen werden in der Folge am Beispiel regionaltypischer Ausprägungen des Deutschen in Österreich empirisch überprüft. Die Analyse von Social-Media-Diskussionen aus der App „Jodel“ zeigt dabei, dass typisch österreichische Formen konstitutiver Bestandteil der digitalen Schriftlichkeit junger Österreicher/-innen sind, die diese Ressource gezielt einsetzen, um regionale Gruppenzugehörigkeit zu markieren. In ähnlicher Weise belegen die Einstellungen junger Österreicher/-innen die soziale Anerkennung typisch österreichischer Sprechweisen (besonders des Regiolekts) als bevorzugtes Mittel der informellen und Nähekommunikation mit identitätsstiftender Funktion. Die Analyse öffentlicher Schriftlichkeit in Wien mit Hilfe von Daten aus dem Projekt „Lingscape“ zuletzt verdeutlicht, dass typisch österreichische Formen in der städtischen Sprachlandschaft verankert sind, dabei aber vor allem der Herstellung soziokultureller Nähe in institutioneller und ökonomischer Kommunikation dienen.
Für den öffentlichen Sprachgebrauch im Internet ist Facebook, das mit 15 Jahren zur älteren Generation von Social-Media-Sites zählt, nach wie vor hochrelevant. Im deutschsprachigen Raum ist es die am meisten genutzte Social-Media-Plattform (Newman et al. 2019). Zu den Diensten gehören unter anderem Facebook-Seiten (Pages), die von Unternehmen, Parteien, Medien und anderen Institutionen oder Individuen betrieben werden und als öffentliche Angebote prinzipiell auch von nicht bei Facebook angemeldeten Personen eingesehen werden können. Solche öffentlichen Facebook-Seiten sind als sites of engagement zwischen gesellschaftlichen Institutionen und Individuen reichhaltige Quellen für die linguistische Forschung.
Im Vergleich zu anderen Plattformen bietet Facebook aber nur einen eingeschränkten Zugriff auf diese öffentlichen Sprach- und Interaktionsdaten (Freelon 2018). Während beispielsweise für Twitter viele Tools zur Datensammlung existieren und auch die Plattform selbst eine ausgebaute Suchmaske bietet, erschweren die limitierten Suchmöglichkeiten der Facebook-Plattform und das fehlende Angebot von einfach nutzbarer Software linguistische Projekte in Forschung und Lehre. Gleichzeitig stellen sich neben den praktischen Fragen an vielen Stellen auch forschungsethische Fragen im Umgang mit Onlinedaten.
Seit 30 Jahren besteht die Mauer als physische Grenze zwischen den ehemaligen beiden deutschen Staaten nicht mehr. Aus linguistischer Perspektive kann von einer „sprachlichen Vereinigung“ ausgegangen werden, jedoch scheint sich die Mauer mental und sprachlich als diskursive MauerindenKöpfen festgesetzt zu haben. Mittels der draw-a-map-Methode und der Priming-Methode der kognitiven Psychologie wird im vorliegenden Beitrag untersucht, ob sich eine solche Mauer auch in den Köpfen jünge-rer Personen finden lässt, die sozialisiert wurden, als die beiden deutschen Staaten nicht mehr existierten. Die Ergebnisse zeigen deutlich, dass sich Unterschiede unter den Priming-Bedingungen bzgl. der Sprechproben, der Herkunft der Proband/-innen und den Variablen Verortung, Benennung und Assoziation finden lassen
Having the necessary skills for staying in contact with friends and relatives through digital devices is crucial in today’s world. As the current COVID-19 pandemic shows, this holds especially true for the elderly. Being quarantined and restricted from physically meeting people, various communication technologies are more important than ever for staying social and informed on current events. In nursing homes, staff members are now finding new ways for staying in touch with family members by assisting residents in making video calls with mobile devices.
But what if elderly people cannot rely on personal assistance for accessing these alternative means of communication? This raises the general question of how older people can and do learn to use such technologies. Although the internet is full of guides and instructional videos on how to use smartphones or tablets, they are a cold comfort to someone who may not even know what an internet browser is.
Especially for digital newcomers, the tried and true method of face-to-face instruction is invaluable. While many older people turn to their children or grandchildren for help in all things digital, courses specifically tailored for elderly users are also increasingly popular.
More and more governmental initiatives and associations indeed acknowledge the already existing interest of elderly citizens in digital tools and their growing need to receive customized training (e.g. “SeniorSurf” and “Kansalaisen digitaidot” in Finland or “Silver Tipps” in Germany). For a researcher of social interaction, these courses can also provide a valuable window for discovering what it looks and sounds like to learn to use essential but sometimes alien technologies.
Im vorliegenden Beitrag werden erstmals Daten zweier aktueller Projekte zu Einstellungen von Deutschschweizer/-innen zu Hochdeutsch und Dialekt verglichen. Dabei wird beleuchtet, welche Unterschiede und Gemeinsamkeiten sich in den Daten der Samples – einem bezüglich Bildung und Beruf heterogenen und einem bezüglich dieser Faktoren homogenen – feststellen lassen. Es zeigt sich eine vielschichtige Konzeptualisierung des Hochdeutschen in beiden Studien, die mit der Annahme unterschiedlicher mentaler Hochdeutsch-Modelle (Norm, Plurizentrizität, Schriftlichkeit, Mündlichkeit mit zwei Untermodellen) erklärt werden kann.
Grammatische Termini sind in ihrer Existenz nicht immer stabil. neue wissenschaftliche Erkenntnisse, erweiterte Perspektiven und Paradigmenwechsel führen zu einem Wandelin der Terminologie. Während die Termini in Linguistischen Grammatiken dem aktuellen Status Quo der sprachwissenschaftlichen Grammatikschreibung weitgehend entsprechen, hinkt die sprachpraktische Anwendung in der Didaktik deutsch als Fremdsprache oft hinterher. Dies wird mithilfe einer Auswahl grammatischer Themen (Konnektoren, Verbvalenz, Wortbildung des Verbs und dem Bereich der Kollokationen/usuellen Wortverbindungen) und der im DAF-Bereich häufig verwendeten Pädagogisch-didaktischen Grammatiken, Handbüchern und Fachlexika sowie Lehrwerken aufgezeigt.
Ziel des vorliegenden Beitrages ist es, LingTermNet, ein Online-Repositorium für linguistische Fachtermini, vorzustellen. Methodologisch und hinsichtlich seiner lexikografischen Umsetzung basiert LingTermNet auf framesemantischen Prinzipien, die auch dem Berkeleyer FrameNet-Projekt zugrunde liegen. Dargestellt werden zunächst leitende theoretische Annahmen; im Zentrum steht sodann die Präsentation von Aufbau und Struktur der Ressource. Im Unterschied zu ‘traditionellen’ Wörterbüchern entstehen Einträge in LingTermNet auf der Grundlage von framesemantischen Annotationen, deren Auswertung auf zwei Ebenen lexikografisch aufgearbeitet werden: Die framesemantische Ebene dokumentiert Frames und ihre Beziehungen untereinander, die lemmaspezifische Ebene basiert auf framesemantischen Untersuchungserkenntnissen, wobei die Einträge hier klassischen Wörterbuchdefinitionen ähneln.
We introduce a novel scientific document processing task for making previously inaccessible information in printed paper documents available to automatic processing. We describe our data set of scanned documents and data records from the biological database SABIO-RK, provide a definition of the task, and report findings from preliminary experiments. Rigorous evaluation proved challenging due to lack of gold-standard data and a difficult notion of correctness. Qualitative inspection of results, however, showed the feasibility and usefulness of the task.
pyMMAX2 is an API for processing MMAX2 stand-off annotation data in Python. It provides a lightweight basis for the development of code which opens up the Java- and XML-based ecosystem of MMAX2 for more recent, Python-based NLP and data science methods. While pyMMAX2 is pure Python, and most functionality is implemented from scratch, the API re-uses the complex implementation of the essential business logic for MMAX2 annotation schemes by interfacing with the original MMAX2 Java libraries. pyMMAX2 is available for download at http://github.com/nlpAThits/pyMMAX2.
Im Projekt fussballlinguistik.de baue ich Korpora mit schriftlichen und mündlichen Texten aus dem Bereich der Fußballberichterstattung auf und mache sie über das webbasierte Tool CQPweb (Hardie 2012) der Fachöffentlichkeit zuganglich (Meier 2017). Die Korpora (www.fussballlinguistik.de/korpora) enthalten vornehmlich internetbasierte Texte wie etwa Liveticker, Spielberichte und Taktikanalysen, aber auch transkribierte Radioreportagen im Umfang von 44,8 Mio. Tokens (Stand Marz 2019) in den Sprachen Deutsch, Englisch, Niederländisch und Russisch in vollständig annotierter Form. Ein Teil der Daten ist zudem in das Deutsche Referenzkorpus (DeReKo 2018–II) eingegangen. Die seit gut 50 Jahren etablierte sprachwissenschaftliche Forschung zur Sprache des Fußballs hat dadurch eine in ihrer Themenspezifik einzigartige empirische Ressource erhalten.