Refine
Year of publication
Document Type
- Article (78)
- Part of a Book (35)
- Book (17)
- Other (17)
- Working Paper (10)
- Report (3)
- Conference Proceeding (1)
- Preprint (1)
- Review (1)
Is part of the Bibliography
- yes (163) (remove)
Keywords
- Deutsch (63)
- Korpus <Linguistik> (23)
- Institut für Deutsche Sprache <Mannheim> (18)
- Sprache (12)
- Wörterbuch (12)
- Gesprochene Sprache (9)
- Grammatik (9)
- Computerunterstützte Lexikographie (8)
- Linguistik (8)
- Politische Sprache (6)
Publicationstate
- Veröffentlichungsversion (125)
- Erstveröffentlichung (1)
Reviewstate
Publisher
- Institut für Deutsche Sprache (163) (remove)
„Bringt morgen jemand ein paar Mistgabeln und Fackeln mit zur Schule???“ Diese Frage werfen Schüler/innen eines Gymnasiums in einem Facebook-Thread auf. Mit Mistgabeln und Fackeln, so malen es sich die Jugendlichen für jede/n mitlesbar aus, müsse man die Person attackieren, die ihren Unmut auf sich gezogen hat. In einem anderen Fall droht ein/e Schreiber/in in einer geschlossenen Hassgruppe, dass ein Mitglied der Trainingsgruppe dessen / deren „füße in der fresse hängen [haben wird]!“, was Beifall in der Gruppe und eine Reihe weiterer diskreditierender Kommentare hervorruft.
Diese Schlaglichter aus Online-Interaktionen geben einen ersten Eindruck von Cybermobbing, einer Form von Gewalt, die vornehmlich sprachlich realisiert und in Sozialen Medien verbreitet wird und sozialpsychologischen Studien zufolge heute zum Schulalltag gehört.
Wenn die Frage heißt, „Warum Frühling?“, ist „Weil nicht Winter!“ in mancherlei Hinsicht eine plausible Antwort – auch von der sprachlichen Form her. Und sie ist besser als „Weil nicht Sommer!“, obwohl der Satz natürlich genauso wahr wäre. Den Herbst wollen wir aufgrund seiner nicht unmittelbaren Nachbarschaft zunächst einmal beiseitelassen. So sieht das auch die Bedeutungsbeschreibung, die in elexiko für das Stichwort Frühling ‚geliefert‘ wird:
(1) Mit Frühling wird eine der vier Jahreszeiten bezeichnet, und zwar die recht milde, die zwischen Winter und Sommer liegt. Der Frühling ist (in den gemäßigten Zonen der Erde) die Jahreszeit, in der die Natur wieder erwacht.<www.owid.de/artikel/9393/Jahreszeit?module=elex_b>
Eine europaweite Umfrage zu Wörterbuchbenutzung und -kultur. Ergebnisse der deutschen Teilnehmenden
(2018)
Gebrauchsgegenstand, Streitschlichter, Spielzeug, Nationalsymbol, Arbeitshilfe oder doch nur etwas, für das sich hauptsächlich Akademikerinnen und Akademiker interessieren? Welche Rolle spielen einsprachige Wörterbücher heute? Um unter anderen diesen Fragen nachzugehen, koordinierten wir gemeinsam mit Iztok Kosem (Universität Ljubljana) und Robert Lew (Adam-Mickiewicz Universität Poznań) die bis dato größte europaweite Umfrage zur Wörterbuchbenutzung und -kultur. Gemeinsam mit 26 ‚lokalen‘ Partnerinnen und Partnern aus ganz Europa führten wir im Rahmen des European Network of e-Lexicography (ENeL) diese Umfrage durch. Die Ergebnisse der Studie versprechen neue Einsichten in den gesellschaftlichen Status von Wörterbüchern in vielen europäischen Ländern. Durch die möglichst parallele Erhebung der Daten in den teilnehmenden Ländern werden außerdem interessante Vergleiche der lokalen ‚Wörterbuchkulturen‘ möglich sein. Im Fokus der Befragung standen allgemeine einsprachige Wörterbücher in der oder den jeweiligen Landessprache(n).
Über 400 Wissenschaftler/-innen aus insgesamt 25 verschiedenen Herkunftsländern kamen dieses Jahr zur 54. Jahrestagung des Instituts für Deutsche Sprache (IDS) nach Mannheim in den Rosengarten. Unter dem Titel „Neues vom heutigen Deutsch. Empirisch – methodisch – theoretisch“ konnten sich die Besucher/-innen hier über drei Tage hinweg insgesamt 14 Fachvorträge zu verschiedensten Gebieten der Sprachwissenschaft anhören.
Am 17. Mai 2018 wurde das Journal für Medienlinguistik (jfml) mit einer zweitägigen Konferenz am Institut für Deutsche Sprache eröffnet und ist seitdem unter <jfml.org> erreichbar. Zuvor gab es trotz reger medienlinguistischer Forschungstätigkeiten kein zusammenführendes, periodisches Publikationsorgan für die Medienlinguistik im deutschsprachigen Raum. Das wollten wir, die Herausgeber_innen des jfml, ändern.
Die „21. Arbeitstagung zur Gesprächsforschung“ mit dem Rahmenthema „Vergleichende Gesprächsforschung“ fand vom 21.-23. März 2018 am Institut für Deutsche Sprache in Mannheim statt. Das Ziel der Tagung war es, Forscherinnen und Forscher zusammenzubringen, die authentische Interaktionsdaten aus vergleichender Perspektive untersuchen. Das Rahmenthema der Tagung ergab sich aus dem steigenden Interesse an vergleichenden Fragestellungen innerhalb konversations- und gesprächsanalytischer Untersuchungen. Die Tagung nahm gezielt Vorgehensweisen und Methoden bei der Durchführung vergleichender Untersuchungen in den Blick. Die Vorträge1, Projektpräsentationen und Datensitzungen erörterten 1. das Vergleichen als analytische Grundoperation der Konversations- und Gesprächsanalyse, 2. Vergleiche alternativer Ressourcen und Praktiken für spezifische Handlungen und Aktivitäten in der Interaktion sowie 3. methodologische Herausforderungen einer vergleichenden Gesprächsforschung.
Augenblicks-Kommunikation: Mikrostruktur und soziale Implikativität einer kommunikativen Minimalform
(2018)
Die hier vorgelegte Studie ist das empirisch-konstitutionsanalytische Ergebnis meiner multi-modal-interaktionsanalytischen Beschäftigung mit einem bestimmten Typ kommunikativer Minimalform. Es handelt sich um den nur wenige Sekunden dauernden und oftmals nur blick-lich-mimisch-körperlich konstituierten sozialen Austausch von Passanten, die an einem Fens-ter vorbeigehen und dabei in das Zimmer blicken, an dem eine Person an einem Tisch sitzt, die ihrerseits die Hereinblickenden anschaut und somit eine Situation der Wahrnehmungs-wahrnehmung (Hausendorf 2003) etabliert. Im Mittelpunkt dieser Untersuchung zu Augenblicks-Kommunikation am Fenster steht die detaillierte Analyse motiviert ausgewählter Fälle aus einem umfangreichen Korpus (siehe Abschnitt 11). Die Fallanalysen dienen dem Nachweis der konstitutiven Bausteine der kom-munikativen Minimalform und der Systematik des Beteiligtenverhaltens über eine Vielzahl unterschiedlicher Konstellationen hinweg. Basierend auf der fallanalytisch produzierten empi-rischen Evidenz und Rekurrenz interaktionsstruktureller und sozial-implikativer Konstituen-ten des dokumentierten Interaktionsereignisses wird es möglich, die Relevanz der interakti-onsanalytischen Beschäftigung mit kommunikativen Minimalformen als relevante Unter-suchungsgegenstände deutlich zu machen. Um den empirisch basierten Nachweis kommunikativer Minimalformen als relevante und bislang übersehene Untersuchungsgegenstände der multimodalen Interaktionsanalyse nicht noch durch die Beschreibung, Reflexion und Problematisierung damit zusammenhängender methodisch-methodologischer Voraussetzungen und Anforderungen zu überfrachten, habe ich letztere Überlegungen – soweit es mir vertretbar erschien – mehr oder weniger konsequent ausgeklammert. Ich habe sie jedoch nicht ausgesondert und zur Seite gelegt. Vielmehr stellt die Reflexion und Diskussion der methodisch-methodologischen Implikationen der multimo-dal-interaktionsanalytischen Untersuchung kommunikativer Minimalform(en) ein zweites Ergebnis meiner bisherigen Beschäftigung mit der Augenblicks-Kommunikation am Fenster dar. Dieses Ergebnis befindet sich augenblicklich noch in Vorbereitung und wird als eigen-ständige Publikation veröffentlicht. Es stellt eine systematische und notwendige Ergänzung der hier vorliegenden Studie mit ihrem empirisch-fallanalytischen Fokus dar. Wer sich also speziell für die (weiterführende) methodisch-methodologische und theoretische Seite der Ana-lyse kommunikativer Minimalformen interessiert, der sei auf diese zweite Publikation (Schmitt/Petrova i. Vorb.) verwiesen.
Lexical explorer
(2018)
Das Tool Lexical Explorer ermöglicht, die Korpus-Frequenzangaben vom FOLK (Forschung und Lehrkorpus Gesprochenes Deutsch; Schmidt 2014) und GeWiss (Gesprochene Wissenschaftssprache; Fandrych, Meißner & Wallner 2017) zu durchsuchen und abzufragen. Das Tool besteht aus Tabellen, die für die Zwecke des Projekts LeGeDe entwickelt wurden (Möhrs et al. 2017). Die Zahlen beruhen auf dem DGD-Release 2.10 (23.05.2018). Für den Vergleich zwischen Korpora der gesprochenen Sprache und DeReKo wird die DeReKo Version 2016-II (30.09.2016) ohne Subkorpora Wikipedia-Daten (Artikel, Diskussionen) und ohne Sprachliche Umbrüche (45/68) verwendet (vgl. Kupietz & Keibel 2009). Die Tabellen werden mit Hilfe von DataTables (plug-in for jQuery) präsentiert, wobei die Ajax Protokolle benutzt werden, um die Tabellen asynchron aus der Datenbank zu ziehen. Die Benutzung des Tools setzt die Vertrautheit mit der Annotation der Korpora in der DGD voraus.
Präpositionalphrasen
(2018)
In der Datenbank zum Datensatz attributive_Adjektive_1.csv finden sich 1.598 Belege zu artikellosen Nominalphrasen mit je zwei attributiven Adjektiven im Dativ Singular Maskulinum oder Neutrum.
Die Datenbank attributive Adjektive enthält zu jedem Beleg neben dem Satzkontext eine Reihe von Annotationen. Dazu gehören Metadaten wie Register und regionale Zuordnung sowie Annotationen zur Phonologie, Morphosyntax, Semantik und Frequenz. Anhand dieser Annotationen lassen sich Hypothesen zur Adjektivflexion und -reihenfolge überprüfen. Nach einer Auswahl aus diesen Annotationen können Sie hier suchen. Alternativ können Sie unter „Download“ das gesamte Suchergebnis mit allen Annotationen und inklusive aller Belege, die bei der Untersuchung von Adjektivflexion und -reihenfolge als Fehlbelege eingestuft worden sind, herunterladen.
Verbalkomplex
(2018)
Neulich sah ich am Pfeifferswörth, wo immer die freundlich orangen Wagen der Mannheimer Abfallwirtschaft runterbrettern, einen Cityfanten, auf dem Cityfant stand. Das fällt einer Sprachwissenschaftlerin natürlich auf, die sich aus ihrer Jugend an den Ottifanten erinnert und mal was über einen aus dem Ei gepellten Mammufanten geschrieben hat. Also habe ich nachrecherchiert, ob es nicht noch mehr Bildungen mit fant als zweitem Teil gibt.
2017 gibt es im deutschen Mikrozensus zum ersten Mal seit etwa achtzig Jahren eine Frage zur Sprache der Bevölkerung in Deutschland. Diese Frage wird dann offenbar im entsprechenden Rhythmus des Mikrozensus jährlich wiederholt werden. Der Mikrozensus ist eine seit 1957 durchgeführte, repräsentative Befragung, bei der ungefähr 830.000 Menschen (das sind ca. 1 % der Bevölkerung) in rund 370.000 Haushalten befragt werden.1 Darin werden etwa Angaben zu den soziodemographischen Daten erfragt, zur familiären Situation, zur Wohnsituation, zur Aus- und Fortbildung und zur Arbeitssituation. Für die befragten Personen besteht Auskunftspflicht. Das Stellen einer Sprachfrage sieht, aus sprachwissenschaftlicher Sicht, zunächst nach einem sinnvollen und wünschenswerten Schritt aus. Nach näherer Betrachtung der gestellten Frage zeigen sich jedoch viele Unzulänglichkeiten und das, obwohl die Antworten und statistischen Auswertungen zu dieser Frage überhaupt noch ausstehen. Die Ergebnisse werden üblicherweise in der zweiten Hälfte des Folgejahres durch das statistische Bundesamt veröffentlicht.
Who understands Low German today and who can speak it? Who makes use of media and cultural events in Low German? What images do people in northern Germany associate with Low German and what is their view of their regional language?
These and further questions are answered in this brochure with the help of representative data collected in a telephone survey of a total of 1,632 people from eight federal states (Bremen, Hamburg, Lower Saxony, Mecklenburg-West Pomerania and Schleswig-Holstein as well as Brandenburg, North Rhine-Westphalia and Saxony-Anhalt).
Im Rahmen einer zur Zeit stattfindenden Umgestaltung der Inhalte und der Benutzeroberfläche des Online-Portals grammis hat sich eine Projektgruppe konstituiert, die es sich zur Aufgabe gemacht hat, das am IDS vorhandene Terminologiesystem zur Grammatik des Deutschen zu überarbeiten und zu erweitern: Dies betrifft zum einen die Überarbeitung und Erweiterung des Terminologieinventars, aber auch die zugrundeliegende methodische Grundlage und technische Infrastruktur. Zum Verständnis dieses Vorhabens sollen zunächst die vorhandenen Vorarbeiten und Grundlagen vorgestellt werden.
Die Diskurslinguistik hat sich in den letzten Jahren als eine linguistische Teildisziplin etabliert, die in transtextuellen Untersuchungen über sprachliche Muster gesamtgesellschaftlich rele-vante Denk- und Vorstellungswelten rekonstruiert. Die Digitalisierung hat nicht nur unsere Gesellschaft grundlegend verändert und neue Kommunikationsformen und innovative kulturelle Praktiken geprägt, sondern auch das diskurslinguistische Arbeiten maßgeblich beein-flusst. So war die Etablierung der Diskurslinguistik sowie auch der diskursorientierten Lexikographie geprägt durch die Engführung mit computergestützten Methoden (Bubenhofer 2009, Teubert/Čermáková 2007, Halliday et al. 2004), die große Textsammlungen für Diskursanalysen zugänglich machen. Da diskursanalytische Forschung in foucaultscher Tradition nicht am Einzelbeleg interessiert ist, sondern mit kontextuellen Mustern und intertextuellen Verweisstrukturen arbeitet, bietet eine korpusgestützte Analyse eine produktive Ausgangsbasis für Diskursuntersuchungen. Dies gilt insbesondere für die Diskurslexikographie, bei der auf breiter Datenbasis Wörterbücher zu kulturhistorischen Diskursen erstellt werden.
In der Datenbank zum Datensatz attributive_Adjektive_1.csv finden sich 1.598 Belege zu artikellosen Nominalphrasen mit je zwei attributiven Adjektiven im Dativ Singular Maskulinum oder Neutrum.
Die Datenbank attributive Adjektive enthält zu jedem Beleg neben dem Satzkontext eine Reihe von Annotationen. Dazu gehören Metadaten wie Register und regionale Zuordnung sowie Annotationen zur Phonologie, Morphosyntax, Semantik und Frequenz. Anhand dieser Annotationen lassen sich Hypothesen zur Adjektivflexion und -reihenfolge überprüfen. Nach einer Auswahl aus diesen Annotationen können Sie hier suchen. Alternativ können Sie unter „Download“ das gesamte Suchergebnis mit allen Annotationen und inklusive aller Belege, die bei der Untersuchung von Adjektivflexion und -reihenfolge als Fehlbelege eingestuft worden sind, herunterladen.
Deutschland sieht sich in den nächsten Jahren vor enorme Herausforderungen gestellt. Mit der Fluchtmigration von knapp 1,5 Mio. Menschen allein zwischen den Jahren 2014 und 2017 stehen nahezu in jedem gesellschaftlichen Bereich und hier insbesondere in den Sektoren Bildung und Arbeit große Integrationsaufgaben an. Steven Vertovec, der Leiter des Max-Planck-Instituts zur Erforschung multireligiöser und multiethnischer Gesellschaften, bezeichnet die Fluchtmigration von 2015 auch deshalb als die „zweite Wende“ (Vertovec 2015) für Deutschland, die das Land nachhaltig verändern wird. Nach seiner Einschätzung sind die erwartbaren gesellschaftlichen Transformationen von so einer Größenordnung, dass die Formulierung „seit der Flüchtlingskrise“ eine ebenso geläufige Redewendung werden wird wie die Formulierung „seit der Wende“. Um diese gegenwärtigen Migrations- und Integrationsprozesse von Anfang an dokumentieren und analysieren zu können, wurde am Institut für Deutsche Sprache (IDS) zu Beginn des Jahres 2016 das Projekt „Deutsch im Beruf: Die sprachlich-kommunikative Integration von Flüchtlingen“ gestartet, dessen erste Ergebnisse hier zusammenfassend präsentiert werden. Eine ausführliche Darstellung unserer Ergebnisse findet sich in der Zeitschrift „Deutsche Sprache 3 / 2018“
Ziel einer größer angelegten Studie – die Grundlage dieses Beitrags ist – war es, anhand der „Gassigespräche“ auf gattungsspezifische Ordnungsprinzipien und Familienähnlichkeiten miteinander verwandter Alltagsgattungen einzugehen, die vor allem in westlichen Kulturen etabliert zu sein scheinen. Die ihnen zugrundeliegenden kommunikativen Muster beschreiben wir als mehr oder weniger stark verfestigte Elemente. Mit diesem Beitrag wollen wir einen Einblick in die gattungsanalytische Betrachtung von Alltagskommunikation am Beispiel der Gassigespräche bieten.
Die ältesten schriftlichen Rezepte in deutscher Sprache sind uns im Buoch von guoter Spise aus der Zeit um 1350 überliefert (<http://digital.slub-dresden.de/werkansicht/dlf/2518/1/>, 10.7.2017). Schon damals hatten Rezepte wie heute außer der Kochanleitung einen Namen. Denn um über etwas reden zu können, geben wir allem einen Namen. Im Buoch von guoter Spise heißen die Gerichte Ain mandel suppen oder Ein gebraten gefültes ferhelin.
Qualifizierungsmaßnahmen wie „Perspektive für Flüchtlinge Plus“ (PerFPlus) können als wichtige Bestandteile der neuen Willkommenskultur in Deutschland betrachtet werden. Deutschland als Einwanderungsland kann mit Hilfe solcher Initiativen gezielt für Arbeitsbereiche und Berufsgruppen werben, in denen es an Nachwuchs mangelt. Den Neuzugewanderten bieten sie die eine Chance sich in der hiesigen Arbeitswelt zu orientieren und Berufsfelder zu erkunden, die ihnen bislang noch nicht oder nur in anderer Form bekannt waren. Auf der anderen Seite bergen solche Maßnahmen aber auch ihr Risiko: Wenn sie ihr Ziel verfehlen und Frustrationen auf beiden Seiten erzeugen, sind lange Warteschleifen, Arbeitslosigkeit und möglicherweise politische Polarisierung und Radikalisierung die Folge. Insofern ist eine schnelle Intervention hinsichtlich der Verbesserung solcher Maßnahmen essentiell. Der vorliegende Bericht soll die konzeptionell-arbeitenden Teams bei der Bundesagentur für Arbeit (BA) sowie bei Bildungsanbietern die mit der BA kooperieren bei ihren wichtigen Aufgaben unterstützen. Alle Partner bleiben im Bericht anonym.
Am 12. Mai 1965 nahmen der Staat Israel und die Bundesrepublik Deutschland offiziell diplomatische Beziehungen auf. Damit kam über 15 Jahre nach der Konstitution der beiden Länder und 20 Jahre nach dem Ende der Shoah ein komplexer Prozess der langsamen politischen Annäherung zu einem keineswegs selbstverständlichen Abschluss. Das fünfzigjährige Jubiläum dieses Ereignisses im Jahr 2015 war weltweit, vor allem aber in Israel und Deutschland, Anlass für zahlreiche Veranstaltungen, über die eine offizielle bilaterale Webseite <www.de50il.org/> (Stand: 6.11.2017) Auskunft gibt. Im Rahmen des Jubiläums wurde am 30. September 2015 in einer feierlichen Abendveranstaltung im Jüdischen Museum Berlin offiziell das „Wörterbuch deutscher Lehnwörter im Hebräischen“ von Uriel Adiv in einer ersten Fassung im „Lehnwortportal Deutsch“ des IDS freigeschaltet. Eine von Koautor Jakob Mendel erheblich überarbeitete und verbesserte zweite Version ging im Mai 2017 online. Der vorliegende Beitrag möchte einige Hintergründe zum deutschen Lehnwortschatz im modernen Hebräischen darstellen sowie die Entstehungsgeschichte des Werks und seinen Platz in der lehnwortlexikografischen Publikationsplattform „Lehnwortportal Deutsch“ <http://lwp.ids-mannheim.de/> (Stand: 6.11.2017) beleuchten.
Interaktion und Medien
(2017)
Am 1. September 2016 hat das Forschungsprojekt „Lexik des gesprochenen Deutsch“ (= LeGeDe) am Institut für Deutsche Sprache in Mannheim als Kooperationsprojekt der Abteilungen Pragmatik und Lexik seine Arbeit aufgenommen. Dieses drittmittelgeförderte Projekt der Leibniz-Gemeinschaft (Leibniz-Wettbewerb 2016; Förderlinie 1: Innovative Vorhaben) hat eine Laufzeit von drei Jahren (1.9.2016-31.8.2019) und besteht aus einem Team von Mitarbeiterinnen und Mitarbeitern aus den Bereichen Lexikologie, Lexikografie, Gesprächsforschung, Korpus- und Computerlinguistik sowie Empirische Methoden. Im folgenden Beitrag werden neben Informationen zu den Eckdaten des Projekts, zu den unterschiedlichen Ausgangspunkten, dem Gegenstandsbereich, den Zielen sowie der LeGeDe-Datengrundlage vor allem einige grundlegende Forschungsfragen und methodologische Ansätze aufgezeigt sowie erste Vorschläge zur Gewinnung, Analyse und Strukturierung der Daten präsentiert. Zur lexikografischen Umsetzung werden verschiedene Möglichkeiten skizziert und im Ausblick einige Herausforderungen zusammengefasst.
Die pfälzische Sprachinsel am Niederrhein, deren Gründung auf das Jahr 1641 zurückgeht, ist die letzte deutsche Binnensprachinsel. Sie steht unter einem akuten Assimilationsdruck, der sich im funktionellen Wandel des autochthonen dialektalen Systems bemerkbar macht; verstärkt wird dieser Prozess durch den deutschlandweit vielerorts beobachtbaren Rückgang der Dialektkompetenz auf basisdialektaler Ebene. In der vorliegenden Arbeit werden einerseits die Entwicklung in der Struktur des Sprachinseldialekts und andererseits die Rolle des Gebrauchs von sprachlichen Varianten als identitätsmarkierende Mittel untersucht. Dazu werden Sprachproben aus zwei Generationen variablenanalytisch ausgewertet und die Ergebnisse gegenübergestellt. Dabei zeigt sich, dass die dialektkompetenten Sprecher der jüngeren Generation einzelne (ehemals) dialektale Merkmale verstärkt realisieren, um ihre Identität als pfälzische Sprachinsulaner zu markieren.
CMC Corpora in DeReKo
(2017)
We introduce three types of corpora of computer-mediated communication that have recently been compiled at the Institute for the German Language or curated from an external project and included in DeReKo, the German Reference Corpus, namely Wikipedia (discussion) corpora, the Usenet news corpus, and the Dortmund Chat Corpus. The data and corpora have been converted to I5, the TEI customization to represent texts in DeReKo, and are researchable via the web-based IDS corpus research interfaces and in the case of Wikipedia and chat also downloadable from the IDS repository and download server, respectively.
Contents:
1. Andreas Dittrich: Intra-connecting a small exemplary literary corpus with semantic web technologies for exploratory literary studies, S. 1
2. John Kirk, Anna Čermáková: From ICE to ICC: The new International Comparable Corpus, S. 7
3. Dawn Knight, Tess Fitzpatrick, Steve Morris, Jeremy Evas, Paul Rayson, Irena Spasic, Mark Stonelake, Enlli Môn Thomas, Steven Neale, Jennifer Needs, Scott Piao, Mair Rees, Gareth Watkins, Laurence Anthony, Thomas Michael Cobb, Margaret Deuchar, Kevin Donnelly, Michael McCarthy, Kevin Scannell: Creating CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes – The National Corpus of Contemporary Welsh), S. 13
4. Marc Kupietz, Andreas Witt, Piotr Bański, Dan Tufiş, Dan Cristea, Tamás Váradi: EuReCo - Joining Forces for a European Reference Corpus as a sustainable base for cross-linguistic research, S. 15
5. Harald Lüngen, Marc Kupietz: CMC Corpora in DeReKo, S. 20
6. David McClure, Mark Algee-Hewitt, Douris Steele, Erik Fredner, Hannah Walser: Organizing corpora at the Stanford Literary Lab, S. 25
7. Radoslav Rábara, Pavel Rychlý ,Ondřej Herman: Accelerating corpus search using multiple cores, S. 30
8. John Vidler, Stephen Wattam: Keeping Properties with the Data: CL-MetaHeaders – An Open Specification, S. 35
9. Vladimir Benko: Are Web Corpora Inferior? The Case of Czech and Slovak, S. 43
10. Edyta Jurkiewicz-Rohrbacher, Zrinka Kolaković, Björn Hansen: Web Corpora – the best possible solution for tracking phenomena in underresourced languages: clitics in Bosnian, Croatian and Serbian, S. 49
11. Vít Suchomel: Removing Spam from Web Corpora Through Supervised Learning Using FastText, S. 56
Deutschland sieht sich in den nächsten Jahren vor enormen Herausforderungen gegen-übergestellt. Mit der Fluchtmigration von knapp 1,5 Mio. Menschen alleine zwischen 2014 und 2017 stehen nahezu in jedem gesellschaftlichen Bereich und hier insbesonde-re in den Sektoren Bildung und Arbeit große Integrationsaufgaben an. Steven Vertovec, der Leiter des Max-Planck-Instituts zur Erforschung multireligiöser und multiethnischer Gesellschaften bezeichnet die Fluchtmigration von 2015 auch deshalb als die „zweite Wende“ (Vertovec 2015) für Deutschland, die das Land nachhaltig verändern wird. Nach seiner Einschätzung werden die gesellschaftlichen Transformationen dermaßen tiefgrei-fend sein, dass die Formulierung „seit der Flüchtlingskrise“ eine ebenso geläufige Rede-wendung sein wird wie die Formulierung „seit der Wende“.
Berufliche Qualifizierungsmaßnahmen wie „GASTRO“ im Rhein-Neckar-Raum sind in diesem Kontext sehr wichtige Anstrengungen im Hinblick auf die strukturelle Integrati-on der Fluchtmigranten. Im gesamtgesellschaftlichen Kontext sind sie unverzichtbare Bestandteile der neuen Willkommenskultur, die seit den 2010ern versucht wird, in Deutschland zu etablieren. Als Einwanderungsland kann Deutschland mit Hilfe solcher Initiativen gezielt für Arbeitsbereiche und Berufsgruppen werben, in denen es an Nach-wuchs mangelt. Den Neuzugewanderten bieten sie die Chance sich in der hiesigen Ar-beitswelt zu orientieren und möglicherweise Berufsfelder zu erkunden, die ihnen bis-lang noch nicht oder nur in anderer Form bekannt waren.
Deutsch-russisches Neologismenwörterbuch. Neuer Wortschatz im Deutschen, 1991-2010. Bd. 1 - 2 (A-Z)
(2016)
Dieses Wörterbuch, das auf dem ersten größeren Neologismenwörterbuch für das Deutsche fußt, schließt eine Lücke in der deutsch-russischen Wörterbuchlandschaft: Es präsentiert dem Benutzer den neuen deutschen Wortschatz, den er in anderen Wörterbüchern meist vergeblich sucht. Enthalten sind fast 2000 neue Wörter (z.B. Kletterwald, scrollen), neue feste Wortverbindungen (z.B. etw. in die Tonne treten, der Drops ist gelutscht) und neue Bedeutungen etablierter Wörter (z.B. halbrund, Stolperstein), von denen rund 1350 umfassend lexikografisch beschrieben sind. Die vielen Verknüpfungen zwischen den Stichwörtern ermöglichen Einblicke in die Vernetztheit des neuen Wortschatzes und leisten so einen wichtigen Beitrag für den Wortschatzerwerb.
Während lexikographische Prozesse, die zur Publikation gedruckter Wörterbücher führen, bereits seit einigen Jahrzehnten im Fokus der Wörterbuchforschung stehen und die dafür unterschiedenen Phasen der Vorbereitung, der Datenbeschaffung, der Datenaufbereitung, der Datenauswertung und der Satz- und Druckvorbereitung mittlerweile als etabliert betrachtet werden dürfen, steht die Diskussion und Beschreibung lexikographischer Prozesse von Internetwörterbüchern noch in den Anfängen. Zwar besteht kein Zweifel daran, dass sich lexikographische Prozesse bei der Publikation von Internetwörterbüchern anders gestalten als bei Printwörterbüchern, doch die Fragen, inwiefern sie dies tun, welchen Einfluss die neuen Möglichkeiten der Datengewinnung aus elektronischen Textkorpora auf die Prozesse haben, wie Bearbeitungsteilwortschätze auszuwählen sind, wie verschiedene Fassungen zu versionieren und zu archivieren sind und wie sich schließlich die Änderungen der lexikographischen Prozesse auf die Nutzer auswirken, ob und wie die Nutzer in diese Prozesse einbezogen werden können, sind noch nicht ausführlich beantwortet.
Diese und andere Fragen waren daher Gegenstand des vierten Arbeitstreffens des wissenschaftlichen Netzwerks “Internetlexikografie”, das am 22. und 23. November 2012 an der Universität Trier stattfand und vom Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften/Trier Center for Digital Humanities organisiert wurde. Die Auseinandersetzung mit dem lexikographischen Prozess wurde fortgesetzt in drei Arbeitsgruppen, die sich mit Auswahlkriterien, Umsetzung und Problemen von Bearbeitungsteilwortschätzen, mit Archivierung und Versionierung und mit dem korpusbasierten Vorgehen bei der Erweiterung bestehender lexikographischer Ressourcen beschäftigten. Der vorliegende Band beschäftigt sich mit den in den Diskussionsrunden und Arbeitsgruppen gefundenen Ergebnissen und den dort identifizierten weiterführenden Fragen.
Nachruf auf Siegfried Grosse
(2016)
Valenz im Fokus. Grammatische und lexikografische Studien. Festschrift für Jacqueline Kubczak
(2015)
Die Festschrift Valenz im Fokus: Grammatische und lexikografische Studien enthält zum einen die Beiträge des internationalen Kolloquiums „Valenz im Fokus“, das am 12. Juli 2013 im Institut für Deutsche Sprache in Mannheim zu Ehren von Jacqueline Kubczak veranstaltet wurde, zum anderen weitere Beiträge von Kollegen aus der ganzen Welt, die zum einen als elektronische Publikation während des Kolloquiums präsentiert wurden, zum anderen speziell für die Festschrift hinzukamen.
Die Beiträge dieses Hefts knüpfen inhaltlich an die Artikel des OPAL-Sonderhefts 4/2009 mit dem Titel Konstruktionelle Varianz bei Verben (http://pub.ids-mannheim.de/laufend/opal/opal09-4.html) an. Thema beider Hefte sind die Argumentstrukturen von Verben. Im vorliegenden Heft werden zwei der bereits im OPAL-Sonderheft diskutierten Argumentstrukturmuster, Argumentstrukturmuster mit innerem Objekt und SUCH-Argumentstrukturmuster, wieder aufgegriffen und unter dem Gesichtspunkt ihres Status als Mitglieder größerer Gruppen von Argumentstrukturmustern diskutiert. Die erstgenannte Gruppe von Argumentstrukturmustern umfasst – wie der Name auch sagt – Strukturen, die ein Objekt enthalten, das in der Grammatikschreibung als inneres oder kognates Objekt bezeichnet wird, wie etwa einen aussichtslosen Kampf kämpfen, eines natürlichen Todes sterben, einen Walzer tanzen u.Ä. Bei Letzteren handelt es sich um eine Gruppe von Argumentstrukturmustern wie etwa nach etwas suchen, etwas auf etwas durchsuchen, nach etwas fahnden, nach etwas sinnen, nach etwas schreien und jemanden um etwas bitten. Wie diese Auflistung bereits zeigt, handelt es sich bei SUCH-Argumentstrukturmustern nicht nur um Muster mit reiner SUCH-Bedeutung. Insofern ist der Name arbiträr. Er wurde in Anlehnung an den von Levin (1993, S. 70-71) eingeführten Begriff der SEARCH-Alternation gewählt, mit dem die Alternation der Muster NP1 V NP2 in NP3 (Ida hunted deer in the woods), NP1 V NP3 for NP2 (Ida hunted the woods for deer) und NP1 V for NP2 in NP3 (Ida hunted for deer in the woods) im Englischen gemeint war. Sowohl die Beiträge des OPAL-Sonderhefts 4/2009 als auch die Beiträge des vorliegenden Hefts sind aus dem Projekt Verben und Argumentstrukturen (www.ids-mannheim.de/lexik/polysemievarianz.html; ehemals Polysemie und konstruktionelle Varianz) hervorgegangen, das zur Zeit in der Abteilung Lexik des IDS bearbeitet wird.
Valenz im Fokus: Vorwort
(2015)
Die Festschrift Valenz im Fokus: Grammatische und lexikografische Studien enthält zum einen die Beiträge des internationalen Kolloquiums „Valenz im Fokus“, das am 12. Juli 2013 im Institut für Deutsche Sprache in Mannheim zu Ehren von Jacqueline Kubczak veranstaltet wurde, zum anderen weitere Beiträge von Kollegen aus der ganzen Welt, die zum einen als elektronische Publikation während des Kolloquiums präsentiert wurden, zum anderen speziell für diese Festschrift hinzukamen.
Das Wörterbuch "Neuer Wortschatz" präsentiert den deutschen Wortschatz, der zwischen 2001 und 2010 aufgekommen und in die Allgemeinsprache eingegangen ist. Lexikografisch umfassend beschrieben sind mehr als 570 neue Wörter (z.B. Umweltzone, twittern), neue feste Wortverbindungen (z.B. grünes Rezept, etwas ist kein Ponyhof) und neue Bedeutungen etablierter Wörter (z.B. Heuschrecke 'Finanzinvestor', Stolperstein 'Gedenkstein'). Zu den aus herkömmlichen Wörterbüchern bekannten Angaben z.B. zur Aussprache, Grammatik, Bedeutung treten neue, z.B. zur Wortbildung, zu Enzyklopädischem, die den erhöhten Informationsbedarf in Bezug auf neuen Wortschatz befriedigen helfen. Zusätzlich finden sich neologismusspezifische Angaben zu Aufkommen und Ausbreitung im Erfassungszeitraum - unter Einbeziehung von Zeitverlaufsgrafiken - sowie zur Erstbuchung in einschlägigen Wörterbüchern.
Ziel des vorliegenden Beitrags ist es, auszuloten, wie Sprechen und Handeln, das wir aus dem Alltag kennen, einzuschätzen ist, wenn es im Fernsehen und vor allem im so genannten Reality-TV erscheint. Einen guten Einstieg, diese Problemstellung zu illustrieren, bieten Pannen, wie man sie etwa aus Nachrichtensendungen wie der Tagesschau kennt.
Das Wörterbuch "Neuer Wortschatz" präsentiert den deutschen Wortschatz, der zwischen 2001 und 2010 aufgekommen und in die Allgemeinsprache eingegangen ist. Lexikografisch umfassend beschrieben sind mehr als 570 neue Wörter (z.B. Umweltzone, twittern), neue feste Wortverbindungen (z.B. grünes Rezept, etwas ist kein Ponyhof) und neue Bedeutungen etablierter Wörter (z.B. Heuschrecke 'Finanzinvestor', Stolperstein 'Gedenkstein'). Zu den aus herkömmlichen Wörterbüchern bekannten Angaben z.B. zur Aussprache, Grammatik, Bedeutung treten neue, z.B. zur Wortbildung, zu Enzyklopädischem, die den erhöhten Informationsbedarf in Bezug auf neuen Wortschatz befriedigen helfen. Zusätzlich finden sich neologismusspezifische Angaben zu Aufkommen und Ausbreitung im Erfassungszeitraum - unter Einbeziehung von Zeitverlaufsgrafiken - sowie zur Erstbuchung in einschlägigen Wörterbüchern.
In dem Beitrag werden Argumentstrukturmuster mit inneren Objekten genauer untersucht. Als innere Objekte werden Akkusativobjekte bezeichnet, die gelegentlich von normalerweise intransitiven Verben zu sich genommen werden und deren Objekts-Nomen mit dem Verb etymologisch, morphologisch und/oder semantisch verwandt ist. Das heißt, es handelt sich um Sätze wie Maria lachte ihr fröhliches Lachen, Alles geht seinen geordneten Gang oder Er kämpft einen aussichtslosen Kampf. Wie man an diesen wenigen Beispielsätzen bereits sehen kann, wird mit dem inneren Objekt etwas explizit zum Ausdruck gebracht, was bereits in der Verbbedeutung implizit enthalten bzw. angelegt ist, denn lachen bedeutet ja ‘Freude zum Ausdruck bringen, indem man ein Lachen von sich gibt’ und kämpfen heißt ‘einen Kampf führen, Kampfhandlungen vollziehen, sich mit jmdm. oder etw. auseinandersetzen’.
Contents:
1. Michal Křen: Recent Developments in the Czech National Corpus, S. 1
2. Dan Tufiş, Verginica Barbu Mititelu, Elena Irimia, Stefan Dumitrescu, Tiberiu Boros, Horia Nicolai Teodorescu: CoRoLa Starts Blooming – An update on the Reference Corpus of Contemporary Romanian Language, S. 5
3. Sebastian Buschjäger, Lukas Pfahler, Katharina Morik: Discovering Subtle Word Relations in Large German Corpora, S. 11
4. Johannes Graën, Simon Clematide: Challenges in the Alignment, Management and Exploitation of Large and Richly Annotated Multi-Parallel Corpora, S. 15
5. Stefan Evert, Andrew Hardie: Ziggurat: A new data model and indexing format for large annotated text corpora, S. 21
6. Roland Schäfer: Processing and querying large web corpora with the COW14 architecture, S. 28
7. Jochen Tiepmar: Release of the MySQL-based implementation of the CTS protocol, S. 35
Introduction
(2015)
Maskierung
(2015)
Aus forschungsethischen Gründen müssen die Daten aus Gesprächsaufzeichnungen, die Metadaten sowie die Transkripte maskiert werden. Der Beitrag stellt Arbeitsschritte der Maskierung vor, die auf den Erfahrungen bei der Datenaufbereitung der Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) für die Veröffentlichung in der Datenbank für Gesprochenes Deutsch (DGD) basieren.
Transkriptionsaufwand
(2015)
Während die Erhebung von Gesprächsdaten zwar zeitaufwändig, aber doch noch relativ zügig zu bewältigen ist, handelt es sich bei der Transkription um eine langwierige Aufgabe, die oft unterschätzt wird. Damit Studierende, Promovierende sowie WissenschaftlerInnen, die Exposés, Arbeitspläne usw. aufstellen oder Zuschüsse für Projekte beantragen müssen, zukünftig über fundiertere Werte verfügen und damit realistischere Aussagen über den benötigten Aufwand (zeitliche wie personelle Ressourcen) treffen können, stellt der Beitrag die Ergebnisse einer Erhebung des Transkriptionsaufwandes im FOLK-Projekt vor.
Valenz und Kookkurrenz
(2015)
In dem Beitrag diskutieren die Autoren die deutschdidaktische Behauptung (u. a. Dürscheid 2007), dass ein zusätzliches Angebot von Grammatikunterricht im Fach Deutsch der Sekundarstufe II zu besseren und langfristig anhaltenden expliziten Grammatikkenntnissen des Deutschen führt. Laut curricularen Vorgaben ist für die Klassen neun bis zwölf kein Grammatikunterricht vorgesehen. Ob ein solches Angebot tatsächlich zu entsprechend besseren Ergebnissen führt, ist empirisch nicht belegt. Die Autoren konzipieren daher eine longitudinale Untersuchung zur Leistungserhebung, in der zwei Vergleichsgruppen jährlich einmal Aufgaben, aufbauend auf den VERA-8-Arbeiten, in den Klassen acht bis zwölf bearbeiten. Nur eine der beiden Gruppen hat ab Klasse neun am expliziten Grammatikunterricht in Form einer kontrollierten Selbstlerneinheit teilgenommen. Es sollen hierbei dieselben 1000 Schüler befragt werden. Die Befragung erfolgt in den Schuljahren 2014 bis 2018. Das Projekt „Grammatische Kenntnisse in der Sekundarstufe II (GramKidSII)“ wird finanziert vom Institut für Deutsche Sprache in Mannheim.
Der Blick zurück nach vorn
(2014)
"Badeölgrüne Buchten", "kükengelbes Haar" und "tomatenrote Tomaten" - Vergleiche mit Farbadjektiven
(2014)
In diesem Wörterbuch finden sich von App bis Zickenalarm mehr als 570 Stichwörter, die die aktuelle Wortschatzerweiterung im Deutschen als Ausdruck der Anpassung des Wortschatzes an neue Gegebenheiten und Sachverhalte spiegeln. Erfasst und in umfangreichen Wortartikeln beschrieben und dokumentiert sind die Neulexeme und Neubedeutungen, die im Zeitraum von 2001 bis 2010 aufgekommen sind und sich weitgehend im allgemeinsprachlichen Teil des Wortschatzes der deutschen Standardsprache etabliert haben.
In diesem Wörterbuch finden sich von App bis Zickenalarm mehr als 570 Stichwörter, die die aktuelle Wortschatzerweiterung im Deutschen als Ausdruck der Anpassung des Wortschatzes an neue Gegebenheiten und Sachverhalte spiegeln. Erfasst und in umfangreichen Wortartikeln beschrieben und dokumentiert sind die Neulexeme und Neubedeutungen, die im Zeitraum von 2001 bis 2010 aufgekommen sind und sich weitgehend im allgemeinsprachlichen Teil des Wortschatzes der deutschen Standardsprache etabliert haben.
Die Leibniz-Gemeinschaft
(2014)
As a result of legal restrictions the Google Ngram Corpora datasets are a) not accompanied by any metadata regarding the texts the corpora consist of and the data are b) truncated to prevent an indirect conclusion from the n-gram to the author of the text. Some of the consequences of this strategy are discussed in this article.
This contribution outlines a conceptual analysis of the dictionary-internal cross-reference structure in electronic dictionaries along the lines of Wiegand’s actional-theoretical text theory of print dictionaries. The discussion focuses on issues of XML-based data modeling, using the monolingual German online dictionary elexiko as a running example. The first part of the article demonstrates how Wiegand’s formal theory of mediostructure and its intricate nomenclature can be extended in a systematic and lexicographically justified way to cover the structure of the underlying lexicographical database of online dictionaries. The second part of the article applies the concepts developed to a more technical question, examining the extent to which cross-reference information can be stored and processed separately from the dictionary entry documents, e.g., in a relational database. The results are largely negative; in most real world cases, this leads to an unwanted duplication of XML-related structural information. The concluding third part briefly describes the strategy chosen for elexiko: mediostructural information is not externalized at all; cross-reference consistency checks are performed by a dictionary editing tool that takes advantage of a specialized XML database index and can easily be made more efficient and scalable by using a simple caching technique.