Refine
Year of publication
- 2014 (302) (remove)
Document Type
- Part of a Book (118)
- Article (115)
- Conference Proceeding (33)
- Book (17)
- Part of Periodical (11)
- Other (6)
- Working Paper (2)
Is part of the Bibliography
- no (302) (remove)
Keywords
- Deutsch (93)
- Korpus <Linguistik> (25)
- Linguistik (24)
- Germanistik (22)
- Institut für Deutsche Sprache (18)
- Institut für Deutsche Sprache <Mannheim> (18)
- Rhetorik (15)
- Gastwissenschaftler (13)
- Gesprochene Sprache (12)
- Computerlinguistik (11)
Publicationstate
- Veröffentlichungsversion (118)
- Zweitveröffentlichung (22)
- Postprint (10)
Reviewstate
- (Verlags)-Lektorat (102)
- Peer-Review (46)
- Verlags-Lektorat (3)
- Review-Status-unbekannt (2)
- Preprint (1)
Publisher
- Institut für Deutsche Sprache (61)
- De Gruyter (55)
- de Gruyter (33)
- Lang (7)
- Stauffenburg (6)
- Universitätsverlag Hildesheim (5)
- PaoloLoffredo (4)
- Springer (4)
- Benjamins (3)
- International Speech Communication Association (3)
Wie selbstbestimmt können wir das Internet nutzen? Wie viel wissen wir darüber,welche digitalen Spuren wir setzen und wer diesen hinterher spürt?
Wie werden die beim Surfen erzeugten Daten von Dritten weiter verwendet – mit und ohne unser Wissen? Und ist die gefühlte Nacktheit in Zeiten der digital ausspähbaren, scheinbaren Transparenz wirklich akut oder durch traditionelle analoge Denk- und Erfahrungsstrukturen geprägt?
“My Curiosity was Satisfied, but not in a Good Way”: Predicting User Ratings for Online Recipes
(2014)
In this paper, we develop an approach to automatically predict user ratings for recipes at Epicurious.com, based on the recipes’ reviews. We investigate two distributional methods for feature selection, Information Gain and Bi-Normal Separation; we also compare distributionally selected features to linguistically motivated features and two types of frameworks: a one-layer system where we aggregate all reviews and predict the rating vs. a two-layer system where ratings of individual reviews are predicted and then aggregated. We obtain our best results by using the two-layer architecture, in combination with 5 000 features selected by Information Gain. This setup reaches an overall accuracy of 65.60%, given an upper bound of 82.57%.
Previous accounts addressing the question what semantic properties of a matrix predicate determine the possible clause type of the embedded clause have not provided a general answer (e.g. Grimshaw 1979, Zifonun et al. 1997, Ginzburg & Sag 2000). This paper proposes that clause-embedding predicates fulfill characteristic logical conditions, so-called consistency conditions, which rule the syntactic potential of the matrix clause: for instance, the clause type of the embedded clause (declarative, ob- and/or wh-interrogative) and the correlate type, the matrix predicate can co-occur with (es and/or ProPP). Furthermore, they predict the logical forms of legitimate constructions with embedded ob- or wh-interrogatives, respectively, and how a legitimate optional correlate modifies the meaning of the matrix predicate.
Previous accounts addressing the question what semantic properties of a matrix predicate determine the possible clause type of the embedded clause have not provided a general answer (e.g. Grimshaw 1979, Zifonun et al. 1997, Ginzburg & Sag 2000). This paper proposes that clause-embedding predicates fulfill characteristic logical conditions, so-called consistency conditions, which rule the syntactic potential of the matrix clause: for instance, the clause type of the embedded clause (declarative, ob- and/or wh-interrogative) and the correlate type, the matrix predicate can co-occur with (es and/or ProPP). Furthermore, they predict the logical forms of legitimate constructions with embedded ob- or wh-interrogatives, respectively, and how a legitimate optional correlate modifies the meaning of the matrix predicate.
Zur Frühgeschichte des IDS
(2014)
Der Beitrag präsentiert eine Untersuchung des Zusammenhangs zwischen Formulierungsverfahren und der Handlungsstruktur eines institutionellen Schlichtungsgesprächs. Im Fokus steht das Verhältnis zwischen den verwendeten Referenzierungsformen, ihrem Bezug auf spezifische Handlungsrollen und der Modalität der ausgedrückten Handlungen. Die Analyse konzentriert sich auf die Äußerungen des Schlichters, weil institutionelle Schlichtungen sehr stark durch die kommunikative Arbeit des Schlichters strukturiert werden. Das Ziel der Untersuchung ist, die Analyse der interaktiven Dynamik und die Analyse von Formulierungsverfahren zu verbinden und die Relation zwischen der Handlungsstruktur und den Formulierungsverfahren zu begreifen. Es ist anzunehmen, dass Regelmäßigkeiten der Beziehung zwischen den beiden Ebenen bestehen und dass besondere Formulierungsverfahren diese Beziehung verdeutlichen. In dieser Arbeit geht es darum, diese Hypothese zu präzisieren und zu bestimmen, welche Rolle die Modalität der Äußerungen spielt, und zwar vor allem die durch das Modalverb sollen vermittelte Modalität der Notwendigkeit. Der gewählte analytische Zugang verbindet die Verfahren der Gesprächsanalyse für die Sequenzanalyse im mikro- und makrostrukturellen Bereich mit der linguistischen Analyse von Formulierungsverfahren. Die Analyse der Handlungsstruktur stellt den Referenzrahmen für die Analyse der Formulierungsverfahren dar. Am Ende erfolgt ein kurzer Ausblick auf die Reinterpretation der Ergebnisse aus einer konstruktionsgrammatischen Perspektive.
Eine syntaktische Besonderheit der kontinentalwestgermanischen Sprachen ist die Bildung satzfinaler Verbalkomplexe (" ... dass sie das Buch gelesen haben muss"), für die ein hohes Maß an sprach- bzw. dialektübergreifender und idiolektaler Verbstellungsvariation charakteristisch ist. Der niederdeutsche Verbalkomplex gilt in Überblicksdarstellungen als streng kopffinal, wobei bisher – anders als für niederländische und hochdeutsche (besonders: oberdeutsche) Mundarten – kaum empirische Studien vorliegen. Der Aufsatz präsentiert eine deskriptive Analyse des zweigliedrigen Verbalkomplexes im Märkisch-Brandenburgischen, dem südöstlichsten der niederdeutschen Dialektverbände.
Im Gegensatz zum Standarddeutschen und anderen niederdeutschen Mundarten wie dem Nordniederdeutschen, weist das Brandenburgische selbst bei nur zwei verbalen Elementen in der rechten Satzklammer Variation auf ("dass sie lesen kann/kann lesen"). Anhand von Tonaufnahmen aus dem bisher kaum erschlossenen DDR-Korpus wird folgenden Fragen nachgegangen: Welche Verbstellungsvarianten sind in welchen Syntagmen möglich bzw. werden präferiert? Welche Unterschiede bestehen zwischen Haupt- und Nebensatzkomplexen? Wie verhält sich der brandenburgische Verbalkomplex in Bezug auf nicht-verbale Intervenierer (sog. Verb Projection Raising)? Wie verhalten sich Modal- und andere infinitivregierende Verben unter Perfekteinbettung (d.h. in stddt. Ersatzinfinitivkontexten)?
Am Ende steht eine erste typologische Einordnung des brandenburgischen Verbalkomplexes im Vergleich mit anderen kontinentalwestgermanischen Varietäten, wobei sich areallinguistisch interessante Ähnlichkeiten mit dem südlich angrenzenden Ostmitteldeutschen zeigen.
Zeugma
(2014)
Seit Jahrzehnten fordern zahlreiche Metalexikografen und Lexikografen immer wieder eine umfangreichere Beschäftigung mit Wörterbüchern im muttersprachlichen Deutschunterricht, auch in der gymnasialen Oberstufe. Trotzdem spielen die Wortschatzarbeit und der Umgang mit Wörterbüchern in Lehrplänen, Didaktiken und Lehrwerken in den meisten Fällen allenfalls eine marginale Rolle. Im Anschluss an eine überblicksartige Bestandsaufnahme dazu untersucht der vorliegende Beitrag, inwieweit elexiko, ein Onlinewörterbuch zur deutschen Gegenwartssprache, sinnvoll in den muttersprachlichen Deutschunterricht der Sekundarstufe II integriert werden könnte. Am Beispiel des Angabebereichs der Bedeutungserläuterung wird überprüft, ob Schüler der gymnasialen Oberstufe als Zielgruppe für elexiko infrage kommen und für welche linguistischen Themen sich die Wortschatzarbeit mit den semantischen Paraphrasen für elexiko anbietet.
Die vorliegende empirische Untersuchung befasst sich mit einer Umfrage zur Wörterbuchbenutzung bei 41 Studentinnen und Studenten des Dipartimento di Filologia, Letteratura e Linguistica der Universität Pisa, dasselbe Department, an dem auch das deutsch-italienische sprachwissenschaftliche Online-Wörterbuch DIL erarbeitet worden ist (vgl. Flinz: 2011). Die schriftliche Umfrage wurde in Anlehnung an Hartmanns 5. Hypothese „An analysis of users´ needs should precede dictionary design“ (1989) durchgeführt. Die wichtigsten Ergebnisse waren von großer Bedeutung für die Gestaltung der makro- und mikrostrukturellen Eigenschaften des Fachwörterbuches. Die Ergebnisse der Untersuchung und die daraus folgenden Reflektionen werden in thematischen Kernblöcken vorgestellt.
Wortartikel
(2014)
By evaluating two corpora containing linguistic data on spoken standard language usage (with a total of 770 speakers), the current range of variation of lexical stress in loanwords will be analyzed. In doing so, the focus will be on the age and background of the speakers to be able to document processes of linguistic change and regionalisms. Regarding the phenomenon studied here, it becomes apparent that more detailed and multicausal separate analyses are required to interpret the results conclusively in spite of an overall trend that was at irst convincing (and that would support the theoretical assumptions concerning the loanwordʼs age and the source language inluencing the rate of assimilation). The results of the individual analyses contradict the assumed “overall trend”. One of the corpora was collected by experienced ield workers, while the other was collected by students. By comparing both corpora, some light can be shed onto the question as to what extent “undirected” and less rigidly collected data can support or complement more extensive and costly research projects.
The 2014 issue of KONVENS is even more a forum for exchange: its main topic is the interaction between Computational Linguistics and Information Science, and the synergies such interaction, cooperation and integrated views can produce. This topic at the crossroads of different research traditions which deal with natural language as a container of knowledge, and with methods to extract and manage knowledge that is linguistically represented is close to the heart of many researchers at the Institut für Informationswissenschaft und Sprachtechnologie of Universität Hildesheim: it has long been one of the institute’s research topics, and it has received even more attention over the last few years.
Der Aufsatz untersucht das syntaktische Verhalten nicht-satzförmiger Adverbialia im Deutschen und im brasilianischen Portugiesisch in vergleichender Perspektive. Behandelt werden Adverbialia aus sechs Klassen, deren semantische Funktionen von der Sachverhaltsbeschreibung bis zur Beschreibung von Handlungsabsichten des Sprechers reichen. Insgesamt zeigen sich große Ähnlichkeiten zwischen den Vergleichssprachen. Im Deutschen scheint eine etwas stärkere Tendenz zu bestehen, Adverbialia syntaktisch zu integrieren, während es im Portugiesischen mehr Möglichkeiten gibt, sie desintegriert zu verwenden.
Prejudice against a social group may lead to discrimination of members of this group. One very strong cue of group membership is a (non)standard accent in speech. Surprisingly, hardly any interventions against accent-based discrimination have been tested. In the current article, we introduce an intervention in which what participants experience themselves unobtrusively changes their evaluations of others. In the present experiment, participants in the experimental condition talked to a confederate in a foreign language before the experiment, whereas those in the control condition received no treatment. Replicating previous research, participants in the control condition discriminated against Turkish-accented job candidates. In contrast, those in the experimental condition evaluated Turkish- and standard-accented candidates as similarly competent. We discuss potential mediating and moderating factors of this effect.
Vulgarismus
(2014)
Vorwort
(2014)
Vorwort
(2014)
Von Mannheim bis in die USA: Eine persönliche Verbindung mit dem Institut für Deutsche Sprache
(2014)
Johann Leo Weisgerbers bekannter Titel bezieht sich auf Humboldts Energeia-Begriff, also auf die Sprache als wirkende Kraft. Auch in diesem Beitrag soll den wirkenden Kräften nachgegangen werden, freilich nicht als Unterstellung eines wesenhaften Sprachvermögens, sondern als Versuch, die wirksamen Motive der sprachkritischen Einstellungen, Publikationen und publizistischen Erscheinungen an einem Raster sozialwissenschaftlicher Begriffe darzulegen. An einigen ausgewählten Presseberichten und grammatischen Beispielen (Veränderungen im Bereich der deutschen Zeitenfolge) wird zunächst gezeigt, dass sich Sprachkritik oft schon von ihrem Gegenstand, der deutschen Sprache, weitgehend gelöst hat. Auch angesichts neuer Formen von substandardsprachlichen Erscheinungen (z.B. Jugendsprache, Jargon, Kiezsprache usw.) kann oft nachgewiesen werden, dass es sich in vielen Fällen um kommunikativ funktionale Sprachformen handelt. Um es schlagwortartig zusammenzufassen: Es gibt Sprachkritik ohne Sprache. Die „wirkenden Kräfte“ der Sprachkritik sichern vielmehr die Wahrnehmung gesellschaftlicher Differenzen und machen damit das Gefüge unterschiedlicher Lebensformen deutlich. Sie werden hier mit systemtheoretischen Begrifflichkeiten nach Niklas Luhmanns Theorie sozialer Systeme beschrieben und damit auch erklärt. Während das für die 80er-Jahre des vorigen Jahrhunderts charakteristische Programm der „Kritik der Sprachkritik“ auf eine sprachwissenschaftliche Aufklärung zielt, scheint heute vielmehr eine soziologische Aufklärung diese metakritische Funktion erfüllen zu können. Es könnte sich aber auch zeigen, dass Sprachkritik ihren Beitrag zur Stabilisierung des gesellschaftlichen Zusammenwirkens leistet — wenn man sie nicht als Sprachkritik im engeren Sinn versteht.
Ein «Alpha-Gottesdienst» ist ein Gottesdienst «mit dem etwas anderen Programm», bei dem «Neugierige und Suchende nicht nur Predigt und Gebet, sondern auch Anspiele und Interviews sowie jede Menge Livemusik» erleben können. Die Autoren wollen im vorliegenden Beitrag in Form einer Fallstudie den Beginn eines solchen «Alphagottesdienstes» analysieren, weil er für den Zusammenhang von Interaktionsarchitektur, Sozialtopografie und Interaktionsraum hoch aufschlussreich erscheint. Naturgemäß muss bei einer solchen Analyse auch die Struktur des ausgewählten Falles gebührend zur Sprache kommen, d. h. im vorliegenden Fall die Struktur eines gottesdienstlichen Geschehens, dessen Bedeutung weitgehend vom Kontrast zu einem unterstellten Normalfall von Gottesdienst lebt («nicht nur Predigt und Gebet») und der sich ausdrücklich an ein nicht bereits im Glauben eingerichtetes Publikum routinierter Gottesdienstbesucher, sondern an «Neugierige und Suchende» wendet.
Dieser Band vereinigt Beiträge aus zwei Arbeitstreffen des von der DFG geforderten wissenschaftlichen Netzwerks „Internetlexikografie“ (www.internetlexikografie.de) und setzt damit die Reihe der Arbeitsberichte des Netzwerks fort. Das zweite Arbeitstreffen des Netzwerks fand am 5. und 6. Dezember 2011 in Berlin (DE) statt und hatte „Vernetzungs- und Zugriffsstrukturen bei Internetworterbüchern zum Thema. Das folgende Arbeitstreffen wurde am 3. und 4. Mai 2012 in Bozen (IT) abgehalten und beschäftigte sich mit „Aspekten der automatischen Gewinnung von lexikografischen Angaben“. Der Band enthält die Ausarbeitungen ausgewählter Beiträge der beiden Treffen. Beim zweiten Arbeitstreffen mit dem Thema „Vernetzung und Zugriffsstrukturen“ wurden Fragen für die Internetlexikografie behandelt, die für den Bereich der Printlexikografie schon recht lange diskutiert wurden, durch die Möglichkeiten des neuen Mediums, die sich am besten mit dem Stichwort „Verlinkung“ charakterisieren lassen, aber eine ganz neue Dimension erhalten. Beim Berliner Arbeitstreffen wurden verschiedene Möglichkeiten der Kodierung von Vernetzungen und ihre Onlineprasentation anhand von Beitragen zu theoretischen und praktischen Aspekten diskutiert, um zu zeigen, wie sie fur unterschiedliche Zugriffsstrukturen nutzbar gemacht werden können.
Verbum proprium
(2014)
This paper presents challenges and opportunities resulting from the application of geographical information systems (GIS) in the (digital) humanities. First, we provide an overview of the intersection and interaction between geography (and cartography), and the humanities. Second, the “GeoBib” project is used as a case study to exemplify challenges for such collaborative, interdisciplinary projects, both for the humanists and the geoscientists. Finally, we conclude with an outlook on further applications of GIS in the humanities, and the potential scientific benefit for both sides, humanities and geosciences.
Uncertain about Uncertainty: Different ways of processing fuzziness in digital humanities data
(2014)
The GeoBib project is constructing a georeferenced online bibliography of early Holocaust and camp literature published between 1933 and 1949 (Entrup et al. 2013a). Our immediate objectives include identifying the texts of interest in the first place, composing abstracts for them, researching their history, and annotating relevant places and times. Relations between persons, texts, and places will be visualized using digital maps and GIS software as an integral part of the resulting GeoBib information portal. The combination of diverse data from varying sources not only enriches our knowledge of these otherwise mostly forgotten texts; it also confronts us with vague, uncertain or even conflicting information. This situation yields challenges for all researchers involved – historians, literary scholars, geographers and computer scientists alike. While the project operates at the intersection of historical and literary studies, the involved computer scientists are in charge of providing a working environment (Entrup et al. 2013b) and processing the collected information in a way that is formalized yet capable of dealing with inevitable vagueness, uncertainty and contradictions. In this paper we focus on the problems and opportunities of encoding and processing fuzzy data.
Badania nad postrzeganiem społecznym wskazują, że osoby uśmiechające się są na licznych wymiarach postrzegane korzystniej aniżeli osoby nieuśmiechające się. Jednakże w niniejszych badaniach twierdzimy, że ta zależność nie zawsze jest pozytywna ponieważ postrzeganie uśmiechu może być zależne od kultury i takich jej wymiarów jak indywidualizm-kolektywizm czy asertywność. Eksperyment przeprowadzony w sześciu krajach (w Polsce, Niemczech, Norwegii, Iranie, USA oraz RPA) pokazał, że osoby uśmiechające się mogą być w kulturach kolektywistycznych i mało asertywnych postrzegane mniej korzystnie od osób nieuśmiechających się. W Niemczech osoby uśmiechnięte zostały ocenione jako bardziej inteligentne, a w Iranie jako mniej inteligentne niż osoby nieuśmiechnięte. Ponadto we wszystkich krajach poza Iranem osoby uśmiechnięte były postrzegane jako bardziej szczere niż osoby nieuśmiechnięte. Dyskutujemy stwierdzone efekty w kontekście zróżnicowania kultur opisanego przez Housea i zespół (2004) oraz przez Hofstedego (2001).
Twitter Analytics
(2014)
Die Online-Forschung setzt sich in den letzten Jahren zunehmend mit Mikro-Blogs, insbesondere dem weltweit populärsten Anbieter Twitter, auseinander. Verschiedenste Disziplinen beschäftigen sich aus ihren jeweiligen Perspektiven mit der Analyse von kommunikativen Prozessen und Strukturen von Twitter und nutzen dabei eine Vielzahl an methodischen Zugängen. In diesem Artikel werden zunächst die grundlegenden Funktionen, Möglichkeiten des Zugangs zur Datenstruktur sowie Methoden der Datenerhebung und -auswertung dargelegt. Im Anschluss werden Ansätze verschiedener Fachdisziplinen vorgestellt.
Tropus
(2014)
Translativ
(2014)
Measuring the quality of metadata is only possible by assessing the quality of the underlying schema and the metadata instance. We propose some factors that are measurable automatically for metadata according to the CMD framework, taking into account the variability of schemas that can be defined in this framework. The factors include among others the number of elements, the (re-)use of reusable components, the number of filled in elements. The resulting score can serve as an indicator of the overall quality of the CMD instance, used for feedback to metadata providers or to provide an overview of the overall quality of metadata within a repository. The score is independent of specific schemas and generalizable. An overall assessment of harvested metadata is provided in form of statistical summaries and the distribution, based on a corpus of harvested metadata. The score is implemented in XQuery and can be used in tools, editors and repositories.
This paper describes a first version of an integrated e-dictionary translating possessive constructions from English to Zulu. Zulu possessive constructions are difficult to learn for non-mother tongue speakers. When translating from English into Zulu, a speaker needs to be acquainted with the nominal classification of nouns indicating possession and possessor. Furthermore, (s)he needs to be informed about the morpho-syntactic rules associated with certain combinations of noun classes. Lastly, knowledge of morpho-phonetic changes is also required, because these influence the orthography of the output word forms. Our approach is a novel one in that we combine e-lexicography and natural language processing by developing a (web) interface supporting learners, as well as other users of the dictionary to produce Zulu possessive constructions. The final dictionary that we intend to develop will contain several thousand nouns which users can combine as they wish. It will also translate single words and frequently used multiword expressions, and allow users to test their own translations. On request, information about the morpho-syntactic and morpho-phonetic rules applied by the system are displayed together with the translation. Our approach follows the function theory: the dictionary supports users in text production, at the same time fulfilling a cognitive function.
Totum pro parte
(2014)
Topos
(2014)
Topik
(2014)
This article presents preliminary results indicating that speakers have a different pitch range when they speak a foreign language compared to the pitch variation that occurs when they speak their native language. To this end, a learner corpus with French and German speakers was analyzed. Results suggest that speakers indeed produce a smaller pitch range in the respective L2. This is true for both groups of native speakers. A possible explanation for this finding is that speakers are less confident in their productions, therefore, they concentrate more on segments and words and subsequently refrain from realizing pitch range more native-like. For language teaching, the results suggest that learners should be trained extensively on the more pronounced use of pitch in the foreign language.
This paper presents the first release of the KiezDeutsch Korpus (KiDKo), a new language resource with multiparty spoken dialogues of Kiezdeutsch, a newly emerging language variety spoken by adolescents from multi-ethnic urban areas in Germany. The first release of the corpus includes the transcriptions of the data as well as a normalisation layer and part-of-speech annotations. In the paper, we describe the main features of the new resource and then focus on automatic POS tagging of informal spoken language. Our tagger achieves an accuracy of nearly 97% on KiDKo. While we did not succeed in further improving the tagger using ensemble tagging, we present our approach to using the tagger ensembles for identifying error patterns in the automatically tagged data.
This paper seeks to apply the principles of the famous 3-Circle-Model devised for the description of the ecolinguistic position of English world-wide to the position of German around the world.
On the one hand, the 3-Circle-Model for English with its "Inner", "Outer" and "Extended/Expanding" Circles was invented by Kachru in the 1980s and has since then been adopted, refined and criticised by numerous authors. The situation of German world-wide, on the other hand, has only been scarcely discussed in the past 20 years. While the global extension of German is obviously by far weaker than that of English, there are also a number of noteworthy similarities in terms of historical spread and the current position of these two languages.
This paper therefore discusses the analogies of global English and German by establishing three circles for German: the Inner Circle for the core German-speaking area, i.e. Germany, Austria and Switzerland; the Outer Circle including a number of German minority areas (mostly in Europe), and finally the Extended Circle which may be denoted as "Crumbling" rather than "Expanding". The latter comprises traditional German diaspora communities in different parts of the world which either result from migration, but also reflect the previous functions of German as a language of culture and as a lingua franca in regions like Eastern Europe. The paper argues that there are some striking structural similarities, but also shows the limits of this comparison.