OPUS 4 | Search

Twitter Analytics (2014)

Die Online-Forschung setzt sich in den letzten Jahren zunehmend mit Mikro-Blogs, insbesondere dem weltweit populärsten Anbieter Twitter, auseinander. Verschiedenste Disziplinen beschäftigen sich aus ihren jeweiligen Perspektiven mit der Analyse von kommunikativen Prozessen und Strukturen von Twitter und nutzen dabei eine Vielzahl an methodischen Zugängen. In diesem Artikel werden zunächst die grundlegenden Funktionen, Möglichkeiten des Zugangs zur Datenstruktur sowie Methoden der Datenerhebung und -auswertung dargelegt. Im Anschluss werden Ansätze verschiedener Fachdisziplinen vorgestellt.

„Nackt“ im Netz? Über Datenspuren und selektive Distribution in digitalen Medien (2014)

Dang-Anh, Mark

Wie selbstbestimmt können wir das Internet nutzen? Wie viel wissen wir darüber,welche digitalen Spuren wir setzen und wer diesen hinterher spürt? Wie werden die beim Surfen erzeugten Daten von Dritten weiter verwendet – mit und ohne unser Wissen? Und ist die gefühlte Nacktheit in Zeiten der digital ausspähbaren, scheinbaren Transparenz wirklich akut oder durch traditionelle analoge Denk- und Erfahrungsstrukturen geprägt?

Claudia Fraas / Stefan Meier / Christian Pentzold (Hrsg.): Online-Diskurse. Theorien und Methoden transmedialer Online-Diskursforschung [Rezension] (2014)

Dang-Anh, Mark

GeoBib – Visualisierung von historischen Karten in einem WebGIS (2014)

Schiller, Ines ; Schaarschmidt, Sandra ; Lobin, Henning

Dieser Artikel gibt einen Einblick in das GeoBib-Projekt und die Problematik der Verwendung von historischen Karten und der daraus abgeleiteten Geodaten in einem WebGIS. Das GeoBib-Projekt hat zum Ziel, eine annotierte und georeferenzierte Online-Bibliographie der frühen deutsch- bzw. polnischsprachigen Holocaust- und Lagerliteratur von 1933 bis 1949 bereitzustellen. Zu diesem Zeitraum werden historische Karten und Geodaten gesammelt, aufbereitet und im zugehörigen WebGIS des GeoBib-Portals visualisiert. Eine Besonderheit ist die aufwendige Recherche von Geodaten und Kartenmaterial für den Zeitraum zwischen 1933 und 1949. Die Problematiken bezüglich der Recherche und späteren Visualisierung historischer Geodaten und des Kartenmaterials sind ein Hauptaugenmerk in diesem Artikel. Weiterhin werden Konzepte für die Visualisierung von historischem, unvollständigem Kartenmaterial präsentiert und ein möglicher Lösungsweg für die bestehenden Herausforderungen aufgezeigt.

Parsing German: How Much Morphology Do We Need? (2014)

Maier, Wolfgang ; Kübler, Sandra ; Dakota, Daniel ; Whyatt, Daniel

We investigate how the granularity of POS tags influences POS tagging, and furthermore, how POS tagging performance relates to parsing results. For this, we use the standard “pipeline” approach, in which a parser builds its output on previously tagged input. The experiments are performed on two German treebanks, using three POS tagsets of different granularity, and six different POS taggers, together with the Berkeley parser. Our findings show that less granularity of the POS tagset leads to better tagging results. However, both too coarse-grained and too fine-grained distinctions on POS level decrease parsing performance.

“My Curiosity was Satisfied, but not in a Good Way”: Predicting User Ratings for Online Recipes (2014)

Liu, Can ; Guo, Chun ; Dakota, Daniel ; Rajagopalan, Sridhar ; Li, Wen ; Kübler, Sandra ; Yu, Ning

In this paper, we develop an approach to automatically predict user ratings for recipes at Epicurious.com, based on the recipes’ reviews. We investigate two distributional methods for feature selection, Information Gain and Bi-Normal Separation; we also compare distributionally selected features to linguistically motivated features and two types of frameworks: a one-layer system where we aggregate all reviews and predict the rating vs. a two-layer system where ratings of individual reviews are predicted and then aggregated. We obtain our best results by using the two-layer architecture, in combination with 5 000 features selected by Information Gain. This setup reaches an overall accuracy of 65.60%, given an upper bound of 82.57%.

Diskurszukünfte. 10. Jahrestagung des Forschungsnetzwerks "Sprache und Wissen". Jubiläums- und Programmzeitschrift (2014)

Interdisziplinäre Forschungsarbeit im Netzwerk. Brücken bauen. Ein Interview mit Prof. Dr. Thomas Spranz-Fogasy und PD Dr. med. Christoph Nikendei, MME, geführt von Maria Becker und Evi Schedl. "Jeder hat seine Kontexte und Erlebenswelten - wir müssen Brücken zwischen diesen bauen." (2014)

Becker, Maria ; Schedl, Evi

Die Graduiertenplattform des Forschungsnetzwerks "Sprache und Wissen" (2014)

Jacob, Katharina ; Schedl, Evi ; Müller, Marcus

Einleitung (2014)

Kämper, Heidrun

POS tagset refinement for linguistic analysis and the impact on statistical parsing (2014)

Rehbein, Ines ; Hirschmann, Hagen

The annotation of parts of speech (POS) in linguistically annotated corpora is a fundamental annotation layer which provides the basis for further syntactic analyses, and many NLP tools rely on POS information as input. However, most POS annotation schemes have been developed with written (newspaper) text in mind and thus do not carry over well to text from other domains and genres. Recent discussions have concentrated on the shortcomings of present POS annotation schemes with regard to their applicability to data from domains other than newspaper text.

Deutsche Akademie für Sprache und Dichtung, Union der deutschen Akademien der Wissenschaften (Hg.). 2013. Reichtum und Armut der deutschen Sprache. Erster Bericht zur Lage der deutschen Sprache. Berlin, Boston: De Gruyter. 233 S. Teil II. Der Bericht zur Lage der deutschen Sprache im Kontext sprachwissenschaftlicher Öffentlichkeitsarbeit [Rezension] (2014)

Stefanowitsch, Anatol ; Kopf, Kristin ; Flach, Susanne

Differences of Pitch Profiles in Germanic and Slavic Languages (2014)

Andreeva, Bistra ; Demenko, Grazyna ; Möbius, Bernd ; Zimmerer, Frank ; Jügler, Jeanin ; Oleskowicz-Popiel, Magdalena

This study investigates cross-language differences in pitch range and variation in four languages from two language groups: English and German (Germanic) and Bulgarian and Polish (Slavic). The analysis is based on large multi-speaker corpora (48 speakers for Polish, 60 for each of the other three languages). Linear mixed models were computed that include various distributional measures of pitch level, span and variation, revealing characteristic differences across languages and between language groups. A classification experiment based on the relevant parameter measures (span, kurtosis and skewness values for pitch distributions for each speaker) succeeded in separating the language groups.

Der Fall der Fälle. Entwicklungen in der nominalen Morphologie (2014)

Eichinger, Ludwig M. ; Rothe, Astrid

In diesem Beitrag wird an einigen Beispielen aus der nominalen Morphologie bzw. der Morphosyntax der deutschen Substantivgruppe gezeigt, wie sich in den Veränderungen in diesem Bereich, die sich über das 20. Jahrhundert hin beobachten lassen, Fragen eines langfristigen Systemwandels mit Regularitäten des Sprachgebrauchs überlagern. Im Mittelpunkt soll die Frage der Markierung der Kasus – insbesondere in den allgemein als „kritisch“ angesehenen Fällen von Genitiv und Dativ – stehen. Wenn man die Daten dazu betrachtet, sieht man, dass in den meisten Fällen schon zum Anfang des 20. Jahrhunderts eine weitgehende Anpassung an die Regularitäten der Monoflexion erfolgt war, auch, dass dieser Prozess über das Jahrhundert hin fortschreitet. Bemerkenswert ist, dass insgesamt die als „alt“ angesehenen Fälle in den untersuchten Korpora geschriebener Sprache (sehr) selten auftauchen, dass aber in zunehmendem Ausmaß die daraus folgende Markiertheit in der einen oder anderen Weise funktional genutzt wird. Einen Fall eigener Art stellt in diesem Zusammenhang der Genitiv dar, der sich bei den starken Maskulina und Neutra bekanntlich dem Trend zur „Einmalmarkierung“ der Kasus an den flektierten, das Substantiv begleitenden Elementen widersetzt. Das führt zu der bekannten Orientierung dieser Formen auf die Nicht-Objekt-Verwendungen und auch zu einem auffälligen Maß an Variation in der Nutzung der entsprechenden Flexionsformen.

Duch-Adamczyk, Justyna: Funktionsdistribution der Abtönungspartikeln des Deutschen und des Polnischen (2012). [Rezension] (2014)

Trawiński, Beata

Designing a Bilingual Speech Corpus for French and German Language Learners: a Two-Step Process (2014)

Fauth, Camille ; Bonneau, Anne ; Zimmerer, Frank ; Trouvain, Jürgen ; Andreeva, Bistra ; Colotte, Vincent ; Fohr, Dominique ; Jouvet, Denis ; Jügler, Jeanin ; Laprie, Yves ; Mella, Odile ; Möbius, Bernd

We present the design of a corpus of native and non-native speech for the language pair French-German, with a special emphasis on phonetic and prosodic aspects. To our knowledge there is no suitable corpus, in terms of size and coverage, currently available for the target language pair. To select the target L1-L2 interference phenomena we prepare a small preliminary corpus (corpus1), which is analyzed for coverage and cross-checked jointly by French and German experts. Based on this analysis, target phenomena on the phonetic and phonological level are selected on the basis of the expected degree of deviation from the native performance and the frequency of occurrence. 14 speakers performed both L2 (either French or German) and L1 material (either German or French). This allowed us to test, recordings duration, recordings material, the performance of our automatic aligner software. Then, we built corpus2 taking into account what we learned about corpus1. The aims are the same but we adapted speech material to avoid too long recording sessions. 100 speakers will be recorded. The corpus (corpus1 and corpus2) will be prepared as a searchable database, available for the scientific community after completion of the project.

Der Löwe und die Kellerassel: Gender im Reich der Tiere (2014)

Becker, Thomas

Most questionable pronouns: variation between das- vs. was-relatives in German (2014)

Brandt, Patrick ; Fuß, Eric

The article investigates the conditions under which the w-relativizer was appears instead of the d-relativzer das in German relative clauses. Building on Wiese 2013, we argue that was constitutes the elsewhere case that applies when identification with the antecedent cannot be established by syntactic means via upward agreement with respect to phi-features. Corpuslinguistic results point to the conclusion that this is the case whenever there is no lexical nominal in the antecedent that, following Geach 1962 and Baker 2003, supplies a criterion of identity needed to establish sameness of reference between the antecedent and the relativizer.

Endungsvariation (2014)

Konopka, Marek

Hypertext, Wissensnetz und Datenbank: die Webinformationssysteme Grammis und ProGr@mm (2014)

Schneider, Roman ; Schwinn, Horst

Open Access

Refine

Author

Year of publication

Document Type

Language

Has Fulltext

Is part of the Bibliography

Keywords

Publicationstate

Reviewstate

Publisher

173 search hits