ja
Refine
Year of publication
- 2014 (316) (remove)
Document Type
- Part of a Book (146)
- Article (81)
- Conference Proceeding (51)
- Book (16)
- Part of Periodical (9)
- Working Paper (7)
- Other (5)
- Preprint (1)
Keywords
- Deutsch (117)
- Korpus <Linguistik> (44)
- Institut für Deutsche Sprache <Mannheim> (36)
- Linguistik (28)
- Germanistik (25)
- Computerunterstützte Lexikographie (21)
- Institut für Deutsche Sprache (18)
- Wörterbuch (17)
- Sprachvariante (15)
- Computerlinguistik (14)
Publicationstate
- Veröffentlichungsversion (164)
- Zweitveröffentlichung (23)
- Postprint (11)
Reviewstate
- (Verlags)-Lektorat (125)
- Peer-Review (58)
- Verlags-Lektorat (7)
- Peer-review (5)
- Review-Status-unbekannt (2)
- (Verlags)Lektorat (1)
- (Verlags-)Lektorat (1)
- Peer-Revied (1)
- Preprint (1)
Publisher
- Institut für Deutsche Sprache (93)
- De Gruyter (28)
- de Gruyter (23)
- European Language Resources Association (ELRA) (11)
- Stauffenburg (10)
- Lang (5)
- Universitätsverlag Hildesheim (5)
- Erich Schmidt Verlag (3)
- International Speech Communication Association (3)
- Narr (3)
Wie selbstbestimmt können wir das Internet nutzen? Wie viel wissen wir darüber,welche digitalen Spuren wir setzen und wer diesen hinterher spürt?
Wie werden die beim Surfen erzeugten Daten von Dritten weiter verwendet – mit und ohne unser Wissen? Und ist die gefühlte Nacktheit in Zeiten der digital ausspähbaren, scheinbaren Transparenz wirklich akut oder durch traditionelle analoge Denk- und Erfahrungsstrukturen geprägt?
“My Curiosity was Satisfied, but not in a Good Way”: Predicting User Ratings for Online Recipes
(2014)
In this paper, we develop an approach to automatically predict user ratings for recipes at Epicurious.com, based on the recipes’ reviews. We investigate two distributional methods for feature selection, Information Gain and Bi-Normal Separation; we also compare distributionally selected features to linguistically motivated features and two types of frameworks: a one-layer system where we aggregate all reviews and predict the rating vs. a two-layer system where ratings of individual reviews are predicted and then aggregated. We obtain our best results by using the two-layer architecture, in combination with 5 000 features selected by Information Gain. This setup reaches an overall accuracy of 65.60%, given an upper bound of 82.57%.
Previous accounts addressing the question what semantic properties of a matrix predicate determine the possible clause type of the embedded clause have not provided a general answer (e.g. Grimshaw 1979, Zifonun et al. 1997, Ginzburg & Sag 2000). This paper proposes that clause-embedding predicates fulfill characteristic logical conditions, so-called consistency conditions, which rule the syntactic potential of the matrix clause: for instance, the clause type of the embedded clause (declarative, ob- and/or wh-interrogative) and the correlate type, the matrix predicate can co-occur with (es and/or ProPP). Furthermore, they predict the logical forms of legitimate constructions with embedded ob- or wh-interrogatives, respectively, and how a legitimate optional correlate modifies the meaning of the matrix predicate.
Previous accounts addressing the question what semantic properties of a matrix predicate determine the possible clause type of the embedded clause have not provided a general answer (e.g. Grimshaw 1979, Zifonun et al. 1997, Ginzburg & Sag 2000). This paper proposes that clause-embedding predicates fulfill characteristic logical conditions, so-called consistency conditions, which rule the syntactic potential of the matrix clause: for instance, the clause type of the embedded clause (declarative, ob- and/or wh-interrogative) and the correlate type, the matrix predicate can co-occur with (es and/or ProPP). Furthermore, they predict the logical forms of legitimate constructions with embedded ob- or wh-interrogatives, respectively, and how a legitimate optional correlate modifies the meaning of the matrix predicate.
Der Beitrag beschäftigt sich mit der Frage, wie und inwieweit korpusbasierte Ansätze zur Untersuchung und Bewertung von Sprachwandel beitragen können. Die Bewertung von Sprachwandel erscheint in dieser Hinsicht interessant, da sie erstens von größerem öffentlichen Interesse ist, zweitens nicht zu den Kernthemen der Sprachwissenschaft zählt und drittens sowohl die geisteswissenschaftlichen Aspekte der Sprachwissenschaft berührt als auch die empirischen, die eher für die so genannten harten Wissenschaften typisch sind. Letzteres trifft bei der Frage nach Sprachverfall (gutem vs. schlechtem Deutsch diachron) vermutlich unbestrittener zu als bei der Frage nach richtigem vs. falschem Deutsch, da zu ihrer Beantwortung offensichtlich einerseits empirische, messbare Kriterien herangezogen werden müssen, andererseits aber auch weitere Kriterien notwendig sind und es außerdem einer Entscheidung zur Einordnung und Gewichtung der verschiedenartigen Kriterien sowie einer Begründung dieser Entscheidung bedarf. Zur Annäherung an die Fragestellung werden zunächst gängige, leicht operationalisierbare Hypothesen zu Symptomen eines potenziellen Verfalls des Deutschen auf verschiedenen DeReKo-basierten Korpora überprüft und im Hinblick auf ihre Verallgemeinerbarkeit und Tragweite diskutiert. Im zweiten Teil werden weitere empirische Ansätze zur Untersuchung von Wandel, Variation und Dynamik skizziert, die zur Diskussion spezieller Aspekte von Sprachverfall beitragen könnten. Im Schlussteil werden die vorgestellten Ansätze in den Gesamtkontext einer sprachwissenschaftlichen Untersuchung von Sprachverfall gestellt und vor dem Hintergrund seines gesellschaftlichen Diskurses reflektiert.
Zur Frühgeschichte des IDS
(2014)
Eine Umschau in jüngeren sprachwissenschaftlichen Arbeiten zeigt einen häufig betonten engen Zusammenhang von Sprache und Identität, vor allem den der eigenen Sprache und der ethnischen Identität. Dass aber Sprache in einem zwei- oder mehrsprachigen Kontext nur eine Ressource einer Identitätskonstruktion sein kann, wird selten herausgestellt. Der nachstehende Aufsatz untersucht als charakteristisches Beispiel einer gelösten Bindung von Sprache und ethnischer Identität die Minderheit der deutschen Aussiedler aus der ehemaligen Sowjetunion. Im Vordergrund steht dabei die zweite Generation, bei der ihr Zugehörigkeitsgefühl zur ethnischen Identität als Deutsche trotz der erfolgten Sprachumstellung sich nicht oder selten verändert hat.
Der Beitrag präsentiert eine Untersuchung des Zusammenhangs zwischen Formulierungsverfahren und der Handlungsstruktur eines institutionellen Schlichtungsgesprächs. Im Fokus steht das Verhältnis zwischen den verwendeten Referenzierungsformen, ihrem Bezug auf spezifische Handlungsrollen und der Modalität der ausgedrückten Handlungen. Die Analyse konzentriert sich auf die Äußerungen des Schlichters, weil institutionelle Schlichtungen sehr stark durch die kommunikative Arbeit des Schlichters strukturiert werden. Das Ziel der Untersuchung ist, die Analyse der interaktiven Dynamik und die Analyse von Formulierungsverfahren zu verbinden und die Relation zwischen der Handlungsstruktur und den Formulierungsverfahren zu begreifen. Es ist anzunehmen, dass Regelmäßigkeiten der Beziehung zwischen den beiden Ebenen bestehen und dass besondere Formulierungsverfahren diese Beziehung verdeutlichen. In dieser Arbeit geht es darum, diese Hypothese zu präzisieren und zu bestimmen, welche Rolle die Modalität der Äußerungen spielt, und zwar vor allem die durch das Modalverb sollen vermittelte Modalität der Notwendigkeit. Der gewählte analytische Zugang verbindet die Verfahren der Gesprächsanalyse für die Sequenzanalyse im mikro- und makrostrukturellen Bereich mit der linguistischen Analyse von Formulierungsverfahren. Die Analyse der Handlungsstruktur stellt den Referenzrahmen für die Analyse der Formulierungsverfahren dar. Am Ende erfolgt ein kurzer Ausblick auf die Reinterpretation der Ergebnisse aus einer konstruktionsgrammatischen Perspektive.