Computerlinguistik
Refine
Year of publication
Document Type
- Conference Proceeding (219)
- Part of a Book (68)
- Article (67)
- Book (16)
- Working Paper (9)
- Contribution to a Periodical (7)
- Doctoral Thesis (7)
- Other (7)
- Report (5)
- Master's Thesis (3)
Language
- English (282)
- German (127)
- French (1)
- Multiple languages (1)
Is part of the Bibliography
- no (411) (remove)
Keywords
- Computerlinguistik (158)
- Korpus <Linguistik> (93)
- Annotation (48)
- Automatische Sprachanalyse (48)
- Deutsch (39)
- Natürliche Sprache (39)
- XML (33)
- Information Extraction (28)
- Maschinelles Lernen (24)
- Metadaten (22)
Publicationstate
- Veröffentlichungsversion (231)
- Zweitveröffentlichung (67)
- Postprint (46)
- (Verlags)-Lektorat (1)
- Erstveröffentlichung (1)
- Preprint (1)
Reviewstate
Publisher
- Association for Computational Linguistics (32)
- Springer (20)
- European Language Resources Association (ELRA) (17)
- European Language Resources Association (16)
- de Gruyter (14)
- Institut für Deutsche Sprache (13)
- Universitätsverlag Hildesheim (8)
- Narr (7)
- Oxford University Press (6)
- LiU Electronic Press (5)
“My Curiosity was Satisfied, but not in a Good Way”: Predicting User Ratings for Online Recipes
(2014)
In this paper, we develop an approach to automatically predict user ratings for recipes at Epicurious.com, based on the recipes’ reviews. We investigate two distributional methods for feature selection, Information Gain and Bi-Normal Separation; we also compare distributionally selected features to linguistically motivated features and two types of frameworks: a one-layer system where we aggregate all reviews and predict the rating vs. a two-layer system where ratings of individual reviews are predicted and then aggregated. We obtain our best results by using the two-layer architecture, in combination with 5 000 features selected by Information Gain. This setup reaches an overall accuracy of 65.60%, given an upper bound of 82.57%.
In diesem Beitrag werden erste Erfahrungen mit und Überlegungen zu der Aufgabe dargelegt, ein Mikrostrukturenprogramm für ein Hypertext-Wörterbuch zu entwerfen. Zur Hypertextualisierung gedruckter Wörterbücher gibt es inzwischen erste Veröffentlichungen; meist bleibt hier die Bindung an eine gedruckte Vorlage, und sei die Hypertextualisierung noch so konsequent, bestehen. Im Unterschied zu solchen Hypertext-Wörterbüchern gehen nachfolgende Überlegungen von einem vorlagenunabhängigen Hypertext aus, dessen allgemeines Ziel es ist, Informationen zum deutschen Wortschatz zu vermitteln. Die hier vorgestellten Erfahrungen und Überlegungen sind an ein konkretes Projekt gebunden: LEKSIS - das lexikalisch-lexikologische Informationssystem des Instituts für Deutsche Sprache, Mannheim. Auf eine (weitere) Projektbeschreibung wird hier aber verzichtet; sie findet sich in Fraas/Haß-Zumkehr (1999), ferner auf der Homepage unter http://www.ids-mannheim.de/wiw. Vor dem Hintergrund dieses Projektes stehen die Bedingungen bzw. lexikografischen Konsequenzen des Mediums Hypertext im Unterschied zum Druck zur Diskussion.
This paper presents an annotation scheme for English modal verbs together with sense-annotated data from the news domain. We describe our annotation scheme and discuss problematic cases for modality annotation based on the inter-annotator agreement during the annotation. Furthermore, we present experiments on automatic sense tagging, showing that our annotations do provide a valuable training resource for NLP systems.
Dieser Beitrag skizziert die Möglichkeiten, die die Extensible Markup Language (XML) im Umfeld von eLearning und Web Based Training (WBT) eröffnet. Bisherige eLearning-Angebote kranken an verschiedenen Problemen, die durch die Verwendung von XML-basierten Learning Objects vermieden werden können. Ausgehend vom aktuellen Stand im Projekt MiLCA - Medienintensive Lehrmodule in der Computerlinguistik-Ausbildung - soll zudem ein Ausblick auf zukünftige technische Möglichkeiten des Computer-gestützten Lernens gegeben werden.
The 2014 issue of KONVENS is even more a forum for exchange: its main topic is the interaction between Computational Linguistics and Information Science, and the synergies such interaction, cooperation and integrated views can produce. This topic at the crossroads of different research traditions which deal with natural language as a container of knowledge, and with methods to extract and manage knowledge that is linguistically represented is close to the heart of many researchers at the Institut für Informationswissenschaft und Sprachtechnologie of Universität Hildesheim: it has long been one of the institute’s research topics, and it has received even more attention over the last few years.