Refine
Year of publication
- 2012 (102) (remove)
Document Type
- Part of a Book (53)
- Conference Proceeding (24)
- Article (22)
- Book (1)
- Other (1)
- Part of Periodical (1)
Keywords
- Deutsch (31)
- Korpus <Linguistik> (18)
- Computerlinguistik (9)
- Konversationsanalyse (8)
- Englisch (7)
- Kontrastive Grammatik (7)
- Sprachpolitik (7)
- Metadaten (6)
- Annotation (5)
- Datenmanagement (5)
Publicationstate
- Veröffentlichungsversion (102) (remove)
Reviewstate
- (Verlags)-Lektorat (68)
- Peer-Review (31)
- Peer-review (1)
- Verlags-Lektorat (1)
Publisher
Anhand einer Auswahl historischer Reden je dreier prominenter Deutscher und Polen wird eine signalphonetisch gestützte sprachvergleichende Analyse der glottalen Markierung vokalinitialer Wörter durchgeführt.
Generell erweist sich die glottale Markierung als variabel entlang eines Kontinuums zwischen einem echten glottalen Verschlusslaut (harter Stimmeinsatz) des Initialvokals über zeitlich nicht exakt koordinierte Glottalisierungen (Knarrstimme) und leichte Reflexe im Grundfrequenzverlauf bis hin zum völligen Fehlen einer Markierung.
Insgesamt zeigen sich im Polnischen gegenüber dem Deutschen seltener glottale Markierungen sowie eine sprachübergreifende schwache Abhängigkeit der Markierungshäufigkeit vom Sprechtempo (weniger bei Sprechtempoerhöhung).
Die Auftretenshäufigkeit glottaler Markierung wird sprachabhängig zudem durch unterschiedliche Faktoren beeinflusst: Für das Deutsche zeigen sich signifikante Einflüsse sowohl des Worttyps (Inhaltswörter mit häufigerer Markierung gegenüber Funktionswörtern) als auch der Betonung (betonte Silben mit häufigerer Markierung gegenüber unbetonten), während im Polnischen hier kein Einfluss sichtbar ist. Dafür zeigt das Polnische gegenüber dem Deutschen einen signifikanten Einfluss der Position innerhalb der Phrase (häufigere glottale Markierung in phraseninitialen im Gegensatz zu phrasenmedialen Wörtern). Diese sprachspezifischen Unterschiede können mit den prosodischen Charakteristika beider Sprachen Zusammenhängen. Im Unterschied zum Deutschen mit einem freien Wortakzent fällt dieser im Polnischen auf die Penultima, ist somit vorhersagbar und bedarf demzufolge keiner zusätzlichen glottalen Markierung im Sprachsignal.
Beide Sprachen hingegen zeigen übereinstimmend einen klar ausgeprägten Effekt der Vokalhöhe auf das Auftreten der glottalen Markierung (tiefe Vokale > mittlere Vokale > hohe Vokale).
Gerade weil das Thema der diesjährigen Arbeitstagung bereits seit einigen Jahrzehnten immer wieder Gegenstand verschiedener Forschungsrichtungen gewesen ist und heute gleichermaßen polymorph erforscht wird, sollten im Rahmen dieser Tagung aktuelle Projekte aus unterschiedlichen Disziplinen vorgestellt und interdisziplinär verhandelt werden. Das Ziel der Tagung war es, MedizinerInnen, PsychologInnen und GesprächsanalytikerInnen eine Plattform zu bieten, miteinander in Kontakt zu treten, die vorgestellten Ansätze, Erkenntnisinteressen und Methoden gemeinschaftlich zu diskutieren und dabei herauszustellen, in welchen Punkten sich diese von den eigenen unterscheiden.
Deklinationsklassen bilden einen Grundpfeiler des traditionellen Paradigmenmodells, das nach dem Vorbild der Grammatiken der klassischen Sprachen auch für die Beschreibung der deutschen Substantivflexion Verwendung gefunden hat. Im vorliegenden Beitrag soll die Rolle, die Deklinationsklassen in der deutschen Substantivdeklination spielen, überprüft werden. Beobachtungen zur Substantivflexion in verschiedenen europäischen Sprachen, darunter das Ungarische, das Polnische und das Italienische, die unterschiedliche Positionen innerhalb eines Spektrums besetzen, das vom hochflexivischen Lateinischen bis zu Sprachen ohne Deklinationsklassen (wie dem Englischen oder dem Türkischen) reicht, liefern Bausteine für eine Neuanalyse der deutschen Substantivflexion. Sichtbar wird, dass die deutsche Substantivflexion, bildlich gesprochen, auf dem Weg vom „Typus Latein“ zum „Typus Englisch“ schon sehr viel weiter fortgeschritten ist, als dies traditionelle Darstellungen nahe legen. An die Stelle der für kanonische Deklinationsklassen charakteristischen Sätze von klassentypischen Flexiven ist eine kleine Menge von Mustern der Stammformenbildung getreten.
We present a gold standard for semantic relation extraction in the food domain for German. The relation types that we address are motivated by scenarios for which IT applications present a commercial potential, such as virtual customer advice in which a virtual agent assists a customer in a supermarket in finding those products that satisfy their needs best. Moreover, we focus on those relation types that can be extracted from natural language text corpora, ideally content from the internet, such as web forums, that are easy to retrieve. A typical relation type that meets these requirements are pairs of food items that are usually consumed together. Such a relation type could be used by a virtual agent to suggest additional products available in a shop that would potentially complement the items a customer has already in their shopping cart. Our gold standard comprises structural data, i.e. relation tables, which encode relation instances. These tables are vital in order to evaluate natural language processing systems that extract those relations.
Knowledge Acquisition with Natural Language Processing in the Food Domain: Potential and Challenges
(2012)
In this paper, we present an outlook on the effectiveness of natural language processing (NLP) in extracting knowledge for the food domain. We identify potential scenarios that we think are particularly suitable for NLP techniques. As a source for extracting knowledge we will highlight the benefits of textual content from social media. Typical methods that we think would be suitable will be discussed. We will also address potential problems and limits that the application of NLP methods may yield.
In this paper, we examine methods to automatically extract domain-specific knowledge from the food domain from unlabeled natural language text. We employ different extraction methods ranging from surface patterns to co-occurrence measures applied on different parts of a document. We show that the effectiveness of a particular method depends very much on the relation type considered and that there is no single method that works equally well for every relation type. We also examine a combination of extraction methods and also consider relationships between different relation types. The extraction methods are applied both on a domain-specific corpus and the domain-independent factual knowledge base Wikipedia. Moreover, we examine an open-domain lexical ontology for suitability.