Refine
Year of publication
- 2008 (21) (remove)
Document Type
- Article (12)
- Conference Proceeding (9)
Has Fulltext
- yes (21)
Is part of the Bibliography
- no (21)
Keywords
- Deutsch (7)
- Französisch (3)
- Information Extraction (3)
- Automatische Sprachanalyse (2)
- Computerunterstützte Lexikografie (2)
- Datensatz (2)
- Diskurs (2)
- Information Retrieval (2)
- Interaktion (2)
- Konversationsanalyse (2)
Publicationstate
- Veröffentlichungsversion (14)
- Zweitveröffentlichung (4)
- Postprint (3)
Reviewstate
- Peer-Review (21) (remove)
Publisher
- European Language Resources Association (ELRA) (2)
- de Gruyter (2)
- European Language Resources Association (1)
- Gesellschaft für deutsche Sprache (GfdS) (1)
- Institut de Linguistique Française (1)
- Institut für Deutsche Sprache (1)
- International Speech Communication Association (1)
- Pabst (1)
- Presses universitaires de la Méditerranée (1)
- Schmidt (1)
Although there is a growing interest of policy makers in higher education issues (especially on an international scale), there is still a lack of theoretically well-grounded comparative analyses of higher education policy. Even broadly discussed topics in higher education research like the potential convergence of European higher education systems in the course of the Bologna Process suffer from a thin empirical and comparative basis. This paper aims to deal with these problems by addressing theoretical questions concerning the domestic impact of the Bologna Process and the role national factors play in determining its effects on cross-national policy convergence. It develops a distinct theoretical approach for the systematic and comparative analysis of cross-national policy convergence. In doing so, it relies upon insights from related research areas — namely literature on Europeanization as well as studies dealing with cross-national policy convergence.
One problem of data-driven answer extraction in open-domain factoid question answering is that the class distribution of labeled training data is fairly imbalanced. In an ordinary training set, there are far more incorrect answers than correct answers. The class-imbalance is, thus, inherent to the classification task. It has a deteriorating effect on the performance of classifiers trained by standard machine learning algorithms. They usually have a heavy bias towards the majority class, i.e. the class which occurs most often in the training set. In this paper, we propose a method to tackle class imbalance by applying some form of cost-sensitive learning which is preferable to sampling. We present a simple but effective way of estimating the misclassification costs on the basis of class distribution. This approach offers three benefits. Firstly, it maintains the distribution of the classes of the labeled training data. Secondly, this form of meta-learning can be applied to a wide range of common learning algorithms. Thirdly, this approach can be easily implemented with the help of state-of-the-art machine learning software.
Im Deutschen und anderen europäischen Sprachen können Demonstrativa das Antezedens von Relativsätzen bilden oder als Determinator eines solchen Antezedens fungieren. Konstruktionen dieser Art weisen Besonderheiten in Bezug auf Form und Bedeutung auf: Einerseits finden sich Demonstrativa, die nicht oder nur marginal mit appositiven Relativsätzen kombiniert werden können, andererseits solche, die entweder keine restriktiven Relativsätze zulassen oder sich mit diesen nur in speziellen, nichtdeiktischen und nichtphorischen Bedeutungen kombinieren lassen. Zumindest einige dieser Besonderheiten scheinen auf allgemeinere, sprachübergreifende Beschränkungen hinzuweisen. So zeigt sich tendenziell, dass die Kombinierbarkeit von Demonstrativa mit restriktiven Relativsätzen mit der deiktischen Stärke des Demonstrativums korreliert: Distanzmarkierende und in diesem Sinn deiktisch starke Demonstrativa schließen restriktive Relativsätze tendenziell aus, während distanzneutrale oder nichtdeiktisch verwendbare Demonstrativa sie in der Regel zulassen. Beschränkungen dieser Art werden anhand des Deutschen, Französischen und Schwedischen aufgezeigt.
In der „Nacherstposition“ zwischen einer Vorfeldkonstituente und dem Finitum können im Deutschen bestimmte unflektierbare Einheiten (wie allerdings, wiederum, also, nun, nämlich, beispielsweise) auftreten, die sich anders als Fokuspartikeln verhalten. Es handelt sich um Adverbkonnektoren, die neben ihrer relationierenden Funktion in dieser - und nur in dieser - Position die informationsstrukturelle Aufgabe der Topikwechselmarkierung übernehmen. Nur eine kleine Klasse skalierender Einheiten - die typischen Stiefkinder der Fokuspartikelforschung {zumindest, höchstens, wenigstens u. a.) - kann hier alternativ Topik und Fokus markieren. Mit ihrer spezifischen Form-Funktions-Korrelation stellt die Nacherstposition von Adverbkonnektoren eine nicht zur Gänze kompositional erschließbare „Konstruktion“ im konstruktionsgrammatischen Sinne dar.
In this paper, we present a suite of flexible UIMA-based components for information retrieval research which have been successfully used (and re-used) in several projects in different application domains. Implementing the whole system as UIMA components is beneficial for configuration management, component reuse, implementation costs, analysis and visualization.
Current Natural Language Processing (NLP) systems feature high-complexity processing pipelines that require the use of components at different levels of linguistic and application specific processing. These components often have to interface with external e.g. machine learning and information retrieval libraries as well as tools for human annotation and visualization. At the UKP Lab, we are working on the Darmstadt Knowledge Processing Software Repository (DKPro) (Gurevych et al., 2007a; Müller et al., 2008) to create a highly flexible, scalable and easy-to-use toolkit that allows rapid creation of complex NLP pipelines for semantic information processing on demand. The DKPro repository consists of several main parts created to serve the purposes of different NLP application areas
Introduction
(2008)
In this paper we investigate the coverage of the two knowledge sources WordNet and Wikipedia for the task of bridging resolution. We report on an annotation experiment which yielded pairs of bridging anaphors and their antecedents in spoken multi-party dialog. Manual inspection of the two knowledge sources showed that, with some interesting exceptions, Wikipedia is superior to WordNet when it comes to the coverage of information necessary to resolve the bridging anaphors in our data set. We further describe a simple procedure for the automatic extraction of the required knowledge from Wikipedia by means of an API, and discuss some of the implications of the procedure’s performance.
Lors de la négociation située de l'alternance des tours de parole en interaction (Sacks, Schegloff et Jefferson, 1974), les participants s'orientent vers la complétude possible des unités de construction de tour. Grâce à une complétion différée d'un tour de parole précédent, un locuteur peut revendiquer son droit à la parole au-delà d'un tour intercalaire d'un autre locuteur. Cet article exploite différentes formes de cette "delayed completion" (Lerner, 1989) en français parlé. À l'aide du cadre théorique de l'Analyse conversationnelle (ten Have, 1999), nous démontrerons que ce procédé ne relève pas uniquement d'une alternance de tour de parole problématique, mais aussi de séquences collaboratives, qui sont en lien étroit avec le phénomène des constructions syntaxiques collaboratives. En s'intéressant à ces structures syntaxiques émergentes, il est possible de démontrer la négociation située et locale - tour par tour – du droit à la parole et de la dynamique de l'alternance des tours en conversation ordinaire. A base d'une collection d'extraits issus d'interactions naturelles enregistrées en audio ou en vidéo, différentes manières de revendiquer ou de partager son tour seront illustrées. Lors des analyses, une attention particulière sera dédiée à quelques phénomènes récurrents dans les séquences de complétion différée. Ainsi, l'exploitation de certaines conjonctions en tant que marqueurs discursifs ou la présence d'allongements vocaliques en fin du premier segment semblent indiquer des co-occurrences de ressources audibles spécifiques à différents types de complétion différée en conversation française.
Cet article se fonde sur une collection de répétitions suite à un chevauchement, tirée de données vidéo en allemand et en français. La description systématique de cet outil de reprise de tour articule une comparaison entre cas clairs et cas déviants de ce phénomène. Il est démontré que le recyclage est aussi bien une ressource du locuteur suivant que du locuteur en cours.
Research on syntactic ambiguity resolution in language comprehension has shown that subjects' processing decisions are influenced by a variety of heterogeneous factors such as e.g., syntactic complexity, semantic fit and the discourse frequency of the competing structures. The present paper investigates a further potentially relevant factor in such processes: effects of syntagmatic lexical chunking (or matching to a complex memorized prefab) whose occurrence would be predicted from usage-based assumptions about linguistic categorisation. Focusing on the widely studied so-called DO/SC-ambiguity in which a post-verbal NP is syntactically ambiguous between a direct object and the subject of an embedded clause, potentially biasing collocational chunks of the relevant type are identified in a number of corpus-linguistic pretests and then investigated in a self-paced reading experiment. The results show a significant increase in processing difficulty from a collocationally neutral over a lexically biasing to a strongly biasing condition. This suggests that syntagmatically complex and partially schematic templates of the kind envisioned in usage-based Construction Grammar may impinge on speakers' online processing decisions during sentence comprehension.
Lexicon schemas and their use are discussed in this paper from the perspective of lexicographers and field linguists. A variety of lexicon schemas have been developed, with goals ranging from computational lexicography (DATR) through archiving (LIFT, TEI) to standardization (LMF, FSR). A number of requirements for lexicon schemas are given. The lexicon schemas are introduced and compared to each other in terms of conversion and usability for this particular user group, using a common lexicon entry and providing examples for each schema under consideration. The formats are assessed and the final recommendation is given for the potential users, namely to request standard compliance from the developers of the tools used. This paper should foster a discussion between authors of standards, lexicographers and field linguists.
Badania etnolingwistyczne zdobyly w ciqgu ostatnich dwu dekad znaozna populamosc. Najwazniejsz^ formuh\ nietaforycznn okreslajqcii glowny przedmiot tych badaií jest .jçzykowy obraz swiata”. W zwiqzku z tym. iz powstaj^ obecnie projekty studiów komparatyslycznych na duzíi skalç, warto byt moze rozwazyc, czego takie ujçcie etnolingwistyki nie uwzglçdnia. Wizualna metafora obrazów implikuje, ze mówincy si\ w slanie wyjsc ix>za swiat i patrzec nan (oraz nazywac go) z zewmprz. Artykul oinawia dwie kcinsekwencje tej inetafory, które mog^ przysporzyc problemów. Po pierwsze, wyizolowanie jçzyka ze swiata ludzkich dzialan, którego jyzyk wszak jest czçsci^. prowadzi do przyjçcia kognitywistycznego modeln znaczenia jako oddzielnego stmmienia komunikaeji. Taki model nie pasuje do eodziennego doswiadezenia przezroczystosci jyzyka. Po drugie, wyizolowanie jçzyka z zycia sprzyja stosowaniu metod „bezczasowych” oraz studiom nad stowami wyalKtrahowanymi z sytuaeji, w której zostaly one uzyte (jesli nie wyjçtymi z kontekstu). Przyjmuj^c takie metafory i inetody, inozetny stracic z oczu znaczn^ czçsc tego, co jest istotne dla jyzyka poUx;znego — przedmiotu badan etnonauki.
The present study examines the dynamics of the kanji combinations that form common (or general) and proper nouns in Japanese. The following three results were obtained. First, the degree of distribution results from two similar processes which are based on a steady-state of birth-and-death processes with different birth and death rates, resulting in a positive negative binomial distribution with the proper nouns and in a positive Waring distribution with common nouns. Second, all rank-frequency distributions follow the negative hypergeometric distribution used very frequently in ranking problems. Third, the building of kanji compounds follows a dissortative strategy. The higher the outdegree of a kanji, the more it prefers kanji with lower indegrees. A linear dependence can be observed with common nouns, whereas the relationship between compounded kanji is rather curvilinear with proper nouns. The actual analytical expression is not yet known.
In the context of a Nordic Conference on Bilingualism, it can be a rewarding task to look at issues such as language planning, policy and legislation from a perspective of the southern neighbours of the Nordic world. This paper therefore intends to point attention towards a case of societal multilingualism at the periphery of the Nordic world by dealing with recent developments in language policy and legislation with regard to the North Frisian speech community in the German Land of Schleswig-Holstein. As I will show, it is striking to what degree there are considerable differences in the discourse on minority protection and language legislation between the Nordic countries and a cultural area which may arguably be considered to be part of the Nordic fringe - and which itself occasionally takes Scandinavia as a reference point, e.g. in the recent adoption of a pan-Frisian flag modelled on the Nordic cross (Falkena 2006).
The main focus of the paper will be on the Frisian Act which was passed in the Parliament of Schleswig-Holstein in late 2004. It provides a certain legal basis for some political activities with regard to Frisian, but falls short of creating a true spirit of minority language protection and/or revitalisation. In contrast to the traditions of the German and Danish minorities along the German-Danish border and to minority protection in Northern Scandinavia (in particular to Sámi language rights), the approach chosen in the Frisian Act is extremely weak and has no connotation of long-term oriented language-planning, let alone a rights-based perspective.
The paper will then look at policy developments in the time since the Act was passed, e.g. in the Schleswig-Holstein election campaign in 2005, and on latest perceptions of the Frisian language situation in the discourse on North Frisian Policy in Schleswig-Holstein majority society. In the final part of the paper, I will discuss reasons for the differences in minority language policy discourse between Germany and the Nordic countries, and try to provide an outlook on how Frisian could benefit from its geographic proximity to the Nordic world.
In our study we use the experimental framework of priming to manipulate our subjects’ expectations of syllable prominence in sentences with a well-defined syntactic and phonological structure. It shows that it is possible to prime prominence patterns and that priming leads to significant differences in the judgment of syllable prominence.
Aus psychologischer Sicht wird Verstehen als ein kognitiver Prozess begriffen. Im Gegensatz dazu stellt der Aufsatz einen konversationsanalytischen Zugang zu Verstehen dar. Es wird rekonstruiert, wie Verstehen in Gesprächen durch verschiedene Verfahren der Verstehensdokumentation verdeutlicht und durch wechselseitig aufeinander bezogene Reaktionen ausgehandelt wird. Anhand von sechs Gesprächssequenzen wird eine linguistische Typologie von Verstehensdokumentationen in der Interaktion vorgestellt. Auf Basis der Fallanalysen werden grundlegende Eigenschaften von Verstehensdokumentationen sowie Aufgaben, die die Interaktionsteilnehmer bei der Produktion von und bei der Reaktion auf Verstehensdokumentationen bearbeiten, rekonstruiert. Dazu gehören: Identifikation des Bezugs von Verstehensdokumentationen, Interpretation des Verstehensgegenstands, Sicherung der Verständlichkeit und Legitimität (accountability) der Verstehensdokumentation, Herstellung des Bezugs der Verstehensdokumentation zu den praktischen Zwecken der laufenden Interaktion, Aushandlung intersubjektiven Verständnisses, rhetorische Nutzung von Verstehensdokumentationen und ihr indikativer Bezug auf Beteiligungsrollen und sozialstrukturelle Rahmen der Interaktion.
Das vorliegende Themenheft widmet sich einigen „sperrigen“ Phänomenen des Deutschen, die sowohl für eine gebrauchsorientierte Grammatikographie als auch für eine stärker theoriebasierte Linguistik Herausforderungen darstellen, weil sie nicht recht in die gängigen Erklärungsmuster und Kategorienraster passen wollen oder gegen vermeintlich allgemeine Prinzipien und Regeln zu verstoßen scheinen. Als „Ausnahmen“ von Grammatiken (und ihren Benutzern) schon immer diskriminiert, als „Randphänomene“ lange Zeit im toten Winkel einer syntaxzentrierten neueren Linguistik, wird ihnen seit kurzer Zeit - gerade auch von Seiten der sprachtheoretisch orientierten Linguistik - wieder mehr Aufmerksamkeit zuteil.