Refine
Document Type
- Article (1)
- Part of a Book (1)
- Conference Proceeding (1)
Has Fulltext
- yes (3)
Keywords
- Autor (3) (remove)
Publicationstate
- Zweitveröffentlichung (2)
- Postprint (1)
- Veröffentlichungsversion (1)
Reviewstate
- Peer-Review (2)
- (Verlags)-Lektorat (1)
Publisher
Data sets of publication meta data with manually disambiguated author names play an important role in current author name disambiguation (AND) research. We review the most important data sets used so far, and compare their respective advantages and shortcomings. From the results of this review, we derive a set of general requirements to future AND data sets. These include both trivial requirements, like absence of errors and preservation of author order, and more substantial ones, like full disambiguation and adequate representation of publications with a small number of authors and highly variable author names. On the basis of these requirements, we create and make publicly available a new AND data set, SCAD-zbMATH. Both the quantitative analysis of this data set and the results of our initial AND experiments with a naive baseline algorithm show the SCAD-zbMATH data set to be considerably different from existing ones. We consider it a useful new resource that will challenge the state of the art in AND and benefit the AND research community.
Erpressung ist eine Straftat, die sich meist in einer ersten Phase rein sprachlich manifestiert und so liegt es nahe, die Sprachwissenschaft zur Klärung eines derartigen Falles heranzuziehen. Ist es möglich, für eine Ermittlung relevante Aussagen über den Verfasser zu machen, den Verfasser zu kategorisieren? Ist er ein notorischer Schreiber, ein alter Bekannter, oder handelt es sich um einen ersten unbeholfenen Versuch? Diese und andere Fragen werden an Linguisten und Linguistinnen im BKA herangetragen, die sich in eine sehr ungewöhnliche Rolle einfinden und ihre Methodik auf sehr spezifische Fragestellungen zuschneiden müssen. Der Aufsatz soll die konkreten Bedingungen der linguistischen Arbeit im Bereich der Autorenerkennung im BKA vorstellen. Dabei werden Aufgabenstellungen, Methodik, Probleme und Forschungsdesiderate skizziert. Ziel ist es, Sprachwissenschaftler zu erreichen, die an einer konkreten Anwendung ihres Faches sowie an der Lösung sehr spezifischer Problemstellungen interessiert sind, und somit eine stärkere fachliche Vernetzung zu schaffen.