@incollection{RichterSailerTrawiński2016, author = {Frank Richter and Manfred Sailer and Beata Trawiński}, title = {The Collection of Distributionally Idiosyncratic Items: An Interface between Data and Theory}, series = {Corpora, Web and Databases. Computer-Based Methods in Modern Phraseology and Lexicography}, editor = {Stefaniya Ptashnyk and Erla Hallsteinsd{\´o}ttir and Noah Bubenhofer}, publisher = {Schneider Verlag Hohengehren}, address = {Baltmannsweiler}, isbn = {978-3-8340-0733-9}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:mh39-52836}, pages = {247 -- 262}, year = {2016}, abstract = {Dieser Beitrag gibt einen {\"U}berblick {\"u}ber CoDII, die Collection of Distributionally Idiosyncratic Items. CoDII ist eine elektronische Sammlung verschiedener Untergruppen lexikalischer Elemente, die sich durch idiosynkratische Distribution auszeichnen. Das bedeutet, dass sich die Verteilung dieser Lexeme im Text nicht alleine aufgrund ihrer syntaktischen Kategorie Vorhersagen l{\"a}sst. Die Methoden, die in der Entwicklung von CoDII angewandt werden, greifen {\"u}ber traditionelle Fachgrenzen hinaus und umfassen Korpuslinguistik, Computerlinguistik, Phraseologie und theoretische Sprachwissenschaft. Ein wichtiger Schwerpunkt unserer Diskussion liegt auf der Darstellung, inwiefern die in CoDII gesammelten, annotierten und unter anderem mit Suchwerkzeugen abfragbaren Daten dazu beitragen k{\"o}nnen, die linguistische Theoriebildung durch die Bereitstellung sorgf{\"a}ltig aufbereiteter Datensammlungen bei der {\"U}berpr{\"u}fung ihrer Datengrundlage zu unterst{\"u}tzen.}, language = {en} }