@phdthesis{Witt2018, author = {Andreas Witt}, title = {Multiple Informationsstrukturierung mit Auszeichnungssprachen. XML-basierte Methoden und deren Nutzen f{\"u}r die Sprachtechnologie}, publisher = {Bielefeld University}, address = {Bielefeld}, url = {https://nbn-resolving.org/urn:nbn:de:hbz:361-4028}, pages = {217}, year = {2018}, abstract = {Im Zentrum der Dissertation steht der Begriff Informationsmodellierung oder genauer der Begriff der \"textuellen Informationsmodellierung\", wobei auf einer bereits vorgeschlagenen Unterscheidung einer prim{\"a}ren und einer sekund{\"a}ren Ebene der Informationsstrukturierung aufgebaut wird. Der Gegenstand der prim{\"a}ren Ebene sind die textuellen Daten selbst sowie ihre Strukturierung, wohingegen die sekund{\"a}re Ebene beschreibt, wie die f{\"u}r die prim{\"a}ren Ebenen verwendeten Regelwerke mit alternativen Regelwerken in Beziehung gesetzt werden k{\"o}nnen. Der Einteilung in eine prim{\"a}re und eine sekund{\"a}re Informationsstrukturierung wird in der Dissertation das Konzept der multiplen Informationsstrukturierung nebengeordnet. Dieses Konzept ist so zu verstehen, dass die prim{\"a}re Ebene bei Bedarf vervielfacht wird - jedoch bezieht sich jede dieser Ebenen auf dieselbe Datengrundlage. Hierbei ergeben sich auch Auswirkungen auf die sekund{\"a}re Informationsstrukturierung. Die Informationsmodellierung erfolgt mit Auszeichnungssprachen. Die Standard Generalized Markup Language (SGML) stellt hierf{\"u}r einen Rahmen dar, jedoch wurde dieser Formalismus seit seiner 1986 erfolgten Standardisierung nicht nur weiterentwickelt, sondern es wurde mit der Extensible Markup Language (XML) im Jahr 1998 eine wesentlich einfachere Untermenge dieser Sprache definiert, die zudem das derzeitige Zentrum weiterer Entwicklungen auf dem Gebiet der Auszeichnungssprachen darstellt. Der entwickelte Ansatz zur Modellierung linguistischer Information basiert auf der Extensible Markup Language (XML), wobei die weitergehenden M{\"o}glichkeiten von SGML selbstverst{\"a}ndlich ebenfalls dargestellt und diskutiert werden. Mittels XML k{\"o}nnen Informationen, die sich nicht in bestimmten Hierarchien (mittels mathematischer B{\"a}ume) strukturieren lassen, nicht in einer nat{\"u}rlichen Weise repr{\"a}sentiert werden. Eine L{\"o}sung dieses Problems liegt in der Aufteilung der Strukturierung auf verschiedene Ebenen. Diese neue L{\"o}sung wird dargestellt, diskutiert und modelliert.}, language = {de} }